BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Emosi merupakan salah
satu aspek yang berperan
penting dalam proses pembelajaran. Banyak parameter yang dapat
menentukan
kondisi
emosi
seseorang.
Wajah
merupakan parameter yang paling mudah untuk menentukan kondisi
emosi
seseorang.
Bagian
wajah
yang
dapat
menunjukkan kondisi emosi adalah mata, bibir, dan dahi. Mata dapat digunakan tolak ukur untuk mendapatkan informasi
mengenai
kondisi
emosi.
Mata
dapat
menyampaikan beberapa informasi mengenai apa yang akan dilakukan (Porta, et al., 2012).
Pola perubahan mata
dapat merepresentasikan emosi yang dialami seseorang dalam suatu waktu tertentu. Salah
satu
proses
yang
dapat
dilakukan
adalah
membuat pendeteksi emosi berdasarkan pola-pola perubahan pada
mata.
Pendeteksi
emosi
ini
dilakukan
untuk
mengklasifikasikan emosi berdasarkan pola perubahan mata dalam
waktu
merupakan untuk
tertentu.
salah
satu
klasifikasi.
Algoritma
k-Nearest
Neighbor
algoritma
yang
dapat
digunakan
Klasifikasi
yang
dapat
dilakukan
adalah menentukan kondisi emosi seseorang berdasarkan pola perubahan yang terjadi pada pupil mata. Dalam penelitian Machine Learning to Differentiate Between
Positive
Diameter algoritma
and
(Babiker, k-Nearest
et
Negative al.,
Neighbor
Emotions 2015)
Using
Pupil
diketahui
bahwa
digunakan
untuk
proses
pengklasifikasian emosi. Pada penelitian ini pelatihan 7
data
hanya
penelitian
digunakan ini
tingkat
dinilai
kurang
konstanta maksimal
k=5.
karena
Pada hanya
menggunakan percobaan untuk satu nilai konstanta saja. Dalam sebuah penelitian Classification of Emotions in Indonesian Texts Using K-NN Method (Arfin & Purnama, 2012).Dalam
penelitian
tersebut
mendeteksi
emosi
berdasarkan pola kalimat yang terbentuk dalam bahasa indonseia.Dalam penelitian ini menggunakan 7 variasi nilai k dalam penelitian. Dimana dalam penelitiannya nilai precision and recall terbaik didapatkan dengan menggunakan nilai k pada angka 40. Dalam penelitian tersebut mendapatkan akurasi tertinggi pada nilai k=40. Dapat disimpulkan bahwa nilai k berpengaruh besar pada peningkatan
akurasi
dalam
proses
pengklasifikasian
dengan algoritma k-Nearest Neighbor. Penelitian lain juga melakukan pengujian terhadap pola
perubahan
pola
pupil
mata
terhadap
rangasangan
emosi. Pada penelitian yang berjudul Neural Networks for Emotion Recognition Based on Eye Tracking Data (Aracena, et al., 2004). Pada penelitian tersebut mendeteksi polapola
perubahan
yang
terjadi
pada
pupil
mata
dengan
menggunakan kelas yang dibentuk berdasarkan data EEG. Penggunaan
data
pada
EEG
berfungsi
untuk
menentukan
kondisi yang dialami subjek penelitian. Pada penelitian ini digunakan pupilometry sebagai tools pengambilan data pola pupil mata. Musik merangsang
merupakan kondisi
salah emosi
satu
aspek
seseorang.
yang Pada
dapat sebuah
penelitian yang berjudul The Eye is Listening: MusicInduced
Arousal
and
Individual 8
Differences
Predict
Pupillary Responses mengatakan respon pupil mata dapat menunjukkan kondisi emosi seseorang. Pada penelitian ini menggunakan 15 subjek wanita sebagai subjek penelitian. Diameter pupil mata akan bereaksi terhadap rangsangan emosi selama 0,2 detik (Aracena, et al., 2004). 2.2. Landasan Teori Berdasakarkan mengenai
penelitian
“Pendeteksi
menggunakan
Algoritma
teori-teori
yang
yang
Emosi
melalui
k-Nearest
mendukung
akan
dilakukan
pupil
Neighbor”
penelitian
mata
diperlukan
ini.
Beberapa
teori yang bersangkutan dengan penelitian ini, sebagai berikut : 2.2.1. Emosi
Kata emotion,
emosi dari
kegembiraan.
berasal kata
Selain
dari
bahasa
Prancis
yang
berarti
emouvoir,
itu
emosi
juga
berasal
dari
bahasa Latin emovere yang berarti “luar” dan movere yang berarti “bergerak”. Lahey (2003) mengatakan emosi
merupakan
suatu
hal
yang
dihasilkan
oleh
fisiologis yang menyebabkan munculnya reaksi emosi. Reaksi ini tidak dapat dibaca namun hanya dapat dilihat dari ekspresinya dan perilaku saja. Sifat dan intensitas emosi sangat berkaitan erat dengan aktivitas kognitif (berfikir) manusia sebagai
hasil
persepsi
terhadap
situasi
yang
dialaminya. Reaksi manusia terhadap hadirnya emosi, disadari atau tidak memiliki dampak yang bersifat membangun
atau
dikatakan
emosi
terhadap
kondisi
sendiri,
tetapi
merusak. tidak diri
Dengan hanya
sendiri
juga
upaya 9
demikian
merupakan maupun
pencapaian
bisa reaksi
luar
diri
ke
arah
pembentukan diri menuju hidup yang transendental (spiritual). Berdasarkan disimpulkan
definisi
bahwa
emosi
diatas
adalah
maka
respon
dapat
kognitif,
perasaan, dan perilaku yang muncul akibat stimulus tertentu. Emosi manusia secara umum terdiri dari 2 bagian sebagai berikut : a. Emosi Positif Emosi positif adalah emosi yang mampu menghadirkan perasaan
positif
mengalaminya.
terhadap
Hill
(2011)
seseorang mengatakan
yang bahwa
terdapat tujuh macam emosi yang masuk dalam emosi positif,
diantaranya
adalah
hasrat,
keyakinan,
cinta, seks, harapan, romansa dan antusiasme. b. Emosi Negatif Emosi negatif merupakan emosi yang selalu identik dengan
perasaan
tidak
menyenangkan
dan
dapat
mengakibatkan perasaan negatif pada orang yang mengalaminya. Pada umumnya, orang yang mengalami emosi negatif cenderung lebih memperhatikan emosiemosi yang bernilai negatif, seperti sedih, marah, cemas,
tersinggung,
benci,
jijik,
prasangka,
takut, curiga dan lain sebagainya. Emosi dapat diekspresikan dalam bentuk verbal atau nonverbal. Ekspresi emosi yang paling mudah dilihat adalah ekspresi nonverbal. Ekpresi nonverbal dapat dilihat dari perubahan raut wajah, dari mata, bibir, dahi, dan pipi. Melalui ekspresi wajah kita dapat melihat seseorang sedang mengalami kondisi emosi tertentu.
10
2.2.2. k-Nearest Neighbor (kNN)
K-Nearest
Neighbor
instance-based merupakan
salah
(KNN)
learning. satu
termasuk
Algoritma
teknik
lazy
kelompok ini
juga
learning.
KNN
dilakukan dengan mencari kelompok k objek dalam data training yang paling dekat dengan objek pada data baru atau data testing. Algoritma k-Nearest Neighbor adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Nearest Neighbor
adalah
pendekatan
untuk
mencari
kasus
dengan menghitung kedekatan antara kasus baru dan kasus lama yaitu berdasarkan pada pencocokan bobot dari sejumlah fitur yang ada. Untuk mendefinisikan jarak antara dua titik yaitu titik pada data training dan titik pada data testing maka digunakan rumus Euclidean.
Gambar 2.1. Persamaan Euclidian pada k-Nearest Neighbor. Pada gambar 3.1 merupakan persamaan Euclidian pada k-Nearest Neighbor. Dapat dijelaskan D adalah jarak antara titik training yaitu x dan titik testing yaitu
y
yang
akan
diklasifikasikan.
Pada
fase
training, algoritma ini hanya melakukan penyimpanan vektor-vektor fitur dan klasifikasi data training sample. Pada fase klasifikasi, fitur-fitur yang sama dihitung untuk testing data (yang klasifikasinya tidak diketahui). Jarak dari vektor baru yang ini
11
terhadap seluruh vektor training sample dihitung dan sejumlah k buah yang paling dekat diambil. Nilai
k
yang
terbaik
untuk
algoritma
ini
tergantung pada data secara umumnya, nilai k yang tinggi akan mengurangi efek noise pada klasifikasi, tetapi membuat batasan antara setiap klasifikasi menjadi lebih kabur. Nilai k yang bagus dapat dipilih dengan
optimasi
menggunakan
parameter,
misalnya
cross-validation.
klasifikasi
diprediksikan
Kasus
dengan di
mana
berdasarkan
data
pembelajaran yang paling dekat (dengan kata lain, k = 1) disebut algoritma nearest neighbor. Ketepatan algoritma k-NN ini sangat dipengaruhi oleh ada atau tidaknya fitur-fitur yang tidak relevan, atau jika bobot
fitur
tersebut
tidak
setara
dengan
relevansinya terhadap klasifikasi. Riset terhadap algoritma memilih
ini
dan
sebagian
memberi
besar
bobot
membahas
terhadap
bagaimana
fitur,
agar
performa klasifikasi menjadi lebih baik. Berikut ini adalah diagram flow chart algoritma k-NN :
12
Gambar 2.2. Langkah Algoritma k-Nearest Neighbor. Pada proses k-Nearest Neighbor proses training dari algoritma ini terdiri dari memasukan vektor dan label dari citra yang akan dilatih. Pada proses klasifikasi titik permintaan yang tidak memiliki label ditugaskan sebagai label k terdekat. Setelah setiap
citra
dikonversi
real. Setiap jarak untuk
k-Nearest
yang
menjadi paling
Neighbor.
bilangan umum
Berikut
vektor
digunakan
ini
adalah
visualisasi proses klasifikasi menggunakan kNN.
13
Gambar 2.3. Visualisasi Klasifkasi Menggunakan kNN. Gambar 2.2 merupakan visualisasi dari kNN dalam mengklasifikasi data. Pada gambar terlihat objek lingkaran berwarna hijau merupakan data testing yang akan diuji berdasarkan data training. Data training merupakan objek persegi berwarna biru, belah ketupat berwarna
merah,
dan
segitiga
berwarna
ungu.
Sedangkan untuk nilai k yang digunakan adalah a, b, dan c. Titik a merupakan hasil klasifikasi dengan k bernilai 1, sesuai dengan konsep dari algoritma kNearest Neighbor menentukan titik mayoritas jarak terdekat
sesuai
dengan
nilai
k
yang
telah
ditentukan, maka denngan nilai k sama dengan 1 data testing
akan
terklasifikasikan
menjadi
objek
persegi berwarna biru. 2.2.3. Trainable Weka Segmentation
Trainalbe
Weka
Segementation
merupakan
plugin yang terdapat pada Fiji yang digunakan untuk menyeleksi menggunakan
fitur-fitur beberapa
pada
sebuah
algoritma.
citra
Trainable
dengan Weka
Segmentation ini dapat digunakan untuk mengekstraksi 14
sebuah citra menjadi data numeris yang dapat diproses dalam Weka. Ekstraksi numeris yang dapat dilakukan Fiji adalah mengekstraksi berupa data numeris RGB jika gambar berupa RGB. Sedangkan untuk tipe gambar grayscale maka Fiji akan mengekstraksi menjadi data numeris
berupa
double
precision
numerical
(Arganda-Carreras,, et al., 2016). Segmentation
memiliki
beberapa
digunakan mengekstraksi
data
Trainable Weka
fitur
yang
dapat
data numeris dari sebuah
citra. Berikut ini adalah feature extraction yang dapat digunakan dalam Trainable Weka Segmentation. a. Edge Features. Edge Features ini berfungsi untuk mengekstraksi fitur garis-garis dalam sebuah citra. Untuk melihat pola garis
yang
digunakan
terbentuk fitur
dalam
ini.
sebuah
Didalam
gambar
dapat
Trainable
Weka
Segmentation terdapat beberapa metode yang digunakan untuk melakukan ekstraksi tersebut, yaitu Laplacian
and
Sobel
filters,
difference
of
Gaussians,
Hessian matrix eigenvalues, and Gabor filters. b. Texture Extraction Texture
Extraction
mengekstraksi citra.
Dimana
memiliki
tekstur Texture
yang
fungsi menyusun
Extraction
untuk sebuah
ini
dapat
digunakan untuk proses pengenalan pola-pola yang terdapat dalam sebuah citra. Didalam Trainable Weka
Segmentation
terdapat
beberapa
metode
yang
digunakan untuk melakukan ekstraksi tersebut, yaitu
minimum,
maximum,
median,
entropy, structure tensor. c. Noise Reduction Filter
15
mean,
variance,
Noise Reduction Filter
memiliki fungsi untuk
mengurangi
sebuah
noise
dalam
citra.
Didalam
Trainable Weka Segmentation terdapat beberapa metode yang digunakan untuk melakukan ekstraksi tersebut,
Gaussian
yaitu
blur,
bilateral
filter,
Anisotropic diffusion, Kuwahara, and Lipschitz. 2.2.4. Waikato Environment for Knowledge Analysis
(WEKA) WEKA
merupakan
perangkat
lunak
yang
menyediakan layanan untuk melakukan pengolahan data dalam data mining. Perangkat lunak ini berbasis open source dan dibuat dan
dikembangkan
Selandia Baru.
menggunakan oleh WEKA
Java.
WEKA
Universitas merupakan
dibuat
Waikato
perangkat
di
lunak
gratis yang tersedia dibawah General Public License. Perangkat
ini
preprocessing
memiliki data,
fasilitas
untuk
classification,
melakukan
regression,
clustering, association rules, dan visualiszation. Di dalam WEKA terdapat library kelas Java yang lengkap untuk melakukan implementasi pembelajaran dan algoritma
metode mesin
data mining. Kemudahan
dari aplikasi WEKA ini adalah library kelas yang ada dapat
digunakan
secara
bebas
pada
aplikasi
lain.
Bahkan, kelas yang ada pada WEKA dapat dijalankan pada
aplikasi
berbasis
web.
Hal
ini memungkinkan
pengguna untuk menerapkan berbagai teknik dan metode data mining pada weka untuk data yang inigin mereka olah sendiri tanpa memperhatikan platform komputer yang digunakan. (Witten, Frank & Hall, 2011).
16
Gambar 2.4. User Interface dari Aplikasi Weka WEKA mulai dikembangkan sejak tahun 1994 dan telah menjadi software data mining open source yang paling popular. WEKA mempunyai kelebihan seperti banyak algoritma data mining dan machine learning, kemudahan dalam penggunaannya, selalu up- to-date dengan algoritma-algoritma yang baru. Ian H. Witten merupakan WEKA. of
latar
Beliau
Waikato,
Library, metode
merupakan New
Text
Information
belakang
Retrieval.
pemilihan
di Universitas
profesor
Zealend, Mining,
dibalik kesuksesan
yang
menekuni Digital
Machine Pada
variable
Learning
Weka dari
dan
ada
beberapa
suatu
dataset,
diantaranya BestFirst, ExhautiveSearch, FCBFSearch, GeneticSearch,
GreedyStepwise,
RaceSearch,
RandomSearch, Rankerdan, RankerSearch. Metode atau Teknik yang digunakan Weka adalah Predictive dan Descriptive data
karena
preprocessing,
Weka
mendukung
clustering,
teknik-teknik
classification,
regression, visualization, dan feature Reduction. Semua teknik Weka adalah didasarkan pada asumsi 17
bahwa data tersedia sebagai flat file tungggal atau hubungan, dimana setiap titik data digambarkan oleh sejumlah tetap atribut (biasanya, atribut numeric atau nominal, tetapi beberapa jenis atribut lain juga
didukung).
WEKA
memiliki
empat
jenis
test
option yang dapat digunakan untuk melakukan proses klasifikasi. Proses yang ditangani adalah proses pelatihan dan pengujian. Keempat jenis test option tersebut yaitu: a. Use Training Set Klasifikasi untuk
ini
melakukan
akan
menggunakan
pelatihan.
satu
Kemudian
data
seluruh
data yang dilatih sebelumnya juga digunakan untuk proses pengujian. b. Supplied test set Klasifikasi ini dilakukan evaluasi dengan cara memprediksi
seberapa
baik
satu
dataset
yang
diambil dari sebuah data tertentu yang memang sudah
disediakan
pelatihan
untuk
akan
menggunakan
pengujian.
Proses
terlebih
dahulu
kemudian
proses
dilakukan
data
latih
pengujian akan dilakukan dengan data uji yang berbeda
dengan
data
yang
dilatih
pada
klasifikasi. c. Cross Validation Klasifikasi
ini
cross-validation yang
tertentu
manual.Pada
dilakukan dan
evaluasi
menggunakan
yang
cross-validation
dapat akan
dengan
jumlah
fold
diinputkan ada
pilihan
berapa fold yang akan digunakan. Nilai fold awal 18
yang diberikan adalah 10. Proses pengujian akan dilakukan
sebanyak
nilai
fold
yang
diberikan
serta akan dibentuk subset sebanyak nilai fold. Kemudian
proses
menggunakan sisany
pengujian
sebuah
akan
subset
akan
yang
dilakukan
terbentuk
dan
digunakan
untuk
proses
dilakukan
evaluasi
dengan
pelatihannya. d. Precentage Split Klasifikasi
ini
melakukan pembagian data antara data uji dan data latih
pada
prosentase.
satu
dataset
Prosentase
dengan
yang
menggunakan
diinputkan
akan
digunakan untuk proses pelatihan dan sisanya akan digunakan
untuk
proses
pengujian.
Proses
ini
biasanya dilakukan dengan perbandingan 2/3 data untuk
pelatihan dan 1/3
proses pengujian.
19
data digunakan untuk