Volume 2, Edisi 4, Agustus 2016
SISTEM TEMU KEMBALI CITRA DENGAN HISTOGRAM FUZZY DAN CHI-SQUARE DISTANCE 1
1,2
Raditya Hendrawan, 2Dwi Puspitasari
Program Studi Teknik Informatika, Jurusan Teknologi Informasi, Politeknik Negeri Malang 1
[email protected], 2
[email protected]
Abstrak Temu kembali citra berbasis query teks telah jamak digunakan di dalam suatu sistem temu kembali citra. Namun temu kembali dengan query teks tidak efektif apabila deskripsi citra tidak mengambarkan konten yang terkandung dalam citra. Dari latar belakang tersebut diajukan sebuah solusi berupa suatu sistem temu kembali citra berwarna menggunakan metode histogram warna fuzzy dan chi-square distance. Sistem ini menggunakan konten berupa citra sebagai query sebagai acuan temu kembali citra yang mirip dari segi komposisi warna. Histogram warna fuzzy didapatkan dengan mengelompokkan warna dengan pendekatan fuzzy. Kemudian histogram warna fuzzy dari citra query dan citra koleksi melalui uji kemiripan dengan formula chi-square distance. Sistem yang diuji mampu menemukan kembali citra yang sama serta mampu menemukan citra yang mirip dalam koleksi citra homogen dan heterogen dengan kesesuaian terhadap pengamatan manusia masing-masing sebesar 89,5% dan 78%. Kata Kunci : Temu kembali citra, histogram warna fuzzy, chi-square distance
1
Pendahuluan
Teknologi media penyimpanan yang semakin mendukung tersimpannya data citra digital dengan besar di dalam media penyimpanan lokal maupun dalam server. Penyimpanan citra digital dalam jumlah besar ini memberikan kesulitan dalam pengelolaannya khususnya pada pecarian atau temu kembali(retrieval). Sistem pencarian pada umumnya berbasis teks dengan merujuk pada nama file citra. Namun pencarian sulit jika sebagian besar nama file citra dalam database tidak mewakili gambar yang terkandung dalam citra tersebut seperti jika citra tersebut berasal dari kamera digital. Salah satu metode pencarian citra adalah temu kembali citra berbasis konten (Content Based Image Rerieval). Dengan metode ini pecarian citra dilakukan dengan mecocokkan atribut-atribut yang terkandung dalam citra tersebut. Salah satu atribut yang dapat digunakan dalam temu kembali citra adalah atribut warna. Metode yang digunakaan untuk merepresentasikan atribut warna adalah Histogram warna. Histogram adalah metode statistik, yang menggambarkan persebaran warna dalam sebuah citra. Kelemahan dari histogram warna konvensional adalah metode ini tidak mempertimbangkan persamaan warna pada bin yang berbeda dan perbedaan pada bin yang sama(Han J & Ma KK 2002). Untuk kelemahan histogram warna konvensional dalam persepsi kesamaan warna pada bin maka berkembang suatu metode lain yang disebut
170 | H a l a m a n
histogram warna fuzzy. Histogram warna fuzzy adalah salah satu cara yang dapat digunakan untuk mengurangi bin warna. Histogram warna fuzzy memanfaatkan logika fuzzy serta sistem inferensi fuzzy dalam implementasinya. Sistem inferensi fuzzy berperan dalam penentuan golongan bin warna tiap pixel. Untuk membandingkan persamaan dari citra dibutuhkan suatu alat ukur yang membandingkan histogram. Terdapat banyak metode yang telah digunakan untuk membandingkan histogram , salah satunya adalah Chi-Square distance. Chi-Square distance biasa digunakan pada ilmu statistika sebagai metode untuk uji kecocokan (goodest of fit test) antara frekuensi sampel teramati dengan frekuensi sampel harapan yang dalam penelitian ini digunakan untuk histogram query dan histogram citra dalam database. Dari uraian di atas, maka pada penelitian ini dikembangkan suatu sistem temu kembali citra berwarna menggunakan histogram fuzzy dan chisquare distance. Sistem mampu menerima masukan (query) berupa citra berwarna yang ingin dicari dan menampilkan sejumlah citra yang memiliki kemiripan komposisi warna dengan citra masukan. Diharapakan sistem ini akan membantu pengelolaan citra dalam jumlah besar dalam hal temu kembali atau pencarian. 2 Landasan Teori 2.1 Citra Digital Citra Digital merujuk pada pemrosesan gambar 2 dimensi menggunakan komputer. Dalam konteks
Jurnal Informatika Polinema
yang lebih luas, pengolahan citra digital mengacu pada pemrosesan setiap data 2 dimensi. Citra digital merupakan sebuah larik (array) yang berisi nilai-nilai real maupun komplek yang direpresentasikan dengan deretan bit tertentu (Putra,2010). Suatu citra didefinisikan sebagai fungsi f(x,y) berukuran M baris dan N kolom, dengan x dan y adalah koordinat spasial, dan amplitudo f dan titik koordinat (x,y) dinamakan intensitas atau tingkat keabuan dari citra pada titik tersebut. Apabila nilai x,y, dan nilai amplitudo f secara keseluruhan berhingga (finite) dan bernilai diskrit maka dikatakan bahwa citra tersebut adalah citra digital. Gambar 1 menunjukkan posisi koordinat citra digital.
Gambar 1 Koordinat citra digital Citra digital dapat ditulis dalam bentuk matrik sebagai berikut.
(1) Nilai pada suatu irisan baris dan kolom (pada posisi x,y) disebut dengan picture elements, image elements, pels, atau pixels. Istilah terakhir (pixel) paling sering digunakan pada citra digital. 2.2
Warna Warna sebagai persepsi yang ditangkap sistem visual terhadap panjang gelombang cahaya yang dipantulkan oleh objek. Secara fisik warna adalah reaksi otak terhadap stimulasi visual tertentu (Ford dan Roberts,2008). Pada retina mata, warna dibentuk berdasrakan tiga unsur cahaya yaitu merah, hijau dan biru, biasa disebut tri-chromatic, melalui gabungan ketiga cahaya tersebut, otak menerjemahkan berbagai macam warna. Sistem penggunaan tiga unsur cahaya dalam merepresentasikan warna secara fisik diadopsi juga dalam berberapa ruang warna lain di bidang teknologi komputer. Model warna adalah model standard untuk mendefinisikan dan menampilkan warna pada komputer, televisi dan perangkat elektronik lain.
ISSN: 2407-070X
Beberapa model warna yang digunakan sekarang antara lain : Tabel 2.1 Tabel Model Warna Model Warna Deskripsi RGB Red(Merah), Green(Hijau), dan Blue(Biru), model warna pokok adaptif yang digunakan pada sistem display CMY(K) Cyan, Magenta, Yellow (dan Hitam). Sebuah model warna substraktif yang digunakan pada mesin printer. YcbCr Luminasi (Y) dan Dua Komponen kromasiti (Cb dan Cr). Digunakan dalam siaran geombang televisi. HIS (HSL) Hue, Saturasi dan intensitas. Berdasarkan persepsi manusia terhadap warna. CIE L*a*b L untuk luminance (kecerahan) dan a, b untuk dua komponen warna yang berbeda. Model warna yang didasarkan pada representasi konseptual manusia. Atribut warna inilah yang menjadi parameter pada penelitian ini. Kesamaan komposisi warna menjadi acuan penghitungan kemiripan suatu citra query dengan citra dalam database. Pada penelitian ini warna RGB pada citra dikonversi menjadi model HSL. Proses konversi model warna RGB ke model warna HSL dilakukan untuk mempermudah ektraksi, karena model warna HSL hanya menggunakan satu parameter untuk menentukan warna yaitu H(Hue). 2.3 Konsep Temu Kembali Citra Temu kembali citra bebasis konten (Content Base Image Retrieval) adalah suatu teknik untuk mencari citra dari basis data citra yang besar menggunakan konten visual (atribut/fitur) citra menurut kriteria yang diinginkan. Temu kembali citra berbasis konten mulai dikenal sejak tahun 1990-an, namun sejarah temu kembali citra dimulai pada tahun 1970-an. Proses dalam sistem temu kembali citra berbasis konten terdapat dalam dua tahapan, yaitu: 1. Ektraksi atribut Atribut yang diperlukan dalam citra, diekstrak menggunakan metode tertentu. Atribut bisa berupa warna, tekstur, bentuk dan lainnya. 2. Pencocokan Atribut citra kueri dan atribut masing-masing citra pada basis data dicocokkan satu-persatu. Pencocokan dilakukan dengan membandingkan kedua buah atribut. Jika selisih perbedaan sedikit, maka kedua citra dikatakan sama.
H a l a m a n | 171
Volume 2, Edisi 4, Agustus 2016
(O) dengan frekuensi yang diharapkan (E). Perbedaan tersebut meyakinkan jika harga dari chi square sama atau lebih besar dari suatu harga yang ditetapkan pada taraf signifikan tertentu (dari tabel χ2).
2.4 Histogram Warna Fuzzy Histogram warna konvensional menggolongkan warna-warna ke dalam banyak bin dan bin warna yang bertetangga memiliki perbedaan yang tidak signifikan. Perbedaan yang tidak signifikan ini namun berbeda bin ini menimbulkan permasalahan seperti adanya noise pada suatu citra menimbulkan perbedaan golongan bin. Permasalahan seperti ini dapat dikurangi dengan mengelompokkan warna yang hampir sama melalui sistem inferensi fuzzy. Histogram hasil sistem inferensi ini disebut histogram warna fuzzy. Sistem inferensi fuzzy berperan dalam penentuan golongan bin warna tiap pixel. Pada histogram warna fuzzy satu warna dapat masuk ke dalam lebih dari satu bin dengan derajat keanggotaan yang berbeda di setiap bin-nya.Untuk mengelompokkan warna dalam suatu bin, suatu warna akan dimasukkan ke dalam rumus keanggotaan fuzzy seperti yang terlihat pada tabel dibawah.
3. Analisis dan Perancangan Pada bagian ini akan ditunjukan desain dari sistem temu kembali citra yang dibangun 3.1 Analisis Dalam Sistem temu kembali citra ini memiliki dua proses utama yaitu: 1) Ekstraksi Citra Ekstraksi merupakan pengambilan informasi dari citra yang. Penelitian ini menggunakan warna sebagai atribut atau fitur diekstraksi. Ekstraksi warna pada penelitian ini dilakukan menggunakan pendekatan fuzzy ke dalam bentuk histogram, metode ini disebut dengan histogram fuzzy. Dari histogram fuzzy tersebut akan didapatkan komposisi warna dari citra. Proses konversi model warna RGB ke model warna HSL dilakukan untuk mempermudah ektraksi, karena model warna HSL hanya menggunakan satu parameter untuk menentukan warna yaitu H(Hue). Sedangkan S(Saturation) digunakan untuk mementukan kemurnian warna atau kekeruhan warna(abu-abu) dan L(Lightness) digunakan untuk menetukan tingkat percampuran warna putih dalam warna. Untuk mengelompokkan warna. Hue dibagi menjadi 6 warna dalam fuzzy set. Berikut ini adalah Fuzzy set dari variabel Hue:
Tabel 1 Tabel Rumus Keanggotaan Fuzzy Fungsi Rumus
[ , , ]= ; ≤ 0;
≤ ≥
(2)
[ , , ]= 0; ≤ ;
≤
≤
;
≤
≤
(3)
[ , , ]= 0; ;
≤
Gambar 2 Fuzzy Set Variabel Hue Dari fuzzy set diatas suatu warna dikelompokkan dalam suatu bin warna dengan rumus fuzzy(Tabel 1 Tabel Rumus Keanggotaan Fuzzy). Namun dari fuzzy set variable Hue diatas belum dapat mengelompokkan warna putih, hitam, dan abu-abu. Disinilah digunakan Saturation dan Lightness sebagai parameter. Dibuatlah rules sebagai berikut:
1; (4) 2.5 Chi Square Distance Uji chi square (dilambangkan dengan "χ2" dari huruf Yunani "Chi" dilafalkan "Kai") digunakan untuk menguji dua kelompok data baik variabel independen maupun dependennya berbentuk kategorik atau dapat juga dikatakan sebagai uji proporsi untuk dua peristiwa atau lebih, sehingga datanya bersifat diskrit. Dasar uji kai kuadrat itu sendiri adalah membandingkan perbedaan frekuensi hasil observasi
172 | H a l a m a n
Warna Putih Hitam Abu-abu
Tabel 2 Tabel Rules warna Rules L>95 L<=10 dan S <25 L>10 dan S<10
Akan timbul masalah jika pada uji kemiripan dibandingkan dua citra dengan ukuran yang berbeda. Hal tersebut akan menimbulkan perbedaan signifikan pada setiap citra. Maka dari itu perlu penyamaan jumlah frekuensi dari histogram warna atau dinamakan normalisasi. Normalisasi dilakukan dengan membuat presentase disribusi warna dari tiap
Jurnal Informatika Polinema
ISSN: 2407-070X
bin. Sehingga setiap citra akan memiliki jumlah frekuensi pada histogram sebesar 100. 2) Uji Kemiripan Sedangkan pada uji kemiripan, pada penelitian ini menggunkan metode chi square distance, yang merupakan pengembangan dari chi-square test yang biasa digunakan menghitung kesesuaian suatu data. Histogram dari citra query akan dibandingkan dengan histogram citra dalam basis data hingga ditemukan jarak dari keduanya. Rumus chi-square yang merupakan uji statistik yang biasa digunakan untuk membandingkan data yang diamati dengan data yang kita harapkan dikembanagkan menjadi chi-square distance yang menujukkan jarak kesesuaian data diamati dengan data diharapkan seperti rumus dibawah ini:
(5) Keterangan: C = nilai chi square distance pi = Citra 1 qj = Citra 2 K = Jumlah bin warna hi(k) = Frekuensi histogram citra 1 ke-k hj(k) = Frekuensi histogram citra 2 ke-k
Proses
Mulai Citra Query
Penggolongan Warna dengan Fuzzy Uji Kemiripan (chi-square)
Selesai
Histogram Warna Fuzzy
Semua citra telah diuji Citra Hasil
Preproses
Database
Mulai Citra untuk databse
Penggolongan Warna dengan Fuzzy
Histogram Warna Fuzzy
Gambar 3 Gambaran Kerja Sistem 3.2 Perancangan Proses Ada dua proses utama pada sistem ini yaitu ektraksi dan uji kemiripan. Pada proses ekstraksi, masukan berupa citra digital yang berektensi atau berformat jpeg, png, maupun gif. Dengan metode fuzzy, setiap warna dikelompokkan pada bin sehingga menjadi histogram warna.
Dari rumus diatas akan ditemukan suatu angka yang menunjukkan jarak kemiripan antara dua citra. Semakin mirip citra semakin mendekati 0, sebaliknya semakin tidak mirip suatu citra jarak akan semakin besar. Jalannya sistem temu kembali citra pada penelitian ini sendiri, terbagi lagi menjadi dua tahap. 1) Tahap pertama adalah preproses yaitu persiapan data. Tahap ini merupakan tahap persiapan, dimana citra-citra yang akan digunakan sebagai database diunggah untuk dilakukan proses ekstraksi. Kemudian hasil ekstraksi berupa histogram akan disimpan dalam database Mysql, sehingga mempercepat proses temu kembali informasi. 2) Tahap kedua adalah proses yaitu tahap dimana akan dimunculkan hasil dari temu kembali citra. Pada tahap ini citra query akan diekstraksi ke bentuk histogram fuzzy kemudian akan melalui proses uji kemiripan dengan histogram-histogram dari citra yang telah tersimpan dalam database Mysql di tahap sebelumnya. Alur sistem sendiri digambarkan oleh gambar berikut:
Simbol 1 Flowchart Ekstraksi Pada proses uji kemiripan, masukan berupa histogram fuzzy dari citra query dibandingkan dengan histogram fuzzy dari citra koleksi dalamdatabase. Uji kemiripan dilakukan dengan perhitungan chi-square distance hingga didapatkan keluaran berupa angka perbedaan kedua citra.
H a l a m a n | 173
Volume 2, Edisi 4, Agustus 2016
START
Histogram Citra Query , Histogram Citra Database
Perhitungan Chi Square Distance
Hasil Chi Square Distance
END
Sistem dan Responden A sama. Sedangkan koefisien -1 menunjukkan urutan yang terbalik antara urutan Sistem dan urutan Responden A. 4.2.1 Pengujian dengan Koleksi Citra Homogen Pengujian dengan koleksi citra homogen(sejenis) dimaksudkan untuk mengetahui kemampuan sistem temu kembali dalam menemukan kembali citra yang benar mirip dalam koleksi citra yang sejenis. Tabel 5 Tabel Hasil Pengujian Sistem dengan Koleksi Citra Homogen Rangking Query 1 2 3 4 5 D E B C A
Simbol 2 Flowchart Uji Kemiripan 4. Uji Coba dan Pembahasan Pengujian dilakukan untuk menguji keakuratan dari sistem. Untuk itu dilakukan beberapa percobaan terhadap sistem dan juga survey untuk membandingkan hasil pengamatan manusia dengan hasil temu kembali dari sistem. 4.1 Pengujian untuk Menemukan Citra yang Sama Pada pengujian ini dilakukan untuk mengetahu kemampuan sistem menemukan citra yang sama namun dengan perlakuan khusus pada citra query, diantaranya: Tabel 4 Tabel Pengujian untuk Menemukan Citra yang Sama No Perlakuan pada Hasil yang Hasil citra query diharapkan Pengujian 1 Citra query asli Chi square Sesuai distance 0 harapan 2 Citra query Chi square Sesuai diperkecil distance harapan mendekati 0 3 Citra query Chi square Sesuai dibalik distance harapan mendekati 0 4 Citra query Chi square Sesuai dipotong distance harapan mendekati 0 4.2 Pengujian untuk Menmukan Citra yang Mirip Pada pengujian ini, dibutuhkan pembanding hasil dari sistem yaitu hasil pengamatan atau intuisi manusia. Dengan begitu dapat diketahui berapa nilai kesesuaian harapan hasil temu kembali dengan hasil temu kembali yang diberikan oleh sistem. Kesesuaian harapan dan hasil dihitung menggunakan rumus korelasi kendall tau. Koefisien Korelasi Kendall Tau sendiri memiliki range -1 hingga 1. Koefisien 1 menunjukkan bahwa urutan
174 | H a l a m a n
Tabel 6 Tabel Hasil Responden dengan Koleksi Citra Homogen Rangking Responden T 1 2 3 4 5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
D D D D D D E D D D D D D D D D D D D D
E B E B B E B E B B E B B B E B B E B E
B E B E E B D B E E B E E E B E E B E B
C A C C C A A C A C C C C A C C A A C A
A C A A A C C A C A A A A C A A C C A C
1 0,6 1 0,8 0,8 0,8 0,4 1 0,6 0,8 1 0,8 0,8 0,6 1 0,8 0,6 0,8 0,8 0,8
RATA-RATA= 0,79 Didapatkan rata rata Koefisien Korelasi Kendall Tau sebesar 0,79 atau 89,5% dalam skala prosentase menandakan sistem secara baik mampu memberikan hasil yang sesuai dengan pengamatan manusia di dalam koleksi citra homogen. 4.2.2 Pengujian dengan Koleksi Citra Heterogen Pengujian dengan koleksi citra heterogen bertujuan untuk mengetahui kemampuan sistem temu kembali dalam menemukan kembali citra yang benar mirip dalam koleksi citra yang berbeda beda jenis. Tabel 7 Tabel Hasil Pengujian Sistem dengan Koleksi Citra Heterogen Rangking Query 1 2 3 4 5 D E A B C
Jurnal Informatika Polinema
ISSN: 2407-070X
Tabel 8 Tabel Hasil Responden dengan Koleksi Citra Homogen Rangking Responden T 1 2 3 4 5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
C C C C C C C C C A C A C C C C C C C C
D D D D D D A D D C D C D A D D D D D D
A B B B A A D A B D B D A D E A A A A A
E A A A B E B B A B A E E B B E E B B B
B E E E E B E E E E E B B E A B B E E E
RATA-RATA=
0,8 0,4 0,4 0,4 0,6 0,8 0,4 0,6 0,4 0,2 0,4 0,4 0,8 0,4 0,8 0,8 0,8 0,6 0,6 0,6
0,56
Didapatkan rata rata Koefisien Korelasi Kendall Tau sebesar 0,56 atau 78% dalam skala prosentase menandakan sistem secara cukup baik mampu memberikan hasil yang sesuai dengan pengamatan manusia di dalam koleksi citra heterogen. 5. Kesimpulan dan Saran 5.1 Kesimpulan Dari semua uraian yang sudah dibahas dapat ditarik kesimpulan sebagai berikut: 1) Histogram warna fuzzy dapat dibentuk dengan merubah model warna dari citra, dari RGB menjadi HSL. Histogram warna fuzzy dapat digunakan dengan baik untuk merepresentasikan citra dalam suatu sistem temu kembali untuk menyederhanakan suatu histogram konvensional. 2) Formula chi square distance yang digunakan untuk menghitung uji kemiripan memberikan hasil yang reliable. Namun rumus ini tidak memberikan angka kemiripan namun menunjukkan angka perbedaan dari citra. 3) Pada proses pengujian sistem dapat diperoleh hasil antara lain: a. Sistem mampu menemukan kembali citra yang sama b. Sistem mampu menemukan kembali citra yang sama dari citra yang telah diperkecil c. Sistem mampu menemukan kembali citra yang sama dari citra yang telah dibalik d. Sistem mampu menemukan kembali citra yang sama dari citra yang telah dipotong
e. Sistem mampu menemukan kembali citra yang mirip dalam koleksi citra yang homogen. f. Sistem mampu menemukan kembali citra yang mirip dalam koleksi citra yang heterogen. 5.2 Saran 1) Sistem ini mengenali komposisi warna citra secara keseluruhan. Kedepannya diharapkan selain mengenali komposisi warna secara keseluruhan, sistem temu kembali ini dapat mengenali komposisi warna citra secara parsial. 2) Sistem temu kembali di penelitian ini hanya mampu mengenali citra melalui komposisi warna, diharapkan kedepannya sistem temu kembali ini dapat mengenali citra melalui tekstur atau bentuk obyek sehingga hasil temu kembali dapat lebih akurat. Daftar Pustaka: El-Feghi, Et all. 2007. Content-Based Image Retrieval Based on Efficient Fuzzy Color Signature,Canada: Electrical and Computer Engineering, University of Windsor. Frediansah. dkk. 2012. “Sistem Temu Kembali Citra Berbasis Histogram Warna Fuzzy untuk Pencarian Citra Berwarna”, Journal of informatics and Technology, Vol 1, No1: 130136. Ford, A, and Roberts, A. 1998. Color Space Conversions [Online] http://poynton.com/PDFs/ coloureq.pdf [ 8 Januari 2015] Kusumadewi, S. dan Purnomo, H. 2010. Aplikasi Logika Fuzzy, Untuk Pendukung Keputusan Edisi 2. Yogyakarta: Graha Ilmu. Han, J and Ma, KK. 2002. Fuzzy Color Histogram andIts Use in Color Image Retrieval. IEEETransaction on Image Processing, vol. 11,no. 8. Murti, B.1996. Penerapan Metode Statistik Non Parametrik Dalam Ilmu-ilmu Kesehatan. Jakarta: PT.Gramedia Pustaka Utama. Putra, D.. 2010. Pengolahan Citra Digital. Yogyakarta: Penerbit Andi. Sutoyo,T. 2009. Teori Pengolahan Citra Digital. Yogyakarta: Penerbit Andi. Sabri, L. dan Hastono, SP. 2008. Statistik Kesehatan.Edisi Revisi. Jakarta: Rajawali Pers. Siegel, S. 1992. Statistik Non Parametrik Untuk Ilmuilmu Sosial. Jakarta: PT.Gramedia Pustaka Utama. Swandaru, A. dkk. 2013. “Sistem Temu Kembali Citra Berbasis Warna Menggunakan Transformasi Wavelet Haar dan Histogram Warna”, Journal of informatics and Technology, Vol 2, No 3 : 77-91.
H a l a m a n | 175