PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK
RIZKI PEBUARDI
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2008
PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
RIZKI PEBUARDI G64104016
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2008
ABSTRAK RIZKI PEBUARDI. Pengukuran Kemiripan Citra Berbasis Warna, Bentuk, dan Tekstur Menggunakan Bayesian Network. Dibimbing oleh AGUS BUONO dan YENI HERDIYENI. Penelitian ini mengimplementasikan dan menganalisis kinerja model Bayesian network dalam pengukuran kemiripan citra menggunakan informasi warna, bentuk, dan testur. Ciri warna diekstraksi menggunakan histogram-162, ciri bentuk diekstraksi menggunakan edge direction histogram, dan ciri tekstur diekstraksi menggunakan co-occurrence matrix. Pada model ini, nilai bobot untuk setiap informasi ditetapkan secara automatis oleh sistem berdasarkan informasi citra yang lebih dominan. Jika setiap karakteristik citra memiliki peluang kejadian pada setiap citra yang ada di basis data, maka peluang kemiripan setiap citra terhadap citra kueri dapat diketahui. Hal ini dapat dimodelkan menggunakan model Bayesian network. Pada model Bayesian network, karakteristik-karakteristik citra, citra kueri, dan citra-citra yang ada di basis data dapat dianggap sebagai node-node yang saling berhubungan membentuk sebuah model Bayesian network. Evaluasi hasil temu kembali menggunakan rataan precision untuk tiap tingkat recall. Secara umum, model Bayesian network dapat digunakan untuk meningkatkan nilai precision hasil temu kembali. Rata-rata peningkatan nilai precision dengan menggunakan model Bayesian network sebesar 8.28 %. Nilai rata-rata precision untuk semua citra di basis data dengan menggunakan model Bayesian network lebih tinggi daripada menggunakan informasi warna, bentuk, dan tekstur secara terpisah. Kata kunci: Bayesian network, histogram-162, edge direction histogram, co-occurrence matrix
Judul : Pengukuran Kemiripan Citra Berbasis Warna, Bentuk, dan Tekstur Menggunakan Bayesian Network Nama : Rizki Pebuardi NIM
: G64104016
Menyetujui: Pembimbing I
Pembimbing II
Ir. Agus Buono, M.Si., M.Kom. NIP 132045532
Yeni Herdiyeni, S.Si., M.Kom. NIP 132282665
Mengetahui: Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. drh. Hasim, DEA NIP 131578806
Tanggal Lulus :
RIWAYAT HIDUP Penulis dilahirkan di Bukittinggi pada tanggal 18 Februari 1986. Penulis merupakan anak keempat dari pasangan Herman dan Lismar. Pada tahun 2004, penulis lulus dari SMU Negeri 1 IV Angkat Candung, Agam, Sumatera Barat dan pada tahun yang sama penulis mendapat undangan seleksi masuk IPB (USMI) dan terdaftar sebagai mahasiswa Departemen Ilmu Komputer Fakultas MIPA Institut Pertanian Bogor hingga saat ini. Pada tahun 2007, penulis melaksanakan praktik kerja lapangan (PKL) di PT. Sigma Cipta Utama selama kurang lebih dua bulan. Selama mengikuti perkuliahan penulis pernah menjadi asisten Algoritme dan Pemrograman, Bahasa Pemrograman, Organisasi Komputer dan Penerapan Komputer.
PRAKATA Alhamdulillahi Rabbil ‘alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas segala curahan rahmat dan karunia-Nya sehingga tugas akhir ini dapat diselesaikan. Tugas akhir ini berjudul Pengukuran Kemiripan Citra Berbasis Warna, Bentuk, dan Tekstur Menggunakan Bayesian Network. Dalam menyelesaikan tugas akhir ini penulis mendapatkan banyak sekali bantuan, bimbingan dan dorongan dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terima kasih kepada semua pihak yang telah membantu dalam penyelesaian tugas akhir ini, antara lain: 1 Kedua orang tua tercinta, Apak dan Amak atas segala do’a, kasih sayang, dan dukungannya, 2 Da Em, Ni Si, Da Al, Deboy, dan keluarga tercinta yang selalu memberikan motivasi dalam penyelesaian tugas akhir ini, 3 Bapak Ir. Agus Buono, M.Si., M.Kom. dan Ibu Yeni Herdiyeni, S.Si., M.Kom. atas bimbingan dan arahannya selama pengerjaan tugas akhir ini, 4 Bapak Firman Ardiansyah, S.Kom., M.Si. selaku moderator dalam seminar dan penguji dalam sidang, 5 Imam, Gibtha, William, dan rekan-rekan Lab. CI atas kebersamaan, motivasi, dan bantuannya, 6 Riza, Hasan, Dhani, Wawan, dan teman-teman di Wisma Badenten atas kebersamaan dan dukungannya, 7 Endang dan Ina atas motivasinya, 8 Seluruh teman-teman seperjuangan Program Studi Ilmu Komputer angkatan 41 yang tidak dapat disebutkan namanya satu-persatu. Penulis juga mengucapkan terima kasih kepada semua pihak yang telah membantu selama penyelesaian tugas akhir ini yang tidak dapat disebutkan satu-persatu. Semoga penelitian ini dapat memberi manfaat.
Bogor,
September 2008
Rizki Pebuardi
DAFTAR ISI Halaman DAFTAR TABEL ................................................................................................................................. vi DAFTAR GAMBAR ............................................................................................................................. vi DAFTAR LAMPIRAN.......................................................................................................................... vi PENDAHULUAN .................................................................................................................................. 1 Latar Belakang .................................................................................................................................. 1 Tujuan ............................................................................................................................................... 1 Ruang Lingkup .................................................................................................................................. 1 Manfaat Penelitian ............................................................................................................................ 1 TINJAUAN PUSTAKA ......................................................................................................................... 1 Content Based Image Retrieval (CBIR) ............................................................................................ 1 Conventional Color Histogram (CCH) ............................................................................................. 1 Edge Detection .................................................................................................................................. 2 Sobel Edge Detector .......................................................................................................................... 2 Texture .............................................................................................................................................. 2 Co-occurrence Matrix ....................................................................................................................... 2 Formula Bayes .................................................................................................................................. 3 Bayesian Network.............................................................................................................................. 3 Recall dan Precision ......................................................................................................................... 4 METODE PENELITIAN ....................................................................................................................... 4 Ekstraksi Ciri..................................................................................................................................... 4 Ekstraksi Ciri Warna ................................................................................................................... 4 Ekstraksi Ciri Bentuk .................................................................................................................. 5 Ekstraksi Ciri Tekstur .................................................................................................................. 5 Model Bayesian Network .................................................................................................................. 6 Pengukuran Tingkat Kemiripan ........................................................................................................ 6 Evaluasi Hasil Temu Kembali........................................................................................................... 7 Perangkat Lunak dan Perangkat Keras .............................................................................................. 8 HASIL DAN PEMBAHASAN............................................................................................................... 8 Data Penelitian .................................................................................................................................. 8 Praproses Citra .................................................................................................................................. 8 Ekstraksi Ciri..................................................................................................................................... 8 Ekstraksi Ciri Warna ................................................................................................................... 8 Ekstraksi Ciri Bentuk .................................................................................................................. 8 Ekstraksi Ciri Tekstur .................................................................................................................. 8 Hasil Temu Kembali ......................................................................................................................... 8 Evaluasi Hasil Temu Kembali........................................................................................................... 9 KESIMPULAN DAN SARAN............................................................................................................. 12 Kesimpulan ..................................................................................................................................... 12 Saran ............................................................................................................................................... 12 DAFTAR PUSTAKA ........................................................................................................................... 12 LAMPIRAN ......................................................................................................................................... 13
v
DAFTAR TABEL Halaman 2 3 4 5 6 7
Perbandingan nilai recall precision pada kelas mobil ....................................................................... 9 Perbandingan nilai recall precision pada kelas singa........................................................................ 9 Perbandingan nilai recall precision pada kelas matahari terbenam ................................................ 10 Perbandingan nilai recall precision pada kelas tekstur ................................................................... 10 Perbandingan nilai recall precision pada kelas gajah ..................................................................... 10 Perbandingan nilai recall precision rata-rata semua citra di basis data........................................... 11 Persentase peningkatan nilai precision menggunakan model Bayesian network ............................ 11
DAFTAR GAMBAR Halaman 1 2 3 4 5 6 7 8 9 10 11
Sistem temu kembali citra ................................................................................................................. 1 Model umum Bayesian network untuk CBIR. .................................................................................. 3 Contoh pembangunan co-occurrence matrix .................................................................................... 3 Metode penelitian .............................................................................................................................. 4 Model umum Bayesian network untuk CBIR menggunakan informasi tekstur. ............................... 6 Model umum Bayesian network untuk CBIR menggunakan gabungan informasi warna, bentuk, dan tekstur ......................................................................................................................................... 7 Hasil temu kembali menggunakan informasi warna ......................................................................... 8 Hasil temu kembali menggunakan informasi bentuk ........................................................................ 8 Hasil temu kembali menggunakan informasi tekstur ........................................................................ 9 Hasil temu kembali menggunakan model Bayesian network. ........................................................... 9 Grafik recall precision menggunakan informasi warna, bentuk, tekstur, dan Bayesian network. .. 11
DAFTAR LAMPIRAN Halaman 1 Penentuan nilai threshold pada Sobel edge detector ....................................................................... 14 2 Nilai recall precision temu kembali citra menggunakan informasi tekstur untuk beberapa level keabuan dalam pembangunan co-occurrence matrix ...................................................................... 15 3 Contoh citra yang digunakan untuk masing-masing kelas .............................................................. 16 4 Perbandingan nilai recall precision pada kelas beruang, tanda panah, pemandangan, reptil, dan pesawat ............................................................................................................................................ 19 5 Antar muka sistem........................................................................................................................... 21
vi
PENDAHULUAN Latar Belakang CBIR (content based image retrieval) dikembangkan untuk menemukembalikan citra berdasarkan pada informasi citra yang terdiri atas warna (color), bentuk (shape), dan tekstur (texture). CBIR terdiri atas beberapa proses utama antara lain praproses, ekstraksi ciri, pengindeksan, dan penemuan kembali citra. Salah satu proses yang memegang peranan penting pada proses penemuan kembali citra adalah pengukuran tingkat kemiripan citra. Pengukuran kemiripan citra dapat dilakukan antara lain dengan menggunakan perhitungan jarak Euclidean dan dengan menggunakan perhitungan peluang. Vailaya (1995) menggunakan fungsi pembobotan (weighted function) untuk mengukur kemiripan citra berdasarkan gabungan informasi warna dan bentuk. Sementara itu, Osadebey (2006) menggunakan fungsi pembobotan untuk mengukur kemiripan citra berdasarkan gabungan informasi tekstur, bentuk, dan spasial. Pada pengukuran kemiripan menggunakan fungsi pembobotan, nilai kemiripan yang diperoleh menggunakan informasi-informasi yang berbeda dikalikan dengan bobot tertentu, untuk mendapatkan nilai kemiripan berdasarkan gabungan informasiinformasi tersebut. Penggunaan fungsi pembobotan kadang-kadang memberikan hasil temu kembali yang kurang tepat karena nilai bobot ditetapkan secara manual. Rodrigues dan Araujo (2004) telah mengembangkan sebuah model Bayesian network dalam pengukuran tingkat kemiripan citra pada suatu sistem CBIR. Model Bayesian network menerapkan teori peluang (probabilistic) untuk pengukuran kemiripan citra. Model ini digunakan untuk menggabungkan kemiripan citra berdasarkan informasi warna, bentuk, dan tekstur. Model ini dapat digunakan untuk mengatasi kekurangan yang terjadi pada penggunaan fungsi pembobotan karena nilai bobot ditetapkan secara automatis oleh sistem berdasarkan informasi citra yang lebih dominan. Jika setiap karakteristik citra memiliki peluang kemunculan/kejadian pada setiap citra yang ada di basis data, maka peluang kemiripan setiap citra terhadap citra kueri dapat diketahui. Hal ini dapat dimodelkan menggunakan model Bayesian network. Pada Bayesian network, karakteristik-karakteristik citra, citra kueri dan citra-citra yang ada di basis data dapat dianggap
sebagai node-node yang saling berhubungan membentuk sebuah model Bayesian network. Penelitian ini mengimplementasikan dan menganalisis kinerja model Bayesian network yang telah dikembangkan oleh Rodrigues dan Araujo (2004). Penelitian ini melakukan perbaikan pada ekstraksi ciri citra menggunakan informasi bentuk dan tekstur untuk mendapatkan hasil yang lebih optimal. Tujuan Tujuan utama dari penelitian ini adalah untuk mengimplementasikan dan menganalisis kinerja model Bayesian network dalam pengukuran kemiripan citra. Ruang Lingkup Ruang lingkup penelitian ini adalah : 1 Kemiripan citra diukur menggunakan model Bayesian network. 2 Ciri warna diekstraksi menggunakan histogram-162. 3 Ciri bentuk diekstraksi menggunakan edge direction histogram. 4 Ciri tekstur diekstraksi menggunakan cooccurrence matrix. Manfaat Penelitian Penggunaan model Bayesian network pada sistem CBIR diharapkan dapat meningkatkan relevansi dari hasil temu kembali citra.
TINJAUAN PUSTAKA Content Based Image Retrieval (CBIR) Secara umum, proses temu kembali citra (image retrieval) dapat dibagi menjadi dua proses utama yaitu pengindeksan dan penemuan kembali citra. Content based image retrieval (CBIR) merupakan suatu pendekatan pada temu kembali citra yang didasarkan pada ciri atau informasi yang terkandung di dalam citra seperti warna, bentuk, dan tekstur (Rodrigues & Araujo 2004). Proses utama pada temu kembali citra diilustrasikan pada Gambar 1 berikut ini:
Gambar 1 Sistem temu kembali citra. Conventional Color Histogram (CCH) Histogram warna menyatakan frekuensi kemunculan atau peluang keberadaan setiap
1
warna dalam sebuah citra. Banyaknya nilai warna (bin) dapat ditetapkan sesuai kebutuhan pembuatan histogram. Histogram warna dapat dinyatakan sebagai berikut:
Pi|j =
1, jika piksel ke-j dikuantisasi ke bin-i 0, selainnya
Histogram warna seperti ini disebut conventional color histogram (Han & Ma 2002). Edge Detection Edge detection adalah operasi yang dijalankan untuk mendeteksi garis tepi (edge) yang membatasi dua wilayah citra homogen yang memiliki tingkat kecerahan yang berbeda (Pitas dalam Wahyuningsih 2006). Beberapa metode pendeteksi garis tepi yang umum digunakan antara lain Sobel, Prewitt, Roberts, Laplacian of a Gaussian, Zero crossings, dan Canny (Gonzalez 2004). Sobel Edge Detector Sobel edge detector merupakan salah satu metode pendeteksi tepi yang umum digunakan (Rodrigues & Araujo 2004). Sobel edge detector menggunakan dua buah matriks konvolusi berukuran 3 x 3. Matriks konvolusi pertama digunakan untuk mengestimasi gradien pada arah sumbu x. Berikut ini adalah matriks konvolusi yang digunakan : -1 0 1
-2 0 2
-1 0 1
Sementara itu, matriks konvolusi kedua digunakan untuk mengestimasi gradien pada arah sumbu y. Berikut ini adalah matriks konvolusi yang digunakan : -1 -2 -1
0 0 0
1 2 1
Misalkan Gx adalah matriks hasil operasi konvolusi terhadap citra I dalam arah sumbu x, dan Gy adalah matriks hasil operasi konvolusi terhadap citra I dalam arah sumbu y, maka magnitudo (edge strength) dari gradien didekati menggunakan persamaan berikut ini: Sebuah piksel akan dianggap sebagai edge (bernilai satu) jika nilai magnitudonya lebih
besar dari nilai threshold yang ditetapkan (Gonzalez 2004). Texture Pada area pemrosesan citra tidak ada definisi yang jelas tentang tekstur. Hal ini disebabkan definisi tekstur yang ada didasarkan kepada metode analisis tekstur dan fitur yang diekstrak dari citra. Akan tetapi, tekstur dapat dianggap sebagai pola piksel yang berulang pada wilayah spasial dimana penambahan noise pada pola dan perulangan frekuensinya, dapat terlihat secara acak dan tidak terstruktur (Osadebey 2006). Beberapa metode yang berbeda diusulkan untuk menghitung ciri tekstur karena tidak ada definisi matematika yang jelas tentang tekstur. Metode yang paling sering digunakan untuk mendeskripsikan ciri tekstur adalah metode berbasis statistika dan berbasis transformasi (Ojala & Pietikainen dalam Osadebey 2006). Penelitian ini menggunakan metode berbasis statistika untuk mengekstraksi ciri tekstur. Metode berbasis statistika menganalisis distribusi spasial dari nilai keabuan dengan menghitung ciri lokal pada setiap titik citra, kemudian menurunkan beberapa perhitungan statistika dari distribusi ciri lokal tersebut. Salah satu jenis metode ini adalah co-occurrence matrix yang akan digunakan pada penelitian ini. Co-occurrence Matrix Co-occurrence matrix menggunakan matriks derajat keabuan untuk mengambil contoh bagaimana suatu derajat keabuan tertentu terjadi, dalam hubungannya dengan derajat keabuan yang lain. Matriks derajat keabuan adalah sebuah matriks yang elemen-elemennya merupakan frekuensi relatif kejadian (occurrence), dari kombinasi level keabuan antar pasangan piksel, dengan hubungan spasial tertentu (Osadebey 2006). Misal diketahui sebuah citra I(i, j), p(i, j) merupakan posisi dari operator, dan A adalah sebuah matriks. Elemen A(i, j) menyatakan jumlah berapa kali titik tersebut terjadi dengan grey-level (intensitas) g(i) pada posisi tertentu menggunakan operator p, relatif terhadap titik dengan intensitas g(j). Matriks A merupakan cooccurrence matrix yang didefinisikan oleh p. Operator p didefinisikan dengan sebuah sudut dan jarak d. Gambar 2 menjelaskan pembangunan cooccurrence matrix untuk citra I yang berukuran 4 x 5 piksel yang memiliki delapan level keabuan. Posisi operator p didefinisikan dengan jarak d = 1 dan = 00. Matriks A
2
merepresentasikan jumlah titik yang memiliki intensitas g(i) terjadi pada posisi yang didefinisikan oleh operator p, relatif tehadap titik dengan intensitas g(j) (Osadebey 2006). I
A 1 2 3 4 5 6 7 8
1 1 0 0 0 1 0 2 0
1 2 4 8
2 2 0 0 0 0 0 0 0
1 3 5 5
3 0 1 0 0 0 0 0 0
5 5 7 1
4 0 0 0 0 0 0 0 0
6 7 1 2
5 1 1 1 1 0 0 0 1
8 1 2 5
6 0 0 0 0 1 0 0 0
1 Satu set node, setiap node merepresentasikan setiap variabel yang ada di sistem. 2 Link antara dua node yang merepresentasikan hubungan sebab dari satu node ke node yang lain. 3 Distribusi bersyarat.
7 0 0 0 0 2 0 0 0
Pengimplementasian Bayesian network secara umum terdiri atas tahapan-tahapan berikut ini :
8 0 0 0 0 0 1 0 0
1. Pembangunan hubungan (relationship) Hubungan antara n variabel dapat dibangun dengan bantuan pakar, dari data observasi atau dari gabungan keduanya. Jika diberikan n variabel dan satu set data observasi, maka semua relationship yang mungkin harus ditentukan.
Gambar 2 Contoh pembangunan co-occurrence matrix. Formula Bayes
Rodrigues dan Araujo (2004) telah membangun sebuah model Bayesian network yang digunakan untuk CBIR. Model Bayesian network yang dibangun dapat dilihat pada Gambar 3.
Formula Bayes dapat digunakan untuk menghitung peluang bersyarat yaitu peluang suatu kejadian setelah kejadian lain terjadi (Neapolitan 2004). Berikut ini adalah formula Bayes : Gambar 3 Model umum Bayesian network untuk CBIR.
Formula di atas juga dapat ditulis :
disebut juga posterior probability adalah peluang A terjadi setelah B terjadi. bersamaan.
adalah peluang A dan B terjadi
Pada Gambar 3, C merupakan karakteristik citra, sedangkan Ij adalah citra-citra yang ada di basis data. Garis berarah menunjukkan peluang sebuah citra Ij memiliki karakteristik Ci. Nilai peluang kemiripan antara citra kueri dan citra di basis data dapat dihitung menggunakan formula Bayes berikut ini :
disebut juga likelihood adalah peluang B terjadi setelah A terjadi. disebut juga prior adalah peluang kejadian A. adalah peluang kejadian B dan
0.
Bayesian Network Bayesian network adalah sebuah graf berarah tanpa cycle (directed acyclic graph) yang digunakan untuk representasi grafis dan pengambilan keputusan (reasoning) mengenai wilayah yang tidak pasti (Neapolitan 2004) yang terdiri atas :
Nilai merupakan nilai pengukuran kemiripan antara dua buah citra. Jika sebuah citra direpresentasikan sebagai sebuah vektor, maka nilai akan sama dengan cosine similarity antara vektor citra kueri dengan vektor citra-citra di basis data. Berikut ini adalah formula cosine similarity : "
!
!
#
"
!
#
dengan Ii merupakan karakteristik ke-i dari sebuah citra di basis data, sedangkan Qi merupakan karakteristik ke-i dari citra kueri.
3
Semakin dekat nilai cosine similarity ke nilai 1 (satu) maka semakin mirip citra tersebut dengan citra kueri. Kelemahan formula ini adalah hanya dapat mengukur kemiripan dua citra yang memiliki karakteristik homogen, misalnya membandingkan kemiripan dua citra berdasarkan informasi warnanya. Model umum Bayesian network dapat digunakan untuk mengombinasikan informasi warna, bentuk, dan tekstur. Misalkan informasi warna direpresentasikan dengan CC, bentuk dengan CS, dan tekstur dengan CT. Jika diberikan kueri Q, maka peluang citra I yang memiliki informasi CC, CS, dan CT dapat ditentukan dengan :
METODE PENELITIAN Penelitian ini dilakukan dalam beberapa tahap yaitu ekstraksi ciri, pembangunan model Bayesian network, pengukuran tingkat kemiripan, dan evaluasi hasil temu kembali. Tahap-tahap yang dilakukan pada penelitian ini diilustrasikan pada Gambar 4.
$$ $% $&
'' '( ')
$$ $% $&
'' '( ')
relevan yang ada di basis data, dan A adalah jumlah seluruh citra yang ditemukembalikan.
$$ $% $&
2. Inference menggunakan Bayesian network Tujuan utama melakukan inference (inferensia) pada suatu Bayesian network adalah untuk menghitung nilai peluang posterior dari satu set variabel kueri. Berdasarkan inference yang dilakukan oleh Rodrigues dan Araujo (2004), nilai dapat dihitung dengan : *+ ,
....- $$ … $$
*+ ,
,
…
…
,
.... $%-
%$.... $&- $& /
$$ $$ …
$%
%$,
$& $& /
yang merupakan persamaan umum model Bayesian network untuk CBIR dengan * adalah sebuah konstanta. Recall dan Precision Recall dan precision merupakan parameter yang digunakan untuk mengukur keefektifan hasil temu kembali. Recall menyatakan proporsi materi relevan yang ditemukembalikan. Sementara itu, precision menyatakan proporsi materi yang ditemukembalikan yang relevan (Baeza-Yates & Ribeiro-Neto 1999). 012344
512 67
03 0
03
dengan Ra adalah jumlah citra relevan yang ditemukembalikan, R adalah jumlah citra
Gambar 4 Metode penelitian. Ekstraksi Ciri Pada penelitian ini, ekstraksi ciri dilakukan berdasarkan warna, bentuk, dan tekstur citra. a Ekstraksi ciri warna Ekstraksi ciri warna dilakukan dengan menentukan histogram warna menggunakan CCH (conventional color histogram). Pada langkah awal pemrosesan citra, citra RGB diubah menjadi HSV. Hal ini dilakukan karena HSV (hue, saturation, value) merupakan ruang warna yang komponen-komponennya berkontribusi langsung pada persepsi visual. Hue digunakan untuk membedakan warna misalnya merah, hijau, dan biru serta untuk menentukan tingkat kemerahan, kehijauan, dst dari sebuah cahaya. Saturation merupakan persentase cahaya putih yang ditambahkan ke cahaya murni. Sementara itu, value merupakan
4
intensitas cahaya yang dirasakan (Rodrigues & Araujo 2004). Transformasi RGB menjadi HSV diperoleh menggunakan formula di bawah ini :
9
E
9 : ; <@ 8 => , 9 : ? < 26
A
, D
5
5
+ 5,: 5,< / B = C 5,< :,< " 5,: # D :
:
<
<
+
75:< /
dengan (r, g, b) adalah warna-warna pada ruang warna RGB dan (h, s, v) adalah warna-warna pada ruang warna HSV (Gonzalez 2004). Setelah citra diubah menjadi HSV, langkah selanjutnya adalah melakukan kuantisasi warna. Kuantisasi warna dilakukan untuk mengurangi waktu komputasi dan menghemat tempat penyimpanan (Rodrigues & Araujo 2004). Selain itu, kuantisasi warna juga dapat mengeliminasi komponen warna yang dapat dianggap sebagai noise. Pada penelitian ini, kuantisasi warna yang digunakan adalah histogram-162 (HSV-162). Pada HSV-162, hue dikuantisasi menjadi 18 bin, saturation dikuantisasi menjadi 3 bin, sedangkan value dikuantisasi menjadi 3 bin, sehingga akan didapatkan kombinasi sebanyak 18 x 3 x 3 = 162. Hue dikuantisasi menjadi 18 bin karena sistem visual manusia lebih sensitif terhadap hue dibandingkan saturation dan value. Setiap citra akan direpresentasikan dengan sebuah vektor yang memiliki elemen sebanyak 162 buah. Nilai elemen vektor menyatakan jumlah piksel citra yang masuk ke dalam bin yang sesuai. Dengan kata lain, vektor dari citra merepresentasikan histogram warna dari citra tersebut. Setelah histogram citra selesai dihitung, langkah terakhir adalah melakukan normalisasi terhadap vektor masing-masing citra. b Ekstraksi ciri bentuk Ekstraksi ciri bentuk dilakukan dengan menentukan edge direction histogram. Langkah awal yang dilakukan untuk menentukan edge direction histogram dari sebuah citra adalah mengubah citra RGB menjadi citra grayscale. Setelah itu, operasi Sobel edge detector dilakukan terhadap citra.
Arah (direction) dapat dihitung menggunakan persamaan berikut ini: 9
F37A
G
dengan Gx merupakan matriks hasil operasi konvolusi terhadap citra I dalam arah sumbu x, dan Gy adalah matriks hasil operasi konvolusi terhadap citra I dalam arah sumbu y. Jika nilai Gx sama dengan nol, maka nilai arah dapat bernilai 900 atau 00 tergantung kepada nilai Gy. Jika Gy bernilai nol, maka nilai arah sama dengan 00. Sebaliknya, jika nilai Gy tidak sama dengan nol, maka nilai arah sama dengan 900 (Green 2002). Setelah nilai edge direction diperoleh, langkah selanjutnya adalah menentukan pikselpiksel citra yang merupakan garis (edge). Sebuah piksel akan dianggap sebagai edge jika nilai magnitudonya lebih besar dari nilai threshold yang ditetapkan. Langkah-langkah penentuan nilai threshold dapat dilihat pada Lampiran 1. Jumlah bin yang digunakan pada penelitian ini adalah 72 bin masing-masing sebesar 50. Jadi, setiap citra akan direpresentasikan dengan sebuah vektor yang memiliki elemen sebanyak 72 buah. Setelah edge dan edge direction ditentukan, langkah selanjutnya adalah menghitung jumlah piksel pada edge yang bersesuaian arahnya dengan 72 buah bin yang didefinisikan. Nilai vektor yang didapatkan dinormalisasi dengan cara membagi nilai vektor dengan jumlah piksel penyusun edge agar vektor bentuk yang didapatkan tidak dipengaruhi oleh perubahan skala citra (scale invariant) (Vailaya 1996). c Ekstraksi ciri tekstur Ekstraksi ciri tekstur dilakukan dengan menggunakan co-occurrence matrix. Menurut Osadebey (2006), representasi co-occurrence matrix dapat digunakan untuk menghitung energy, moment, entropy, maximum probability, contrast, dan correlation. Menurut Rodrigues dan Araujo (2004), informasi tekstur dari suatu citra dapat direpresentasikan menggunakan maximum probability, moment, variance, contrast, dan entropy. Sementara itu, menurut Haralick dan Shapiro (1992), informasi tekstur dapat direpresentasikan dengan contrast, correlation, energy, dan homogeneity. Pada penelitian ini, informasi tekstur akan direpresentasikan dengan menggunakan gabungan dari ketiga pendapat di atas yaitu energy, moment, entropy, maximum probability, contrast, correlation, dan homogeneity.
5
Berikut ini adalah definisi matematika dari tujuh fitur di atas : 1715:
H
#
7E15 1 6 17F 17F56J 3
I
,
H 46:
K J56<3< 4F
267F53 F
2655143F 67
6 6:171 F
H # ,H
,H
#
,L
3
H
H,L MM
H ,H
H
digunakan yaitu 8, 16, 32, dan 64. Jumlah level keabuan yang dipilih adalah yang mengoptimalkan precision untuk temu kembali menggunakan informasi tekstur. Berdasarkan Lampiran 2 diperoleh bahwa jumlah level keabuan yang mengoptimalkan hasil temu kembali menggunakan informasi tekstur adalah 16. Model Bayesian Network Penelitian ini menggunakan model Bayesian network yang merupakan hasil penelitian Rodrigues dan Araujo (2004). Model Bayesian network digunakan pada proses pengindeksan citra dan pada proses penemuan kembali citra.
H H
dengan H adalah elemen baris ke-i, kolom ke-j dari co-occurrence matrix yang telah dinormalisasi. L adalah nilai rata-rata baris ke-i dan L adalah nilai rata-rata kolom ke-j pada matriks P. M adalah standard deviasi baris ke-i dan M adalah standard deviasi kolom ke-j pada matriks P. Langkah awal yang dilakukan untuk mendapatkan informasi tekstur dari sebuah citra adalah dengan menentukan co-occurrence matrix. Co-occurrence matrix dihitung dalam empat arah yaitu 00, 450, 900, dan 1350. Jadi, untuk setiap citra akan dihasilkan empat cooccurrence matrix. Setelah itu, nilai energy, moment, entropy, maximum probability, contrast, correlation, dan homogeneity dihitung untuk setiap co-occurrence matrix, sehingga untuk setiap fitur akan diperoleh empat nilai, masing-masing untuk arah 00, 450, 900, dan 1350. Nilai dari setiap fitur diperoleh dengan menghitung rata-rata keempat nilai fitur yang bersangkutan. Hal ini dilakukan agar informasi tekstur yang diperoleh tidak peka terhadap rotasi (rotation-invariant). Informasi tekstur untuk setiap citra akan direpresentasikan dengan sebuah vektor yang memiliki tujuh elemen dan nilai akhir dari informasi tekstur diperoleh dengan melakukan normalisasi terhadap vektor masing-masing citra. Penelitian ini menggunakan beberapa jumlah level keabuan dalam pembangunan cooccurrence matrix untuk mendapatkan hasil yang optimal. Jumlah level keabuan yang
Informasi warna direpresentasikan dengan vektor yang panjangnya 162, bentuk direpresentasikan dengan vektor yang panjangnya 72, dan tekstur direpresentasikan dengan vektor yang panjangnya 7. Setiap bin dari ketiga vektor di atas memiliki peluang kemunculan pada setiap citra di basis data. Hal inilah yang dimodelkan dalam sebuah struktur network sebagaimana diilustrasikan pada Gambar 3. Model tersebut dapat digambar ulang untuk informasi tekstur pada Gambar 5.
Gambar 5 Model umum Bayesian network untuk CBIR menggunakan informasi tekstur. Pada model network di Gambar 5, nodenode pada level pertama adalah fitur-fitur dari informasi tekstur. Jadi, level pertama akan terdiri atas tujuh node. Jika network memodelkan informasi warna, maka level pertama network akan terdiri atas 162 node. Sementara itu, Jika network memodelkan informasi bentuk, maka level pertama network akan terdiri atas 72 node. Node-node pada level kedua network adalah citra-citra yang ada di basis data yaitu sebanyak 1100 citra. Pada model network yang dibangun, nilai peluang kejadian sebuah citra Ii di basis data yang memiliki karakteristik Cj ( $ ) merupakan nilai elemen vektor citra Ii yang kej. Misalnya, nilai peluang kejadian citra I15 di basis data yang memiliki karakteristik moment pada informasi tekstur, merupakan nilai elemen kedua dari vektor tekstur citra I15. Hal ini merupakan penggunaan model Bayesian network pada proses pembangunan indeks citra.
6
Gambar 6 Model umum Bayesian network untuk CBIR menggunakan gabungan informasi warna, bentuk, dan tekstur. Pengukuran Tingkat Kemiripan Model Bayesian network yang dikembangkan, selain digunakan pada proses pembangunan indeks citra, juga digunakan untuk mengukur tingkat kemiripan antara citra kueri dengan citra-citra yang ada di basis data. Jika citra kueri diketahui, maka nilai peluang citra kueri untuk setiap karakteristik $ dapat diketahui. Dengan demikian, peluang terjadinya setiap citra di basis data jika diketahui sebuah citra kueri dapat dihitung. Dengan kata lain, nilai kemiripan antara setiap citra di basis data terhadap citra kueri dapat dihitung. Model network yang digunakan pada proses ini dapat dilihat pada Gambar 6. Pada Gambar 6, basis data digambarkan sebanyak tiga kali agar garis berarah antara tiaptiap karakteristik dengan citra-citra di basis data dapat terlihat dengan jelas. Nilai kemiripan antara citra kueri dan citra yang ada di basis data dihitung menggunakan persamaan umum model Bayesian network yaitu : …
*+ , ,
,
$$ $$ …
$%
%$,
$& $& /
$$ $$ , $% $% , dan $& $& dihitung dengan menggunakan cosine similarity. $$ $$ merupakan nilai kemiripan antara vektor warna citra kueri dengan vektor warna citra di basis data, $% $% untuk vektor bentuk, dan $& $& untuk vektor tekstur. Selain dapat digunakan untuk mengombinasikan informasi warna, bentuk, dan tekstur, persamaan di atas juga dapat digunakan untuk
mengukur kemiripan berdasarkan salah satu informasi warna, bentuk, atau tekstur. Pengukuran kemiripan berdasarkan informasi warna saja, dapat dilakukan dengan mengabaikan nilai $% $% dan $& $& dengan mendefinisikan $% $% N dan $& $& N , sehingga diperoleh persamaan : *+ ,
,
$$ $$ /
*+ ,
,
$% $% /
*+ ,
,
$& $& /
Pengukuran kemiripan berdasarkan informasi bentuk saja atau tekstur saja, dapat dilakukan menggunakan cara yang sama. Dengan demikian, pengukuran kemiripan berdasarkan informasi bentuk saja, dapat dilakukan menggunakan persamaan berikut: Sementara itu, pengukuran kemiripan berdasarkan informasi tekstur saja, dapat dilakukan menggunakan persamaan berikut : Hasil pada tahap ini adalah nilai kemiripan antara setiap citra di basis data dengan citra kueri. Setelah nilai kemiripan diketahui, citracitra diurutkan berdasarkan nilai kemiripannya. Evaluasi Hasil Temu Kembali Pada tahap evaluasi dilakukan penilaian kinerja sistem dengan melakukan pengukuran recall dan precision untuk menentukan tingkat keefektifan proses temu kembali. Setiap citra dijadikan sebagai citra kueri dan citra yang relevan ditentukan secara manual dengan menghitung jumlah citra yang satu kelas dengan citra kueri. Nilai precision untuk setiap kelas dihitung dari rata-rata nilai precision setiap citra yang berada pada kelas tersebut. Pada tahap selanjutnya dibuat tabel perbandingan recall
7
dan precision untuk tiap-tiap kelas dan untuk sistem secara umum. Perangkat Lunak dan Perangkat Keras Perangkat lunak yang digunakan dalam penelitian ini adalah Windows XP SP 2 dan Matlab 7.0.1. Perangkat keras yang digunakan adalah sebuah notebook dengan prosesor AMD Turion 64 X2 2.0 GHz, memori 1 GB dan hard disk 120 GB.
sebuah matriks berukuran 7 × 1100, karena terdapat 1100 buah citra di basis data dan setiap citra direpresentasikan dengan sebuah vektor yang memiliki elemen sebanyak 7 buah yaitu energy, moment, entropy, maximum probability, contrast, dan correlation. Hasil Temu Kembali Hasil temu kembali menggunakan informasi warna dapat dilihat pada Gambar 7.
HASIL DAN PEMBAHASAN Data Penelitian Data yang digunakan pada penelitian ini terdiri atas 1100 citra yang dikelompokkan secara manual menjadi 10 kelas yaitu mobil, singa, matahari terbenam, tekstur, beruang, gajah, tanda panah, pemandangan, reptil, dan pesawat. Data ini berasal dari http://www.fei.edu.br/~psergio/MaterialAulas/G eneralist1200.zip. Citra memiliki format TIF dengan ukuran yang bervariasi. Beberapa contoh citra yang digunakan dapat dilihat pada Lampiran 3. Praproses Citra Praproses citra dilakukan untuk menghilangkan garis tepi citra asli. Hal ini bertujuan agar Sobel edge detector tidak menangkap informasi yang salah dalam menentukan edge pada sebuah citra. Tahap ini dilakukan dengan melakukan operasi cropping.
Gambar 7 Hasil temu kembali menggunakan informasi warna. Hasil temu kembali menggunakan informasi bentuk dapat dilihat pada Gambar 8.
Ekstraksi Ciri a Ekstraksi ciri warna Hasil dari ekstraksi ciri warna untuk seluruh citra yang ada di basis data adalah sebuah matriks berukuran 162 × 1100, karena terdapat 1100 buah citra di basis data dan setiap citra direpresentasikan dengan sebuah vektor yang memiliki elemen sebanyak 162 buah. b Ekstraksi ciri bentuk Operasi sobel edge detector dilakukan terhadap semua citra di basis data, kemudian edge direction histogram-nya ditentukan. Setiap citra akan direpresentasikan dengan sebuah vektor berukuran 72 elemen. Hasil akhir dari proses ini adalah sebuah matriks berukuran 72 × 1100 karena ada sebanyak 1100 citra di basis data.
Gambar 8 Hasil temu kembali menggunakan informasi bentuk. Hasil temu kembali menggunakan informasi tekstur dapat dilihat pada Gambar 9.
c Ekstraksi ciri tekstur Hasil dari ekstraksi ciri tekstur untuk seluruh citra yang ada di basis data adalah
8
terpisah serta penggabungan ketiga informasi tersebut menggunakan model Bayesian. Tabel 1 menyajikan perbandingan nilai precision pada kelas mobil. Kelas ini terdiri atas 176 citra. Pada kelas ini, nilai rata-rata precision tertinggi diperoleh menggunakan model Bayesian network. Sementara itu, nilai rata-rata precision menggunakan informasi bentuk lebih tinggi jika dibandingkan dengan nilai rata-rata precision menggunakan informasi warna dan tekstur. Hal ini disebabkan citra-citra pada kelas mobil memiliki bentuk yang hampir sama, sebagaimana dapat dilihat pada Lampiran 3. Gambar 9 Hasil temu kembali menggunakan informasi tekstur. Sementara itu, hasil temu kembali menggunakan model Bayesian network dapat dilihat pada Gambar 10.
Gambar 10 Hasil temu kembali menggunakan model Bayesian network. Evaluasi Hasil Temu Kembali Nilai recall dan precision dihitung untuk menentukan tingkat keefektifan proses temu kembali. Untuk mendapatkan nilai precision dari suatu kelas, maka setiap citra yang ada di kelas tersebut dijadikan sebagai citra kueri. Nilai precision untuk kelas tersebut diperoleh dengan merata-ratakan nilai precision dari setiap citra kueri. Hal ini dilakukan untuk mengetahui performa model Bayesian network pada sistem temu kembali yang dibangun. Pada uraian di bawah ini akan dipaparkan nilai precision untuk beberapa kelas yaitu kelas mobil, singa, matahari terbenam, tekstur, dan gajah. Nilai precision yang disajikan adalah nilai precision untuk temu kembali berdasarkan informasi warna, bentuk, dan tekstur secara
Tabel 1 Perbandingan nilai recall precision pada kelas mobil Recall
Warna
Bentuk
Tekstur
Bayes
0
1.0000
1.0000
1.0000
1.0000
0.1
0.3198
0.4447
0.3758
0.4993
0.2
0.2870
0.4079
0.3325
0.4413
0.3
0.2641
0.3936
0.3086
0.3999
0.4
0.2382
0.3791
0.2905
0.3646
0.5
0.2230
0.3643
0.2798
0.3412
0.6
0.2092
0.3408
0.2684
0.3194
0.7
0.1993
0.3171
0.2585
0.3012
0.8
0.1933
0.2887
0.2495
0.2834
0.9
0.1877
0.2348
0.2238
0.2537
1
0.1755
0.1654
0.1909
0.1920
Rataan
0.2997
0.3942
0.3435
0.3996
Kelas singa terdiri atas 103 citra. Nilai ratarata precision pada kelas singa dapat dilihat pada Tabel 2. Tabel 2 Perbandingan nilai recall precision pada kelas singa Recall
Warna
Bentuk
Tekstur
Bayes
0
1.0000
1.0000
1.0000
1.0000
0.1
0.4746
0.2290
0.2572
0.5502
0.2
0.4104
0.2244
0.2047
0.4459
0.3
0.3794
0.2201
0.1787
0.3830
0.4
0.3475
0.2111
0.1589
0.3188
0.5
0.3163
0.2045
0.1519
0.2718
0.6
0.2965
0.2013
0.1397
0.2385
0.7
0.2748
0.1948
0.1116
0.2120
0.8
0.2552
0.1829
0.1087
0.1880
0.9
0.2313
0.1738
0.1092
0.1675
1
0.1156
0.1349
0.1095
0.1368
Rataan
0.3729
0.2706
0.2300
0.3557
9
Pada Tabel 2 dapat dilihat bahwa nilai ratarata precision tertinggi diperoleh ketika menggunakan informasi warna. Hal ini disebabkan citra-citra pada kelas singa memiliki kemiripan warna yang dapat diamati secara visual sebagaimana diperlihatkan pada Lampiran 3. Pada kelas ini, nilai rata-rata precision untuk model Bayesian network lebih rendah dari rata-rata precision menggunakan informasi warna, tetapi lebih tinggi dari ratarata precision menggunakan informasi bentuk dan tekstur. Akan tetapi, pada recall 0.1, 0.2, 0.3, dan 1 nilai precision menggunakan model Bayesian network lebih tinggi daripada menggunakan informasi warna. Sementara itu, nilai rata-rata precision untuk kelas matahari terbenam dapat dilihat pada Tabel 3. Kelas ini terdiri atas 102 citra. Tabel 3 Perbandingan nilai recall precision pada kelas matahari terbenam Recall
Warna
Bentuk
Tekstur
Bayes
0
1.0000
1.0000
1.0000
1.0000
0.1
0.3494
0.3356
0.4149
0.5640
0.2
0.2919
0.2624
0.3743
0.5089
0.3
0.2552
0.2194
0.3245
0.4708
0.4
0.2272
0.1972
0.3000
0.4305
0.5
0.2070
0.1769
0.2847
0.3796
0.6
0.1868
0.1602
0.2576
0.3292
0.7
0.1720
0.1457
0.2374
0.2815
0.8
0.1560
0.1319
0.2142
0.2290
0.9
0.1379
0.1171
0.1616
0.1752
1
0.1121
0.0946
0.1228
0.1123
Rataan
0.2814
0.2583
0.3356
0.4074
Berdasarkan Tabel 3, nilai rata-rata precision tertinggi diperoleh menggunakan model Bayesian network. Sementara itu, nilai rata-rata precision menggunakan informasi tekstur lebih tinggi jika dibandingkan dengan nilai rata-rata precision menggunakan informasi warna dan bentuk. Sebagaimana dapat dilihat pada Lampiran 3 bahwa citra-citra pada kelas matahari terbenam memiliki warna dan bentuk yang lebih beragam, sedangkan teksturnya cenderung lebih mirip. Hal ini menyebabkan nilai precision untuk informasi warna dan bentuk lebih kecil. Tabel 4 menyajikan nilai rata-rata precision pada kelas tekstur. Kelas ini terdiri atas 175 citra. Berdasarkan Tabel 4, nilai rata-rata precision tertinggi diperoleh menggunakan model Bayesian network. Sementara itu, nilai
rata-rata precision menggunakan informasi tekstur lebih tinggi jika dibandingkan dengan nilai rata-rata precision menggunakan informasi warna dan bentuk. Hal ini disebabkan citra-citra pada kelas tekstur memiliki tekstur yang hampir sama, sebagaimana dapat dilihat pada Lampiran 3. Tabel 4 Perbandingan nilai recall precision pada kelas tekstur Recall
Warna
Bentuk
Tekstur
Bayes
0
1.0000
1.0000
1.0000
1.0000
0.1
0.4071
0.4418
0.5220
0.5780
0.2
0.3663
0.3701
0.4954
0.5394
0.3
0.3162
0.3210
0.4860
0.5218
0.4
0.2858
0.2939
0.4710
0.4958
0.5
0.2638
0.2671
0.4510
0.4601
0.6
0.2485
0.2513
0.3994
0.4096
0.7
0.2359
0.2317
0.3440
0.3536
0.8
0.2223
0.2079
0.2702
0.2881
0.9
0.2004
0.1782
0.2238
0.2300
1
0.1676
0.1609
0.1601
0.1637
Rataan
0.3376
0.3385
0.4384
0.4582
Pada Tabel 5 disajikan nilai rata-rata precision pada kelas gajah. Kelas ini terdiri atas 98 citra. Tabel 5 Perbandingan nilai recall precision pada kelas gajah Recall
Warna
Bentuk
Tekstur
Bayes
0
1.0000
1.0000
1.0000
1.0000
0.1
0.2876
0.5017
0.2194
0.4193
0.2
0.2027
0.4594
0.1956
0.3395
0.3
0.1871
0.4175
0.1715
0.3003
0.4
0.1725
0.3831
0.1621
0.2659
0.5
0.1668
0.3525
0.1536
0.2504
0.6
0.1620
0.3196
0.1478
0.2290
0.7
0.1533
0.2866
0.1385
0.2084
0.8
0.1428
0.2469
0.1363
0.1903
0.9
0.1292
0.2095
0.1317
0.1689
1
0.1028
0.1461
0.1062
0.1281
Rataan
0.2461
0.3930
0.2330
0.3182
Pada Tabel 5 dapat dilihat bahwa nilai ratarata precision tertinggi diperoleh ketika menggunakan informasi bentuk. Pada kelas ini, nilai rata-rata precision untuk model Bayesian network lebih rendah dari rata-rata precision bentuk, tetapi lebih tinggi dari rata-rata
10
precision warna dan tekstur. Pada Lampiran 3 dapat dilihat bahwa citracitra-citra citra di kelas ini memiliki kemiripan kemiripan bentuk secara visual. Sementara itu, citra-citra citra citra di kelas tersebut memiliki warna dan tekstur yang lebih beragam. beragam Hal ini dapat dibuktikan dengan nilai rata-rata rata precision warna dan tekstur yang lebih kecil dari rata-rata rata precision bentuk.
Grafik perbandingan nilai recall precision menggunakan informasi warna, bentuk, tekstur, dan model Bayesian network dapat dilihat ilihat pada Gambar 11. 11
Perbandinga nilai rata-rata Perbandingan rata precision untuk kelas yang lain lain dapat dilihat pada Lampiran 4. Secara umum, nilai precision pada kelas-kelas kelas tersebut memiliki kecenderungan yang hampir sama dengan kelas-kelas kelas kelas yang telah dibahas. Pada Tabel 6 disajikan nilai rata-rata rata precision untuk semua citra yang ada di basis data. Seluruh citra yang ada di basis data sebanyak 1100 citra digunakan sebagai citra kueri. Tabel 6 Perbandingan nilai recall precision rata-rata rata semua citra di basis data Recall
Warna
Bentuk
Tekstur
Bayes
0
1.0000
1.0000
1.0000
1.0000
0.1
0.4008
0.3346
0.3561
0.4861
0.2
0.3448
0.2859
0.3136
0.4223
0.3
0.3058
0.2580
0.2798
0.3777
0.4
0.2754
0.2407
0.2564
0.3386
0.5
0.2568
0.2221
0.2383
0.3050
0.6
0.2395
0.2062
0.2134
0.2704
0.7
0.2237
0.1914
0.1929
0.2415
0.8
0.2076
0.1735
0.1724
0.2122
Recall
Warna
Bayes
0.9
0.1924
0.1522
0.1525
0.1825
1
0.1586
0.1249
0.1267
0.1392
0
1.0000
1.0000
Peningkatan (%) 0.0000
Rataan
0.3277
0.2900
0.3002
0.3614
0.1
0.4008
0.4861
17.5591
0.2
0.3448
0.4223
18.3532
0.3
0.3058
0.3777
19.0406
0.4
0.2754
0.3386
18.6793
0.5
0.2568
0.3050
15.8142
0.6
0.2395
0.2704
11.4136
0.7
0.2237
0.2415
7.3467
0.8
0.2076
0.2122
2.1676
0.9
0.1924
0.1825
-5.4027 5.4027
1
0.1586
0.1392
-13.8753 13.8753
Rataan
0.3277
0.3614
8.2815
Berdasarkan Tabel 6, 6, nilai rata-rata rata precision tertinggi diperoleh menggunakan model Bayesian network.. Sementara itu, nilai rata rata-rata precision menggunakan informasi warna lebih tinggi daripada menggunakan informasi bentuk dan tekstur. Hal ini menunjukkan bahwa untuk sistem temu kembali yang dibangun, model Bayesian network dapat meningkatkan nilai precision. precision Model Bayesian network yang menggabungkan informasi warna, bentuk, dan tekstur terbukti lebih baik jika dibandingkan dengan penggunaan informasi warna, bentuk, atau tekstur secara terpisah. Peningkatan nilai precision berarti erarti tingkat relevansi citra-citra citra citra yang ditemukembalikan dengan citra kueri lebih tinggi.
Gambar 11 Grafik recall precision menggunamengguna kan informasi warna, bentuk, tekstur, dan Bayesian network etwork. Sementara itu, peningkatan peningkatan nilai precision yang diperoleh menggunakan model Bayesian network disajikan pada Tabel 7. Tabel 7 Persentase peningkatan nilai precision menggunakan model Bayesian network
Pada Tabel abel 7,, nilai rata rata-rata menggunakan model Bayesian dibandingkan dengan nilai rata rata-rata menggunakan informasi warna. dilakukan karena nilai rata rata-rata
precision network precision Hal ini precision
11
menggunakan warna lebih tinggi daripada bentuk dan tekstur. Pada Tabel 7 dapat dilihat bahwa rata-rata peningkatan nilai precision sebesar 8.2815 %. Pada Tabel 7 juga dapat dilihat bahwa performa model Bayesian network bagus untuk nilai recall antara recall 0 sampai 0.8. Sementara itu, untuk nilai recall 0.9 dan 1, performa model Bayesian network lebih kecil dari penggunaan informasi warna (nilai peningkatan precision bernilai negatif). Secara umum, penggunaan model Bayesian network meningkatkan nilai precision jika dibandingkan dengan penggunaan informasi warna, bentuk, atau tekstur secara terpisah.
KESIMPULAN DAN SARAN Kesimpulan Penelitian ini telah berhasil mengimplementasikan model Bayesian network dalam pengukuran kemiripan citra dengan menggabungkan informasi warna, bentuk, dan tekstur dari suatu citra. Informasi warna diekstraksi dengan histogram 162, informasi bentuk dengan edge direction histogram, dan tekstur dengan co-occurrence matrix. Model Bayesian network memberikan nilai bobot secara automatis berdasarkan kepada informasi citra yang lebih dominan. Secara umum, model Bayesian network dapat digunakan untuk meningkatkan nilai precision hasil temu kembali. Nilai rata-rata precision untuk semua citra di basis data dengan menggunakan model Bayesian network lebih tinggi daripada menggunakan informasi warna, bentuk, dan tekstur secara terpisah. Pada beberapa kelas, nilai rata-rata precision menggunakan model Bayesian network lebih rendah dari salah satu informasi warna, bentuk, atau tekstur, tetapi tetap lebih tinggi dari dua informasi lainnya. Saran Model Bayesian network dapat bekerja dengan baik jika hasil ekstraksi ciri warna, bentuk, dan tekstur menghasilkan ciri yang bagus. Oleh karena itu, penelitian selanjutnya disarankan menggunakan metode lain untuk ekstraksi ciri, baik ciri warna, bentuk, maupun tekstur untuk mendapatkan ciri yang lebih bagus. Penelitian selanjutnya dapat menggunakan fuzzy color histogram untuk ekstraksi ciri warna, Hough transform untuk ekstraksi ciri bentuk, dan Tamura untuk ekstraksi ciri tekstur.
DAFTAR PUSTAKA Baeza-Yates R & Berthier Ribeiro-Neto. 1999. Modern Information Retrieval. New York : Addison Wesley. Gonzalez RC, et al. 2004. Digital Image Processing Using Matlab. New Jersey : Pearson Prentice Hall. Green B. 2002. Edge Detection Tutorial. http://www.pages.drexel.edu/%7Eweg22/ed ge.html [28 Juli 2008] Han J & Kai-Kuang Ma. 2002. Fuzzy Color Histogram and Its Use in Color Image Retrieval. IEEE Transaction on Image Processing, vol. 11, no. 8, 2002. Haralick RM & Linda G. Shapiro. 1992. Computer and Robot Vision. Vol. 1, p. 460. New York : Addison Wesley. Neapolitan RE. 2004. Learning Bayesian Networks. Illinois : Prentice Hall. Osadebey ME. 2006. Integrated Content-Based Image Retrieval Using Texture, Shape and Spatial Information [thesis]. Umea : Department of Applied Physics and Electronics, Umea University. Rodrigues PS & Arnaldo de Albuquerque Araujo. 2004. A Bayesian Network Model Combining Color, Shape and Texture Information to Improve Content Based Image Retrieval Systems. LNCC, Petropolis, Brazil. Vailaya A & Anil Jain. 1995. Image Retrieval Using Color and Shape. Michigan : Michigan State University. Vailaya A. 1996. Shape-Based Image Retrieval [thesis]. Michigan : Michigan State University. Vailaya A, et al. 1998. On Image Clasification : City Images vs. Landscapes. Michigan : Department of Computer Science, Michigan State University. Wahyuningsih Y. 2006. Metode Hough Transform untuk Ekstraksi Ciri Bentuk pada Citra Bunga [skripsi]. Bogor : Departemen Ilmu Komputer, Institut Pertanian Bogor.
12
LAMPIRAN
13
Lampiran 1 Penentuan nilai threshold pada Sobel edge detector Penentuan nilai threshold dilakukan melalui langkah-langkah sebagai berikut : 1 Nilai threshold untuk edge detector dari setiap citra yang ada di basis data ditentukan dengan menggunakan fungsi edge yang ada di Matlab sehingga setiap citra akan memiliki nilai threshold yang berbeda-beda. Hasil dari proses ini adalah sebuah array threshold yang mempunyai elemen sebanyak citra di basis data. 2 Nilai mean dan standard deviasi dari hasil pada langkah satu dihitung untuk menentukan penyebaran nilai threshold. Nilai threshold yang digunakan adalah nilai yang berada di dalam selang kepercayaan yaitu antara mean dikurang standard deviasi sampai mean ditambah standard deviasi. 3 Edge dari setiap citra dihitung menggunakan beberapa nilai threshold yang berada di dalam selang kepercayaan. Setelah itu, edge direction histogram untuk tiap-tiap citra dihitung. 4 Nilai precision untuk temu kembali citra menggunakan informasi bentuk dihitung menggunakan edge direction histogram yang diperoleh. Setiap citra dijadikan sebagai kueri sehingga nilai precision akhir dapat diperoleh dengan merata-ratakan nilai precision dari setiap citra kueri. 5 Nilai threshold yang dipilih adalah threshold yang memaksimumkan nilai precision. 6 Nilai threshold untuk edge detector dari setiap citra yang ada di basis data ditentukan dengan menggunakan fungsi edge yang ada di Matlab, sehingga akan dihasilkan sebuah array yang memiliki 1100 elemen. Nilai mean yang diperoleh adalah 0.12348, sedangkan nilai standard deviasinya adalah 0.057643. Dengan demikian, nilai threshold yang digunakan adalah yang berada di antara selang 0.065839 sampai 0.18112. Berdasarkan batas dari selang kepercayaan, maka dipilih beberapa nilai threshold sebagai sample yaitu 0.066, 0.08, 0.10, 0.12, 0.14, 0.16, dan 0.18. 7 Edge dari setiap citra ditentukan menggunakan nilai-nilai threshold di atas, kemudian edge direction histogram-nya ditentukan sehingga untuk setiap citra akan dihasilkan tujuh edge direction histogram. Setelah itu, dengan memperlakukan setiap citra di basis data sebagai citra kueri, maka nilai precision rata-rata akan diperoleh. Tabel di bawah ini menyajikan nilai rata-rata precision yang diperoleh untuk beberapa nilai threshold yang digunakan pada pemrosesan edge : Tabel nilai recall dan precision untuk beberapa nilai threshold Recall
Threshold 0.0660
0.0800
0.1000
0.1200
0.1400
0.1600
0.1800
0.1
0.3346
0.3379
0.3363
0.3219
0.3183
0.3036
0.2882
0.2
0.2859
0.2879
0.2840
0.2754
0.2737
0.2598
0.2482
0.3
0.2580
0.2587
0.2533
0.2441
0.2378
0.2266
0.2153
0.4
0.2407
0.2387
0.2297
0.2197
0.2133
0.2044
0.1962
0.5
0.2221
0.2187
0.2120
0.2025
0.1968
0.1883
0.1787
0.6
0.2062
0.2031
0.1964
0.1871
0.1804
0.1718
0.1647
0.7
0.1914
0.1874
0.1797
0.1714
0.1658
0.1583
0.1525
0.8
0.1735
0.1698
0.1637
0.1555
0.1512
0.1468
0.1426
0.9
0.1522
0.1491
0.1444
0.1407
0.1379
0.1361
0.1343
1
0.1249
0.1223
0.1206
0.1204
0.1218
0.1236
0.1268
Rataan
0.2190
0.2174
0.2120
0.2039
0.1997
0.1919
0.1847
Berdasarkan data yang disajikan pada tabel di atas dapat disimpulkan bahwa nilai rata-rata precision tertinggi diperoleh ketika menggunakan nilai threshold 0.066. Oleh karena itu, nilai threshold 0.066 akan digunakan sebagai threshold pada proses edge detection.
14
Lampiran 2 Nilai recall precision temu kembali citra menggunakan informasi tekstur untuk beberapa level keabuan dalam pembangunan co-occurrence matrix Tabel nilai recall precision untuk beberapa nilai level keabuan Recall
Jumlah level keabuan 8
16
32
64
0
1.0000
1.0000
1.0000
1.0000
0.1
0.3478
0.3561
0.3441
0.3397
0.2
0.3034
0.3136
0.3056
0.2952
0.3
0.2705
0.2798
0.2696
0.2597
0.4
0.2436
0.2564
0.2462
0.2403
0.5
0.2244
0.2383
0.2297
0.2242
0.6
0.2003
0.2134
0.2015
0.1955
0.7
0.1810
0.1929
0.1856
0.1831
0.8
0.1616
0.1724
0.1637
0.1586
0.9
0.1465
0.1525
0.1484
0.1445
1
0.1247
0.1267
0.1253
0.1232
Rataan
0.2913
0.3002
0.2927
0.2876
Jumlah level keabuan yang digunakan adalah 16 karena mengoptimalkan hasil temu kembali menggunakan informasi tekstur.
15
Lampiran 3 Contoh citra yang digunakan untuk masing-masing kelas 1 Kelas mobil
Citra 1
Citra 7
Citra 18
Citra 32
Citra 39
Citra 49
Citra 92
Citra 113
Citra 165
Citra 159
Citra 177
Citra 182
Citra 189
Citra 194
Citra 198
Citra 237
Citra 253
Citra 271
Citra 276
Citra 279
2 Kelas singa
3 Kelas matahari terbenam
Citra 281
Citra 285
Citra 310
Citra 317
Citra 317
Citra 335
Citra 341
Citra 348
Citra 369
Citra 376
Citra 386
Citra 412
Citra 422
Citra 430
4 Kelas tekstur
Citra 382
16
Lanjutan
Citra 444
Citra 516
Citra 528
Citra 534
Citra 550
Citra 558
Citra 563
Citra 567
Citra 577
Citra 589
Citra 595
Citra 621
Citra 630
Citra 644
Citra 654
Citra 668
Citra 676
Citra 686
Citra 716
Citra 722
Citra 726
Citra 731
Citra 746
Citra 752
Citra 754
Citra 757
Citra 759
Citra 762
Citra 767
Citra 769
Citra 772
Citra 774
Citra 788
Citra 792
Citra 800
5 Kelas beruang
6 Kelas gajah
7 Kelas tanda panah
17
Lanjutan 8 Kelas pemandangan
Citra 804
Citra 823
Citra 837
Citra 847
Citra 853
Citra 861
Citra 888
Citra 902
Citra 916
Citra 927
Citra 938
Citra 942
Citra 943
Citra 948
Citra 955
Citra 957
Citra 959
Citra 975
Citra 982
Citra 995
Citra 1002
Citra 1005
Citra 1015
Citra 1024
Citra 1039
Citra 1053
Citra 1063
Citra 1072
Citra 1085
Citra 1098
9 Kelas reptil
10 Kelas pesawat
18
Lampiran 4 Perbandingan nilai recall precision pada kelas beruang, tanda panah, pemandangan, reptil, dan pesawat 1 Perbandingan nilai recall precision pada kelas beruang Recall
Warna
Bentuk
Tekstur
Bayes
0
1.0000
1.0000
1.0000
1.0000
0.1
0.3068
0.1913
0.2504
0.3277
0.2
0.2205
0.1427
0.2107
0.2558
0.3
0.1949
0.1247
0.1765
0.2164
0.4
0.1710
0.1158
0.1568
0.1818
0.5
0.1621
0.1146
0.1420
0.1572
0.6
0.1500
0.1106
0.1309
0.1436
0.7
0.1414
0.1073
0.1249
0.1366
0.8
0.1328
0.1054
0.1293
0.1297
0.9
0.1252
0.1038
0.1228
0.1241
1
0.1081
0.0967
0.1001
0.1036
Rataan
0.2466
0.2012
0.2313
0.2524
2 Perbandingan nilai recall precision pada kelas tanda panah Recall
Warna
Bentuk
Tekstur
Bayes
0
1.0000
1.0000
1.0000
1.0000
0.1
0.9737
0.6777
0.9830
0.9877
0.2
0.9666
0.5526
0.8071
0.9796
0.3
0.8122
0.4612
0.5199
0.7726
0.4
0.8318
0.3997
0.3121
0.6194
0.5
0.8148
0.2677
0.1957
0.5362
0.6
0.7856
0.1752
0.0596
0.4358
0.7
0.7714
0.1187
0.0625
0.4201
0.8
0.7810
0.0593
0.0364
0.3846
0.9
0.7843
0.0453
0.0396
0.3568
1
0.7997
0.0406
0.0419
0.2554
Rataan
0.8474
0.3453
0.3689
0.6135
19
Lanjutan 3 Perbandingan nilai recall precision pada kelas pemandangan Recall
Warna
Bentuk
Tekstur
Bayes
0
1.0000
1.0000
1.0000
1.0000
0.1
0.2594
0.2268
0.1674
0.2291
0.2
0.2149
0.1833
0.1567
0.1855
0.3
0.1966
0.1611
0.1506
0.1682
0.4
0.1808
0.1533
0.1521
0.1607
0.5
0.1726
0.1488
0.1507
0.1557
0.6
0.1651
0.1457
0.1483
0.1495
0.7
0.1568
0.1430
0.1423
0.1444
0.8
0.1473
0.1377
0.1377
0.1400
0.9
0.1368
0.1281
0.1338
0.1316
1
0.1252
0.1247
0.1285
0.1244
Rataan
0.2505
0.2320
0.2244
0.2354
4 Perbandingan nilai recall precision pada kelas reptil Recall
Warna
Bentuk
Tekstur
Bayes
0
1.0000
1.0000
1.0000
1.0000
0.1
0.2650
0.2264
0.1119
0.2597
0.2
0.1066
0.1653
0.0863
0.1225
0.3
0.0644
0.1469
0.0775
0.1061
0.4
0.0517
0.1395
0.0738
0.1005
0.5
0.0507
0.1309
0.0719
0.0956
0.6
0.0517
0.1245
0.0627
0.0844
0.7
0.0530
0.1158
0.0599
0.0746
0.8
0.0554
0.1030
0.0606
0.0721
0.9
0.0577
0.0886
0.0608
0.0705
1
0.0595
0.0691
0.0602
0.0630
Rataan
0.1651
0.2100
0.1569
0.1863
20
Lanjutan 5 Perbandingan nilai recall precision pada kelas pesawat Recall
Warna
Bentuk
Tekstur
Bayes
0
1.0000
1.0000
1.0000
1.0000
0.1
0.7421
0.1085
0.4520
0.6576
0.2
0.7167
0.0864
0.3744
0.5908
0.3
0.6464
0.0811
0.3375
0.5118
0.4
0.5316
0.0806
0.3050
0.4464
0.5
0.4788
0.0774
0.2597
0.3674
0.6
0.4207
0.0771
0.2228
0.2940
0.7
0.3579
0.0810
0.1848
0.2292
0.8
0.2779
0.0851
0.1470
0.1799
0.9
0.2336
0.0887
0.1225
0.1340
1
0.1374
0.0924
0.1018
0.0987
Rataan
0.5039
0.1689
0.3189
0.4100
Lampiran 5 Antar muka sistem
21