Proceeding, Seminar Ilmiah Nasional Komputer dan Sistem Intelijen (KOMMIT 2008) Auditorium Universitas Gunadarma, Depok, 20-21 Agustus 2008
ISSN : 1411-6286
PENGGUNAAN FITUR TEKSTUR LOKAL PADA KLASIFIKASI CITRA X-RAY 1)
Bertalya Prihandoko 3) Djati Kerami 2)
Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Gunadarma Jl. Margonda Raya, 100, Pondok Cina, Depok Telp : (021) 78881112 1)
E-mail :
[email protected] s2) E-mail :
[email protected] 3) E-mail :
[email protected]
ABSTRAK Selama ini proses pengklasifikasian citra X-ray di rumah sakit, khususnya di Indonesia masih dilakukan secara manual dengan memanfaatkan pengetahuan medis dari pakar radiologi. Hal ini menyebabkan proses pengklasifikasian menjadi lambat serta informasi yang dihasilkan menjadi tidak akurat. Untuk itu diperlukan suatu mekanisme yang secara otomatis dapat mengklasifikasikan citra X-ray berdasarkan karakteristik dari citra X-ray itu sendiri. Pada makalah ini, kami mempresentasikan proses pengklasifikasian citra X-ray dengan menggunakan hanya fitur tekstur. Fitur tesktur diekstrak dari citra X-ray secara lokal dengan melakukan segmentasi terlebih dahulu untuk mendapatkan area objek citra. Kemudian pada area objek citra diekstrak fitur tekstur secara statistik. Untuk menghitung similaritas diaplikasikan teknik Euclidean distance dan Jeffrey Divergence Kata kunci : citra X-ray, klasifikasi, fitur tekstur, area objek 1. PENDAHULUAN Produksi citra medis di rumah sakit untuk membantu pekerjaan dokter dalam mendiagnosa penyakit pasien semakin meningkat tajam. Citra medis yang dihasilkan adalah citra yang diakuisisi dari peralatan medis X-ray, USG, MRI, fotografi, dan lain-lain. Hal ini, tentunya membutuhkan suatu mekanisme penyimpanan maupun retrieval citra medis dari database secara otomatis. Di samping itu proses pengklasifikasian citra medis sesuai dengan kriteria-kriteria pada domain medis masih dikerjakan secara manual menggunakan kepakaran para dokter atau radiologis. Pada saat proses Penggunaan Fitur Tekstur Lokal (Bertalya)
pendokumentasian, kategori atau klas dari citra medis dianotasikan secara manual atau dengan memberikan kode khusus pada citra medis tersebut. Tentunya, hal ini akan menyebabkan proses pendokumentasian menjadi lambat serta informasi yang dihasilkan menjadi tidak akurat. Untuk menyelesaikan masalah ini dibutuhkan suatu mekanisme otomatis yang dapat mengklasifikasikan citra medis secara akurat dan cepat dari suatu citra queri terhadap klas citra yang telah didefinisikan sebelumnya berdasarkan karakteristik dari citra itu sendiri. Pada penelitian ini, kami berorientasi pada proses pengklasifikasian 359
Proceeding, Seminar Ilmiah Nasional Komputer dan Sistem Intelijen (KOMMIT 2008) Auditorium Universitas Gunadarma, Depok, 20-21 Agustus 2008
citra medis, khususnya citra X-ray dengan menggunakan fitur tekstur untuk merepresentasikan salah satu konten dari citra X-ray. Fitur tekstur ini diperoleh dengan menganalisis distribusi statistik dari intensitas citra. Akan tetapi proses ekstraksi tidak dilakukan secara global pada keseluruhan citra melainkan secara lokal hanya pada area objek citra saja. Area objek citra diperoleh dengan melakukan terlebih dahulu proses segmentasi objek citra. Tujuannya untuk menghindari intensitas citra yang tidak relevan dengan objek citra sehingga proses analisis statistik menjadi lebih akurat dibandingkan dengan proses secara global. Fitur tekstur yang digunakan adalah third moment, uniformity dan entropy. Untuk mengetahui tingkat keakuratan dari metode ini, dihitung recognition rate berdasarkan hasil perhitungan similaritas menggunakan teknik Euclidean distance dan Jeffrey Divergence. 2. TINJAUAN PUSTAKA Menurut Guld dan Lehmann [Guld et al., 2004; Lehmann et al., 2005], pengklasifikasian citra medis didefinisikan sebagai suatu pengelompokkan citra medis ke dalam klas citra yang telah didefinisikan sebelumnya. Sama halnya dengan proses kategorisasi pada metode IRMA [Lehmann et al., 2000; 2004]. Jain [Jain et al., 2000] mendefinisikan pengklasifikasian otomatis sebagai suatu pemetaan citra ke dalam klasnya. Hal ini melibatkan tiga prinsip dasar : (1). representasi, artinya ekstraksi fiturfitur tertentu untuk menggambarkan konten citra, (2). adaptasi, merupakan penyeleksian subset fitur terbaik dengan melihat informasi yang diskriminatif, (3). generalisasi, artinya training dan evaluasi dari pengklasifikasinya. Sejumlah peneliti telah mengajukan berbagai metode klasifikasi citra [Lehmann et al.,, 2000; 2004; 2005; Guld et al., 2004; Pinhas and Greenspan, 2003; Parades et 360
ISSN : 1411-6286
al., 2002]. Proyek IRMA (Image Retrieval in Medical Applications) dalam [Lehmann et al., 2000; 2004], klasifikasi merupakan tahap yang sangat penting pada proses retrieval citra berbasis konten. Tahap ini bertujuan untuk menentukan modalitas pencitraan dan orientasinya dari area tubuh yang diperiksa serta sistem fungsional untuk setiap citra queri. Skema klasifikasi secara detail telah dibangun untuk mengkodekan citra medis menurut konten citra itu sendiri. Konten dari suatu citra dapat digambarkan dengan fitur warna, tekstur, betuk objek dan informasi spasial. Untuk merepresentasikan konten citra medis, sebagian besar peneliti menggunakan fitur tekstur yang diekstrak secara global pada citra. Fitur tekstur dapat diekstrak secara struktural atau statistik [Gonzales et al., 2005; Long et al., 2003]. Secara struktural, tekstur suatu citra digambarkan dengan mengidentifikasikan aturan penempatan, metodenya terdiri dari morphological operator atau adjacency graph. Sedangkan secara statistik dengan menganalisa distribusi statistik dari intensitas citra, termasuk Fourier power, co-occurence matrice, Tamura feature dan lain-lain. Kebanyakan peneliti dalam ruang lingkup klasifikasi citra medis menggunakan fitur tekstur yang diekstrak secara global dari citra untuk menggambarkan konten citra medis. Pada Proyek IRMA [Lehmann et al., 2005; Guld et al., 2004] digunakan fitur tekstur sebagai salah satu parameter untuk mengekstrak fitur global citra, di samping frekuensi dan struktur citra. Mereka berhasil mengklasifikasikan sebanyak 6231 citra medis ke dalam 81 kategori dengan menggunakan fitur tekstur TAMURA dengan tingkat keakuratan sebesar 66%. Dan meningkat menjadi 85% setelah fitur tekstur TAMURA dikombinasikan dengan Image Distortion Model (IDM). Demikian pula Pinhas [Pinhas and Greenspan, 2003] menggunakan fitur tekstur (kontras) yang dikombinasikan dengan intensitas dan informasi spasial x Penggunaan Fitur Tekstur Lokal (Bertalya)
Proceeding, Seminar Ilmiah Nasional Komputer dan Sistem Intelijen (KOMMIT 2008) Auditorium Universitas Gunadarma, Depok, 20-21 Agustus 2008
dan y untuk menggambarkan objek citra dalam bentuk ‘blob’. Mereka mengklaim berhasil mengklasifikasikan sebanyak 851 citra radiologi ke dalam 8 klas citra dengan tingkat kesalahan sebesar 1%. Algoritma pencocokan yang digunakan adalah leaveone-out procedure. 3. METODE PENELITIAN Secara garis besar, proses klasifikasi citra X-ray yang kami lakukan terdiri atas proses ekstraksi fitur tekstur dan proses pencocokan. Akan tetapi untuk meningkatkan keakuratan dalam proses
ISSN : 1411-6286
ekstraksi fitur tekstur dengan menghindari area objek citra yang tidak relevan dengan area objek citra yang menjadi objek target, maka pada citra X-ray terlebih dahulu dilakukan proses segmentasi. Proses segmentasi ditujukan untuk mendapatkan area dari objek citra medis dengan memisahkan area di luar dari batas area objek. Kemudian pada area objek citra hasil dari segmentasi dilakukan proses ekstraksi fitur tekstur. Skema proses klasifikasi citra X-ray ini dapat dilihat pada Gambar 1.
Gambar 1. Skema Proses Klasifikasi Citra X-ray
Gambar 1 mengilustrasikan proses klasifikasi citra X-ray yang dimulai dengan citra original yang disegmentasi untuk memperoleh area objek citra, kemudian dilanjutkan proses ekstraksi fitur tekstur terbatas hanya pada ruang lingkup area objek citra saja. Hasil ekstraksi selanjutnya direpresentasikan dalam vektor. Vektor fitur inilah yang digunakan pada proses pencocokan dengan merujuk pada citra
Penggunaan Fitur Tekstur Lokal (Bertalya)
referensi pada database untuk menentukan klas objek citra X-ray. Proses Segmentasi Objek Citra Proses segmentasi objek citra X-ray bertujuan untuk memperoleh citra biner dari objek citra dengan menggunakan konsep morfologi terdiri atas proses thresholding, deteksi tepi, dilation, filling, erosion dan cleaning. Proses ini secara detail dapat dilihat pada Gambar 2.
361
Proceeding, Seminar Ilmiah Nasional Komputer dan Sistem Intelijen (KOMMIT 2008) Auditorium Universitas Gunadarma, Depok, 20-21 Agustus 2008
ISSN : 1411-6286
Gambar 2. Skema Teknik Segmentasi Objek Citra X-ray
Seperti yang digambarkan pada Gambar 2, citra original atau citra uji diaplikasikan proses thresholding berbasis pada Metode Otsu [Gonzales et al., 2005]. Dilanjutkan dengan proses deteksi tepi objek menggunakan teknik pendeteksi tepi Canny untuk mendapatkan garis-garis tepi dari objek. Pendeteksi tepi Canny dipilih diantara beberapa pendeteksi tepi lainnya dikarenakan lebih banyak menghasilkan garis-garis tepi objek pada citra [Gonzales et.al., 2005]. Kemudian pada garis-garis tepi objek citra diaplikasikan proses dilation atau penebalan dengan merujuk pada struktur morfologi citra yakni garis, diamond, dan lain-lain, sehingga antara satu garis tepi dengan garis tepi yang berdekatan akan saling terhubung. ‘Lubang’ yang terdapat pada area objek citra biner hasil dari proses dilation diisi dengan mengaplikasikan proses filling
362
sehingga menjadi suatu area objek citra biner yang utuh. Proses selanjutnya, area objek citra biner ditipiskan dengan proses erosion. Seperti proses dilation, proses erosion juga dikontrol oleh elemen terstruktur. Dikarenakan proses ini kemungkinan akan menghasilkan lebih dari satu area objek citra biner maka dilanjutkan dengan proses cleaning, dengan menghilangkan area-area objek citra biner yang kecil. Untuk memperoleh area objek dengan tektur original sehingga tidak kehilangan intensitas dari citra original maka area objek citra biner dari proses segmentasi ini dikembalikan ke citra original. Kemudian dilakukan proses komplemen pada citra dengan menjadikan area di luar dari batas tepi objek sebagai latar belakang objek dan diberi nilai 0. seperti terlihat pada Gambar 3.
Penggunaan Fitur Tekstur Lokal (Bertalya)
Proceeding, Seminar Ilmiah Nasional Komputer dan Sistem Intelijen (KOMMIT 2008) Auditorium Universitas Gunadarma, Depok, 20-21 Agustus 2008
a.
ISSN : 1411-6286
b.
Gambar 3. a. Citra Original. b. Area Objek Citra Hasil Segmentasi
Pada area objek citra hasil segmentasi dengan tekstur original seperti diperlihatkan Gambar 3.b. diaplikasikan proses ekstraksi fitur tekstur dimana nilainilainya akan direpresentasikan pada vektor fitur. Proses Ekstraksi Fitur Tekstur Dari hasil percobaan terhadap enam fitur tekstur yakni mean, standard deviation, smoothness, third moment, uniformity dan entropy maupun kombinasi yang mungkin diperoleh tiga kombinasi dari ketiga fitur tekstur yang memberikan hasil yang terbaik. Formula ketiga fitur tekstur ini didasarkan pada analisis statistik dengan menggunakan histogram dari intensitas citra antara lain [Long et al., 2003] L 1. Third moment, µ3= ∑(zi–m)3.p(zi) (1) i=0 Formula (1) untuk mengukur kecondongan histogram citra. Histogram citra yang simetris mempunyai nilai 0, sedangkan positif untuk histogram yang cenderung ke kanan, dan negatif untuk histogram yang cenderung ke kiri. L 2.Uniformity, U = ∑ p2 (zi) (2) i=0 Formula (2) untuk mengukur keseragaman dari intensitas citra. Nilainya
Penggunaan Fitur Tekstur Lokal (Bertalya)
akan mencapai maksimum jika semua level keabuannya adalah sama atau mirip. L 3.Entropy, e = - ∑ p (zi) log2.p(zi) (3) i=0 Formula (3) untuk mengukur keragaman dari intensitas citra. Hasil dari ekstraksi ketiga fitur tekstur ini disimpan dalam vektor. Proses Pencocokan Proses selanjutnya, proses pencocokan dari vektor fitur yang berasal dari citra uji dengan vektor fitur pada citra referensi. Vektor fitur citra uji maupun citra referensi terdiri dari fitur tekstur yang diperoleh secara statistik. Proses pencocokan dilakukan dengan menghitung similaritas antara kedua vektor fitur yang merepresentasikan dua citra yang berbeda, misalnya I dan J. Penghitungan similaritas antara dua citra I dan J, adalah penghitungan jarak antara vektor fitur yang merepresentasikan kedua citra I dan J. Jarak terkecil dari hasil perhitungan mengindikasikan klas dari objek citra yang diuji. Pada metode klasifikasi citra medis ini digunakan dua teknik penghitungan similaritas [Long et al., 2003] yakni a. Euclidean distance D(I,J) = √ ( ∑ | fi(I) - fi(J) | p ) (4) i Pada formula (4), p = 1,2 dan ∞, D(I,J) adalah jarak antara citra uji dan citra 363
Proceeding, Seminar Ilmiah Nasional Komputer dan Sistem Intelijen (KOMMIT 2008) Auditorium Universitas Gunadarma, Depok, 20-21 Agustus 2008
ISSN : 1411-6286
referensi. Variabel fi(I) merupakan nilai parameter i pada citra I (citra uji),
sedangkan fi(J) merupakan nilai parameter i pada citra J (citra referensi). c. Jeffrey Divergence D(I,J) = ∑ fi(I) log( fi(I) / ^fi) + fi(J) log ( fi(J) / ^fi) (5) i ^ fi = [fi(I) + fi(J)] / 2
Jeffrey Divergence merupakan teknik pengembangan dari Euclidean distance. Sebagai alat ukur untuk mengetahui keakuratan metode pengklasifikasian citra X-ray digunakan recognition rate = citra yang dapat diklasifikasikan secara tepat x 100 % jumlah keseluruhan citra Berdasarkan hasil penghitungan similaritas dapat diketahui jumlah citra yang dapat diklasifikasikan secara tepat maupun yang diklasifikasikan dengan salah. Dari jumlah citra yang dapat diklasifikasikan secara tepat, dibagi dengan jumlah keseluruhan dari citra X-ray, kemudian dikalikan 100 %, akan diperoleh nilai recognition rate. 4. HASIL DAN PEMBAHASAN Pada percobaan digunakan 35 citra X-ray yang diuji untuk ditentukan klas objek citra dan 7 citra X-ray yang ditentukan sebagai citra referensi dimana ketujuh citra yang berbeda ini mengindikasikan tujuh klas citra yang berbeda terdiri atas kepala, leher, dada, panggul, tulang belakang, tangan dan kaki. Hasil ekstraksi fitur tekstur third moment, uniformity dan entropy terhadap citra referensi dapat dilihat pada Tabel 1. Contohnya untuk citra kepala diperoleh third moment sebesar 6.3277, uniformity sebesar 0.2594 dan entropy sebesar 4.7850.
Tabel 1. Data Ketiga Fitur Tekstur pada Citra Referensi Third NO CITRA moment Uniformity Entropy 1
kepala
6.3277
0.2594
4.7850
2
leher
4.8125
0.6372
1.9295
3
dada
3.8507
0.2698
4.2769
4
panggul
6.3411
0.5667
2.4229
5
t.belakang
10.8042
0.4733
3.2391
6
tangan
5.7895
0.6936
1.6584
7
kaki
7.2663
0.6195
2.0507
Tahap selanjutnya, diimplementasikan kombinasi dari ketiga fitur tekstur, yakni kombinasi thirdmoment+entropy(T+E), thirdmoment+uniformity(T+U), dan uniformity+entropy(U+E). Kemudian proses pencocokan dengan menghitung similaritas antara vektor fitur dari ketiga kombinasi yang merepresentasikan citra uji dengan vektor fitur citra referensi dengan teknik pengukuran similaritas Euclidean distance dan Jeffrey Divergence Hasil perhitungan similaritas dapat dilihat pada Tabel 2. Tabel 2. Recognition Rate untuk Kombinasi 2 Fitur Tekstur Pada Area Objek Fitur
Euclidean
Jeffrey
Tekstur
Distance
Divergence
T+E
29%
37%
T+U
26%
31%
U+E
26%
26%
Pada Tabel 2. ditunjukkan nilai recognition rate untuk kombinasi thirdmoment+entropy dan thirdmoment+uniformity lebih baik dibandingkan dengan kombinasi unformity+entropy. karena di atas 30 %. Sedangkan untuk teknik penghitungan 364
Penggunaan Fitur Tekstur Lokal (Bertalya)
Proceeding, Seminar Ilmiah Nasional Komputer dan Sistem Intelijen (KOMMIT 2008) Auditorium Universitas Gunadarma, Depok, 20-21 Agustus 2008
similaritas yang mempunyai nilai recognition rate yang tinggi untuk semua kombinasi adalah Jeffrey Divergence. 5. KESIMPULAN DAN SARAN Dari hasil penelitian dapat disimpulkan bahwa fitur tekstur, khususnya untuk fitur tekstur yang diperoleh dari analisis distribusi statistik dari intensitas citra yakni kombinasi thirdmoment+entropy dan thirdmoment+uniformity dapat digunakan pada proses klasifikasi citra X-ray dengan recognition rate sebesar 37 %. Tingkat keakuratan yang diperoleh berada di bawah peneliti yang lain. Hal ini disebabkan perbedaan pada teknik pencocokan yang digunakan. Di samping itu juga perbedaan pada jumlah data citra yang digunakan. Untuk memperoleh hasil yang lebih baik akan diperbaiki pada kuantitas dan kualitas dari data citra X-ray yang diuji maupun pada citra referensi.
[4]
[5]
[6]
[7]
DAFTAR PUSTAKA [1]
[2]
[3]
Gonzales, Rafael C, R.E. Woods and S.L. Eddins, 2005, Digital Image Processing Using MATLAB, Pearson Education, India Guld, MO, D.Keysers, T.Deselaers, M. Leisten, H. Schubert, H. Neys and TM. Lehmann, 2004, “Comparison of Global Features for Categorization of Medical Images”, Proc. SPIE, 5371, 211-222 Jain AK, Duin RPW, Mao J, 2000, “Statistical Pattern Recognition: A Review”, IEEE Transactions on Pattern Analysis and Machine Intelligence 22(1), 4-36
Penggunaan Fitur Tekstur Lokal (Bertalya)
[8]
[9]
ISSN : 1411-6286
Lehmann, TM, B. Wein, J.Dahmen, J.Bredno, F.Vogelsang, and M.Kohnen, 2000, “Content-Based Image Retrieval in Medical Applications: A Novel Multi-Step Approach”, International Society for Optical Engineering (SPIE), volume 3972 (32) , pp:312-320 Lehmann, TM, MO. Guld, C. Thies, B. Fischer, K. Spitzer, D. Keysers, H. Ney, M. Kohnen, H. Schubert and BB. Wein, 2004, “Content-based Image Retrieval In Medical Applications”, Methods of Information in Medicine, 43, 354-361 Lehmann, TM, MO. Guld, T Deselaers, D Keysers, H. Schubert, K Spitzer, S, H. Ney, and BB. Wein, 2005, “Automatic Categorization of Medical Images for Content-based Retrieval and Data Mining”, Computerized Medical Imaging and Graphics,29, 143-155 Long, F. H. Zhang and DD. Feng, 2003, “Fundamentals of Content-Based Image Retrieval”, Multimedia Information Retrieval and Management: Technological Fundamentals and Applications Paredes,R, D. Keyaers, TM.Lehmann, B.Wein, H.Ney and E.Vidal, 2002, “Classification of Medical Images Using Local Representation”, In Meiler M, Saupe D, Kruggel, Handels H, Lehmann TM (Hrsg) Bildverarbeitung fur die Medezin, Springer-Verlag, Berlin, 171-174 Pinhas A and H Greenspan, 2003, “A Continuous and Probabilistic Framework for Medical Image Representation and Categorization”, Proceeding SPIE, 5371, 230-238
365