Perbandingan Metode Fuzzy C-Means Clustering dan Fuzzy C-Shell Clustering (Studi Kasus: Kabupaten/Kota di Pulau Jawa Berdasarkan Variabel Pembentuk Indeks Pembangunan Manusia)
Agus Widodo1, Purhadi2 Mahasiswa Pascasarjana Jurusan Statistika, FMIPA, ITS 2 Jurusan Statistika, FMIPA, ITS
1
1,2
Jurusan Statistika Kampus ITS Sukolilo, Surabaya, 60111 E-mail:
[email protected],
[email protected]
Abstract Cluster analysis is a multivariate analysis technique with the main purpose is to classify objects into groups based on the characteristics observation. Clustering methods currently being developed is the method of grouping based on the fuzzy sets, also called as fuzzy clustering analysis. Various methods of fuzzyclustering analysis, such as Fuzzy CMeans Cluster (FCM) and Fuzzy C-Shell Cluster (FCS). FCM is developed based on c-means using fuzzy weighting, while the FCS applying geometric partition, in particular using the circle and ellipse shapes. While the optimum number of groups is obtained by the criteria of validity measure, mentioned as Xie and Beni index, while for the right method is used the ratio of standard deviation within the group against the standard deviation between groups. FCM and FCS will be applied to the grouping of districts/cities by using the variable forming the Human Development Index (HDI) in 2008 for the districts/cities on the island of Jawa. HDI forming variables, consisting of the life expectancy; literacy rates, mean years school, and the Purchasing Power Parity . The results obtained FCM method has optimum number of groups is six groups, and FCS method has optimum number of groups is four groups. Keywords : Fuzzy C-Means cluster, Fuzzy C-shell Cluster, Xie and Beni Index, Human Development Index (HDI) Abstrak Analsis kelompok merupakan salah satu teknik dalam analisis multivariat yang mempunyai tujuan utama untuk mengelompokkan objek-objek pengamatan menjadi beberapa kelompok berdasarkan karakteristik yang dimilikinya. Metode pengelompokkan yang saat ini sedang berkembang adalah metode pengelompokkan yang berdasarkan himpunan fuzzy atau yang disebut sebagai fuzzy clustering analysis. Berbagai metode dalam fuzzy clustering analysis, diantaranya adalah Fuzzy C-Means Cluster (FCM) dan Fuzzy C-Shell Cluster (FCS). FCM adalah pengembangan dari K-mean dengan menggunakan pembobotan fuzzy, sedangkan FCS menggunakan pengelompokkan yang bersifat geometris, khususnya menggunakan bentuk lingkaran dan ellips. Untuk jumlah kelompok yang optimum didapatkan dengan menggunakan kriteria ukuran validitas, yaitu Indeks Xie dan Beni, sedangkan untuk metode yang tepat digunakan rasio simpangan baku didalam kelompok terhadap simpangan baku antar kelompok.
1
FCM dan FCS akan diterapkan pada pengelompokkan kabupaten/kota dengan menggunakan variabel pembentuk Indeks Pembangunan Manusia (IPM) tahun 2008 untuk kabupaten/kota di pulau Jawa. Variabel-variabel pembentuk IPM, terdiri dari angka harapan hidup; angka melek huruf; rata-rata lamanya sekolah, dan Purchasing Power Parity (paritas daya beli). Pada FCM jumlah kelompok optimum sebanyak enam kelompok, sedangkan pada FCS jumlah kelompok optimum sebanyak 4 kelompok.
Kata kunci : Fuzzy C-Means cluster, Fuzzy C-shell Cluster, Indeks Xie dan Beni, Indeks Pembangunan Manusia
1. Pendahuluan Pada proses pengelompokkan berhierarki atau tak berhierarki, pembentukan kelompok dilakukan dengan sedemikian rupa sehingga setiap objek berada tepat pada satu kelompok. Namun, pada suatu saat, hal itu tidak dapat dilakukan untuk menempatkan suatu objek tepat pada suatu kelompok, karena sebenarnya objek tersebut terletak diantara dua atau lebih kelompok yang lain. Sehingga perlu dilakukan penggelompokkan dengan menggunakan fuzzy clustering yang memperhitungkan tingkat keanggotaan himpunan fuzzy sebagai dasar pembobotan [1]. Pengelompokkan dengan logika fuzzy terus berkembang karena pada umumnya data tidak bisa dipisahkan secara tegas ke dalam kelompok, tetapi memiliki kecenderungan yang dinyatakan sebagai derajat keanggotaan, yang bernilai diantara 0 dan 1, terhadap kelompoknya [2]. Pengelompokkan dengan menggunakan algoritma Fuzzy c-means (FCM) merupakan salah satu teknik yang merupakan perkembangan metode pengelompokkan tak berhierarki (Cmeans) dengan menggunakan logika fuzzy. FCM pertama kali diperkenalkan oleh Dunn pada tahun 1973 [3] yang kemudian dikembangkan oleh Bezdek [4] yang digunakan dalam bidang pengenalan pola (pattern recognition). Metode FCM sering digunakan dalam pengelompokkan, karena metode ini memberikan hasil yang halus dan cukup efektif untuk meningkatkan homogenitas tiap kelompok yang dihasilkan [5]. Dalam penelitian ini akan digunakan metode Fuzzy c-shell cluster sebagai pembanding dari fuzzy c-means cluster untuk melihat seberapa efisien metode fuzzy c-mean clsuter digunakan dalam fuzzy clustering karena metode FCS jarang digunakan. [6], menjelaskan teknik pendekatan yang dipakai dalam FCS menggunakan pengelompokkan bersifat geomteris, khususnya menggunakan bentuk lingkaran dan ellips. Bentuk dasar kelompok adalah p-dimensi hyper-spherical shell yang dikarakteristikan dengan pusat dan radius. Dalam penelitiannya diaplikasikan sebagai pengenalan pola (pattern recognition) dalam bidang analisa citra. Salah satu indikator keberhasilan pembangunan adalah Indeks Pembangunan Manusia (IPM), dimana IPM sebagai indikator modal manusia dalam mencapai kualitas hidup yang lebih baik tergambar melalui komponen pendidikan, ekonomi, dan kesehatan. Modal manusia di suatu daerah untuk bersaing dengan daerah lain ini tidak hanya bersumber dari jumlah penduduk, melainkan juga dari ketrampilan yang dimiliki penduduk dan kesehatan penduduknya. Penghitungan IPM didasarkan 4 variabel yang memliki satuan pengukuran yang berbeda, terdiri dari: peluang hidup (diukur dengan variabel Angka Harapan Hidup dalam tahun), pendidikan (diukur dengan variabel Angka Melek Huruf dalam persen dan Angka Rata-rata Lama Sekolah dalam tahun), dan hidup layak (diukur dengan variabel paritas daya
beli perbulan dalam rupiah). Tinggi rendahnya IPM Kabupaten/Kota di pulau Jawa hanya ditunjukkan Indeks Komposit tetapi tidak ditunjukkan variabel mana yang dominan terhadap tinggi/rendahnya peringkat IPM. Provinsi-provinsi di pulau Jawa pada tahun 2008, memiliki peringkat IPM diatas 20 besar, kecuali provinsi Banten yang memiliki peringkat ke-23. Provinsi DKI Jakarta sebagai peringkat pertama, kemudian propinsi Daerah Istimewa Yogyakarta dengan peringkat 4. Pada provinsi Jawa Tengah, memiliki peringkat ke-14, sedangkan propinsi Jawa Barat pada peringkat ke-15, serta propinsi Jawa Timur memiliki peringkat ke-19 dari seluruh propinsi yang ada di Indonesia. Pengelompokkan wilayah bertujuan untuk membagi wilayah-wilayah dalam beberapa kelompok dengan karakteristik yang memiliki tingkat keserupaan yang tinggi di dalam setiap kelompok dan memiliki perbedaan antar kelompok. Pada kasus pengelompokkan kabupaten/kota di pulau Jawa berdasarkan Indikator Pembangunan Manusia ini ingin didapatkan metode pengelompokkan yang tepat untuk data komponen pembentuk IPM. Pengelompokan dengan kedua metode ini memerlukan indeks validitas yang digunakan untuk mengetahui banyak kelompok yang optimum yang terbentuk. Indeks validitas yang digunakan adalah Indeks Xie dan Beni [7]. Dalam penelitiannya, indeks ini memiliki ketepatan dan keandalan yang tinggi dalam memberikan banyak kelompok optimum. Penentuan jumlah kelompok yang optimum yang akan digunakan dari kedua metode tersebut berdasarkan pada kiteria fungsi objektif, ukuran validitas, dan waktu komputasi. Adapun tujuan penelitian ini adalah membandingkan pengelompokkan antara metode fuzzy c-shell cluster dan fuzzy cmeans cluster dengan menggunakan indeks validitas cluster dalam kasus pengelompokkan kabupaten/kota di Pulau Jawa berdasarkan variabel pembentuk IPM. 2. Tinjauan Pustaka Pada bagian ini membahas bahan rujukan yang digunakan sebagai tinjauan pustaka, sebagai berikut: 2.1. Distribusi Multivariat Normal Pengujian data normal multivariat di uji dengan membandingkan jarak kuadrat [8]: d 2j = X j − X ′ S −1 X j − X
(
)
(
)
dengan: X j adalah sampel random ke j, j=1,2,…,n, X adalah vektor rata-rata kolom, S −1 adalah matrik varians kovarians, Hipotesis yang digunakan adalah H0 adalah data berdistribusi normal multivariat sedangkan H1 adalah data tidak berdistribusi normal multivariat. H0 diterima jika nilai d 2j < χ p2 ,α lebih dari 50%. 2.2. Pengujian Mean Vektor untuk Beberapa Populasi Untuk melihat rata-rata vektor dari p buah populasi mempunyai nilai yang sama atau maka perlu dilakukan uji hipotesis. Bentuk hipotesisnya adalah H 0 : µ1= µ2= ...= µc= µ , dan H1 : paling sedikit ada satu µi yang berbeda. Statistik uji
tidak,
yang digunakan adalah Wilk’s Lambda dengan rumus [8]. Dimana tolak H0 jika Λ* < Λα ;q ;vH ;vE dengan derajat bebas hipotesis adalah vh= k − 1 dan derajat bebas error adalah
vE = ∑ i =1 ni − k = n − k . k
3
ni
∑∑ ( X c
=i 1 =j 1
Λ* =
T
ni
∑∑ ( X c
− X i )( X ij − X i )
ij
=i 1 =j 1
− X )( X ij − X )
T
ij
2.3. Pengujian Covarian Matrik untuk Beberapa Populasi Analisis selanjutnya adalah pengujian covarian matrik untuk beberapa populasi yang menggunakan statistik uji Box M, dengan hipotesisnya: H 0 : Σ1 =Σ 2 =... =Σ c sedangkan
H1 : satu Σi yang berbeda, Statistik uji yang digunakan adalah [9] : 1
2 = −2(1 − p1 ) ∑ i 1 b= χ hitung ln S pool ∑ i 1 bi i ln Si − = 2 2
Dengan : S pool ni
Si =
∑ ( X j =1
1
c
∑ = ∑
c bS i =1 i i , p1 = c b i =1 i
∑
i − i =1 b i
c
2 2q + 3q − 1 dan b= n − 1, serta i i c b 6(q + 1)(c − 1) i =1 i
1
c
∑
− X i ) ( X ij − X i ) . Terima hipotesa nol yang berarti matriks varian-kovarians ni − 1 T
ij
2 bersifat homogen jika χ hitung ≤ χ 12 2
( c −1) q ( q +1),α
.
2.4. Teori Himpunan Fuzzy Konsep dari himpunan fuzzy sejalan dengan himpunan tegas, hanya saja derajat atau tingkat keanggotaan dari himpunan fuzzy tersebut bersifat kontiyu dimana nilainya dalam interval [0,1]. Dimisalkan didefinisikan suatu himpunan Z yang anggotanya dapat dilambangkan dengan z . Suatu himpunan fuzzy A dalam Z yang didefinisikan dengan = A {( z , uA( z ) | z ∈ Z } , uA( z ) adalah fungsi keanggotaan untuk himpunan fuzzy A. Dimana fungsi keanggotaan akan memetakan setiap elemen dari Z ke derajat keanggotaan antara 0 dan 1. Semakin nilai fungsi keanggotaan mendekati satu, maka semakin tinggi derajat atau tingkat keanggotaan z dalam A. Himpunan fuzzy dalam pengelompokan berperan dalam pembentukan fungsi dan tingkat keanggotaan dari setiap objek dalam kelompok. 2.5. Fuzzy C-means Cluster Metode FCM merupakan pengembangan dari metode tak berhierarki c-means cluster yang mengalokasikan data ke dalam masing-masing kelompok dengan memanfaatkan teori himpunan fuzzy. Dalam metode FCM digunakan variabel fungsi keanggotaan, uik, yang merujuk pada seberapa besar kemungkinan suatu data bisa menjadi anggota ke dalam suatu kelompok. Kemudian [4] memperkenalkan suatu variabel m yang merupakan weigthing exponent dari membership function. Nilai m mempunyai nilai diatas satu (1 < m < ∞). Pada saat ini belum ada ketentuan yang jelas mengenai besaran nilai m yang optimal dalam proses tersebut. Nilai yang paling sering digunakan oleh para peneliti untuk variabel m adalah 2 [10].
Fungsi keanggotaan untuk suatu data ke dalam suatu kelompok tertentu dihitung dengan menggunakan rumus sebagai berikut:
c d2 uik = ∑ ik2 j =1 d jk
1 m −1
−1
(1)
Fungsi keanggotaan tersebut diatas, merujuk pada seberapa besar kemungkinan suatu objek bisa menjadi anggota ke dalam suatu kelompok, atau derajat keanggotaan objek ke-k ke kelompok ke-i, yang mempunyai nilai 0 ≤ uik ≤ 1 , dan
c
∑u
ik
= 1 . Nilai d ik2 ( xk , vi ) merupakan
i =1
formulasi jarak yang digunakan, yang dirumuskan sebagai berikut: (2) d ik2 ( xk , vi ) = xk − vi =( xk − vi )T ( xk − vi ) dimana vi adalah nilai pusat kelompok ke-i, dan v j adalah nilai pusat kelompok ke-j yang 2
dihitung dengan menggunakan persamaan dibawah ini : n
vi =
∑u
m ik
k =1
xk
n
∑u
(3)
m ik
k =1
Dalam FCM, pusat awal kelompok masih belum akurat. Setiap data memiliki derajat keanggotaan untuk setiap kelompok, dengan melakukan perulangan akan memperbaiki pusat kelompok dan derajat keanggotaan, sehingga pusat kelompok akan bergerak menuju lokasi yang tepat. Perulangan ini berdasarkan pada minimalisasi fungsi objektif. Fungsi objektif didasarkan pada pendekatan jarak antara data dengan setiap pusat kelompok. Fungsi objektif yang digunakan pada FCM adalah sebagai berikut: c
1. 2. 3. 4.
n
J FCM ( X, U, V ) = ∑∑ (uik ) m d ik2 ( xk , vi ) (4) k 1 =i 1 = Berikut ini algoritma FCM sebagai berikut : Menentukan jumlah kelompok yang akan dibentuk (2 ≤ c ≤ n) Menginisialisasi matriks fungsi keanggotaan awal U 0 , biasanya dipilih secara acak. Menghitung nilai pusat kelompok ke-k dengan menggunakan persamaan 3. Menghitung matriks derajat keanggotaan yang baru U t +1 dengan persamaan 1. Menbandingkan nilai keanggotaan dalam matriks U , jika U t +1 − U t < ε maka sudah konvergen dan iterasi dihentikan, dimana ε merupakan nilai threshold yang ditentukan. Jika U t +1 − U t ≥ ε , maka kembali ke langkah 4. Nilai threshold adalah suatu bilangan
positif yang kecil sekali mendekati nol, 0.00001 (10-5). 2.6. Fuzzy C-shell Cluster Algoritma pada fuzzy c-shell cluster, bentuk dasar dari kelompok adalah p-dimensi hyper-spherical shell, yang dapat dikarakteristikan oleh pusat dan jari-jari. Dimisalkan
5
ℜ adalah himpunan riil, dan ℜ p adalah himpunan dari p-tuples. Misalkan = X { x1 , x2 , , xn } ⊂ ℜ p menjadi suatu himpunan data yang infinte sedimikian xk ∈ X adalah vektor ke-k. Misal U ∈ M fc adalah keanggotaan dari X; dan misal V adalah c vi ∈ℜ p , dan dimisalkan R adalah c-tuple tuple {v1 , v2 , , vc } , dimana {r1 , r2 , , rc } , ri ∈ ℜ+ . Untuk FCS, fungsi objektifnya adalah sebagai berikut : n
c
J FCS ( U, V, R , X) = ∑∑ uikm Dik2
(5)
k 1 =i 1 =
Dengan nilai m ∈ [1, ∞ ) , serta jarak Dik ( xk , vi ) merupakan formulasi jarak yang dirumuskan
sebagai berikut:
Dik2 ( xk , vi ) = ( xk − vi − ri ) Fungsi keanggotaannya dirumuskan sebagai berikut : 1 n 2 m −1 d x v ( , ) ik k i uik = ∑ 2 j =1 d jk ( xk , v j )
2
(6)
−1
(7)
Berikut ini algoritma FCS [6] sebagai berikut: 1. Menentukan jumlah kelompok yang akan dibentuk (2 ≤ c ≤ n) : 2. Menginisialisasi matriks fungsi keanggotaan awal U 0 , biasanya dipilih secara acak. 3. Menghitung pusat kelompok vi dan jari-jari kelompok ri dengan mengunakan persamaan 3 dan 10, dibawah ini: n
ri =
∑u
m ik
k =1
xk − vi
n
∑u
(8)
m ik
k =1
2 4. Menghitung jarak, Dik menggunakan persamaan 6
5. Menghitung matriks derajat keanggotaan yang baru U t +1 dengan persamaan 7. 6. Membandingkan nilai keanggotaan dalam matriks U , jika U t +1 − U t < ε maka sudah konvergen dan iterasi dihentikan, dimana ε merupakan nilai threshold yang ditentukan. Jika U t +1 − U t ≥ ε , maka kembali ke langkah 4. Nilai threshold adalah suatu bilangan positif yang kecil sekali mendekati nol, 0.00001 (10-5). 2.7. Indeks Validitas Indeks validitas adalah suatu ukuran yang digunakan untuk menentukan jumlah kelompok yang optimal [11]. Pada penelitian ini menggunakan indeks Xie dan Beni(XB),[7] merekomendasikan indeks ini untuk pengelompokan, karena memiliki ketepatan dan kehandalan yang tinggi untuk digunakan sebagai kriteria dalam menentukan jumlah kelompok
yang optimum. Kriteria banyak kelompok yang optimum ditunjukan pada nilai Indeks Xie dan Beni yang minimum pada lembah pertama. Indeks Xie dan Beni adalah sebagai berikut : c
I PI (c ) =
n
∑∑ u
m ik
d ik2
k 1 =i 1 =
n min ij vi − v j 2.8. Indeks Pembangunan Manusia (IPM)
2
(11)
Salah satu indikator keberhasilan pembangunan adalah Indeks Pembangunan Manusia (IPM), dimana IPM sebagai indikator modal manusia dalam mencapai kualitas hidup yang lebih baik tergambar melalui komponen pendidikan, ekonomi, dan kesehatan. Penghitungan IPM didasarkan 4 variabel yang memliki satuan pengukuran yang berbeda, terdiri dari: peluang hidup (diukur dengan variabel Angka Harapan Hidup dalam tahun), pendidikan (diukur dengan variabel Angka Melek Huruf dalam persen dan Angka Rata-rata Lama Sekolah dalam tahun), dan hidup layak (diukur dengan variabel paritas daya beli perbulan dalam rupiah). 3. Metodologi Penelitian Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari Publikasi Badan Pusat Statistik (BPS) 2009 mengenai IPM menurut kabupaten/kota tahun 2008. Komponen-komponen IPM tersebut dipakai sebagai variabel dalam penelitian ini. Variabel tersebut yaitu: 1. X1 = Angka harapan hidup (tahun)/AHH 2. X2 = Angka melek huruf (persen)/AMH 3. X3 = Rata-rata lama sekolah (tahun)/MYS 4. X4 = Rata-rata pengeluaran riil per kapita per bulan (ribuan Rp)/PPP Obyek dari penelitian ini adalah kabupaten/kota di pulau Jawa sebanyak 117 kabupaten/kota, terdiri dari 33 kota dan 84 kabupaten. Tahapan penelitian adalah sebagai berikut : a. Melakukan pengelompokkan dari c=2 sampai 10, baik dengan menggunakan FCM dan FCS, serta menentukan faktor fuzzy (weigthing exponent) hasil pengelompokkan(m). Pada penelitian ini digunakan m = 2, b. Menghitung indeks validitas clustering, dengan indeks Xie dan Beni, untuk metode FCM dan FCS. c. Membandingkan hasil pengelompokkan yang terbentuk dari FCM dan FCS dengan jumlah kelompok yang optimum mempunyai nilai indeks validitas Xie dan Beni yang paling minimum untuk setiap metode FCM dan FCS. Sehingga diperoleh jumlah kelompok yang optimum untuk masing-masing metode. Kelompok yang dengan nilai indeks validitas Xie dan Beni yang paling minimum diantara metode FCM dan FCS merupakan jumlah kelompok yang akan dipilih. Sehingga dapat dilakukan pengelompokkan kabupaten/kota berdasarkan variabel IPM dengan menggunakan jumlah kelompok tersebut. Setelah didapatkan kelompok yang optimum dilakukan uji distribusi multivariate normal, uji mean vektor serta uji kovarian matrik. Untuk memilih kelompok yang akan dipakai dalam pengelompokkan digunakan perbandingan antara fungsi objektif, indeks validitas Xie dan Beni serta waktu komputasinya.
7
4. Hasil dan Pembahasan Berikut ini deskripsi variabel penelitian yang digunakan dapat dilihat pada Tabel 1. Berdasarkan Tabel 1 dapat dijelaskan bahwa standar deviasi yang paling tinggi adalah pada variabel X4, ini menunjukkan bahwa variansi data pada variabel tersebut cukup bervariasi, sedangkan standar deviasi yag paling kecil adalah pada variabel X3. Tabel 1. Statistik Diskriptif Variabel Penelitian Variabel N Min Max X1 117 60.560 74.430 X2 117 64.120 93.010 X3 117 3.770 11.420 X4 117 588.04 647.03
Rata-rata 68.743 91.843 7.604 632.00
Standar Deviasi 2.903 6.293 1.603 9.29
Sebelum proses pengelompokkan, dilakukan terlebih dahulu pengujian multivariat normal terhadap variabel penelitian tersebut. Pemeriksaan distribusi multivariat normal dapat 2 2 dilakukan dengan cara membuat q-q plot dari nilai d j [8]. Jika hasi q-q plot nilai d j 2 2 menunjukan ada lebih 50 persen yang memiliki nilai d j ≤ χ n;0.05 maka keputusan yang
diambil adalah gagal menolak H0, yang berarti bahwa data berdistribusi multivariate normal. Hasil pengujian asumsi multivariat normal, menunjukkan bahwa ada 61,53 persen data yang 2 2 memiliki nilai d j ≤ χ n;0.05 sehingga dapat disimpulkan bahwa data telah berditribusi multivariat normal, dan data dapat dilakukan proses pengelompokkan dengan menggunakan kedua metode tersebut. Dengan data yang telah berdistribusi multivariat normal, maka tahapan berikutnya adalah melakukan pengelompokkan dengan mengunakan metode FCM dan metode FCS. Jumlah kelompok yang digunakan sebagai input adalah c= 1 sampai dengan c =10. Dengan melakukan 10 kali pengulangan, hasil dari ukuran kriteria pengelompokkan disajikan pada Tabel 2. Dari Tabel 2, dapat dilihat bahwa nilai fungsi objektif semakin menurun, apabila jumlah kelompok yang inginkan bertambah. Pada jumlah kelompok sama dengan dua, banyaknya iterasi hampir sama pada setiap pengulangan, dengan rata-rata iterasi sebanyak 15,6 iterasi. Demikian juga untuk nilai fungsi objektif yang nilainya relatif sama, yang berarti fungsi objektif ini konvergen pada nilai 54,9181. Nilai indeks validitas Xie dan Beni pada c=2, pada setiap pengulangan nilai relatif sama, yaitu pada nilai 0,0019. Pada c=5, jumlah iterasi berbeda pada setiap pengulangan, namun nilai fungsi objektif relatif sama. Nilai indeks validitas Xie dan Beni pada setiap pengulangan menghasilkan nilai yang relatif sama, dengan rata-rata 0,0037. Pada setiap pengulangan, jumlah iterasi pada c = 5 sampai dengan c = 10, mendapatkan hasil yang berbeda satu dengan yang lain. Apabila memperhatikan algoritma FCM, dapat dilihat bahwa FCM, pada tahap awal, inisialisasi derajat keanggotaannya dilakukan secara random. Penentuan jumlah kelompok yang optimum pada metode FCM, ditunjukkan pada nilai indeks validitas yang minimum pada lembah pertama. Pada Tabel 1 menunjukkan nilai indeks validitas pada jumlah kelompok dua sampai dengan jumlah kelompok sebanyak 4 nilainya semakin meningkat, namun turun secara perlahan, sampai jumlah kelompok sebanyak 6.
Sehingga sesuai dengan kreteria diatas bahwa jumlah kelompok mencapai optimum dengan jumlah kelompok sebanyak 6, dimana rata-rata iterasinya 154,90 dan nilai indeks validitas Xie dan Beni pada lembah pertama minimum, sebesar 0,0036. Tabel 2 Jumlah kelompok 2 3 4 5 6 7 8 9 10
Rata-rata Iterasi, Fungsi Objektif, Komputasi, dengan metode FCM Banyaknya Fungsi Objektif Iterasi 15,6 54,91810502 22,1 31,91411894 60,6 22,85390327 133,6 18,03633625 154,9 14,70658773 188,5 12,11427890 177,3 10,37901985 121,5 9,125209527 112,4 8,010650976
Indeks Xie dan Beni, dan Waktu Indeks Xie dan Beni 0,001993298 0,002263152 0,005038049 0,003781829 0,003641467 0,003735356 0,004283722 0,004060736 0,003941949
Waktu Komputasi 0,741448173 1,011946319 1,217283024 1,393808393 1,786786863 2,279097467 2,421107644 2,676930352 2,536219871
Pada metode FCS juga menggunakan jumlah kelompok sebagai input adalah c= 1 sampai dengan c =10, serta setiap kelompok dilakukan 10 kali pengulangan, hasil dari ukuran kriteria pengelompokkan dapat disajikan pada Tabel 3. Pada metode FCS, nilai fungsi objektifnya menunjukkan, bahwa semakin turun apabila jumlah kelompok semakin bertambah, dapat dilihat pada Tabel 3. Setiap penggulangan pada jumlah kelompok c=2, memberikan hasil yang relatif sama. Namun pada jumlah kelompok c=3 sampai dengan c=10, hasil setiap pengulangan, memberikan hasil yang relatif berbeda. Hal ini disebabkan pada tahap inisialisasi awal derajat keanggotaan dilakukan secara random. Pada algoritma FCS juga memperhitungkan radius atau jari-jari pada masing-masing kelompok dalam menghitung jaraknya. Waktu komputasi yang dipakai untuk metode FCS, akan bertambah lebih lama apabila jumlah kelompok ditambahkan. Dengan metode FCM, waktu komputasi lebih cepat apabila dibandingkan dengan metode FCS. Jumlah kelompok yang optimum pada metode FCS, juga menggunakan nilai indeks validitas Xie dan Beni, yang ditunjukkan pada nilainya yang minimum pada lembah pertama. Pada Tabel 3 menunjukkan nilai indeks validitas pada jumlah kelompok dua sampai dengan jumlah kelompok empat, nilainya semakin menurun, kemudian meningkat pada jumlah kelompok 5 namun turun lagi, sampai jumlah kelompok sebanyak 6. Sehingga sesuai dengan kreteria diatas bahwa jumlah kelompok mencapai optimum dengan jumlah kelompok sebanyak 4, dimana rata-rata iterasinya 40,4 dan nilai indeks validitas Xie dan Beni pada lembah pertama minimum, sebesar 0,0005. Tahapan selanjutnya adalah melakukan pengujian perbedaan rata-rata kelompok untuk masing-masing metode, berdasarkan hasil pengolahan didapatkan, dengan menggunakan uji Wilks Lambda untuk kedua metode tersebut. Berdasarkan pengujian yang telah dilakukan pada nilai Wilk’s Lambda (Λ*) untuk metode FCM dengan jumlah kelompok sebanyak 6 kelompok sebesar 0,0199, dan nilai Chi Squarenya sebesar 434,6743. P-value yang cukup
9
kecil yaitu sebesar 0.000 atau p-value < 0,05, sehingga dapat diputuskan untuk menolak H0 sehingga bisa dikatakan bahwa terdapat perbedaan rata-rata antar kelompok pada metode FCM yang terbentuk. Untuk metode FCS dengan menggunakan jumlah kelompok yang optimum sebanyak 4 kelompok diperoleh nilai Wilk’s Lambda (Λ*), sebesar 0.7420 dan nilai Chi Squarenya sebesar 33.4216. Nilai p-value yang diperoleh cukup kecil yaitu 0,000 bila dibandingkan dengan derajat kepercayaan atau p-value < 0,05, sehingga diputuskan untuk menolak H0 yang berarti terdapat perbedaan rata-rata antar kelompok pada metode FCS. Tabel 3 Jumlah kelompok 2 3 4 5 6 7 8 9 10
Rata-rata Iterasi, Fungsi Objektif, Indeks Xie dan Beni, dan Waktu Komputasi, dengan metode FCS Banyaknya Indeks Xie dan Fungsi Objektif Waktu Komputasi Iterasi Beni 27,6 706,023521395 0,008038464 35,105140122 41,5 190,670830048 0,007628473 96,764461173 40,4 102,818966609 0,005013489 135,020787350 46,0 58,652288055 0,013566060 149,064922086 48,0 39,922629811 0,005645252 212,843493769 53,7 30,386437454 0,021967206 270,998872936 54,9 23,650643668 0,014782679 313,227428878 41,9 21,008471343 0,017612013 317,912637367 42,5 14,652646693 0,007557815 352,556117707
Pengelompokkan kabupaten/kota dengan menggunakan metode FCM diperoleh 6 kelompok, sedangkan pengelompokkan dengan menggunakan FCS diperoleh 4 kelompok. Untuk mengetahui hasil pengelompokkan yang lebih baik dari kedua metode tersebut maka digunakan uji homogenitas. Uji Box’s M digunakan untuk uji homogenitas hasil pengelompokkan. Berdasarkan hasil pengolahan didapatkan hasil Uji Box’s M untuk kedua metode tersebut. Dengan metode FCM, hasil uji Box’s M sebesar 62,5243 dengan nilai Chisquare sebesaar 55.1648, sedangkan untuk pengelompokkan dengan metode FCS sebesar 30.0946 dengan nilai chi-square 27.6152. Kedua nilai p-value menunjukkan lebih besar dari nilai α= 0,05 yang berarti gagal tolak H0 , maka dapat disimpulkan bahwa matriks varians dan kovarians dari kedua metode tersebut adalah sama (homogen). Pada jumlah kelompok 4 dengan menggunakan metode FCM, nilai indeks Xie dan Beni mempunyai selisih sedikit dengan jumlah kelompok yang sama pada FCS. Namun pada nilai fungsi objektif, metode FCM lebih kecil daripada metode FCS, demikian juga dengan waktu komputasinya yang lebih cepat daripada metode FCS. Dengan melihat jumlah kelompok pada metode FCM dengan jumlah kelompok yang sama pada metode FCS yaitu 6 kelompok, dapat dilihat bahwa nilai indeks validitas Xie dan Beni nilainya lebih kecil daripada dengan metode FCS. Demikian juga dengan waktu komputasi yang dibutuhkan semakin cepat. Pada kasus ini metode FCM lebih baik untuk digunakan daripada FCS. Oleh karena itu, hasil pengelompokkan dengan metode fuzzy c-means cluster akan digunakan untuk pengelompokkan kabupaten/kota berdasarkan variabel IPM. Berdasarkan pembahasan sebelumnya interpretasi pengelompokkan akan dilakukan pada hasil pengelompokkan dengan menggunakan metode FCM dengan jumlah kelompok
sebanyak 6 kelompok. Banyaknya kabupaten/kota anggota kelompok pertama sampai dengan kelompok keenam berturut-turut 28, 25, 8, 29, 12, 15. Setelah kelompok terbentuk, terhadap seluruh obyek penelitian sebanyak 117 kabupaten/kota diambil rata-rata dari masing-masing variabel pembentuk IPM, yaitu AHH, AMH, MYS, dan PPP ( X ) dapat dilihat Tabel 1. Selanjutnya masing-masing kelompok diambil rata-rata untuk variabel AHH, AMH, MYS, dan PPP ( X c ) . Pada setiap variabel di dalam kelompok diberi tanda, jika
(Xc ≥ X )
adalah tanda + , sedangkan apabila
( X c < X ) akan diberikan tanda –. Pada Tabel 4 memberikan hasil selengkapnya. Dari Tabel 4, dapat kita amati bahwa keompok 3 dan kelompok 4 mempunyai kesamaan karakteristik. Nilai rata-rata variabel AHH, AMH, MYS, dan PPP di dalam kelompok masih berada dibawah rata-rata tersebut untuk semua kabupaten/kota di pulau Jawa. Apabila dilihat dari nilai rata-rata variabel pada kelompok 6 lebih besar daripada nilai rata-rata variabel pada kelompok 3, kecuali untuk variabel PPP. Tabel 4
Karateristik Kelompok berdasarkan Rata-rata
Karekteristik AHH AMH MYS PPP 1 + – – – 2 + + + + 3 – – – – 4 – + – – 5 + – – + 6 – – – – Karakteristik kelompok yang paling berhasil dari kelompok lainnya adalah kelompok ke-2, pada rata-rata nilai variabel-variabel pembentuk IPM merupakan yang tertinggi diantara kelompok lainnya. Pada kelompok ke-5, variabel yang memiliki nilai rata-rata diatas nilai ratarata di pulau Jawa adalah variabel angka harapan hidup dan paritas daya beli, sehingga variabel yang perlu mendapatkan perhatian adalah variabel pendidikan yaitu angka melek huruf dan rata-rata lamanya sekolah. Kelompok ke-4, variabel yang memiliki nilai rata-rata diatas nilai rata-rata di pulau Jawa hanya pada angka melek huruf, sedangkan variabel lainnya berada di bawah nilai rata-rata di pulau Jawa, yaitu angka harapan hidup, rata-rata lamanya sekolah dan paritas daya beli. Sehingga variabel tersebut yang mendapatkan perhatian untuk pembangunan manusia yang lebih baik. Pada kelompok pertama, hanya variabel angka harapan hidup yang nilai rata-ratanya diatas nilai rata-rata di pulau Jawa, sehingga untuk kelompok ini, variabel yang perlu dilakukan ditingkatkan adalah variabel angka melek huruf, rata-rata lama sekolah dan paritas daya beli. Pada kelompok ke-3 dan kelompok ke-6, merupakan kelompok yang semua nilai rata-rata variabelnya dibawah nilai rata-rata di pulau Jawa. Kelompok ke-6 nilai rata-rata variabelnya lebih bagus daripada nilai rata-rata di kelompok pertama. Variabel-variabel pada kelompok pertama memiliki nilai rata-rata terendah diantara kelompok lainnya. Kelompok
11
5. Kesimpulan Berdasarkan hasil dan pembahasan yang dilakukan pada bab sebelumnya dapat diambil kesimpulan bahwa berdasarkan nilai indeks validitas Xie dan Beni yang minimum pada lembah pertama, hasil pengelompokkan dengan menggunakan metode fuzzy c-means cluster diperoleh sebanyak 6 kelompok, dengan nilai indeks validitas Xie dan Beni 0,0036. Hasil pengelompokkan dengan menggunakan metode fuzzy c-shell cluster diperoleh sebanyak 4 kelompok, dengan nilai indeks validitas Xie dan Beni 0,005. Berdasarkan nilai fungsi objektif, nilai indeks validitas Xie dan Beni, serta waktu komputasinya, metode fuzzy c-means cluster digunakan sebagai metode yang akan digunakan dengan jumlah kelompok sebanyak 6 kelompok. Daftar Pustaka [1] [2] [3] [4] [5] [6] [7]
[8] [9] [10] [11] [10]
Abonyi, J. dan Szeifert, (2002), “Supervised Fuzzy Clustering for the Identification of Fuzzy Classifiers”, Journal Elseiver, Vol. 24, 2195-2207 Hoppner, F. dan Klawonn, F., (2004), “Learning Fuzzy Systems – An Objective Function-Approach”,Mathware & Soft Computing, Vol 11, pp.143-162 Dunn, J. (1973). A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact well-Separated Cluster. Jurnal of Cybernetic 3 , 32-37. Bezdek, J. (1981). Pattern Recognition with Fuzzy Objective Function Algorithm. New York: Plenum Press. Shihab, A. (2000). Fuzzy Clustering Algorithm and Their Application to Medical Image Analysis. Dissertation, University of London, London. Dave, R. (1992). Generalized Fuzzy C-Shell Clustering and Detection of Circular and Elliptical Boundaries. Pattern Recognition , Vol. 25 No. 7, 713-721 Duo, C., Xue, L., & Du-Wu, C. (2007). An Adaptive Cluster Validiti Index for the Fuzzy C-Means. International Journal of Computer Science and Nework Security 7 No. 2 , 146-156. Johnson, RA, & Wichern, E. (2002), Applied Multivariate Statistical Analysis, Prentice-Hall, New York Rencher, A.C. (2002), Methods of Multivariate Analysis, John Wiley and Sons, New York
Yu, J., Cheng, Q., & Huang, H. (2004). Analysis of the Weighting Exponent in the FCM. IEEE Transactions on Systems, Man, and Cybernetics , vol 34, 634-639. Wu, K.-L., & Yang, M.-S. (2005). A Cluster Validity Index for Fuzzy Clustering. Pattern Recognition Letters , 1275–1291. Bungker, M.J. dan Miller, J.R. (1996), Definition of Climate Regions in the Northern Plains using an Objective Cluster Modification Technique. Journal of Climate. 9 :130146.
13