PREDIKSI KOTA PERAIH ANUGERAH ADIPURA MENGGUNAKAN ALGORITME KLASIFIKASI VFI5
MUHAMAD HAIKAL
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2009
PREDIKSI KOTA PERAIH ANUGERAH ADIPURA MENGGUNAKAN ALGORITME KLASIFIKASI VFI5
Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
MUHAMAD HAIKAL G64066018
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2009
ABSTRAK MUHAMAD HAIKAL. Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5. Dibimbing oleh Aziz Kustiyo, S.Si., M.Kom. Program Adipura merupakan program kerja berlingkup nasional yang dikelola oleh Kementerian Lingkungan Hidup (KLH). Program ini bertujuan untuk mewujudkan kota yang bersih dan teduh (KLH 2007). Penilaian Program Adipura terdiri atas penilaian Fisik dan penilaian Non Fisik. Penilaian Fisik terdiri atas Pemantauan I, Pemantauan II, dan Pemantauan Verifikasi. Penilaian Non Fisik berupa penilaian terhadap kuesioner yang diisi oleh kabupaten/kota. Mekanisme kota pantau pada Pemantauan I dan Pemantauan II telah diatur dalam Peraturan Menteri nomor 14 tahun 2006 yaitu seluruh kota peserta Program Adipura, sedangkan mekanisme kota pantau pada Pemantauan Verifikasi tidak diatur dalam peraturan tersebut. Periode pelaksanaan Program Adipura adalah satu tahun. Pemeringkatan kota, penentuan kota peraih anugerah Adipura, dan persiapan lainnya dilaksanakan setelah seluruh data hasil penilaian Fisik dan penilaian Non Fisik tersedia. Waktu yang tersedia untuk menyelesaikan seluruh kegiatan tersebut sebelum pengumuman peraih anugerah Adipura sangat sempit. Karena keterbatasan waktu dalam proses persiapan dan penentuan kota peraih anugerah Adipura, sehingga memerlukan penelitian untuk memprediksi kota peraih anugerah Adipura lebih awal. Penelitian ini bertujuan untuk memprediksi kota peraih anugerah Adipura menggunakan algoritme klasifikasi VFI5. Data yang digunakan merupakan data Fisik hasil Pemantauan I dan Pemantauan II kategori kota Sedang dan kota Kecil regional Jawa periode 2007-2008. Metode klasifikasi yang digunakan adalah klasifikasi VFI5 biasa dan klasifikasi VFI5 modifikasi. Bobot yang digunakan adalah bobot masing-masing feature satu dan bobot yang telah ditentukan KLH. Klasifikasi VFI5 modifikasi merupakan klasifikasi VFI5 biasa dengan penambahan batas bawah dan batas atas interval dengan nilai minimum dan nilai maksimum skala nilai Program Adipura, vote pada nilai minimum dan nilai maksimum tersebut sama dengan vote batas bawah dan batas atas skala nilai Program Adipura. Hasil penelitian ini menunjukan tingkat akurasi tertinggi diperoleh menggunakan data Pemantauan II dan data rata-rata Pemantauan I dan II dengan metode klasifikasi VFI5 modifikasi dan bobot masing-masing feature satu. Tingkat akurasi yang dihasilkan adalah sebesar 91.82 %. Kata kunci : Klasifikasi, Program Adipura, algoritme VFI5.
Judul Nama NIM
: Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5 : Muhamad Haikal : G64066018
Menyetujui:
Pembimbing
Aziz Kustiyo, S.Si., M.Kom. NIP. 197007191998021001
Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. drh. Hasim, DEA. NIP. 196103281986011002
Tanggal Lulus :
RIWAYAT HIDUP Penulis dilahirkan di Bogor pada tanggal 12 Januari 1986. Anak pertama dari lima bersaudara, dari pasangan Bapak H. Taufik Muhammad Sungkar dan Ibu Hj. Syakirah Askar. Tahun 2003, penulis lulus dari SMU Insan Kamil Bogor, kemudian melanjutkan pendidikan Diploma III Program Studi Informatika Sub Program Teknik Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor. Pada tahun 2006, Penulis pernah menjadi asisten dosen beberapa mata kuliah dan melanjutkan pendidikan Sarjana Ilmu Komputer Institut Pertanian Bogor. Saat ini penulis bekerja pada salah satu instansi pemerintah di Jakarta.
PRAKATA Bismillahirrahmanirrahim Puji dan syukur penulis panjatkan kepada Allah SWT atas rahmat dan karuniaNya. Shalawat dan salam penulis curahkan kepada nabi Muhammad SAW sehingga penulis dapat menyelesaikan skripsi tugas akhir dengan judul Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5. Penulis mengucapkan terimakasih kepada seluruh pihak sehingga penelitian ini dapat diselesaikan, diantaranya : Kedua orangtua tercinta yang selalu memberikan doa dan motivasi kepada penulis. Bapak Aziz Kustiyo, S.Si., M.Kom. selaku dosen pembimbing yang telah memberikan arahan, masukan, dan semangat kepada penulis sehingga penelitian ini dapat diselesaikan. Ibu Dra. Melda Mardalina, M.Sc. dan Bapak Dr. Ir. Agus Buono, M.Si., M.Kom. selaku dosen penguji yang telah memberikan masukan kepada penulis dalam menyelesaikan penelitian ini. Adik-adikku tercinta, Haiva, Sumaya, Rania, dan Nadia yang selalu memberikan motivasi dan dukungan. Seluruh dosen pengajar dan staf Departemen Ilmu Komputer, FMIPA, IPB. Ibu Ir. Ratna Kartikasari, M.Sc. dan Bapak Drs. Tri Bangun L. Sony selaku pimpinan yang telah mendukung dalam proses pendidikan penulis. Octo Mulyanto, Rion Evrian Adwanosa, Sandi Wasmana, Vanny Zaenudin, Dhilla Hapsari, Sekar Tangi, Anggita Dhiny dan seluruh teman kerja yang telah memberikan motivasi dan dukungan. Bapak Trias Hermanu dan keluarga yang telah memberikan motivasi dan dukungan. Seta Baehera, Abdul Rosyid, Tuti dan teman-teman angkatan I, II, dan III ILKOM Ekstensi IPB yang tidak dapat disebutkan satu per satu. Seluruh pihak lain yang membantu penelitian ini yang tidak dapat disebutkan satu per satu. Akhirnya penulis berharap semoga penelitian ini dapat bermanfaat bagi semua pihak yang membutuhkan. Amin.
Bogor, Juli 2009
Muhamad Haikal
iv
DAFTAR ISI Halaman DAFTAR ISI .............................................................................................................................. iv DAFTAR TABEL ....................................................................................................................... v DAFTAR GAMBAR ................................................................................................................... v DAFTAR LAMPIRAN............................................................................................................... vi PENDAHULUAN ....................................................................................................................... 1 Latar Belakang ........................................................................................................................ 1 Tujuan ..................................................................................................................................... 1 Ruang Lingkup ........................................................................................................................ 1 Manfaat ................................................................................................................................... 1 TINJAUAN PUSTAKA .............................................................................................................. 1 Program Adipura ..................................................................................................................... 1 1 Penilaian Fisik ............................................................................................................... 2 2 Penilaian Non Fisik ........................................................................................................ 2 Klasifikasi ............................................................................................................................... 2 VFI5 (Voting Feature Intervals 5)............................................................................................ 3 1 Pelatihan ........................................................................................................................ 3 2 Klasifikasi...................................................................................................................... 3 METODE PENELITIAN ............................................................................................................. 4 Data ........................................................................................................................................ 4 Data latih dan data uji .............................................................................................................. 4 Pelatihan ................................................................................................................................. 5 Klasifikasi ............................................................................................................................... 5 Akurasi ................................................................................................................................... 6 Lingkup Pengembangan........................................................................................................... 6 HASIL DAN PEMBAHASAN .................................................................................................... 6 Data Pemantauan I................................................................................................................... 6 Data Pemantauan II ................................................................................................................. 7 Data rata-rata Pemantauan I dan Pemantauan II ........................................................................ 8 KESIMPULAN DAN SARAN .................................................................................................. 10 Kesimpulan ........................................................................................................................... 10 Saran ..................................................................................................................................... 10 DAFTAR PUSTAKA ................................................................................................................ 10
v
DAFTAR TABEL Halaman 1 Kategori kota Program Adipura .............................................................................................. 2 2 Kriteria Penilaian Fisik Program Adipura ................................................................................ 2 3 Skala nilai Program Adipura ................................................................................................... 2 4 Confusion matrix .................................................................................................................... 3 5 3-Fold Cross Validation data Program Adipura ....................................................................... 5 6 Jumlah data latih dan data uji Pemantauan I ............................................................................ 5 7 Confusion matrix pada iterasi pertama data Pemantauan I. ....................................................... 7 8 Hasil tahap klasifikasi pada iterasi pertama data Pemantauan I ................................................ 7 9 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan I.................................................... 7 10 Hasil tahap klasifikasi pada iterasi ketiga data Pemantauan I ................................................... 7 11 Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan I................................................... 7 12 Hasil tahap klasifikasi pada iterasi pertama data Pemantauan II ............................................... 8 13 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan II .................................................. 8 14 Hasil tahap klasifikasi pada iterasi ketiga data Pemantauan II .................................................. 8 15 Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan II ................................................. 8 16 Hasil tahap klasifikasi pada iterasi pertama data rata-rata Pemantauan I dan Pemantauan II ..... 8 17 Hasil tahap klasifikasi pada iterasi kedua data rata-rata Pemantauan I dan Pemantauan II......... 9 18 Hasil tahap klasifikasi pada iterasi ketiga data rata-rata Pemantauan I dan Pemantauan II ........ 9 19 Tingkat akurasi rata-rata tahap klasifikasi data rata-rata Pemantauan I dan Pemantauan II........ 9
DAFTAR GAMBAR Halaman 1 Pseudocode tahap pelatihan algoritme VFI5. ........................................................................... 4 2 Pseudocode tahap klasifikasi algoritme VFI5. ......................................................................... 5 3 Metode penelitian. .................................................................................................................. 5 4 Perbandingan interval VFI5 dengan VFI5 modifikasi. ............................................................. 6 5 Grafik tingkat akurasi prediksi. ............................................................................................... 9 6 Grafik tingkat akurasi metode. ................................................................................................ 9
vi
DAFTAR LAMPIRAN 1 Jadwal Pelaksanaan Program Adipura ................................................................................... 12 2 Data kabupaten/kota kategori kota Sedang dan kota Kecil regional Jawa ............................... 12 3 Ilustrasi tahap pelatihan ........................................................................................................ 15 4 Ilustrasi tahap klasifikasi....................................................................................................... 16 5 Kota salah prediksi pada data Pemantauan I iterasi pertama ................................................... 17 6 Kota salah prediksi pada data Pemantauan I iterasi kedua ...................................................... 17 7 Kota salah prediksi pada data Pemantauan I iterasi ketiga ...................................................... 17 8 Vote masing-masing instance kota Pasuruan ......................................................................... 17 9 Akurasi prediksi pada data Pemantauan I .............................................................................. 18 10 Kota salah prediksi pada data Pemantauan II iterasi pertama .................................................. 18 11 Kota salah prediksi pada data Pemantauan II iterasi kedua ..................................................... 18 12 Detail vote kota Pasuruan pada iterasi pertama data Pemantauan II ........................................ 18 13 Detail vote kabupaten Temanggung pada iterasi pertama data Pemantauan II ......................... 19 14 Detail vote kabupaten Wonogiri pada iterasi pertama data Pemantauan II............................... 19 15 Kota salah prediksi pada data Pemantauan II iterasi ketiga ..................................................... 20 16 Akurasi prediksi pada data Pemantauan II ............................................................................. 20 17 Kota salah prediksi pada data rata-rata Pemantauan I dan Pemantauan II iterasi pertama ........ 20 18 Kota salah prediksi pada data rata-rata Pemantauan I dan Pemantauan II iterasi ketiga ........... 20 19 Akurasi prediksi pada data rata-rata Pemantauan I dan Pemantauan II.................................... 21 20 Daftar tingkat akurasi seluruh data, iterasi dan metode klasifikasi .......................................... 21
1
PENDAHULUAN Latar Belakang Upaya pengendalian pencemaran lingkungan dilakukan dengan berbagai kegiatan, salah satunya melalui Program Adipura oleh Kementerian Lingkungan Hidup (KLH). Program Adipura merupakan salah satu program prioritas dalam pengendalian pencemaran dari kegiatan domestik (KLH 2008). Periode pemantauan Program Adipura adalah satu tahun dimulai dari bulan Juni tahun berjalan sampai dengan bulan Juni tahun berikutnya. Pemantauan Program Adipura dilaksanakan setidaknya dua kali dalam satu periode, yaitu : 1 Pemantauan I pada bulan Agustus sampai dengan bulan September. 2 Pemantauan II pada bulan Januari sampai dengan bulan Februari. Pemantauan Verifikasi dilaksanakan jika diperlukan (KLH 2006). Mekanisme penentuan kota pantau pada Pemantauan I dan Pemantauan II telah diatur dalam Peraturan Menteri Negara Lingkungan Hidup nomor 14 tahun 2006 yaitu seluruh kota peserta Program Adipura, sedangkan penentuan kota pantau pada Pemantauan Verifikasi tidak diatur dalam peraturan tersebut. Pengumuman kota peraih anugerah Adipura dilaksanakan pada tanggal 5 juni, bertepatan dengan hari lingkungan nasional maupun internasional. Penentuan kota peraih anugerah Adipura dapat dilaksanakan setelah seluruh data hasil pemantauan didapatkan, yaitu setelah data hasil Penilaian Fisik dan Penilaian Non Fisik dihasilkan antara bulan Maret sampai dengan bulan Mei. Jadwal pelaksanaan Program Adipura dapat dilihat pada Lampiran 1. Setelah seluruh data hasil penilaian Fisik dan Non Fisik Program Adipura tersedia, selanjutnya yang dilakukan adalah pemeringkatan kota, penentuan kota peraih anugerah Adipura, dan persiapan lainnya. Waktu yang tersedia untuk menyelesaikan seluruh kegiatan tersebut sebelum pengumuman peraih anugerah Adipura sangat sempit (dua minggu). Karena keterbatasan waktu dalam proses persiapan dan penentuan kota peraih anugerah Adipura, sehingga memerlukan penelitian untuk memprediksi kota peraih anugerah Adipura lebih awal. Penerapan algoritme VFI5 sebagai algorime klasifikasi untuk memprediksi kota peraih anugerah Adipura
diharapkan dapat membantu permasalahan tersebut. Tujuan Penelitian ini bertujuan untuk memprediksi kota peraih anugerah Adipura pada Program Adipura berdasarkan data fisik. Ruang Lingkup Ruang lingkup penelitian ini dibatasi pada: 1 Data periode yang digunakan adalah data kategori kota Sedang dan kota Kecil regional Jawa Program Adipura periode 2007-2008. 2 Data yang digunakan merupakan data hasil pemantauan Fisik Program Adipura, yaitu Pemantauan I dan Pemantauan II. Manfaat Penelitian ini diharapkan dapat memberikan prediksi dengan tingkat akurasi tinggi terhadap kota peraih anugerah Adipura. Hasil penelitian ini juga dapat dijadikan alat perhitungan cepat (quick count) bagi pihak KLH untuk memprediksi kota peraih anugerah Adipura menggunakan data Pemantauan I dan Pemantauan II saja. Hasil prediksi pada penelitian ini dapat digunakan pihak KLH untuk membantu menetapkan mekanisme kota pantau pada Pemantauan Verifikasi, sehingga mekanisme penentuan kota pada Pemantauan Verifikasi dapat dibuat suatu ketetapan.
TINJAUAN PUSTAKA Program Adipura Program Adipura adalah program kerja berlingkup nasional yang dikelola oleh Kementerian Lingkungan Hidup. Program Adipura bertujuan untuk mendorong pemerintah kabupaten/kota dan masyarakat dalam mewujudkan kota yang bersih dan teduh melalui penerapan prinsip-prinsip tata kepemerintahan yang baik dibidang pengelolaan lingkungan hidup (KLH 2007). Pelaksanaan Program Adipura saat ini merupakan pengembangan dari Program Adipura pada kurun waktu 1986-1997. Program ini dilanjutkan kembali pada tahun 2002 sampai dengan saat ini. Evaluasi Program Adipura dilakukan berdasarkan kategori kota. Kategorisasi kota didasarkan pada jumlah penduduk wilayah perkotaan. Kategori kota Program Adipura disajikan pada Tabel 1.
2
Tabel 1 Kategori kota Program Adipura Kategori Jumlah Penduduk Metropolitan Lebih dari 1.000.000 Besar 500.001 – 1.000.000 Sedang 100.001 – 500.000 Kecil 20.001 – 100.000 Penghargaan anugerah Adipura diberikan kepada walikota/bupati yang telah berhasil mengelola lingkungannya dengan baik. Kriteria penilaian Program Adipura terdiri atas dua penilaian, yaitu Penilaian Fisik dan Penilaian Non Fisik. 1 Penilaian Fisik Penilaian Fisik merupakan pemantauan terhadap kondisi fisik kawasan perkotaan suatu kabupaten/kota. Pemantauan dilaksanakan paling sedikit dua kali dalam satu periode penilaian. Pemantauan verifikasi dilaksanakan jika diperlukan (KLH 2006). Jumlah kriteria Penilaian Fisik Program Adipura adalah 16 kriteria. Masing-masing kriteria memiliki bobot yang telah ditentukan oleh KLH. Kriteria Penilaian Fisik Program Adipura disajikan pada Tabel 2. Tabel 2 No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Kriteria Penilaian Fisik Program Adipura Kriteria Penilaian Bobot Perumahan 7 Jalan 8 Pasar 9 Pertokoan 6 Perkantoran 3 Sekolah 8 Rumah Sakit/Puskesmas 6 Hutan kota 3 Taman kota 7 Terminal bus/angkot 8 Stasiun kereta 5 Pelabuhan penumpang 5 Perairan terbuka 8 Tempat pembuangan akhir 10 Pemanfaatan sampah 3 Pantai wisata 4
Penilaian Program Adipura menggunakan skala nilai yang telah ditentukan. Skala nilai yang digunakan pada Program Adipura disajikan pada Tabel 3. 2 Penilaian Non Fisik Penilaian Non Fisik merupakan penilaian terhadap dokumen berupa kuisioner yang telah diisi oleh kota peserta Program Adipura.
Penilaian Non Fisik dilaksanakan satu kali dalam satu periode penilaian. Tabel 3 Skala nilai Program Adipura Skala Nilai Sangat Baik 86 - 90 Baik 71 - 85 Sedang 61 - 70 Jelek 46 - 60 Sangat Jelek 30 - 45 Klasifikasi Klasifikasi merupakan proses menemukan sekumpulan model atau fungsi yang menggambarkan dan membedakan konsep atau kelas-kelas data, dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu objek atau data yang label kelasnya tidak diketahui (Han & Kamber 2001). Klasifikasi terdiri atas dua tahap, yaitu pelatihan dan prediksi (klasifikasi). Pada tahap pelatihan, dibentuk sebuah model domain permasalahan dari setiap instance yang ada. Penentuan model tersebut berdasarkan analisis pada sekumpulan data pelatihan, yaitu data yang label kelasnya sudah diketahui. Pada tahap klasifikasi, dilakukan prediksi kelas dari instance baru dengan menggunakan model yang telah dibuat pada tahap pelatihan (Guvenir et al. 1998). K-Fold Cross Validation Sebelum digunakan sebuah sistem berbasis komputer harus dievaluasi dalam berbagai aspek. Di antara aspek-aspek tersebut, validasi kinerja bisa menjadi yang paling penting. Cross validation dan bootstrapping merupakan metode untuk memperkirakan error generalisasi berdasarkan “resampling” (Weiss and Kulikowski, 1991; Efron and Tibshirani, 1993; Hjorth, 1994; Plutowski, Sakata and White, 1994; Shao and Tu, 1995 diacu dalam Sarle 2004) K-Fold Cross Validation membagi himpunan contoh ke dalam k himpunan bagian secara acak. Pengulangan dilakukan sebanyak k kali dan pada setiap ulangan, satu subset untuk pengujian dan subset lainnya untuk pelatihan. Pada metode tersebut, data awal dibagi menjadi k subset atau ‘fold’ yang saling bebas secara acak, yaitu S1,S2,…,Sk, dengan ukuran setiap subset kira-kira sama. Pelatihan dan pengujian dilakukan sebanyak k kali. Pada
3
iterasi ke-i, subset Si diperlakukan sebagai data pengujian dan subset lainnya diperlakukan sebagai data pelatihan. Pada iterasi pertama S2,…,Sk menjadi data pelatihan dan S1 menjadi data pengujian, pada iterasi kedua S1,S3,…,Sk menjadi data pelatihan dan S2 menjadi data pengujian dan seterusnya. VFI5 (Voting Feature Intervals 5) Voting Feature Intervals 5 (VFI5) adalah salah satu algoritme yang digunakan dalam pengklasifikasian data. Algoritme tersebut dikembangkan oleh Demiröz dan Gűvenir (Gűvenir dan Demiröz 1997). Algoritme VFI5 merepresentasikan deskripsi sebuah konsep oleh sekumpulan interval nilai-nilai feature atau atribut. Semua instance pelatihan diproses bersamaan. Algoritme VFI5 terdiri atas dua tahap, yaitu tahap pelatihan dan klasifikasi. 1 Pelatihan Pada tahap Pelatihan dilakukan pencarian nilai end point suatu feature f pada kelas data c. End point yaitu nilai minimum dan nilai maksimum setiap kelas c pada feature f. Kemudian setiap nilai end point tersebut diurutkan menjadi interval untuk feature f. Terdapat dua jenis interval, yaitu point interval yang terdiri atas semua nilai end point yang diperoleh dan range interval yang terdiri atas nilai-nilai antara dua end point yang berdekatan tidak termasuk end point tersebut. Tahap selanjutnya adalah menghitung jumlah instance pelatihan setiap kelas c dengan feature f yang nilainya jatuh pada interval i yang direpsentasikan sebagai interval_class_count[f,i,c]. untuk setiap instance pelatihan, dicari interval i dimana nilai feature f dari instance pelatihan e (ef) tersebut jatuh. Jika interval i merupakan point interval dan nilai ef sama dengan nilai pada batas bawah atau batas atas maka jumlah kelas instance tersebut (ef) pada interval i ditambah 1. Jika interval i merupakan range interval dan nilai ef jatuh pada interval tersebut, maka jumlah kelas instance ef pada interval i ditambah 1. Hasil dari proses tersebut merupakan jumlah vote kelas c pada interval i. Jumlah vote kelas c untuk feature f pada interval i dibagi dengan jumlah instance pada kelas c (class_count[c]) untuk menghilangkan perbedaan distribusi antar kelas. Hasil normalisasi direpresentasikan dalam interval_class_vote[f,i,c]. Nilai-nilai pada
interval_class_vote[f,i,c] dinormalisasi sehingga jumlah vote dari beberapa kelas pada setiap feature sama dengan 1. Pseudocode tahap pelatihan dari algoritme VFI5 disajikan pada Gambar 1. 2 Klasifikasi Tahap klasifikasi algoritme VFI5 dilakukan proses inisialisasi awal nilai vote masing-masing kelas dengan nilai 0. Untuk setiap feature f, dicari nilai interval i dimana ef jatuh, dimana ef adalah nilai feature f dari instance tes e. jika ef tidak diketahui (hilang), maka feature tersebut tidak disertakan dalam voting (member nilai vote 0 untuk masingmasing kelas) sehingga feature yang nilainya tidak diketahui diabaikan. Jika ef diketahui maka interval tersebut dapat ditemukan. Feature tersebut akan memberikan nilai vote untuk masing-masing kelas dengan prosedur (Guvenir 1998): feature_vote[f,c] = interval_class_vote[f,i,c]. Setiap feature f mengumpulkan nilai vote kemudian dijumlahkan untuk memperoleh total vote. Kelas c yang memiliki nilai vote tertinggi diprediksi sebagai kelas dari instance tes c. Pseudocode tahap klasifikasi dari algoritme VFI5 disajikan pada Gambar 2. Confusion Matrix Confusion matrix mengandung informasi tentang kelas data yang aktual direpresentasikan pada baris matiks dan kelas data hasil prediksi suatu algoritme klasifikasi. Kemampuan dari algoritme klasifikasi biasanya dievaluasi dari data yang ada pada matriks. Confusion matrix untuk data dengan dua kelas disajikan pada Tabel 4 (Hamilton et al. 2002). Tabel 4 Confusion matrix Data Aktual
Kelas 1 Kelas 2
Prediksi Kelas 1 Kelas 2 a b c d
Keterangan : a adalah jumlah instance kelas 1 yang berhasil diprediksi dengan benar sebagai kelas 1. b adalah jumlah instance kelas 1 yang tidak berhasil diprediksi dengan benar karena diprediksi sebagai kelas 2. c adalah jumlah instance kelas 2 yang tidak berhasil diprediksi dengan benar karena diprediksi sebagai kelas 1.
4
d adalah jumlah instance kelas 2 yang berhasil diprediksi dengan benar sebagai kelas 2.
METODE PENELITIAN Beberapa tahapan proses yang dilalui untuk mengetahui hasil yang diperoleh algoritme VFI5 dalam memprediksi kota peraih anugerah Adipura. Tahapan proses tersebut disajikan pada Gambar 3. Tahapan proses yang utama adalah tahap pelatihan dan klasifikasi, pada tahap tersebut data akan dilatih untuk menghasilkan vote masing-masing feature. Sedangkan pada tahap klasifikasi, dilakukan prediksi kota peraih anugerah Adipura. Data Data yang digunakan merupakan data Program Adipura. Data tersebut diperoleh dari Asisten Deputi Urusan Pengendalian Pencemaran Limbah Domestik dan Usaha Skala Kecil, Kementerian Lingkungan Hidup. Data yang digunakan merupakan data hasil pemantauan Program Adipura periode 20072008. Data tersebut adalah data Pemantauan
I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II. Data Program Adipura terdiri atas dua kelas yaitu kelas kota peraih anugerah Adipura (Adipura) dan bukan kota peraih anugerah Adipura (Bukan Adipura). Jumlah instance pada data Pemantauan I dan Pemantauan II adalah 98, dan jumlah feature sebanyak 16. Data kabupaten/kota kategori kota Sedang dan kota Kecil regional Jawa dapat dilihat pada Lampiran 2. Feature yang digunakan merupakan kriteria Penilaian Fisik untuk seluruh kabupaten/kota peserta Program Adipura. Kategori kota yang digunakan pada Program Adipura yaitu kategori kota Sedang (36 kota) dan kota Kecil (62 kota). Data latih dan data uji Pada tahap ini dilakukan pembagian data antara data latih dan data uji dengan menggunakan 3-fold cross validation. Pembagian data tersebut disajikan pada Tabel 5. Jumlah data latih dan data uji untuk setiap iterasi disajikan pada Tabel 6.
train (TrainingSet); begin for each feature f if f is linear for each class c EndPoints[f]= EndPoints[f] U find_end_points(TrainingSet,f,c); sort(EndPoints[f]); for each end point p in EndPoints[f] from a point interval from end point p from a range interval between p and the next endpoint ≠ p else /* f is nominal */ from a point interval for each value of f for each interval i on feature f for each class c interval_class_count[f,i,c]=0; count_instances(f,TrainingSet); for each interval i on feature dimension f for each class c interval_class_vote[f,i,c]= interval_class_count[f,i,c]/class_count[c]; normalize interval_class_vote[f,i,c]; /* such that ∑c interval_class_vote[f,i,c] = 1 */ end
Gambar 1 Pseudocode tahap pelatihan algoritme VFI5.
5
classify(e) begin for each class c vote[c] = 0 for each feature f for each class c feature_vote[f,c] = 0; /* vote of feature f for class c */ if ef value is known i = find_interval(f,ef) feature_vote[f,c] = interval_class_vote[f,ic] for each class c vote[c] = vote[c] + feature_vote[f,c]*weight[f]; return class c with highes vote[c] end
Gambar 2 Pseudocode tahap klasifikasi algoritme VFI5.
Pelatihan Pelatihan VFI5 dilakukan pada tiga data, yaitu data Pemantauan I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II. Data tersebut masing-masing dibagi menjadi 2/3 data training dan 1/3 data testing. Kriteria penilaian Program Adipura menjadi feature dalam VFI5. Hasil evaluasi di akhir periode pelaksanaan Program Adipura yang menunjukan suatu kota berhasil meraih penghargaan anugerah Adipura atau tidak menjadi kelas dalam VFI5. Ilustrasi pada tahap pelatihan dapat dilihat pada Lampiran 3.
Mulai
Data
Data Latih
Pelatihan
Tabel 5
3-Fold Cross Validation data Program Adipura Iterasi Data uji Data latih Pertama Subset 1 Subset 2, Subset 3 Kedua Subset 2 Subset 1, Subset 3 Ketiga Subset 3 Subset 1, Subset 2
Tabel 6
Jumlah data Pemantauan I Iterasi Data latih Pertama 66 Kedua 65 Ketiga 65
latih dan data uji Data uji 32 33 33
Jumlah data 98 98 98
Data Uji
VFI5
Klasifikasi
Akurasi
Selesai
Gambar 3 Metode penelitian. Klasifikasi Pada tahap ini dilakukan klasifikasi data testing berdasarkan pola yang telah diperoleh pada tahap pelatihan. ilustrasi pada tahap klasifikasi dapat dilihat pada Lampiran 4. Klasifikasi yang digunakan terdapat empat cara, yaitu :
6
1 Metode klasifikasi VFI5 dengan bobot masing-masing feature adalah satu (VFI5a). 2 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot masing-masing feature adalah satu (VFI5b). 3 Metode klasifikasi VFI5 dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5c). 4 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot yang telah ditentukan oleh KLH untuk masingmasing feature (VFI5d). Metode VFI5 yang telah dimodifikasi (VFI5b dan VFI5d) merupakan algoritme VFI5 dengan batas interval bawah dan batas interval atas dalam bentuk point interval diubah menjadi range interval dengan batas nilai minimum dan nilai maksimum skala nilai Program Adipura. Perbandingan interval antara algoritme klasifikasi VFI5 dengan algoritme klasifikasi VFI5 modifikasi disajikan pada Gambar 4. Kelas yang digunakan untuk memprediksi kota peraih A :0 B :0
A :0 B :1
A : 0.4 B : 0.6
A : 0.5 B : 0.5
A : 0.6 B : 0.4
anugerah Adipura terdiri atas kelas Adipura dan kelas Bukan Adipura. Akurasi Pada tahap ini dilakukan pengukuran tingkat akurasi berdasarkan data hasil klasifikasi. Tingkat akurasi diperoleh dengan perhitungan : =
∑ ∑
Lingkup Pengembangan Penelitian ini diimplementasikan dengan menggunakan Microsoft Access 2003 untuk komputasi algoritme VFI5. Perangkat keras yang digunakan adalah komputer notebook dengan spesifikasi: 1 Prosesor AMD Turion64 X2 2.2GHz, 2 RAM 4 GB, dan 3 Harddisk 250 GB.
A :1 A :0
A : 0.7 B : 0.3
A :1 B :0
A :0 B :0
fi 65
68
71
84
VFI5
A :0 B :1
A :0 B :1
A : 0.4 B : 0.6
A : 0.5 B : 0.5
A : 0.6 B : 0.4
A :1 A :0
A : 0.7 B : 0.3
A :1 B :0
A :1 B :0
fi 30
65
68
71
84
VFI5 modifikasi
Gambar 4 Perbandingan interval VFI5 dengan VFI5 modifikasi.
HASIL DAN PEMBAHASAN Penelitian ini menggunakan data hasil Pemantauan I dan Pemantauan II Program Adipura kategori kota Kecil dan kota Sedang regional Jawa periode 2007-2008. Klasifikasi yang digunakan adalah algoritme klasifikasi VFI5 dan algoritme klasifikasi VFI5 modifikasi. Bobot yang digunakan adalah bobot masing-masing feature yang ditentukan KLH dan bobot masing-masing feature sama.
Data Pemantauan I Data Pemantauan I Program Adipura berjumlah 98 instance. Data ini selanjutnya dibagi menjadi data latih dan data uji (klasifikasi) sesuai dengan 3-fold cross validation. Confusion matrix pada iterasi pertama data Pemantauan I disajikan pada Tabel 7. Seluruh metode klasifikasi digunakan pada tahap pengujian untuk mengetahui tingkat akurasi masing-masing metode. Hasil tahap klasifikasi pada iterasi pertama disajikan pada Tabel 8. Jumlah kota salah prediksi pada
7
iterasi ini berbeda untuk setiap metode klasifikasi. Daftar kota salah prediksi pada iterasi ini dapat dilihat pada Lampiran 5.
kesalahan prediksi kota Pasuruan. Detail vote untuk masing-masing instance dapat dilihat pada Lampiran 8.
Tabel 7
Confusion matrix pada iterasi pertama data Pemantauan I. Prediksi Data Kelas A Kelas BA Kelas A 12 0 Aktual Kelas BA 5 15 * Kelas A : Kelas Adipura; Kelas BA : Kelas Bukan Adipura.
Tabel 10 Hasil tahap klasifikasi pada iterasi ketiga data Pemantauan I Metode Prediksi Prediksi Akurasi benar salah VFI5a 29 4 87.88 % VFI5b 29 4 87.88 % VFI5c 27 6 81.82 % VFI5d 30 3 90.91 %
Tabel 8 Hasil tahap klasifikasi pada iterasi pertama data Pemantauan I Metode Prediksi Prediksi Akurasi benar salah VFI5a 27 5 84.38 % VFI5b 27 5 84.38 % VFI5c 26 6 81.25 % VFI5d 26 6 81.25 %
Tahap klasifikasi data Pemantauan I menggunakan 3-fold cross validation menunjukan penggunaan bobot masingmasing feature adalah satu memiliki akurasi rata-rata yang lebih tinggi dibandingkan dengan bobot yang telah ditentukan KLH, sedangkan penggunaan metode klasifikasi VFI5 (VFI5a) dan VFI5 modifikasi (VFI5b) tidak menunjukan perbedaan tingkat akurasi. Tingkat akurasi rata-rata hasil tahap klasifikasi data Pemantauan I disajikan pada Tabel 11. Grafik akurasi prediksi pada data Pemantauan I dapat dilihat pada Lampiran 9. Hasil tahap klasifikasi data Pemantauan I menunjukan tingkat akurasi tertinggi pada metode VFI5a dan VFI5b sebesar 85.70 %. Metode ini merupakan menggunakan algoritme klasifikasi VFI5 dan algoritme VFI5 modifikasi dengan bobot masingmasing feature sama. Pada tahap klasifikasi ini penggunaan bobot yang ditentukan KLH tidak memberikan hasil yang lebih baik daripada bobot masing-masing feature sama.
Hasil tahap klasifikasi pada iterasi kedua disajikan pada Tabel 9. Seluruh kota salah prediksi pada iterasi kedua adalah sama untuk seluruh metode klasifikasi. Daftar kota salah prediksi seluruh metode pada iterasi kedua dapat dilihat pada Lampiran 6. Hasil tahap klasifikasi pada iterasi kedua data Pemantauan I ini tidak menunjukan perbedaan akurasi terhadap masing-masing metode (84.85%). Tingkat akurasi pada iterasi ini lebih tinggi dari iterasi sebelumnya. Tabel 9 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan I Metode Prediksi Prediksi Akurasi benar salah VFI5a 28 5 84.85 % VFI5b 28 5 84.85 % VFI5c 28 5 84.85 % VFI5d 28 5 84.85 % Hasil tahap klasifikasi pada iterasi ketiga disajikan pada Tabel 10. Jumlah kota salah prediksi pada iterasi ketiga berbeda untuk setiap metode klasifikasi. Daftar kota salah prediksi pada iterasi ini dapat dilihat pada Lampiran 7. Hasil tahap klasifikasi pada iterasi pertama data Pemantauan I menunjukan beberapa kota salah diprediksi. Salah satu kota tersebut adalah kota Pasuruan dengan kategori kota Sedang. Vote untuk kelas Bukan Adipura 48.70, sedangkan vote untuk kelas Adipura 51.30. Selisih vote dengan nilai yang kecil (selisih 2.60) menjadi salah satu penyebab
Tabel 11 Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan I Metode Akurasi rata-rata VFI5a 85.70 % VFI5b 85.70 % VFI5c 82.64 % VFI5d 85.67 % Data Pemantauan II Jumlah instance data Pemantauan II Program Adipura sama dengan jumlah instance pada data Pemantauan I. Data ini selanjutnya dibagi menjadi data latih dan data uji. Jumlah data latih dan data uji pada data Pemantauan II sama dengan pada data Pemantauan I. Metode yang digunakan pada tahap klasifikasi data Pemantauan II sama dengan pada data Pemantauan I. Hasil tahap klasifikasi pada iterasi pertama disajikan
8
pada Tabel 12. Seluruh kota salah prediksi pada iterasi ini adalah sama untuk setiap metode klasifikasi. Daftar kota salah prediksi pada iterasi pertama data Pemantauan II dapat dilihat pada Lampiran 10. Tabel 12 Hasil tahap klasifikasi pada iterasi pertama data Pemantauan II Metode Prediksi Prediksi Akurasi benar salah VFI5a 29 3 90.63 % VFI5b 29 3 90.63 % VFI5c 29 3 90.63 % VFI5d 29 3 90.63 % Hasil tahap klasifikasi pada iterasi kedua disajikan pada Tabel 13. Kota salah prediksi pada iterasi kedua dapat dilihat pada Lampiran 11. Detail vote kota Pasuruan pada kota salah prediksi iterasi pertama dapat dilihat pada Lampiran 12, detail vote kabupaten Temanggung pada Lampiran 13, dan detail vote kabupaten Wonogiri pada Lampiran 14. Tabel 13 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan II Metode Prediksi Prediksi Akurasi benar salah VFI5a 29 4 87.88 % VFI5b 29 4 87.88 % VFI5c 28 5 84.85 % VFI5d 28 5 84.85 % Hasil tahap klasifikasi pada iterasi ketiga disajikan pada Tabel 14. Jumlah kota salah prediksi pada iterasi ini dapat dilihat pada Lampiran 15. Tabel 14 Hasil tahap klasifikasi pada iterasi ketiga data Pemantauan II Metode Prediksi Prediksi Akurasi benar salah VFI5a 31 2 93.94 % VFI5b 32 1 96.97 % VFI5c 31 2 93.94 % VFI5d 31 2 93.94 % Hasil tahap klasifikasi data Pemantauan II menunjukan tingkat akurasi yang lebih tinggi dibandingkan dengan setiap iterasi pada tahap klasifikasi data Pemantauan I. Akurasi tertinggi pada tahap ini adalah pada iterasi ketiga menggunakan metode klasifikasi VFI5 modifikasi dengan bobot yang ditentukan KLH. Tingkat akurasi yang diperoleh pada metode tersebut adalah 96.97 %.
Tingkat akurasi rata-rata tertinggi pada tahap klasifikasi data Pemantauan II sebesar 91.82 % menggunakan metode klasifikasi VFI5 modifikasi dengan bobot yang ditentukan KLH. Secara umum, tingkat akurasi tahap klasifikasi data Pemantauan II lebih tinggi dari tahap klasifikasi data Pemantauan I. Tingkat akurasi rata-rata pada tahap klasifikasi data Pemantauan II disajikan pada Tabel 15. Grafik akurasi prediksi pada data Pemantauan II dapat dilihat pada Lampiran 16. Tabel 15 Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan II Metode Akurasi rata-rata VFI5a 90.81 % VFI5b 91.82 % VFI5c 89.80 % VFI5d 89.80 % Data rata-rata Pemantauan I dan Pemantauan II Data yang digunakan merupakan rata-rata Pemantauan I dan Pemantauan II Program Adipura. Data tersebut dihitung nilai rata-rata Pemantauan I dan Pemantauan II untuk setiap kriteria penilaian seluruh kota peserta Program Adipura. Selanjutnya data ini dibagi menjadi data latih dan data uji. Jumlah data latih dan data uji sama dengan pada data sebelumnya. Metode yang digunakan pada tahap klasifikasi data rata-rata Pemantauan I dan Pemantauan II sama dengan tahap klasifikasi data sebelumnya. Hasil tahap klasifikasi pada iterasi pertama disajikan pada Tabel 16, sedangkan daftar kota salah prediksi pada iterasi pertama dapat dilihat pada Lampiran 17. Tabel 16 Hasil tahap klasifikasi pada iterasi pertama data rata-rata Pemantauan I dan Pemantauan II Metode Prediksi Prediksi Akurasi benar salah VFI5a 28 4 87.50 % VFI5b 29 3 90.63 % VFI5c 27 5 84.38 % VFI5d 28 4 87.50 % Hasil tahap klasifikasi iterasi kedua disajikan pada Tabel 17. Kota salah prediksi untuk setiap metode pada iterasi ini sama, yaitu kabupaten Nganjuk dan kabupaten Kulon Progo. Hasil tahap klasifikasi iterasi kedua memiliki tingkat akurasi paling tinggi
9
yaitu 93.94 % untuk seluruh metode. Penggunaan masing-masing metode dan bobot pada tahap klasifikasi iterasi ini tidak mempengaruhi tingkat akurasi. Tabel 17 Hasil tahap klasifikasi pada iterasi kedua data rata-rata Pemantauan I dan Pemantauan II Metode Prediksi Prediksi Akurasi benar salah VFI5a 31 2 93.94 % VFI5b 31 2 93.94 % VFI5c 31 2 93.94 % VFI5d 31 2 93.94 %
metode klasifikasi VFI5 modifikasi dengan bobot masing-masing feature sama (VFI5b). Tingkat akurasi rata-rata tertinggi diperoleh menggunakan data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II yaitu 91.82 %. Daftar tingkat akurasi untuk setiap data, iterasi dan metode klasifikasi dapat dilihat pada Lampiran 20. Grafik tingkat akurasi setiap metode dan data pemantauan disajikan pada Gambar 5.
Hasil tahap klasifikasi iterasi ketiga disajikan pada Tabel 18. Kota salah prediksi pada iterasi ketiga dapat dilihat pada Lampiran 18. Tabel 18 Hasil tahap klasifikasi pada iterasi ketiga data rata-rata Pemantauan I dan Pemantauan II Metode Prediksi Prediksi Akurasi benar salah VFI5a 29 4 87.88 % VFI5b 30 3 90.91 % VFI5c 30 3 90.91 % VFI5d 30 3 90.91 % Hasil klasifikasi seluruh seluruh iterasi pada data rata-rata Pemantauan I dan Pemantauan II menunjukan tingkat akurasi rata-rata tertinggi sebesar 91.82 %. Tingkat akurasi ini dicapai dengan menggunakan metode klasifikasi modifikasi dengan bobot masing-masing feature adalah satu. Tingkat akurasi rata-rata pada tahap klasifikasi data rata-rata Pemantauan I dan Pemantauan II disajikan pada Tabel 19. Grafik akurasi prediksi pada data rata-rata Pemantauan I dan Pemantauan II dapat dilihat pada Lampiran 19.
Gambar 5 Grafik tingkat akurasi prediksi. Penggunaan kombinasi metode klasifikasi dan bobot bertujuan untuk mengetahui tingkat akurasi tertinggi prediksi kota peraih anugerah Adipura, sehingga dapat diketahui metode yang paling tepat. Tingkat akurasi rata-rata tertinggi untuk seluruh data pemantauan Program Adipura diperoleh menggunakan metode klasifikasi modifikasi dengan menggunakan bobot masing-masing feature sama (VFI5b) yaitu sebesar 89.78 %. Grafik tingkat akurasi rata-rata setiap metode disajikan pada Gambar 6.
Tabel 19 Tingkat akurasi rata-rata tahap klasifikasi data rata-rata Pemantauan I dan Pemantauan II Metode Akurasi rata-rata VFI5a 89.77 % VFI5b 91.82 % VFI5c 89.74 % VFI5d 90.78 % Hasil tahap klasifikasi menggunakan data Pemantauan I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II menunjukan tingkat akurasi tertinggi pada
Gambar 6 Grafik tingkat akurasi metode.
10
KESIMPULAN DAN SARAN Kesimpulan Prediksi anugerah Adipura dapat digunakan pihak KLH untuk membantu menetapkan mekanisme kota pantau pada Pemantauan Verifikasi, selain itu hasil prediksi tersebut dapat dijadikan alat perhitungan cepat (quick count) bagi pihak KLH untuk memprediksi kota peraih anugerah Adipura. Penelitian ini menunjukkan tingkat akurasi tertinggi dihasilkan pada data hasil Pemantauan II dengan menggunakan metode klasifikasi modifikasi dan bobot masingmasing feature sama dengan satu (VFI5b). Tingkat akurasi yang dihasilkan adalah sebesar 91.82 %. Saran Penelitian ini dapat dikembangkan lebih lanjut melalui peningkatan akurasi prediksi dengan melakukan eksplorasi terhadap bobot feature.
DAFTAR PUSTAKA Demiröz G dan Gűvenir HA. 1997. Classification by Voting Feature Intervals. http://www.cs.ucf.edu/~ecl/ papers/demiros97classification.pdf. [November 2008]. Gűvenir HA, Demiröz G, Ilter N. 1998. Learning Differential Diagnosis of Erythemato-Squamous Diseases using Voting Feature Intervals. Artificial Intelligence in Medicine, 13(3), 147165. Hamilton H, Gurak E, Findlater L. 2003. Confusion Matrix. http://www2.cs. uregina.ca/~dbd/cs831/notes/confusion_ matrix/confusion_matrix.html. [Februari 2009]. Han J, Kamber M. 2001. Data Mining Concept & Technique. USA:Academic Press. [KLH] Kementerian Lingkungan Hidup. 2006. Peraturan Menteri Negara Lingkungan Hidup nomor 14 tahun 2006. Jakarta. [KLH] Kementerian Lingkungan Hidup. 2007. ADIPURA Menuju Kota Bersih dan Teduh. Jakarta. [KLH] Kementerian Lingkungan Hidup. 2008. Laporan Tahun 2007 Deputi Bidang Pengendalian Pencemaran
Lingkungan Kementerian Lingkungan Hidup. Jakarta. Sarle W. 2004. What are cross-validation and bootstrapping?. http://www.faqs.org /faqs/ai-faq/neural-nets/part3/section12.html. [November 2008].
LAMPIRAN
12
Lampiran 1 Jadwal Pelaksanaan Program Adipura
Lampiran 2 Data kabupaten/kota kategori kota Sedang dan kota Kecil regional Jawa No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Kota Banyuwangi Batu Blitar Cianjur Cibinong Cilacap Cilegon Cimahi Cirebon Gresik Jember Jepara Jombang Tangerang Kebumen Kediri Kudus Lumajang Madiun Magelang Mojokerto Muntilan Pasuruan Pekalongan Pemalang
Kota/kab Kabupaten banyuwangi Kotamadya kota batu Kotamadya blitar Kabupaten cianjur Kabupaten bogor Kabupaten cilacap Kotamadya cilegon Kotamadya kota cimahi Kotamadya cirebon Kabupaten gresik Kabupaten jember Kabupaten jepara Kabupaten jombang Kabupaten tangerang Kabupaten kebumen Kotamadya kediri Kabupaten kudus Kabupaten lumajang Kotamadya madiun Kotamadya magelang Kotamadya mojokerto Kabupaten magelang Kotamadya pasuruan Kotamadya pekalongan Kabupaten pemalang
Provinsi Jawa timur Jawa timur Jawa timur Jawa barat Jawa barat Jawa tengah Banten Jawa barat Jawa barat Jawa timur Jawa timur Jawa tengah Jawa timur Banten Jawa tengah Jawa timur Jawa tengah Jawa timur Jawa timur Jawa tengah Jawa timur Jawa tengah Jawa timur Jawa tengah Jawa tengah
Kategori Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang
13
Lampiran 2 Lanjutan No 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72
Kota Probolinggo Purwokerto Salatiga Sidoarjo Sleman Soreang Sukabumi Tasikmalaya Tegal Tulungagung Ungaran Bangil Bangkalan Banjar Banjarnegara Bantul Batang Blora Bojonegoro Bondowoso Boyolali Brebes Caruban Ciamis Cikarang Demak Garut Indramayu Kajen Karanganyar Karawang Kendal Kepanjen Klaten Kraksaan Kuningan Lamongan Magetan Majalengka Mojosari Nganjuk Ngawi Pacitan Pamekasan Pandeglang Pare Pati
Kota/kab Kotamadya probolinggo Kabupaten banyumas Kotamadya salatiga Kabupaten sidoarjo Kabupaten sleman Kabupaten bandung Kotamadya sukabumi Kotamadya tasikmalaya Kotamadya tegal Kabupaten tulungagung Kabupaten semarang Kabupaten pasuruan Kabupaten bangkalan Kotamadya banjar Kabupaten banjarnegara Kabupaten bantul Kabupaten batang Kabupaten blora Kabupaten bojonegoro Kabupaten bondowoso Kabupaten boyolali Kabupaten brebes Kabupaten madiun Kabupaten ciamis Kabupaten bekasi Kabupaten demak Kabupaten garut Kabupaten indramayu Kabupaten pekalongan Kabupaten karang anyar Kabupaten karawang Kabupaten kendal Kabupaten malang Kabupaten klaten Kabupaten probolinggo Kabupaten kuningan Kabupaten lamongan Kabupaten magetan Kabupaten majalengka Kabupaten mojokerto Kabupaten nganjuk Kabupaten ngawi Kabupaten pacitan Kabupaten pamekasan Kabupaten pandeglang Kabupaten kediri Kabupaten pati
Provinsi Jawa timur Jawa tengah Jawa tengah Jawa timur D.i. Yogyakarta Jawa barat Jawa barat Jawa barat Jawa tengah Jawa timur Jawa tengah Jawa timur Jawa timur Jawa barat Jawa tengah D.i. Yogyakarta Jawa tengah Jawa tengah Jawa timur Jawa timur Jawa tengah Jawa tengah Jawa timur Jawa barat Jawa barat Jawa tengah Jawa barat Jawa barat Jawa tengah Jawa tengah Jawa barat Jawa tengah Jawa timur Jawa tengah Jawa timur Jawa barat Jawa timur Jawa timur Jawa barat Jawa timur Jawa timur Jawa timur Jawa timur Jawa timur Banten Jawa timur Jawa tengah
Kategori Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Sedang Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil
14
Lampiran 2 Lanjutan No 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98
Kota Pelabuhan ratu Ponorogo Purbalingga Purwakarta Purwodadi Purworejo Rangkas bitung Rembang Sampang Singaparna Situbondo Slawi Sragen Subang Sukoharjo Sumber Sumedang Sumenep Temanggung Trenggalek Tuban Wates Wlingi Wonogiri Wonosari Wonosobo
Kota/kab Kabupaten sukabumi Kabupaten ponorogo Kabupaten purbalingga Kabupaten purwakarta Kabupaten grobogan Kabupaten purworejo Kabupaten lebak Kabupaten rembang Kabupaten sampang Kabupaten tasikmalaya Kabupaten situbondo Kabupaten tegal Kabupaten sragen Kabupaten subang Kabupaten sukoharjo Kabupaten cirebon Kabupaten sumedang Kabupaten sumenep Kabupaten temanggung Kabupaten trenggalek Kabupaten tuban Kabupaten kulon progo Kabupaten blitar Kabupaten wonogiri Kabupaten gunung kidul Kabupaten wonosobo
Provinsi Jawa barat Jawa timur Jawa tengah Jawa barat Jawa tengah Jawa tengah Banten Jawa tengah Jawa timur Jawa barat Jawa timur Jawa tengah Jawa tengah Jawa barat Jawa tengah Jawa barat Jawa barat Jawa timur Jawa tengah Jawa timur Jawa timur D.i. Yogyakarta Jawa timur Jawa tengah D.i. Yogyakarta Jawa tengah
Kategori Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil Kecil
15
Lampiran 3 Ilustrasi tahap pelatihan Kota Kota A Kota B Kota C Kota D Kota E Kota F
Nilai Perumahan 77.23 73.11 70.50 65.41 61.20 74.04
Kelas Adipura Adipura Bukan Adipura Adipura Bukan Adipura Bukan Adipura ……
……
…… Kelas Adipura Bukan Adipura
Maksimum ? ?
Minimum ? ?
Kelas Adipura Bukan Adipura
Maksimum 77.23 74.04
Minimum 65.41 61.20
Adipura Bukan Adipura
0 1 61.20
(data training hasil pemantauan kota Program Adipura)
6 11
Tahap 1 (dicari nilai maksimum dan minimum untuk setiap kelas, untuk setiap komponen, misal Perumahan)
(nilai maksimum dan minimum untuk setiap kelas, untuk setiap komponen, misal Perumahan)
1 0 65.41
12 9
0 1 74.04
21 3
1 0 77.23
Tahap 2 (Nilai pada Tahap 1 diurutkan seperti interval, kemudian data training dihitung nilai yang jatuh pada interval berdasarkan kelas-nya)
Jumlah Adipura
0
6
1
12
0
21
1
41
Bukan Adipura
1
11
0
9
1
3
0
25
61.20
65.41
74.04
77.23
Tahap 3 (seluruh nilai yang jatuh pada interval dijumlah berdasarkan kelas-nya)
Adipura Bukan Adipura
0
0.15
0.02
0.29
0
0.51
0.02
0.04
0.44
0
0.36
0.04
0.12
0
Tahap 4 Normalisasi horizontal (setiap nilai pada interval dibagi jumlah nilai horizontal seluruh interval kelas-nya)
Adipura Bukan Adipura
0 0.04 0.04
0.15 0.44 0.59
0.02 0 0.02
0.29 0.36 0.65
0 0.04 0.04
0.51 0.12 0.63
0.02 0 0.02
Tahap 5 Normalisasi vertikal (setiap nilai/count pada interval dibagi dengan jumlah vertikal nilai interval)
Adipura Bukan Adipura
0 1 61.20
0.25 0.75
1 0 65.41
0.45 0.55
0 1 74.04
Vote Interval (model interval untuk komponen Perumahan)
0.81 0.19
1 0 77.23
16
Lampiran 4 Ilustrasi tahap klasifikasi
Misal, hasil pemantauan Program Adipura untuk Kota Y dengan 16 komponen penilaian
Tahap 1, Untuk setiap komponen dicari vote terhadap kelas Adipura dan kelas Bukan Adipura
vote?
Interval untuk komponen Perumahan
Tahap 2, Nilai komponen Perumahan jatuh pada range interval 74.05 sampai 77.22
Tahap 3, Vote komponen Perumahan untuk kelas Adipura 0.81 dan kelas Bukan Adipura 0.19. seluruh tahap ini diulang untuk setiap komponen
17
Lampiran 5 Kota salah prediksi pada data Pemantauan I iterasi pertama No 1 2 3 4 5 6
VFI5a dan VFI5b kota Pasuruan Kab. Sukabumi Kota Sukabumi Kab. Temanggung Kab. Wonogiri
VFI5c dan VFI5d kota Pasuruan Kab. Sukabumi Kota Sukabumi Kab. Temanggung Kab. Wonogiri Kota Kediri
Lampiran 6 Kota salah prediksi pada data Pemantauan I iterasi kedua No 1 2 3 4 5
VFI5a, VFI5b, VFI5c, dan VFI5d Kab. Probolinggo Kab. Mojokerto Kab. Nganjuk Kab. Purwakarta Kab. Sleman
Lampiran 7 Kota salah prediksi pada data Pemantauan I iterasi ketiga No 1 2 3 4 5 6
VFI5a dan VFI5b Kab. Bangkalan Kab. Jepara Kab. Grobogan Kab. Banyumas
VFI5c Kab. Bangkalan Kab. Jepara Kab. Grobogan Kab. Banyumas Kab. Banyuwangi Kab. Batang
VFI5d Kab. Bangkalan Kab. Grobogan Kab. Banyumas
Lampiran 8 Vote masing-masing instance kota Pasuruan No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
VFI5a dan VFI5b Kelas BA Kelas A 0.35 0.65 0.41 0.59 0.53 0.47 0.58 0.42 0.50 0.50 0.37 0.63 0.29 0.71 1.00 0.00 0.41 0.59 0.68 0.32 0.46 0.54
Komponen Nilai Perumahan 73.96 Jalan 75.20 Pasar 64.50 Pertokoan 68.90 Perkantoran 75.30 Sekolah 72.07 Rumah Sakit/Puskesmas 74.82 Hutan Kota 30.00 Taman Kota 70.19 Terminal Bus/Angkot 68.13 Stasiun KA 70.69 Pelabuhan Penumpang Perairan Terbuka 70.33 0.44 0.56 TPA 63.13 0.43 0.57 Pemanfaatan Sampah 77.50 0.37 0.63 Pantai Wisata 48.70 51.30 Vote * Kelas A : Kelas Adipura; Kelas BA : Kelas Bukan Adipura.
VFI5c dan VFI5d Kelas BA Kelas A 2.46 4.54 3.26 4.74 4.74 4.26 3.49 2.51 1.51 1.49 2.96 5.04 1.76 4.24 3.00 0.00 2.90 4.10 5.41 2.59 2.28 2.72 3.52 4.28 1.12
4.48 5.72 1.88
46.89
53.11
18
Lampiran 9 Akurasi prediksi pada data Pemantauan I
Lampiran 10 Kota salah prediksi pada data Pemantauan II iterasi pertama No 1 2 3
VFI5a, VFI5b, VFI5c, dan VFI5d Kota Pasuruan Kab. Temanggung Kab. Wonogiri
Lampiran 11 Kota salah prediksi pada data Pemantauan II iterasi kedua No 1 2 3 4 5
VFI5a dan VFI5b Kab. Mojokerto Kab. Nganjuk Kab. Purbalingga Kab. Kulon Progo
VFI5c dan VFI5d Kab. Mojokerto Kab. Nganjuk Kab. Purbalingga Kab. Kulon Progo Kab. Purwakarta
Lampiran 12 Detail vote kota Pasuruan pada iterasi pertama data Pemantauan II No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Komponen
Nilai
VFI5a dan VFI5b Kelas BA Kelas A 0.00 1.00 0.00 1.00 0.51 0.49 0.30 0.70 0.30 0.70 0.18 0.82 0.23 0.77 0.42 0.58 1.00 0.00 0.72 0.28 0.28 0.72
Perumahan 78.76 Jalan 76.04 Pasar 68.68 Pertokoan 72.21 Perkantoran 78.16 Sekolah 74.72 Rumah Sakit/Puskesmas 75.34 Hutan Kota 78.00 Taman Kota 71.51 Terminal Bus/Angkot 71.73 Stasiun KA 72.96 Pelabuhan Penumpang Perairan Terbuka 67.20 0.49 0.51 TPA 65.07 0.19 0.81 Pemanfaatan Sampah 80.00 0.34 0.66 Pantai Wisata 35.49 64.51 Vote * Kelas A : Kelas Adipura; Kelas BA : Kelas Bukan Adipura.
VFI5c dan VFI5d Kelas BA Kelas A 0.00 7.00 0.00 8.00 4.59 4.41 1.81 4.19 0.91 2.09 1.42 6.58 1.37 4.63 1.27 1.73 7.00 0.00 5.78 2.22 1.40 3.60 3.95 1.93 1.01
4.05 8.07 1.99
35.65
64.35
19
Lampiran 13 Detail vote kabupaten Temanggung pada iterasi pertama data Pemantauan II No
Komponen
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Perumahan Jalan Pasar Pertokoan Perkantoran Sekolah Rumah Sakit/Puskesmas Hutan Kota Taman Kota Terminal Bus/Angkot Stasiun KA Pelabuhan Penumpang Perairan Terbuka TPA Pemanfaatan Sampah Pantai Wisata Vote * Kelas A : Kelas Adipura; Kelas BA : Kelas Bukan Adipura.
Nilai 73.23 80.06 66.47 67.36 74.59 76.51 74.94 80.40 74.97 71.81
71.58 68.42 60.00
VFI5a dan VFI5b Kelas BA Kelas A 0.29 0.71 0.00 1.00 0.51 0.49 0.30 0.70 0.30 0.70 0.18 0.82 0.23 0.77 0.42 0.58 0.38 0.62 0.72 0.28
VFI5c dan VFI5d Kelas BA Kelas A 2.04 4.96 0.00 8.00 4.59 4.41 1.81 4.19 0.91 2.09 1.42 6.58 1.37 4.63 1.27 1.73 2.68 4.32 5.78 2.22
0.49 0.19 1.00
0.51 0.81 0.00
3.95 1.93 3.00
4.05 8.07 0.00
38.66
61.34
35.75
64.25
Lampiran 14 Detail vote kabupaten Wonogiri pada iterasi pertama data Pemantauan II No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Komponen
Perumahan Jalan Pasar Pertokoan Perkantoran Sekolah Rumah Sakit/Puskesmas Hutan Kota Taman Kota Terminal Bus/Angkot Stasiun KA Pelabuhan Penumpang Perairan Terbuka TPA Pemanfaatan Sampah Pantai Wisata Vote * Kelas A : Kelas Adipura; Kelas BA : Kelas Bukan Adipura.
Nilai 73.53 73.70 72.55 70.75 73.73 75.72 71.97 86.00 74.02 67.73 66.33 77.17 70.35 71.00
VFI5a dan VFI5b Kelas BA Kelas A 0.29 0.71 0.50 0.50 0.00 1.00 0.30 0.70 1.00 0.00 0.18 0.82 1.00 0.00 0.42 0.58 0.38 0.62 0.72 0.28 1.00 0.00
VFI5c dan VFI5d Kelas BA Kelas A 2.04 4.96 4.00 4.00 0.00 9.00 1.81 4.19 3.00 0.00 1.42 6.58 6.00 0.00 1.27 1.73 2.68 4.32 5.78 2.22 5.00 0.00
0.49 0.19 0.34
0.51 0.81 0.66
3.95 1.93 1.01
4.05 8.07 1.99
48.72
51.28
43.83
56.17
20
Lampiran 15 Kota salah prediksi pada data Pemantauan II iterasi ketiga No
VFI5a, VFI5c, dan VFI5d
VFI5b
1
Kab. Batang
Kab. Gunung Kidul
2
Kab. Gunung Kidul
Lampiran 16 Akurasi prediksi pada data Pemantauan II
Lampiran 17 Kota salah prediksi pada data rata-rata Pemantauan I dan Pemantauan II iterasi pertama No
VFI5a
VFI5b
VFI5c
VFI5d
1
Kota Pasuruan
Kota Pasuruan
Kota Pasuruan
Kota Pasuruan
2
Kab. Sukabumi
Kab. Temanggung
Kab. Sukabumi
Kab. Temanggung
3
Kab. Temanggung
Kab. Wonogiri
Kab. Temanggung
Kab. Wonogiri
4
Kab. Wonogiri
Kab. Wonogiri
Kota Kediri
5
Kota Kediri
Lampiran 18 Kota salah prediksi pada data rata-rata Pemantauan I dan Pemantauan II iterasi ketiga No
VFI5a
VFI5b
VFI5c
VFI5d
1
Kab. Batang
Kab. Jepara
Kab. Batang
Kab. Batang
2
Kab. Jepara
Kab. Banyumas
Kab. Grobogan
Kab. Grobogan
3
Kab. Banyumas
Kab. Gunung Kidul
Kab. Banyumas
Kab. Banyumas
4
Kab. Gunung Kidul
21
Lampiran 19 Akurasi prediksi pada data rata-rata Pemantauan I dan Pemantauan II
Lampiran 20 Daftar tingkat akurasi seluruh data, iterasi dan metode klasifikasi Data
P1
P2
rata-rata P1 dan P2
* P1 : Pemantauan I; P2 : Pemantauan II.
Metode
Iterasi VFI5a
VFI5b
VFI5c
VFI5d
Iterasi ke-1
84.38
84.38
81.25
81.25
Iterasi ke-2
84.85
84.85
84.85
84.85
Iterasi ke-3
87.88
87.88
81.82
90.91
Rata-rata
85.70
85.70
82.64
85.67
Iterasi ke-1
90.63
90.63
90.63
90.63
Iterasi ke-2
87.88
87.88
84.85
84.85
Iterasi ke-3
93.94
96.97
93.94
93.94
Rata-rata
90.81
91.82
89.80
89.80
Iterasi ke-1
87.50
90.63
84.38
87.50
Iterasi ke-2
93.94
93.94
93.94
93.94
Iterasi ke-3
87.88
90.91
90.91
90.91
Rata-rata
89.77
91.82
89.74
90.78