BAB I PENDAHULUAN 1.1
Latar Belakang Analisis regresi linier berganda merupakan analisis yang digunakan untuk
menyelidiki hubungan di antara dua atau lebih peubah prediktor đ terhadap peubah respon đ yang berskala minimal interval. Selain itu, analisis regresi juga digunakan sebagai prediksi peubah respon đ dari peubah prediktor đ (Neter et al., 1997). Dalam analisis regresi, metode kuadrat terkecil merupakan suatu metode yang umum digunakan untuk memperoleh penduga dari parameter regresi. Metode ini memberikan hasil yang terbaik dalam menaksir nilai-nilai koefisien parameter regresinya serta memiliki sifat tak berbias, memiliki ragam minimum dan konsisten (Neter et al., 1997). Penggunaan metode ini memerlukan pengujian asumsi klasik yang harus dipenuhi oleh komponen sisaan atau galat (đđ ) dalam model yang dihasilkan. Beberapa asumsinya antara lain adalah komponen sisaan memenuhi asumsi kenormalan, kehomogenan ragam, multikolinieritas dan tidak terjadinya autokorelasi. Dalam berbagai kasus tidak jarang ditemukan berbagai hal yang menyebabkan tidak terpenuhinya asumsi klasik tersebut. Hal ini akan memengaruhi model dengan interpretasi, oleh karena itu saat asumsi klasik tidak terpenuhi, metode penduga kuadrat terkecil harus dihindari. Salah satu penyebab tidak terpenuhinya asumsi klasik adalah adanya pencilan yang menyebabkan pelanggaran terhadap asumsi kenormalan. Pencilan merupakan
suatu data yang pengamatannya berada jauh dari sekelompok data amatan lainnya. Pencilan akan mengakibatkan keragaman data yang dihasilkan menjadi lebih besar, interval data akan memberikan selang yang lebih lebar serta akan memberikan dampak buruk pada penduga koefisien regresinya (bersifat bias). Hal ini mengakibatkan suku galat tidak lagi menyebar normal, đ¸{đđ } â 0. Suku galat seringkali mewakili pengaruh banyak faktor yang tidak disertakan didalam model, sehingga sebaran datanya menjadi tidak normal (Neter et al., 1997). Pengidentifikasian pencilan pada regresi dengan satu atau dua peubah prediktor dapat menggunakan diagram kotak garis, diagram dahan daun, dan plot pencaran sedangkan pada analisis regresi
yang lebih dari dua peubah
prediktor,
pengidentifikasian pencilan melalui grafis sederhana menjadi sulit sebab pemeriksaan peubahnya tidak selalu dapat membantu menemukan pencilan terhadap suatu model regresi (Neter et al., 1997). Pencilan kemungkinan disebabkan oleh kesalahan dalam memasukkan data, kesalahan instrumen, kesalahan sistem, perilaku curang ataupun memang penyimpangan yang dialami populasinya. Analisis data yang teridentifikasi pencilan dapat dilakukan dengan cara melakukan pengkoreksian terhadap data yang mengandung pencilan tersebut, menyertakan data pencilan dalam analisis data maupun menghilangkan pencilan dalam analisis. Namun dengan menghilangkan data pencilan bukanlah suatu alternatif yang baik karena kemungkinan data pencilan merupakan data yang berpengaruh ataupun mengandung informasi yang penting yang tidak bisa diberikan oleh data lainnya. Oleh karena itu, sangat diperlukan metode penduga
parameter yang robust atau kekar terhadap adanya pencilan pada analisis regresi berganda. Penelitian sebelumnya mengenai regresi robust sudah pernah dilakukan oleh Irawan (2013) dengan menggunakan metode Least Median of Squares (LMS) dan Minimum Covariance Determinant (MCD) dalam regresi komponen utama (RKU). Matriks kovarian yang digunakan pada RKU diganti dengan matriks kovarian robust yang diperoleh dari metode MCD, kemudian peubahnya diregresikan dengan metode LMS menghasilkan nilai bias dan mean square error (MSE) yang cenderung kecil. Metode Minimum Covariance Determinant atau selanjutnya disebut MCD diperkenalkan oleh Rousseeuw pada tahun 1985 yang menggunakan matriks kovarians dalam mengatasi pencilan. Metode ini memiliki kemampuan mendeteksi seluruh pencilan di ruang đ dan đ dan memiliki ketahanan yang cukup besar terhadap pencilan (Gusriani et al., 2013). Metode Least Median of Squares atau selanjutnya disebut LMS diperkenalkan oleh Rousseeuw pada tahun (1984) merupakan suatu metode regresi robust yang bekerja mengurangi pengaruh dari sisaan dengan menggunakan median dari kuadrat sisaannya. Namun berlawanan dengan kelebihan di atas, ketika penelitian dihadapkan dengan ukuran data yang kecil, metode MCD dan LMS dipertanyakan kembali keunggulannya. Analisis data yang berkaitan dengan ukuran data yang kecil dapat diatasi dengan resampling atau bootstrap. Bootstrap pertama kali diperkenalkan oleh Efron tahun 1979. Bootstrap merupakan metode yang dapat bekerja tanpa membutuhkan asumsi
distribusi karena sampel asli digunakan sebagai populasi serta digunakan untuk mencari distribusi sampling dari suatu penduga, menggunakan prosedur resampling dengan pengembalian dari data asli. Berdasarkan pemaparan tersebut maka peneliti tertarik melakukan penelitian dengan mengaplikasikan metode Bootstrap dengan metode MCD dan LMS dalam menangani data pencilan dengan ukuran data yang kecil. Penelitian ini akan dilakukan dengan membandingkan hasil penelitian penerapan metode Bootstrap dengan metode MCD dan metode Bootstrap dengan metode LMS pada ukuran data yang kecil.
1.2
Rumusan Masalah Berdasarkan pemaparan latar belakang masalah, maka yang menjadi rumusan
masalah dalam penelitian ini adalah bagaimana bias pada penduga parameter yang dihasilkan oleh metode MCDâbootstrap dan metode LMSâbootstrap?
1.3
Batasan Masalah Adapun batasan masalah pada penelitian ini yakni:
1.
Penelitian ini dilakukan hanya pada data simulasi yang mengandung pencilan.
2.
Tidak ada multikolinieritas antar peubah prediktor.
3.
Data simulasi yang digunakan adalah model regresi linier berganda dengan satu peubah respon dan dua peubah prediktor.
4.
Penelitian ini hanya memaparkan alternatif mengatasi pencilan dengan penggunaan metode MCDâbootstrap dan LMSâbootstrap.
1.4
Tujuan Penelitian Berdasarkan rumusan masalah yang telah diuraikan maka yang menjadi tujuan
dalam penelitian ini adalah untuk mengetahui perbandingan bias pada penduga parameter yang dihasilkan oleh metode MCD-bootstrap dan metode LMSâbootstrap.
1.5
Manfaat Penelitian Adapun manfaat yang diharapkan peneliti mengenai permasalahan data kecil
pada metode MCDâbootstrap dan metode LMSâbootstrap, yaitu: 1.
Bagi penulis, dapat mengetahui bagaimana perbedaan bias yang dihasilkan oleh metode MCDâbootstrap dan metode LMSâbootstrap.
Bagi pembaca, dapat memberikan referensi dalam penelitian selanjutnya mengenai metode MCDâbootstrap dan metode LMSâbootstrap.