APLIKASI REGRESI RIDGE LEAST ABSOLUTE DEVIATION PADA KASUS PELANGGARAN ASUMSI KENORMALAN DAN MULTIKOLINIERITAS Indah Ayustina, Anna Islamiyati, Raupong Program Studi Statistika, FMIPA, Universitas Hasanuddin ABSTRAK Metode yang dapat digunakan ketika terjadi pelanggaran asumsi kenormalan dan multikolinieritas secara bersamaan adalah metode regresi ridge least absolute deviation (RLAD). Metode regresi RLAD merupakan penggabungan antara metode regresi ridge dan metode regresi robust LAD. Skripsi ini bertujuan untuk mengestimasi parameter regresi dengan metode RLAD pada data harga penjualalan dangke Kecamatan Cendana Kabupaten Enrekang tahun 2013 dimana variabel tak bebasnya adalah harga penjualan dangke (π) dan variabel-variabel bebasnya adalah biaya produksi dangke (π1 ), jumlah produksi susu (π2 ), jumlah produksi dangke (π3 ) dan jumlah pembeli dangke (π4 ). Adapun model regresi RLAD yang terbentuk adalah πΜπ
πΏπ΄π· = 9192 + 0.08 π2 β 453.23 π3 . Ketika data diolah dengan metode penaksir ordinary least square tak satupun variabel bebas yang secara signifikan mempengaruhi variabel tak bebas dimana nilai kuadrat tengah galat (KTG) dan π
2 yang diperoleh adalah sebesar 2537086 dan 0.203. Setelah diolah dengan metode RLAD terdapat dua variabel bebas yang berpengaruh terhadap variabel tak bebas yaitu jumlah produksi susu (π2 ) dan jumlah produksi dangke (π3 ) dengan nilai KTG dan π
2 sebesar 2406307.578 dan 0.244. Terlihat bahwa ketika data tidak berdistribusi normal dan terjadi multikolinieritas salah satu metode yang dapat digunakan adalah metode RLAD. Kata Kunci : Ketidaknormalan galat, Multikolinieritas, Regresi Ridge, Regresi Robust LAD, Regresi RLAD. 1.
Pendahuluan Analisis regresi merupakan salah satu metode statistika yang sering digunakan untuk melihat hubungan antara variabel bebas dan variabel tak bebas. Secara umum, analisis regresi linier terbagi atas dua yaitu analisis regresi linier sederhana dan analisis regresi linier berganda. Permasalahan yang sering dihadapi pada regresi linier berganda adalah galat yang tidak berdistribusi normal dan terjadinya multikolineritas. Kedua masalah ini merupakan dua masalah yang saling terpisah namun seringkali terjadi secara bersamaan. Salah satu metode yang diusulkan untuk menangani kedua masalah ini adalah dengan menggabungkan metode regresi ridge dan metode regresi robust least absolute deviation (LAD) (Pfaffenberger dan Dielman (1985) dalam Midi dan Zahari (2007)). Berdasarkan uraian tersebut, penulisan ini akan mengkaji ulang penggunaan regresi RLAD dalam mengatasi masalah ketidaknormalan dan multikolinieritas yang selanjutnya akan diaplikasikan pada data penjualan dangke tahun 2013 di Kecamatan Cendana, Kabupaten Enrekang (Wahyuni, 2013).
1
2. 2.1
Tinjauan Pustaka Least Absolute Deviation Least absolute deviation (LAD) menangani masalah galat yang tidak berdistribusi normal. Penaksir LAD (π½ΜπΏπ΄π· ) didefinisikan sebagai solusi dari meminimumkan harga mutlak galat: min βππ=1|ππ | = min βππ=1|ππ β πΏπ‘π π·πΏπ΄π· |. (2.1) Dibandingkan dengan meminimumkan jumlah kuadrat galat sebagaimana pada OLS, jumlah nilai absolut dari galat lebih minimum. Sehingga efek dari keberadaan pencilan pada penaksir LAD akan lebih kecil dibanding pada penaksir OLS (Abd. El-Salam, 2013). Metode yang digunakan dalam penaksiran parameter ini adalah dengan metode iteratively reweighted least square (IRLS). Metode Weighted Least Square (WLS) dapat digunakan untuk menghitung penaksir parameter LAD. Penaksir parameter WLS dapat dituliskan sebagai: Μ ππΏπ = (πΏπ πΎπΏ)β1 πΏπ πΎπ, π· (2.2) dimana πΎ adalah matriks diagonal dengan elemen diagonalnya π€ππ . Elemen diagonal dari matriks πΎ adalah: 1 , ππππ |ππ | β 0 π€ππ = {|ππ | , 1, ππππ |ππ | = 0 dimana ππ adalah galat dari nilai awal yang diperoleh dari metode OLS (Abd. El-Salam, 2013). 2.2
Regresi Ridge Regresi ridge merupakan salah satu metode yang digunakan untuk mengatasi masalah multikolinieritas melalui modifikasi terhadap metode OLS. Modifikasi tersebut ditempuh dengan cara menambah tetapan bias π yang relatif kecil pada diagonal utama matriks πΏπ‘ πΏ yang diperoleh melalui metode OLS. Model umum dari regresi ridge adalah sebagai berikut: ππ = π½0π
+ π½1π
ππ1 + π½2π
ππ2 + β― + π½ππ
πππ + ππ , π = 1,2, β¦ , π, atau dapat dinyatakan dapat dinyatakan dalam bentuk matriks yakni sebagai berikut: π = πΏπ·π
+ πΊ, (2.3) π
π
β¦ π½π
π dimana π·π
= [π½0 π½1 π ] merupakan parameter regresi ridge yang akan ditaksir. Penaksir regresi ridge diperoleh dengan meminimumkan jumlah kuadrat galat untuk model pada Persamaan (2.3) dengan syarat memenuhi kendala π·π‘π
π·π
= π. Untuk meminimumkan jumlah kuadrat tersebut digunakan metode pengali Lagrange dan diperoleh fungsi yaitu : β(π·π
, π) = ππ‘ π β ππ·π‘π
πΏπ‘ π + π·π‘π
πΏπ‘ πΏπ·π
+ π(π·π‘π
π·π
β π). (2.4) Selanjutnya Persamaan (2.4) diturunkan terhadap π·π
kemudian disamakan dengan nol sehingga diperoleh : Μ π
(π) = (πΏπ‘ πΏ + ππ°)β1 πΏπ‘ π. π· (2.5) 2.3
Regresi Ridge Least Absolute Deviation Regresi ridge least absolute deviation (RLAD) merupakan metode yang menggabungkan antara regresi ridge dan regresi robust LAD. Penggabungan kedua metode
2
ini akan menghasilkan metode yang mampu mengatasi masalah ketidaknormalan dan multikolinieritas pada data (Samkar dan Alpu, 2010). Penggabungan regresi ridge dengan regresi robust LAD dapat dituliskan sebagai berikut: Μ π
πΏπ΄π· (π β ) = (πΏπ‘ πΏ + π β π°)β1 πΏπ‘ πΏπ· Μ πΏπ΄π· , π· Μ Μ πΏπ΄π· penaksir parameter dimana π·π
πΏπ΄π· merupakan penaksir parameter regresi RLAD, dan π· β regresi robust LAD. Nilai π diperoleh dengan menggunakan metode fixed point dengan rumus sebagai berikut: 2 (π+1)π πΏπ΄π· Μ πΏπ΄π· , π·
π β = π·Μπ‘
πΏπ΄π·
dimana 2 π πΏπ΄π· =
Μ πΏπ΄π· )π‘ (πβπΏπ· Μ πΏπ΄π· ) (πβπΏπ· . πβ(π+1)
(2.6) (2.7)
2.4
Pengujian Parameter Regresi Ridge Least Absolute Deviation Pengujian signifikansi parameter regresi RLAD sama dengan pengujian signifikansi parameter OLS, yaitu menggunakan statistik uji π‘ dan statistik uji πΉ. 1. Uji Simultan Pengujian parameter secara simultan dilakukan dengan uji πΉ dengan hipotesis yang akan diuji adalah sebagai berikut: π»0 : π½1 = π½2 = β― = π½π = 0 π»1 : Ada π½π β 0 , untuk π = 1,2, . . , π Uji πΉ dilakukan dengan membandingkan nilai πΉβππ‘π’ππ dengan nilai πΉπΌ,π,πβ(π+1). πΉβππ‘π’ππ diperoleh dengan menggunakan rumus berikut: πΎππ
πΉβππ‘π’ππ = , (2.8) πΎππΊ dimana πΎππ
merupakan kuadrat tengah regresi dan πΎππΊ merupakan kuadrat tengah galat. Kriteria pengambilan keputusan terima π»0 jika πΉβππ‘π’ππ β€ πΉπΌ,π,πβ(π+1) dan tolak π»0 jika πΉβππ‘π’ππ > πΉπΌ,π,πβ(π+1) (Sembiring, 1995). 2. Uji Parsial Pengujian parameter secara parsial (individual) dilakukan dengan uji π‘ dengan hipotesis berikut: π»0 : π½π = 0, dimana π = 1,2, β¦ , π (ππ secara signifikan tidak mempengaruhi harga penjualan dangke). π»1 : π½π β 0 (ππ tidak mempengaruhi harga penjualan dangke). Uji π‘ dilakukan dengan membandingkan nilai π‘βππ‘π’ππ dengan nilai π‘πΌ,πβ(π+1) . Nilai π‘βππ‘π’ππ diperoleh dengan menggunakan rumus berikut: Μ π½
π‘βππ‘π’ππ = ππ(π½Μπ ), π
(2.9)
dimana ππ(π½Μπ ) = βπΎππΊ(πππ ) , dimana πππ merupakan unsur ke-ππ dari matriks (πΏπ‘ πΏ)β1 dan π = 1,2, β¦ , (π + 1). Kriteria pengambilan keputusan terima π»0 jika |π‘βππ‘π’ππ | β€ π‘πΌ,πβ(π+1) dan tolak π»0 jika |π‘βππ‘π’ππ | > π‘πΌ,πβ(π+1) (Sembiring, 1995).
3
2.5
Kriteria Pemilihan Model Terbaik Kriteria pemilihan model regresi linier terbaik dapat dilakukan dengan melihat nilai πΎππΊ. Model regresi linier berganda yang didapat dari penaksiran parameter menggunakan regresi RLAD dibandingkan dengan melihat nilai πΎππΊ. Semakin kecil nilai πΎππΊ, maka semakin baik model regresi yang terbentuk (El-Salam, 2013). 3. 3.1.
Metode Penelitian Sumber Data Data yang digunakan dalam tugas akhir ini adalah data sekunder berupa data harga penjualan dangke per biji, biaya produksi dangke per biji, jumlah produksi susu, jumlah produksi dangke, dan jumlah pembeli (Wahyuni, 2013). 3.2.
Identifikasi Variabel Tugas akhir ini menggunakan variabel-variabel yaitu : 1. Variabel tak bebas π = harga penjualan dangke per biji (rupiah). Variabel bebas π1 = biaya produksi dangke per biji (rupiah). π2 = jumlah produksi susu yang dinyatakan dalam rupiah. π3 = jumlah produksi dangke (biji). π4 = jumlah pembeli dangke (orang). 3.3.
Metode Analisis Adapun langkah-langkah yang dilakukan berdasarkan tujuan penelitian adalah sebagai berikut : 1. Melakukan pengambilan data sekunder yang mengalami masalah ketidaknormalan dan multikolinieritas. 2. Melakukan taksiran dengan menggunakan regresi robust LAD. Langkahnya yaitu sebagai berikut: Μ menggunakan metode OLS, sehingga didapatkan π¦Μπ,0 dan ππ0 = π β a. Menghitung π· 0 πΜ π , (π = 1,2, β¦ , π) yang dijadikan sebagai nilai awal (ππ adalah data hasil pengamatan). b. Menghitung pembobot awal (π€ππ0 ). c. Menyusun matriks pembobot berupa matriks diagonal πΎ0 dengan elemen 0 0 0 π€11 ; π€22 ; β¦ ; π€ππ . d. Menghitung penaksir parameter LAD. e. Menghitung βππ=1|ππ1 |. f. Langkah π sampai dengan π diulang sampai didapatkan βππ=1|πππ+1 | β βππ=1|πππ | β‘ 0 3. Melakukan taksiran dengan menggunakan regresi ridge. Langkahnya yaitu sebagai berikut: Μ πΏπ΄π· yang diperoleh dari metode iterasi. a. Menghitung nilai πΊπΏπ΄π· berdasarkan penaksir π· β b. Menghitung nilai π . Μ π
πΏπ΄π· . c. Menghitung nilai π·
4
4. 4.1
Hasil dan Pembahasan Penaksiran Parameter Model Regresi Ridge Least Absolute Deviation Proses penaksiran dengan metode RLAD diawali dengan menaksir parameter LAD dengan metode IRLS yakni dengan meminimumkan fungsi π(ππ ) yakni sebagai berikut: min βππ=1 π(ππ ) = βππ=1 min π(ππ β πΏπ‘π π·πΏπ΄π· ), (4.1) dimana π(ππ ) = |ππ | dan πΏπ baris ke-π matriks πΏ. Meminimumkan jumlah mutlak galat dilakukan dengan menurunkan secara parsial Persamaan (4.1) terhadap π·πΏπ΄π· kemudian disamakan dengan 0 sehingga diperoleh: βππ=1 π(ππ )πΏπ = π. Nilai π(ππ ) digunakan untuk memperoleh pembobot π€ππ , dengan fungsi pembobot π(π ) π€ππ = π π (Lawrence dan Arthur, 1990). Diperoleh nilai π(ππ ) yakni sebagai berikut: π 1, ππππ ππ > 0 0, ππππ ππ = 0 ) π(ππ = { (4.2) β1, ππππ ππ < 0 Fungsi pada Persamaan (4.2) digunakan untuk menentukan matriks pembobot πΎ yang unsurunsur diagonal utamanya diperoleh berdasarkan fungsi pembobot LAD berikut: 1 , ππππ |ππ | β 0 |π π€ππ = { π| , (4.3) 1 , ππππ |ππ | = 0 sehingga Persamaan (4.3) dapat ditulis sebagai berikut: βππ=1 ππ π€ππ πΏπ = π. (4.4) Dengan demikian terlihat bahwa Persamaan (4.4) merupakan solusi dari WLS yaitu βππ=1 π€ππ (ππ β πΜπ )2 = 0 sehingga diperoleh penaksir parameter LAD yakni sebagai berikut: Μ π³π¨π« = (πΏπ‘ πΎπΏ)βπ πΏπ‘ πΎπ. π· (4.5) Secara umum, proses iterasi pada Persamaan (4.5) dapat dinyatakan dalam bentuk matriks yakni sebagai berikut: π‘ π βπ π‘ π Μ π+1 π· (4.6) πΏπ΄π· = (πΏ πΎ πΏ) πΏ πΎ π. Nilai penaksir parameter LAD yang diperoleh melalui metode IRLS selanjutnya Μ π
πΏπ΄π· ) dengan mensubtitusi nilai π· Μ π³π¨π« digunakan untuk menaksir parameter RLAD (π· kepersamaan berikut: Μ π
πΏπ΄π· (π β ) = (πΏπ πΏ + π β π°)β1 πΏπ‘ πΏπ· Μ πΏπ΄π· , π· (4.7) β dimana nilai π diperoleh dengan rumus: πβ =
2 (π+1) ππΏπ΄π· , π‘ Μ Μ π·πΏπ΄π· π·πΏπ΄π·
(4.9)
2 dimana ππΏπ΄π· diperoleh dengan menggunakan rumus sebagai berikut: 2 ππΏπ΄π· =
Μ πΏπ΄π· )π‘ (πβπΏπ· Μ πΏπ΄π· ) (πβπΏπ· πβ(π+1)
.
(4.10)
4.2
Penerapan Regresi Ridge Least Absolute Deviation Data yang digunakan adalah data harga penjualan dangke tahun 2013 di Kecamatan Cendana, Kabupaten Enrekang. Data ini sebelumnya telah diolah secara deskriptif oleh Wahyuni (2013). Berdasarkan perhitungan penaksiran parameter, diperoleh penaksir parameter RLAD sebagai berikut:
5
Tabel 4.1 Nilai Penaksir Parameter RLAD Μ π
πΏπ΄π· Variabel π· Bebas Konstanta 9190.87 π1
0.17
π2
0.08
π3
-453.23
π4
249.47
Sumber: Hasil olah data (2015) Penaksir parameter yang diperoleh selanjutnya diuji signifikansinya secara simultan (uji-F) dan secara parsial (uji-t). Pada pengujian signifikansi secara simultan diperoleh nilai πΉβππ‘π’ππ = 3.636 dan nilai πΉ(0.05,4,45) = 2.579. Diperoleh nilai πΉβππ‘π’ππ > πΉ(0.05,4,45) sehingga π»0 ditolak. Jadi dapat disimpulkan bahwa untuk πΌ = 5% variabel-variabel bebas secara bersama-sama mempengaruhi harga penjulan dangke. Selanjutnya dilakukan uji signifikansi secara parsial dan diperoleh nilai π‘βππ‘π’ππ sebagai berikut: Tabel 4.2 Nilai π‘βππ‘π’ππ Variabel Parameter Bebas RLAD Konstan 9190.87 ta 0.17 π1 0.08 π2 -453.23 π3 249.47 π4 Sumber: Hasil olah data (2015)
π‘0.05,45
π‘βππ‘π’ππ 2.60489 0.0926210 π. πππππ βπ. πππππ 1.20833
2.0 14
Berdasarkan Tabel 4.2 terlihat bahwa jumlah produksi susu (π2 ) dan jumlah produksi dangke (π3 ) secara signifikan mempengaruhi harga penjualan dangke (π). Model regresi linier berganda terbaik dipilih dengan membandingkan nilai πΎππΊπ
πΏπ΄π· dengan πΎππΊππΏπ . Berdasarkan Persamaan (2.21b) diperoleh nilai πΎππΊ yang dapat dilihat pada tabel berikut: Tabel 4.3 Nilai Kuadrat Tengah Galat πΎππΊ Metode OLS RLAD
π
2
2537086
0.203
2406307.578
0.244
Sumber: Hasil olah data (2015)
6
Berdasarkan Tabel 4.3 nilai πΎππΊπ
πΏπ΄π· = 2406307.578 dan nilai πΎππΊππΏπ = 2 2 2537086. Terlihat bahwa nilai πΎππΊπ
πΏπ΄π· < πΎππΊππΏπ . Selain itu nilai π
πππ < π
π
πΏπ΄π· sehingga dapat disimpulkan bahwa ketika data tidak berdistribusi normal dan terjadi multikolinieritas metode π
πΏπ΄π· lebih baik digunakan dibandingkan metode ππΏπ. Persamaan regresi linier berganda terbaik yang terbentuk adalah sebagai berikut: πΜπ
πΏπ΄π· = 9192 + 0.08 π2 β 453.23 π3 5. 5.1.
Kesimpulan dan Saran Kesimpulan Berdasarkan hasil penelitian yang telah dilakukan, maka dapat diambil beberapa kesimpulan sebagai berikut: 1. Metode RLAD merupakan salah satu metode yang dapat digunakan untuk mengatasi masalah ketidaknormalan dan multikolinieritas pada data. Proses penaksiran parameter RLAD diawali dengan melakukan penaksiran parameter LAD. Proses penaksiran ini dilakukan dengan metode IRLS. Nilai penaksir parameter LAD yang diperoleh selanjutnya digunakan untuk menaksir parameter RLAD dengan rumus sebagai berikut: Μ π
πΏπ΄π· = (πΏπ πΏ + π β π°)β1 πΏπ‘ π Μ πΏπ΄π· , π· Μ πΏπ΄π· adalah vektor penaksir parameter LAD yang diperoleh melalui proses dimana π iterasi dan π β diperoleh dengan rumus: 2 (π + 1) ππΏπ΄π· πβ = π‘ . Μ πΏπ΄π· π· Μ πΏπ΄π· π· 2. Pada kasus pelanggaran asumsi kenormalan dan multikolinieritas pada data harga penjualan dangke tahun 2013 di Kecamatan Cendana, Kabupaten Enrekang ketika diolah dengan metode OLS menghasilkan model regresi linier berganda dimana tak satupun variabel bebas yang secara signifikan berpengaruh terhadap variabel harga penjualan dangke. Data tersebut selanjutnya diolah dengan menggunakan metode RLAD. Setelah diolah dengan metode RLAD, terdapat dua variabel yang secara signifikan mempengaruhi variabel harga penjualan yaitu jumlah produksi susu (π2 ) dan jumlah produksi dangke (π3 ). Persamaan regresi linier berganda terbaik yang terbentuk adalah sebagai berikut: πΜπ
πΏπ΄π· = 9192 + 0.08 π2 β 453.23 π3 . 5.2
Saran Penelitian ini membahas tentang penggunaan metode regresi RLAD. Untuk penelitian selanjutnya dapat dilakukan dengan menggabungkan antara metode regresi ridge dengan metode regresi robust M-estimator untuk mengatasi data yang mengalami masalah ketidaknormalan dan multikolinieritas.
7
Daftar Pustaka Askin, R.G. dan D. C. Montgomery. 1980. Augmented Robust Estimator. Technometrics, Vol.22, No. 3, 333-341, http://www.jstor.org/stable/1268317 , 23 Januari 2015. Draper, N. dan H. Smith. 1992. Analisis Regresi Terapan Edisi Kedua. Jakarta : Gramedia. El-Salam, Moawad El-Fallah. 2013. The Efeciency of Some Robust Ridge Regression for Handling Multicolinearity and Non-Normal Errors Problem. Hikari Ltd, Vol. 7, No. 77, 3831-3846. Holland, P.W. 1973. Weighted Ridge: Combining Ridge and Robust Regression Methods. Working Paper, No. 11. Hamilton, L. C. 1992. Regression with Graphics A Second Course in Applied Statistics. California : Duxbury. Lawrence, K. D dan J. I. Arthur.1990. Robust Regression: Analysis and Aplication. New York: Marcel Deker. Midi, H. dan Zahari, M. 2007. A Simulation Study on Ridge Regression Estimators in The Presence of Outliers and Multicollinearity. Jurnal Teknologi, Vol. 47, 59-74. Katadinata, Abas. 2000. Akuntansi dan Analisa Biaya. Jakarta: Rineke Cipta. Montgomery, D. C. dan E. A. Peck. 1992. Introduction to Linear Regression Analysis Second Edition. New York: Wiley. Samkar, H. dan Alpu, O. 2010. Ridge Regression Based on Some Robust Estimators. Journal of Modern Applied Statistical Methods, Vol. 9, No. 17, 495-501 Sembiring, R.K. 1995. Analisis Regresi Edisi Kedua. Bandung : Penerbit ITB. Wahyuni, A. Rezki. 2013. Skripsi: Faktor-Faktor yang Mempengaruhi Harga Jual Dangke di Kecamatan Cendana, Kabupaten Enrekang. Makassar: Universitas Hasanuddin. Walpole, E. R. dan Myers, R. H. 1995.Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan Edisi ke-4, (diterjemahkan oleh RK Sembiring). Bandung: Penerbit ITB.
8