LPPM Politeknik Bengkalis
PENYELESAIAN PERSAMAAN REGRESI LINIER NON PARAMETRIK DENGAN METODE THEIL’S Darsono Staff pengajar Program Studi Teknologi Informasi Jl. Batin alam Sungai Alam Bengkalis
[email protected]
Abstrak Analisa regresi adalah analisis statistik yang mempelajari bagaimana membangun sebuah model fungsional dari data untuk dapat menjelaskan ataupun meramalkan suatu fenomena alami atas dasar fenomena lain. Analisa regresi merupakan salah satu pengetahuan terapan. Regresi disamping digunakan untuk mengetahui bentuk hubungan antar peubah regresi, juga dapat dipergunakan untuk peramalan. Untuk menyelesaikan suatu model dengan n pengamatan dari suatu model linier sederhana, maka dapat digunakan metode non parametik, dalam hal ini digunakan metode Theil dan untuk pengujian koefisien data dilakukan secara overall. Kata Kunci ; analisa regresi, non parametrik, metode theill
1. PENDAHULUAN Analisa regresi adalah analisis statistic yang mempelajari bagaiaman membangun sebuah model fungsional dari data untuk dapat menjelaskan ataupun meramalkan suatu fenomena alami atas dasar fenomena lain. Analisa regresi merupakan salah satu pengetahuan terapan. Regresi disamping digunakan untuk mengetahui bentuk hubungan antar peubah regresi, juga dapat dipergunakan untuk peramalan. Dengan menggunakan n pengamatan untuk suatu model linier sederhana: Yi = β 0 + β 1 X 1 +Ei dengan Yi : peubah tak bebas. Xi : peubah bebas dengan i = 1,2,…n β 0 danβ 1 : parameter yang tidak diketahui.
ε 1 : Ditribusi error. Diberlakukan asumsi asumsi model ideal tertentu terhadap galat e yaitu bahwa galat menyebar di (0, σ 2 ) . Dengan pemenuhan
terhadap asumsi kenoramalan dapat digunakan regresi parametrik untuk mengetahui bentuk hubungan antar peubah regresi pada data contoh yang diamati. Dalam praktek penyimpanagan terhadap asumsi asumsi sering terjadi dan terkadang peubah acak yang diamati tidak dapat dianggap mneyebarnormal. Dari segi statistika persolan tersebut harus dapat diselesaikan dengan menggunakan teknik statistika. Dalam statistik paramaterik teknik-teknik yang digunakan berhubungan dengan parameter parameter. Identifikasi masalah Dalam kenyataannya penyimpnagan terhadap asumsi – asumsi itu sering terjadi dan terkadang peubah acak yang diamati tidak dapat dianggap menyebar normal. Dalam statistic parametric, teknik –teknik yang digunakan berhubungan dengan pendugaan parameter serta pengujian hipotesis yang berhubungan dengan parameter – parameter. Jadi identifikasi masalah pada makalah ini adalah untuk mengetahui penyelesaian model regresi dengan statistika non parametric.
Disampaikan pada Seminar Nasional Industri dan Teknologi [SNIT] 2008 Bengkalis, 03-04 Desember 2008
357
LPPM Politeknik Bengkalis
Maksud dan Tujuan Maksud dan tujuan dari penulisan makalah ini adalah untuk memperoleh model analisis regresi, pengujian model analis regresi , pengujian model dan interval kepercayaannya bila asumsi parametriks tidak terpenuhi. Dalam hal ini metode yang diambil adalah menyelesaikan masalah persamaan regersi non parametric dengan menggunakan Theil.
∧
∧
Menurut Daniel (1989) dalam banyak hal, penagamatan yang akan dikaji tidak selalu memenuhi asaumsi yang mendasari uji-uji parametrik sehingga kerap kali dibutuhkan teknik –teknik inferensial denga validitas yang tidak bergantung pada asumsi asumsi yang kaku. Dalam hal ini, teknik teknik dalam regresi nonparametrik memenuhi kebutuhan ini karena tetap valid walaupun tidak diperlukan pemenuhan asumsi kenormalan galat dan hanya berlandaskan asumsi-asumsi yang sangat umum. Conover menjelaskan bahwa penggunaan regresi non parametric dilandasi pada asumsi. (a) Contoh yang diambil bersifat acak, (b) regresi (Y/X) bersifat linear, (c) semua nilai Xi saling bebas, (d) data diasumsikan tidak berdistribusi normal.
bagi β 0 adalah β 0 yaitu ∧
∧
β 0 = med (Yi ) − β 1 med ( X i ) med (Xi) adalah median dari seluruh pengamatan dan med (Yi) adalah pasangan nilai pengamatan untuk med(Xi) 2.2. Pengujian Koefisien Regresi Secara Overall Staitik uji yang digunakan:
Z =
τ − µT , µT = 0 σT
σT =
2(2n + 5) 9n (n −1)
τ = Koefisien Kendall
2.1. Estimasi Model Metode theil’s untuk Regresi Linear sederhana Non parametric. Misalkan ada n pasangan pengamatan, katakan (X1, Y1), (X2, Y2),…… (Xn, Yn). Persamaan regresi linier sederhana adalah : Yi = β 0 + β1 X 1 + ε i dengan β 0 adalah intercept ( titik potong) adalah slope(kemiringan) dari tersebut. Xi adalah peubah bebas Yi adalah nilai teramati dari peubah Y.
∧
Penduga bagi β 1 dinotasikan dengan β dinyatakan sebagai median dari nilai-nilai bij sehingga: β = median (bij ) sedangkan penduga
2. LANDASAN TEORI
β1
nilai X yang berbeda, selanjutnya disebut dengan Metode Theil, untuk satu pasangan (Xi, Yi) dan (Xj, Yj) koefisien kemiringannya adalah : Y j − Yi untuk i < j dan X i ≠ X j . bij = X j − Xi
garis
Theil (1950) dalam sprent (1991) mengusulkan koefesien kemiringan (slope) garis regresi sebagai median kemiringan dari seluruh pasangan garis dari titik-titik dengan
Hipotesis yang digunakan untuk menguji keberartian model regresi adalah : H 0 : β i = 0 ≈ tidak hubungan antara variable X dan Y H 1 : β i = 0 ≈ terdapat hubungan antara variable X dan Y Kriteria uji: Tolak H0 jika p z ≤ α 2 , terima dalam hal lain. 2.3. Pengujian Koefisien Slope ( β 1 ). Metode Theil’s untuk Pengujian Koefisien Kemiringan. Daniel (1989) menjelaskan
Disampaikan pada Seminar Nasional Industri dan Teknologi [SNIT] 2008 Bengkalis, 03-04 Desember 2008
358
LPPM Politeknik Bengkalis
bahwa pengujian koofesien kemiringan dengan menggunakan metode theil disusun berdasrkan statistic τ kendall dan digunakan untuk mengetahui bentuk hubungan peubah-peubah regresi. Asumsi – asumsi yang melandasi pengujian pada koefisien kemiringan adalah : a.
Persamaan Rgeresinya Yi = β 0 + β 1 X 1 + ε i , i = 1, ...., n
d.
Kaidah pengambilan keputusan untuk ketiga pasangan Hipotesis diatas adalah sebagai berikut : ∧
adalah dengan
Xi peubah bebas, β 0 dan β 1 adalah parameter yang tidak diketahui; Untuk masing-masing nilai Xi dan Yi, Yi aadalah niali yang termati dariY yang acak dan kontiniu untuk nilai Xi, dan semua nilai Xi saling bebas dimana X1 < X2 < …..< Xn ; Nilai –nilai ε i sling bebas dan berasal dari populasi yang sama.
b. c.
Q = Banyaknya pasangan berurutan Terbalik
τ >τ (n, α 2 ) , tolak H 0 Dua arah :
∧
τ ≤τ (n, α / 2 ), terima H 0 τ ( n, α / 2) adalah harga –harga kritis dalam tabel statistic uji τ Kendall. Pengujian Koefisien kemiringan ini dengan membuat statistic tataan dan memperbandingkan semua hasil pengamatan menurut nilai – nilai X 3. ANALISIS DATA
Hipotesis –hipotesis yang melandasi pengujian ini adalah : dua arah : H 0: β 0 = β1( 0) H 1 : β 0 ≠ β1( 0) ; Seperti yang telah dijelaskan, prosedur yang diuraikan di susun berlandaskan statistik τ Kendall, sehingga Statistik ujinya adalah : Uji parsial untuk koefisien regresi β 1 a. Jika tidak ada angka sama : ∧
τ =
P −Q 0,5n(n − 1)
Tabel 1. Data Harga Tas (Y) dan ukuran tas (X)
n = Banyak pasangan b. Jika ada angka yang sama
P −Q
∧
τ =
0,5 n (n −1) − Tx
Data yang digunakan dalam makalah ini adalah mengenai model tas sekolah berdasarkan harga yang dipengaruhi ukuran tas tersebut, data disajikan dalam tabel dibawah ini, data dibawah ini diasumsikan berditribusi normal dengan α = 5 % . Data ini hanya digunakan hanya untuk aplikasi menyelesaikan teori yang sudah dijelaskan dimana X = UKuran Tas Sekolah (Inci) dan Y = Harga Tas ( US, $). Tabel 1
0,5n(n −1) − T y
N = Banyak pasangan Tx = 0,5 ∑ t (t − 1) T y = 0,5 ∑ t (t − 1)
t = Observasi angka sama P = Banyaknya pasangan berurutan wajar
No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Disampaikan pada Seminar Nasional Industri dan Teknologi [SNIT] 2008 Bengkalis, 03-04 Desember 2008
X 9 8 7 5 6 10 11 12 8 7 5 3 6 2 6
Y 17 14 15 16 18 19 20 21 25 24 18 14 14 9 16
359
LPPM Politeknik Bengkalis
16 17 18 19 20 21 22
8 7 7 7 7 9 5
1. Bahwa variabel atau dalam hal ini Harga tas rata – rata sebesar $ 12,3 dengan anggapan variabel lainnya konstan. 2. Setiap penambahan 1 satuan variabel X1 maka Y akan berkurang sebesar 0,6 satuan
23 18 12 12 17 15 10
Metode estimasi yang digunakan dalam penelitian ini adalah regresi linear sederhana dengan metode Theil’s dengan spesifikasi sebagai berikut : Yi = β 0 + β1 X 1 + ε i 3.1. Model Regresi
Untuk mendapatkan model Regresi non parametrik digunakan rumusan: bij =
Y j − Yi X j − Xi
3.2. Pengujian Model Secara Overall
Hipotesis yang diuji H0 : β 1 = 0 = tidak terdapat hubungan antara variabel X dan Y H1 : β 1 = 0 ≈ terdapat hubungan antara variabel dan Y. Statistik ujinya :
untuk i < j dan X i ≠ X j .
Z =
τ − µT , µT = 0 σT
2(2n + 5) 9n (n −1) τ = Koefisien Kendall τ = 0,384312
Didapat: b1 =
Model regresi diatas perlu dilakukan pengujian hipotesis sehingga dapat dilihat apakah koefisiennya berarti atau tidak.
σT =
(17,9 −15,8) = 0,6
(14,6 − 10,6) (13,2 − 14,6) b2 = = − 0,5 14,2 − 10,4) (17,7 − 16,1) = 0,6 b11 = (18,1 − 14,0)
σT = Z =
2(2 × 22 + 5) = 0.153522 9 × 22(22 − 1)
0.3843 = 2,5033 0.1535
∧
Penduga bagi β 1 dinotasikan β dinyatakan sebagai median dari nilai bij sehingga : ∧
∧
β = median (bij ) , β = 0,6 ∧
Sedangkan penduga bagi β 0 adalah β 0 ∧
∧
β 0 = med (Yi ) − β 1 med ( X i )
Kriteria uji : Tolak H0 jika pz ≤ α / 2 , terima dalam hal Pz = P (Z= 2,5033) = 1 – (0,5 x 0,493) = 0,0062. dengan α / 2 = 0,025 Dari hasil diatas dapat disimpulkan bahwa P = 0,0062 < α / 2 = 0,025 maka H0 ditolak artinya model ini bisa digunakan untuk menyatakan hubungan antara variabel harga tas (x) dengan variabel ukuran (y)
∧
β = 16,5 − (0,6 × 7) =12,3
4. KESIMPULAN ∧
Sehingga didapat model Y =12,3 + 0,6 X 1 Artinya adalah:
Dalam dunia statistika terdapat berbagai macam alat untuk menyelesaikan suatu masalah. Salah satunya adalah mencari model
Disampaikan pada Seminar Nasional Industri dan Teknologi [SNIT] 2008 Bengkalis, 03-04 Desember 2008
360
LPPM Politeknik Bengkalis
regresi apabila asumsi statistika parametrik terpenuhi maka dapat menggunakan metode OLS (Ordinary Least Square) untuk mencari taksirannya tetapi jira data diasumsikan tidak berdistribusi normal maka dapat digunakan non parametrik dalam penyelesaian model regresi non parametrik dengan menggunakan metode theil’s. Walaupun model Regresi non parametriknya ada tetapi digunakan sebagai peramalan. Untuk hasil model non parametrik jika dibandingkan dengan regresi parametrik hasilnya akan berbeda.
DAFTAR PUSTAKA
A non Parametric Linear Regressión with Theil’s Methods www.resources.unpad.ac.id/unpadcontent/uploads/publikasi_dosen/THEIL'S Ngadiman, T. 2005, Statistika tak parametrik, Bandung. Daniel, W.W. 1989, Statistik Nonparametrik terapan, Gramedia, Jakarta. Draper, N & Smith, H. 1992. Analisis Regresi Terapan, Gramedia Pustaka Utama, Jakarta. Kajian Teori Regresi Parametrik Normal dan Regresi Non Parametrik. www.unej.ac.id/fakultas/mipa/skripsi/matemat ika
Disampaikan pada Seminar Nasional Industri dan Teknologi [SNIT] 2008 Bengkalis, 03-04 Desember 2008
361