Regresi Linier Multiple

Views:
 
Category: Entertainment
     
 

Presentation Description

No description available.

Comments

Presentation Transcript

Regresi Linier Ganda (Multivariate Linier Regression):

1 Regresi Linier Ganda ( Multivariate Linier Regression )

REGRESI LINIER:

2 REGRESI LINIER Regresi Linier: Model matematis untuk menganalisis hubungan antara satu atau beberapa variabel independent yang bersifat numerik dengan satu variabel dependent yang bersifat numerik Jenis Regresi Linier: a. Regresi linier Sederhana analisis regresi dengan hanya satu variabel independen

REGRESI LINIER:

3 REGRESI LINIER Persamaan Regresi Linier: y = a + bx Y= variabel dependen X= variabel independen a=intercep: besarnya nilai y, ketika x=0 b =slope: besarnya perubahan nilai y, bila variabel x berubah setiap satu unit

REGRESI LINIER:

4 REGRESI LINIER Metode garis regresi: Least Square Method “meminimalkan jumlah kuadrat jarak antara Nilai Y yang teramati dan nilai Y yg diramalkan oleh garis regresi” Misal ada data: X 48 32 40 34 30 50 26 50 22 43 Y 312 164 280 196 200 288 146 361 149 252 Dihasilkan pers: y=-23,20 + 6,88 x Prediksi: mis utk x=50 y=-23,20+6,88(50) =320,8 Masalah: Dari data utk x=50, y=288, dan y=361 Prediksi statistik tidk bisa tepat ---menunjukan rata-rata Jadi bila ad x=50 akan diprediksi rata-rata y=320,8

REGRESI LINIER:

5 REGRESI LINIER b. Regresi Linier Ganda Untuk apa regresi ganda? Ilmu kesmas: ● akibat --- tak mungkin penyebab tunggal ● akibat ---multi faktor Mis: agent, host & lingk Kompleknya faktor analis multivariat

REGRESI LINIER GANDA:

6 REGRESI LINIER GANDA Fungsi Regresi linier ganda: Mengetahui formula kuantitatif utk meggambarkan/memprediksi variabel dependen (Y) sbg fungsi dari variabel independen (x1, x2, …) Menetapkan model matematik yang paling baik utk menggambarkan hubungan var. indep dan var dep. Menggambarkan hubungan kuantitatif antara var. indep (x) dng var dep (y) setlah dikontrol var. lain Mengetahui variabel x mana yang penting/dominan dlm memprediksi var. dep Mengetahui adanya interaksi pada dua/lebih var. independen thd variabel dependen

REGRESI LINIER GANDA:

7 REGRESI LINIER GANDA Bentuk analisis Regresi Linier: Prediksi Memperkirakan nilai variabel dependen andaikata seseorang individu memiliki suatu set variabel dengan nilai-nilai tertentu. b. Estimasi Mengkuantifikasi hubungan beberapa var. independen dengan sebuah variabel dependen: mengidentifikasi determinan penyakit dan mengukur besarnya pengaruh determinan tsb setelah dikontrol var. lainnya

Pengertian Regresi Linier Ganda:

8 Pengertian Regresi Linier Ganda Membuat model linier untuk prediksi variabel dependen (bersifat kontinyu) dari beberapa variabel independen yang bersifat kontinyu dan/atau kategorikal Syarat untuk menjalankan prosedur regresi linier ganda: C Satu variabel dependen yang bersifat numerik-kontinyu C Satu atau lebih variabel independen bersifat numerik dapat disertai dg variabel yang bersifat kategori Model Regresi linier ganda:

Asumsi Regresi Linier Ganda:

9 Asumsi Regresi Linier Ganda Asumsi Univariate: Variabel numerik harus berdistribusi NORMAL, agar dapat dianalisa dengan uji statistik parametrik Asumsi Bivariate: A. Korelasi antara variabel dependen dengan independent dapat dideteksi dengan melakukan uji korelasi Pearson atau regresi linier sederhana, variabel dengan nilai-p < 0.25 merupakan kandidat model B. Korelasi antar variabel independent perlu juga diketahui untuk mewaspadai adanya gejala kolinearitas (nilai r > 0.8)

Asumsi Regresi Linier Ganda:

10 Asumsi Regresi Linier Ganda Asumsi Model Multivariate: Liniearity : Apakah variabel Y merupakan fungsi linier dari gabungan x1, x2, …xn Multivariate Normality : Apakah variabel Y berdistribusi normal untuk gabungan x1, x2,…xn Existency :Apakah variabel Y merupakan variabel random (acak) yang punya mean dan SD tertentu Homocedasticity : Apakah varian nilai Y sama (homogen) untuk setiap nilai x1, x2, …xn Independency : Apakah variabel Y mempunyai nilai yang saling bebas ( no autocorr. ) satu dengan lainnya Colinearity : Apakah tidak terdapat korelasi antar variabel independen

Pemodelan Regresi Linier:

11 Pemodelan Regresi Linier “memasukan sebanyak mungkin variabel indep ?” Banyak variabel -- hanya aspek statistik Banyak variabel – overfitting, SE terlalu besar Banyak variabel – menyulitkan interpretasi Lalu ? Memasukan variabel– ada aspek statistik dan substansi Sebaiknya variabel yg masuk sedikit, namun cukup baik utk menjelaskan faktor-faktor penting yg ber-hubungan dng var. dependen Model yg baik ? R Square besar namun var. Indep jumlahnya sedikit

Aplikasi Regresi Linier Ganda:

12 Aplikasi Regresi Linier Ganda Variabel apa saja yang dapat digunakan untuk memprediksi tingkat/skor STRES seseorang ? - ROKOK : Status merokok (1=ya, 0=Tdk) - SERAT : Proporsi serat dalam makanan (%) - AKTFISIK : Skor aktifitas fisik - INCOME : Income (ribu rupiah) - IMT : Index massa tubuh - RLPP : Rasio lingkar pinggang panggul - TCHOL : Total cholesterol (gr%)

Asumsi Univariate Normality:

13 Asumsi Univariate Normality Variabel numerik harus berdistribusi NORMAL Dengan Uji (KS) Kolmogorov Smirnov-1-sampel: SPSS Windows Analyze ‣ Nonparametric Test ‣ 1-sampel-KS.. Semua variabel mempunyai nilai-p KS > 0.05 berarti asumsi distribusi normal variabel numerik sudah terpenuhi

Asumsi Korelasi Bivariate:

14 Asumsi Korelasi Bivariate Untuk menyeleksi variabel independen yang jadi kandidat model [nilai-p < 0.25 dilakukan KORELASI BIVARITE Analyze ‣ Correlate ‣ Bivariate.. Variabel IMT (p=0.295) dan TCHOL (p=0.899) tidak diikutkan dalam analisis selanjutnya

Asumsi Korelasi Bivariate:

15 Asumsi Korelasi Bivariate Untuk mendeteksi adanya korelasi antar variabel independen (kolinearitas) [r > 0.8] dilakukan KORELASI BIVARITE Analyze ‣ Correlate ‣ Bivariate.. Tidak ada korelasi yang lebih dari 0.8, sehingga kolinearitas bukan masalah serius

Pemodelan Regresi Linier Ganda:

16 Pemodelan Regresi Linier Ganda Contoh berikut adalah Metode ENTER: Analyze ‣Regression ‣ Linier..

Pemodelan Regresi Linier Ganda:

17 Pemodelan Regresi Linier Ganda Contoh output computer metode ENTER: Nilai Koef. Korelasi r =0.516 (korelasi sedang) Koef. Determinasi r 2 =0.266 (variasi stress yang dapat dijelaskan oleh variabel independen = 26.6%)

Pemodelan Regresi Linier Ganda:

18 Pemodelan Regresi Linier Ganda 3. Nilai-p ANOVA = 0.000 (Asumsi linier sudah terpenuhi) Jika p>0.05 keluarkan variabel xi satu persatu sampai p<0.05

Pemodelan Regresi Linier Ganda:

19 Pemodelan Regresi Linier Ganda Contoh output computer metode ENTER: Nilai-p koef. RLPP = 0.167 (tidak bermakna, sehingga harus dikeluarkan agar didapat model yang parsimony)

Pemodelan Regresi Linier Ganda:

20 Pemodelan Regresi Linier Ganda Output computer metode ENTER, jika RLPP dikeluarkan: r=0.505 r 2 =0.255 dan r 2adj =0.231 p=0.000 -> Model Linier Jika p>0.05 maka asumsi linier tidak terpenuhi S emua variabel mempunyai p<0.05 --> Bermakna secara statistik

Uji Asumsi Regresi Linier Ganda:

21 Uji Asumsi Regresi Linier Ganda Setelah didapatkan model yang parsimony, maka harus dilakukan pengujian terhadap asumsi regresi linier ganda. Liniearity : Bila nilai-p ANOVA < 0.05 berarti asumsi linieritas sudah terpenuhi Multivariate Normality : Diuji dengan melihat nilai RESIDUAL (PLOTS: histogram & Normal Probability plot) Existency : Bila nilai mean RESIDUAL = 0.0

Uji Asumsi Regresi Linier Ganda:

22 Uji Asumsi Regresi Linier Ganda Multivariate Normality : Histogram memperlihatkan distribusi normal & pada p-plot nilai residual berhimpit (mendekati) garis diagonal Kedua grafik tersebut menggambarkan asumsi Normalitas terpenuhi

Uji Asumsi Regresi Linier Ganda:

23 Uji Asumsi Regresi Linier Ganda Existency : Nilai mean residual adalah nol (4.43 x 10 -15 =0.000) berarti asumsi existensi terpenuhi

Uji Asumsi Regresi Linier Ganda:

24 Uji Asumsi Regresi Linier Ganda Homocedasticity: Analisa scatter-plot antara Nilai prediksi standar (ZPRED) dengan nilai residu standar (ZRESID) atau residu student (SRESID) Scatter plot tidak membentuk pola tertentu  berarti asumsi homosiditas terpenuhi

Uji Asumsi Regresi Linier Ganda:

25 Uji Asumsi Regresi Linier Ganda Independency : Apabila nilai Durbin-Watson berkisar antara –2 s.d. +2 berarti asumsi independensi terpenuhi Nilai Durbin-Watson = 1.88  berarti independensi bukan suatu masalah serius

Uji Asumsi Regresi Linier Ganda:

26 Uji Asumsi Regresi Linier Ganda Collinearity: Apabila nilai VIF dari Collinearity diagnostic <10 dan pada korelasi bivariate antar independent variabel r < 0.8 berarti tidak ada gejala collinearitas

Interpretasi Regresi Linier Ganda:

27 Interpretasi Regresi Linier Ganda Persamaan garis linier: Diambil dari Unstandardized Coefficients-B, garis prediksi skor stress adalah Merokok dapat meningkatkan skor stress sebesar 4.1 point Setiap kenaikan 1% kadar serat dalam makanan akan meningkatkan skor stress sebesar 0.2 point Setiap kenaikan income 1000 rupiah akan meningkatkan skor stress sebesar 0.00689 point

Interpretasi Regresi Linier Ganda:

28 Interpretasi Regresi Linier Ganda Variabel yang paling berperan dalam memprediksi stress: Dilihat nilai Standardized Coefficients-Beta yg paling tinggi atau nilai Partial correlation paling tinggi Merokok adalah variabel yang paling berperan dalam memprediksi stress, diikuti oleh variabel income

authorStream Live Help