Model Probabilitas Linear

Persamaan Model, Kelebihan, dan Kelemahan Model Probabilitas Linear

Model Probabilitas Linear

Model Probabilitas Linear biasa juga disebut LPM (linear probability model). Model ini digunakan untuk menganalisa variabel dependen yang bersifat kategorik dan variabel independen yang bersifat nonkategorik. Misalnya kita ingin mengetahui kemungkinan seseorang memiliki rumah (diwakili dengan variabel Y_i ) berdasarkan gaji per bulan. Maka persamaannya adalah sebagai berikut :

Yi = ?₀ + ?₁X_i + e_i

Karena Y_i merupakan bilangan biner (berisi 0 dan 1), persamaan tersebut disebut juga linear probability model (LPM). Nilai Y_i yang diharapkan tergantung kepada X_i, E(Y_i|X_i), dapat diartikan sebagai probabilitas bersyarat (conditional probability) kemungkinan terjadinya Y_i tergantung pada X_i, atau Pr(Y_i=1|X_i). Dengan demikia, dalam contoh disini, E(Y_i|X_i) menunjukkan kemungkinan sebuah keluarga memiliki rumah apabila penghasilannya X_i.

Misalnya diasumsikan E(_Hi)=0 untuk mendapatkan estimator tak bias dapat digunakan persamaan berikut ini :

E(Y_i|X_i)=?_i + ?₂X₁

Bila P₁ probabilitas bahwa Y_i = 1 (memiliki rumah) dan (1-P_i) adalah probabilitas bahwa Y_i=0 (tidak memiliki rumah), variabel Y_i memiliki probabilitas P_i + (1-P_i) = 1. Berarti Y_i mengikuti distribusi probabilitas Bernoulli.

Dengan persamaan tersebut, probabilitas seseorang untuk memiliki rumah merupakan fungsi linear gaji orang tersebut. Semakin tinggi pendapatan sesorang semakin besar pula kemungkinan orang tersebut memiliki rumah.

Model LPM memiliki karakteristik yang mirip dengan model regresi linear, sehingga metode OLS dapat digunakan pada model LPM ini. Model ini banyak digunakan karena mudah. Namun model ini memiliki kelemahan, diantaranya adalah sebagai berikut :

Residual tidak berdistribusi normal, karena mengikuti distribusi binomial (distribusi Bernoulli). Sebenarnya kelemahan ini tidak begitu bermasalah, karena akanmenghasilkan estimator yang BLUE. Apabila datanya semakin banyak, distribusinya juga akan mendekati distribusi normal.
Varian residual mudah bersifat heteroskedastis, karena e_i berdistribusi binomial. Apabila varian residual tersebut bersifat heteroskedastis, maka estimatornya tidak lagi bersifat BLUE. Untuk menghilangkan masalah ini, dapat diterapkan analisis regresi dengan metode WLS (weighted least square)
Nilai Prediksi Y_i, tidak akan selalu terletak di antara 0 dan 1 seperti pada datanya. Untuk mengatasi hal ini, diperlukan model analisis baru yaitu logit dan probit.
Nilai koefisien determinasi (R²) tidak lagi mampu menjelaskan kesesuaia garis regresi dengan datanya.

Diposting oleh Khrisna, pada 23 October 2016

Olah Data

Meet Up

Bagi rekan yang ingin ngobrol dan diskusi santai sambil ngopi, kami siap melayani. Namun saat ini untuk pertemuan kami hanya melayani untuk wilayah Jogja, Bantul, dan sekitarnya. Lokasi bisa agan atau kami yang menentukan asal strategis dan memadai. Jika ingin meet up bersama, sebaiknya melakukan appointment /janji terlebih dahulu.