Model Probabilitas Linear

Persamaan Model, Kelebihan, dan Kelemahan Model Probabilitas Linear

Model Probabilitas Linear

Model Probabilitas Linear biasa juga disebut LPM (linear probability model). Model ini digunakan untuk menganalisa variabel dependen yang bersifat kategorik dan variabel independen yang bersifat nonkategorik. Misalnya kita ingin mengetahui kemungkinan seseorang memiliki rumah (diwakili dengan variabel Yi ) berdasarkan gaji per bulan. Maka persamaannya adalah sebagai berikut :

Yi = ?0 + ?1Xi + ei

Karena Yi merupakan bilangan biner (berisi 0 dan 1), persamaan tersebut disebut juga linear probability model (LPM). Nilai Yi yang diharapkan tergantung kepada Xi, E(Yi|Xi), dapat diartikan sebagai probabilitas bersyarat (conditional probability) kemungkinan terjadinya Yi tergantung pada Xi, atau Pr(Yi=1|Xi). Dengan demikia, dalam contoh disini, E(Yi|Xi) menunjukkan kemungkinan sebuah keluarga memiliki rumah apabila penghasilannya Xi.

Misalnya diasumsikan E(Hi)=0 untuk mendapatkan estimator tak bias dapat digunakan persamaan berikut ini :

E(Yi|Xi)=?i + ?2X1

Bila P1 probabilitas bahwa Yi = 1 (memiliki rumah) dan (1-Pi) adalah probabilitas bahwa Yi=0 (tidak memiliki rumah), variabel Yi memiliki probabilitas Pi + (1-Pi) = 1. Berarti Yi mengikuti distribusi probabilitas Bernoulli.

Dengan persamaan tersebut, probabilitas seseorang untuk memiliki rumah merupakan fungsi linear gaji orang tersebut. Semakin tinggi pendapatan sesorang semakin besar pula kemungkinan orang tersebut memiliki rumah.

Model LPM memiliki karakteristik yang mirip dengan model regresi linear, sehingga metode OLS dapat digunakan pada model LPM ini. Model ini banyak digunakan karena mudah. Namun model ini memiliki kelemahan, diantaranya adalah sebagai berikut :

  • Residual tidak berdistribusi normal, karena mengikuti distribusi binomial (distribusi Bernoulli). Sebenarnya kelemahan ini tidak begitu bermasalah, karena akanmenghasilkan estimator yang BLUE. Apabila datanya semakin banyak, distribusinya juga akan mendekati distribusi normal.
  • Varian residual mudah bersifat heteroskedastis, karena ei berdistribusi binomial. Apabila varian residual tersebut bersifat heteroskedastis, maka estimatornya tidak lagi bersifat BLUE. Untuk menghilangkan masalah ini, dapat diterapkan analisis regresi dengan metode WLS (weighted least square)
  • Nilai Prediksi Yi, tidak akan selalu terletak di antara 0 dan 1 seperti pada datanya. Untuk mengatasi hal ini, diperlukan model analisis baru yaitu logit dan probit.
  • Nilai koefisien determinasi (R2) tidak lagi mampu menjelaskan kesesuaia garis regresi dengan datanya.
Diposting oleh , pada 23 October 2016

Meet Up

Bagi rekan yang ingin ngobrol dan diskusi santai sambil ngopi, kami siap melayani. Namun saat ini untuk pertemuan kami hanya melayani untuk wilayah Jogja, Bantul, dan sekitarnya. Lokasi bisa agan atau kami yang menentukan asal strategis dan memadai. Jika ingin meet up bersama, sebaiknya melakukan appointment /janji terlebih dahulu.