Regresi Logistik

Analisis regresi variabel independen

Regresi Logistik

Ada banyak riset dengan model kausalitas tetapi nilai variabel dependennya "terbatas". Regresi logistik binari merupakan bentuk khusus regresi logistik dimana nilai variabel dependen ada 2 macam, misalnya status bangkrut/sehat.
Asumsi pada regresi logistik
  • Variabel dependen bersifat kategorikal
  • Tidak ada korelasi yang signifikan antar variabel independen
  • Jumlah observasi memadai (>100)
  • Linieritas dalam format logit. Hubungan antara logit varibel dependen dengan variabel independen haruslah linier. Berikut ini adalah penjelasan dari probabilitas, odds, dan logit :
    • Probabilitas = P = n / N
    • Odds = P/(1 - P)
    • Logit probabilitas = logaritma odds
      logit(p) = log (p/(1-p)) = log(p) - log(1-p)
Untuk menentukan nilai parameter model regresi logistik prosedur yang lazim digunakan adalah maximum likelihood estimation (MLE) procedures. Rumus untuk penentuan parameter model adalah seperti ini :

Maximum Likelihood Estimation (MLE)

  • Maximum Likelihood Estimation adalah teknik untuk memperkirakan nilai parameter model.
  • The likelihood function (L) mengukur probabilitas kemunculan nilai variabel dependen tertentu (p1, p2, ..., pn) dalam sampel dapat dituliskan seperti berikut :
    L = Prob (p1* p2* * * pn)
  • Semakin tinggi L semakin tinggi prob menemukan p dalam sampel.
  • MLE involves finding the coefficients (?, ?) that makes the log of the likelihood function (LL < 0) as large as possible
  • Or, finds the coefficients that make -2 times the log of the likelihood function (-2LL) as small as possible
  • The maximum likelihood estimates solve the following condition:
    {Y - p(Y=1)}Xi = 0
    summed over all observations, i = 1, ..., n
    Menginterpretasi koefisien model regresi logit
    Ln[Odds(B|Perubahan)] = -1,609 + 3,806 (Perubahan)
  • Slope (b= 3,806) merupakan tingkat perubahan "log (odds)" yang disebabkan perubahan variabel X (=perubahan)... tampak penafsiran ini "agak susah dipahami"
  • Penafsuran yg lebih intuitif adalah memakai 'odds ratio' = p/(1-p). Karena
    Hal tersebut dikarenakan : [p/(1-p)] = exp(? + ?X)
  • Maka exp(?) adalah efek variabel independen pada 'odds ratio'

Uji signifikansi koefisien

  • Hipotesis yg diuji mirip dengan yg kita temui dalam OLS, yaitu Ha: bi ? 0
  • Tetapi untuk menentukan signfikansi bi kita memakai uji Wald yg mengikuti distribusi Chi-square dan dirumuskan sebagai berikut : z = (bi/(SEb))2 , rumus seperti ini biasa desebut Goodness of fit Model
  • Uji goodness of fit menguji hipotesis sebagai berikut :
  • Ada beberapa ukuran goodness of fit dalam regresi logit. Yg paling sederhana adalah dg 'hit ratio'
  • HR = rasio yang menggambarkan ketepatan ramalan fungsi logit.
  • Ukuran lain adalah pseudo R2 :
Diposting oleh , pada 25 August 2013

Meet Up

Bagi rekan yang ingin ngobrol dan diskusi santai sambil ngopi, kami siap melayani. Namun saat ini untuk pertemuan kami hanya melayani untuk wilayah Jogja, Bantul, dan sekitarnya. Lokasi bisa agan atau kami yang menentukan asal strategis dan memadai. Jika ingin meet up bersama, sebaiknya melakukan appointment /janji terlebih dahulu.