Sonuç değişkeniniz iki kategorili olduğunda — geçti/kaldı, hasta/sağlıklı, satın aldı/almadı — doğru araç lojistik regresyondur. Sıradan en küçük kareler (OLS) regresyonu burada çöker: 0-1 aralığının dışına taşan 'olasılık' tahminleri üretir, hata terimleri normal dağılmaz ve varyans sabit kalmaz. Lojistik regresyonun çıktısındaki odds oranı (OR) ise tezlerde en sık yanlış yorumlanan istatistiklerden biridir. Bu rehber, olasılık-odds ayrımından APA raporlama şablonuna kadar tüm yorum zincirini kurar.
Olasılık ve odds aynı şey değildir
Klasik karışıklık buradadır. Olasılık, olayın gerçekleşme payıdır; odds ise gerçekleşme olasılığının gerçekleşmeme olasılığına oranıdır: odds = P / (1 − P). Çalışılmış örnek: bir öğrencinin sınavı geçme olasılığı 0,80 ise geçme odds'u 0,80 / 0,20 = 4'tür (yani 4'e 1). Olasılık 0,20 ise odds 0,20 / 0,80 = 0,25 olur. 'OR = 2 ise olasılık iki katına çıkar' cümlesi bu yüzden yanlıştır: iki katına çıkan oddstur; olasılıktaki değişim, başlangıç olasılığına bağlıdır ve P büyüdükçe makas açılır. Lojistik regresyon, doğrusal modeli olasılığa değil, odds'un doğal logaritmasına (logit bağlantı fonksiyonu) kurar; katsayıların üssü alındığında (exp(B)) odds oranlarına ulaşılır.
Lojistik regresyon çıktısında odds oranı nasıl okunur?
Sürekli yordayıcılar için OR, yordayıcıdaki bir birimlik artışın odds'u kaç kata çıkardığını söyler: yaş için OR = 1,04, her ek yaşın olayın odds'unu yüzde 4 artırdığı anlamına gelir; birim ölçeği (1 yıl mı, 10 yıl mı) yorumda mutlaka belirtilmelidir. Kategorik yordayıcılar için OR, ilgili kategoriyi referans kategoriyle karşılaştırır: referans 'erkek' iken kadınlar için OR = 1,85, kadınların odds'unun erkeklerinkinden yüzde 85 yüksek olduğunu gösterir — referans kategori yazılmadan bu sayı yorumlanamaz. OR > 1 odds'u artıran, OR < 1 azaltan yönde ilişkidir; OR = 0,50 odds'ta yüzde 50 azalmadır. Yön karşılaştırmaları için pratik dönüşüm: 0,50'nin tersi 1 / 0,50 = 2,00'dir. Tanım da netleşsin: odds oranı iki grubun odds'larının birbirine oranıdır — kadınların geçme odds'u 4, erkeklerinki 2 ise OR = 2,00 olur.
| OR değeri | Anlamı | Odds'taki değişim |
|---|---|---|
| 1,00 | Yordayıcının etkisi yok | %0 |
| 1,25 | Odds'u artıran zayıf ilişki | %25 artış |
| 2,00 | Odds iki katına çıkıyor | %100 artış |
| 3,50 | Güçlü pozitif ilişki | %250 artış |
| 0,75 | Odds'u azaltan ilişki | %25 azalış |
| 0,50 | Odds yarıya iniyor | %50 azalış |
Güven aralığı 1'i kapsıyorsa etki istatistiksel olarak anlamlı değildir: %95 GA [0,92; 1,76] olan bir OR = 1,27, p değeri ne kadar 'yakın' görünürse görünsün anlamlı bir ilişki kanıtı değildir. Tersine, aralığın tamamı 1'in üstünde veya altındaysa etki anlamlıdır. Aşağıdaki grafik, OR = 1 referans çizgisi etrafında tipik bir katsayı tablosunun nasıl görselleştirileceğini gösterir.
Model değerlendirmesi: Uyum, açıklayıcılık, ayırt etme
Lojistik regresyonda tek bir 'model uyumu' göstergesi yoktur; iyi bir rapor üç soruya birden yanıt verir: model veriye uyuyor mu, yordayıcılar ne kadar açıklıyor ve model grupları ne kadar iyi ayırt ediyor?
- −2 Log-Likelihood ve omnibus ki-kare: Modelin sabit-yalnız modele göre anlamlı iyileşme sağlayıp sağlamadığını sınar; raporun ilk cümlesidir.
- Hosmer-Lemeshow testi: p > 0,05 uyumun reddedilmediğini gösterir; ancak test gruplama sayısına duyarlıdır ve büyük örneklemde önemsiz sapmaları anlamlı bulur. Tek başına uyum kanıtı olarak kullanılmamalı, kalibrasyon değerlendirmesiyle desteklenmelidir.
- Nagelkerke sözde R-kare: OLS'deki R-kare ile aynı şey değildir; 'açıklanan varyans' diye değil, modelin göreli açıklayıcılığının kaba bir özeti olarak sunulmalıdır.
- Sınıflandırma doğruluğu ve ROC/AUC: Doğruluk yüzdesi 0,50 kesim noktasına ve grup oranlarına bağımlıdır; ayırt etme gücünün kesimden bağımsız ölçüsü AUC'dir. Kaba kılavuz: 0,70-0,80 kabul edilebilir, 0,80-0,90 iyi ayırt etme.
Örneklem kuralı ve modelin sınırları
Lojistik regresyonda örneklem planının anahtarı değişken başına olay (EPV) kuralıdır: yordayıcı başına, az gözlenen sonuç kategorisinden en az 10-20 olay bulunmalıdır. 300 kişilik örneklemde olay sayısı yalnızca 45 ise model en fazla 2-4 yordayıcıyı güvenle taşır; EPV düştükçe katsayılar şişer ve güven aralıkları güvenilmez hâle gelir. EPV'nin yanında iki teknik denetim daha gerekir: sürekli yordayıcıların logit ile doğrusal ilişkisi ve çoklu bağlantı (VIF). Bir yordayıcı sonucu kusursuz tahmin ediyorsa (tam ayrışma) katsayılar sonsuza kaçar; bu durumda madde birleştirme veya cezalandırılmış kestirim seçenekleri değerlendirilir. Sonuç değişkeni ikiden fazla sırasız kategori içeriyorsa multinomial, sıralı kategoriler içeriyorsa ordinal (sıralı) lojistik regresyon aynı yorum mantığıyla kullanılır; hangi desenin uygun olduğundan emin değilseniz test seçim rehberimiz karar akışını özetler.
APA uyumlu raporlama şablonu
Metinde önce model, sonra katsayılar raporlanır: "Model istatistiksel olarak anlamlıdır, ki-kare(3, N = 412) = 48,67, p < 0,001; Nagelkerke R-kare = 0,18. Sigara kullanımı, geçme odds'unu anlamlı biçimde artırmıştır, B = 0,96, SE = 0,21, Wald = 20,90, p < 0,001, OR = 2,60, %95 GA [1,72; 3,93]." Tabloda her yordayıcı için B, standart hata, Wald, p, OR ve %95 güven aralığı; tablo altında referans kategoriler ve kodlama belirtilir. Kesim noktası, sınıflandırma tablosu ve AUC metinde tek cümleyle özetlenebilir.
Odds oranı olasılık hakkında değil, odds hakkında konuşur; ikisini karıştıran rapor daha ilk cümlede güven kaybeder.
Sık Sorulan Sorular
OR = 2 olması olasılığın iki katına çıktığı anlamına mı gelir?
Hayır; iki katına çıkan odds'tur, olasılık değil. Başlangıç olasılığı 0,10 iken OR = 2 olasılığı yaklaşık 0,18'e taşır; başlangıç 0,50 iken yaklaşık 0,67'ye çıkarır. Olasılık cinsinden etki, başlangıç değerine bağlıdır ve gerekiyorsa marjinal etkilerle ayrıca raporlanmalıdır.
Lojistik regresyon için kaç katılımcı gerekir?
Toplam örneklemden çok, az gözlenen sonuç kategorisindeki olay sayısı belirleyicidir: yordayıcı başına en az 10-20 olay (EPV kuralı) hedeflenmelidir. Ayrıca sürekli yordayıcılarla logit doğrusallığı ve çoklu bağlantı da kontrol edilmelidir.
Hosmer-Lemeshow testi anlamlı çıktı, modelim çöp mü?
Hemen değil. Test büyük örneklemlerde küçük sapmaları bile yakalar ve grup sayısı seçimine duyarlıdır. Kalibrasyon grafiği, AUC ve katsayıların kuramsal tutarlılığıyla birlikte değerlendirin; sorun ısrarcıysa etkileşim terimleri veya doğrusal olmayan formlar deneyin.
Celsus lojistik regresyon analizinde hangi destekleri veriyor?
Celsus, model kurulumu ve EPV kontrolü, varsayım denetimleri, SPSS veya R ile analiz, ROC/AUC değerlendirmesi ve APA 7 uyumlu tablo ile metin raporlaması dahil uçtan uca destek sunar. Multinomial ve ordinal uzantılar da kapsam içindedir; çıktılar yeniden üretilebilir sözdizimiyle teslim edilir.