Panel Veri: Sabit mi Tesadüfi mi? Hausman Testi

Q: Hausman testinde p değeri 0,05'e çok yakınsa hangi model seçilmeli?

Sınırda kalan sonuçlarda tek bir p değerine yaslanmak yerine Mundlak yaklaşımıyla kararı doğrulamak gerekir. Birim ortalamaları modele eklendiğinde ortak anlamlılık çıkıyorsa sabit etkiler güvenli tercihtir; iktisadi gerekçe de kararın yanında raporlanmalıdır.

Q: Zamanla değişmeyen değişkenim sabit etkiler modelinde düştü, ne yapabilirim?

Bu değişkenin katsayısı araştırma sorusunun merkezindeyse Mundlak tipi ilişkili tesadüfi etkiler (CRE) kurgusu veya Hausman-Taylor tahmincisi değerlendirilebilir. Değişken yalnızca kontrol amaçlıysa sabit etkiler zaten onu örtük biçimde kontrol eder; ek işlem gerekmez.

Q: Panel veri analizi için kaç birim ve kaç dönem yeterlidir?

Mekanik bir alt sınır yoktur; ancak GLS varyans bileşenlerinin güvenilir tahmini için genellikle en az 10-15 birim ve 5 üzeri dönem önerilir. N küçük ve T uzunsa panel zaman serisi araçlarına, T çok kısaysa dinamik panel (GMM) yöntemlerine yönelmek gerekebilir.

Q: Celsus panel veri analizinde hangi hizmetleri sunuyor?

Model kurulumu, FE/RE tahmini ve Hausman ile Mundlak karar analizleri, tam tanı testi seti, dirençli ve Driscoll-Kraay standart hatalarıyla nihai tablolar Celsus tarafından hazırlanır. Stata veya R komut dosyaları, tez ve makale formatında raporlama ile birlikte yeniden üretilebilir biçimde teslim edilir.

Lisansüstü tezlerde ve ampirik makalelerde panel veri analizi, aynı birimlerin (firma, ülke, il, hastane) zaman içinde izlenmesiyle hem yatay kesit hem de zaman boyutundaki bilgiyi tek modelde birleştirir. Buna rağmen jüri ve hakem raporlarında en sık dönen soru hâlâ aynıdır: sabit etkiler mi, tesadüfi etkiler mi? Bu rehber, iki tahmincinin mantığını, Hausman testinin sıfır hipotezini ve karar kuralını, ardından modern hakemlerin standart olarak beklediği tanı testlerini somut eşiklerle özetler.

Panel verinin yapısı ve havuzlanmış EKK'nın tuzakları

Panel veri, N birimin T dönem boyunca gözlenmesiyle oluşan N×T boyutlu bir yapıdır. Temel model yit = β′xit + αi + εit biçiminde yazılır; buradaki αi, birime özgü ve zamanla değişmeyen gözlenemeyen heterojenliği (yönetim kalitesi, kurumsal yapı, coğrafya) temsil eder. Havuzlanmış EKK bu terimi yok sayar: αi açıklayıcı değişkenlerle ilişkiliyse katsayılar sapmalı ve tutarsız olur; ilişkili olmasa bile aynı birime ait gözlemler bağımsız olmadığından klasik standart hatalar olduğundan küçük hesaplanır ve t istatistikleri yapay biçimde şişer. Panel tahmincilerinin varlık nedeni tam olarak bu iki sorundur.

Sabit etkiler: Within dönüşümünün mantığı

Sabit etkiler (FE) tahmincisi, her değişkenden kendi birim ortalamasını çıkararak (yit − ȳi) modeli within (grup içi) dönüşümle tahmin eder. Bu işlem αi terimini cebirsel olarak tamamen eler; dolayısıyla αi ile açıklayıcı değişkenler arasındaki korelasyon hangi düzeyde olursa olsun katsayılar tutarlı kalır. Bedeli iki yönlüdür: zamanla değişmeyen değişkenler (cinsiyet, bölge, kuruluş yılı) ortalamadan arındırma sırasında modelden düşer ve birim içi (within) varyansı düşük değişkenlerin standart hataları büyür. FE, yalnızca birim içi değişimden öğrenir; birimler arası farkları kimliğe yükler.

Tesadüfi etkiler: GLS mantığı ve tutarlılık koşulu

Tesadüfi etkiler (RE) tahmincisi αi'yi ortak bir dağılımdan çekilmiş rastsal bileşen sayar ve modeli genelleştirilmiş en küçük kareler (GLS) ile, kısmi ortalamadan arındırma (yit − θȳi) üzerinden tahmin eder. Varyans bileşenlerinden hesaplanan θ, 0 ile 1 arasındadır: θ = 1 olduğunda RE sabit etkilere, θ = 0 olduğunda havuzlanmış EKK'ya yakınsar. RE hem birim içi hem birimler arası bilgiyi kullandığı için kendi varsayımları altında FE'den daha etkindir ve zamanla değişmeyen değişkenleri tahmin edebilir. Tek ama belirleyici koşul şudur: αi ile açıklayıcı değişkenler ilişkisiz olmalıdır, yani Corr(αi, xit) = 0. Bu koşul ihlal edilirse RE tutarsızdır ve etkinlik avantajının hiçbir anlamı kalmaz.

Sabit etkiler ile tesadüfi etkiler karşılaştırması
Özellik	Sabit etkiler (FE)	Tesadüfi etkiler (RE)
Temel varsayım	αi regresörlerle ilişkili olabilir	Corr(αi, xit) = 0 şarttır
Tahmin yöntemi	Within (grup içi) dönüşüm	GLS ile kısmi arındırma (θ)
Zamanla değişmeyen değişkenler	Modelden düşer	Tahmin edilebilir
Corr(αi, x) ≠ 0 iken	Tutarlı	Tutarsız
RE varsayımları altında etkinlik	Daha az etkin	Etkin
Stata / R komutu	xtreg, fe / plm(model = "within")	xtreg, re / plm(model = "random")

Hausman testi: Sıfır hipotezi ve karar kuralı

Hausman testinin sıfır hipotezi, FE ve RE katsayıları arasındaki farkın sistematik olmadığıdır; yani H₀ altında her iki tahminci de tutarlıdır ve RE ayrıca etkindir. Test istatistiği H = (bFE − bRE)′[V(bFE) − V(bRE)]⁻¹(bFE − bRE) biçimindedir ve k serbestlik dereceli ki-kare dağılımına uyar.

p < 0,05 ise H₀ reddedilir: katsayı farkları sistematiktir, RE tutarsızdır → sabit etkiler raporlanır.
p ≥ 0,05 ise H₀ reddedilemez: her iki tahminci de tutarlıdır → daha etkin olan tesadüfi etkiler tercih edilebilir.
Klasik Hausman testi homoskedastiklik varsayar; değişen varyans veya otokorelasyon varsa Mundlak yaklaşımı (birim ortalamalarının modele eklenip ortak anlamlılığının test edilmesi) ya da dirençli/bootstrap Hausman varyantları kullanılmalıdır.

Hausman testi hangi modelin doğru olduğunu değil, tesadüfi etkilerin savunulabilir olup olmadığını söyler.

Panel veri analizinde tanı testleri ve dirençli standart hatalar

FE/RE kararı işin yalnızca yarısıdır; hakemler artık üç standart tanı testini görmeden geçerlilik tartışmasını kabul etmiyor. Bu testlerin tamamında p < 0,05, ilgili sorunun varlığına işaret eder:

Değiştirilmiş Wald testi: FE modeli sonrasında gruplar arası değişen varyansı sınar; H₀ = birim varyansları eşittir.
Wooldridge testi: Panel verisinde birinci derece otokorelasyonu sınar; H₀ = AR(1) otokorelasyon yoktur.
Pesaran CD testi: Birimler arası (yatay kesit) bağımlılığı sınar; H₀ = yatay kesit bağımsızlığı vardır. Makro panellerde ortak şoklar nedeniyle neredeyse rutin olarak reddedilir.

Sorun tespit edildiğinde model değiştirmek değil, standart hataları düzeltmek standart pratiktir. Değişen varyans ve otokorelasyon birlikteyse birim bazında kümelenmiş (cluster-robust) standart hatalar yeterlidir; yatay kesit bağımlılığı da varsa ve zaman boyutu makulse (T ≥ 20 civarı) her üç soruna birden dirençli Driscoll-Kraay standart hataları tercih edilmelidir. Zaman serisi boyutu uzun makro panellerde ayrıca değişkenlerin durağanlığı da sınanmalıdır; bu konunun ayrıntısı için birim kök testleri rehberimize bakabilirsiniz.

Uygulamalı panel çalışmalarında tanı testlerinin sorun raporlama oranı, % (illüstratif)

Yazılım: Stata, R ve EViews

Stata'da akış nettir: xtset ile panel yapısı tanımlanır; xtreg y x, fe ve xtreg y x, re tahminlerinin ardından hausman komutu çalıştırılır; tanı için xttest3 (değiştirilmiş Wald), xtserial (Wooldridge) ve xtcsd, pesaran kullanılır; Driscoll-Kraay için xtscc vardır. R'da plm paketi aynı işi görür: plm(..., model = "within") ve model = "random" tahminleri phtest ile karşılaştırılır; dirençli kovaryanslar vcovHC ve vcovSCC ile elde edilir. EViews'ta panel çalışma dosyasında tahmin seçeneklerinden etki tipi seçilir ve Hausman testi menüden tek tıkla raporlanır. Hangi yazılım kullanılırsa kullanılsın, tez ekinde tam komut dosyasının paylaşılması yeniden üretilebilirlik için güçlü bir artıdır.

Sık Sorulan Sorular

Hausman testinde p değeri 0,05'e çok yakınsa hangi model seçilmeli?

Sınırda kalan sonuçlarda tek bir p değerine yaslanmak yerine Mundlak yaklaşımıyla kararı doğrulamak gerekir. Birim ortalamaları modele eklendiğinde ortak anlamlılık çıkıyorsa sabit etkiler güvenli tercihtir; iktisadi gerekçe de kararın yanında raporlanmalıdır.

Zamanla değişmeyen değişkenim sabit etkiler modelinde düştü, ne yapabilirim?

Bu değişkenin katsayısı araştırma sorusunun merkezindeyse Mundlak tipi ilişkili tesadüfi etkiler (CRE) kurgusu veya Hausman-Taylor tahmincisi değerlendirilebilir. Değişken yalnızca kontrol amaçlıysa sabit etkiler zaten onu örtük biçimde kontrol eder; ek işlem gerekmez.

Panel veri analizi için kaç birim ve kaç dönem yeterlidir?

Mekanik bir alt sınır yoktur; ancak GLS varyans bileşenlerinin güvenilir tahmini için genellikle en az 10-15 birim ve 5 üzeri dönem önerilir. N küçük ve T uzunsa panel zaman serisi araçlarına, T çok kısaysa dinamik panel (GMM) yöntemlerine yönelmek gerekebilir.

Celsus panel veri analizinde hangi hizmetleri sunuyor?

Model kurulumu, FE/RE tahmini ve Hausman ile Mundlak karar analizleri, tam tanı testi seti, dirençli ve Driscoll-Kraay standart hatalarıyla nihai tablolar Celsus tarafından hazırlanır. Stata veya R komut dosyaları, tez ve makale formatında raporlama ile birlikte yeniden üretilebilir biçimde teslim edilir.