Ölçek Geliştirme: AFA ve DFA Adımları

Ölçek geliştirme, soyut bir kavramı (tükenmişlik, dijital okuryazarlık, örgütsel bağlılık gibi) ölçülebilir maddelere dönüştüren çok aşamalı bir psikometrik süreçtir. Hakemlerin en sık reddettiği hata, sürecin tek bir faktör analiziyle geçiştirilmesidir: sağlam bir ölçek, madde havuzundan kapsam geçerliğine, açımlayıcı faktör analizinden (AFA) ayrı bir örneklemde doğrulayıcı faktör analizine (DFA) uzanan bir zincir gerektirir. Bu rehber, tez ve makale standardında her adımın karar kurallarını özetler.

Madde havuzu ve kapsam geçerliği

Süreç, kuramsal çerçeveden ve nitel ön çalışmalardan (görüşme, odak grup) beslenen geniş bir madde havuzuyla başlar; hedeflenen nihai madde sayısının en az iki katı yazılması önerilir. Havuz, alan ve ölçme uzmanlarından oluşan bir panele sunulur. Uzman görüşleri kapsam geçerlik oranı (CVR) ile sayısallaştırılır: her madde için CVR = (gerekli diyen uzman sayısı − toplam uzman sayısının yarısı) / (toplam uzman sayısının yarısı). Panel büyüklüğüne göre değişen kritik değerin altında kalan maddeler atılır veya revize edilir; ardından küçük bir grupla bilişsel ön deneme (pilot okuma) yapılarak anlaşılırlık sınanır. Madde yazımında çift yargılı (double-barrelled) ifadelerden kaçınılmalı, ters kodlu madde sayısı sınırlı tutulmalı ve yanıt formatı (genellikle 5'li veya 7'li Likert) baştan sabitlenmelidir.

AFA öncesi kontroller: Örneklem yeterliği

AFA'ya geçmeden iki koşul raporlanmalıdır. KMO örneklem yeterliği ölçüsü en az 0,60 olmalıdır; 0,80 ve üzeri değerler iyi, 0,90 ve üzeri mükemmel kabul edilir. Bartlett küresellik testi anlamlı çıkmalıdır (p < 0,05); aksi hâlde korelasyon matrisi faktörleşmeye uygun değildir. Örneklem büyüklüğünde yaygın pratik kural madde başına 5–10 katılımcıdır; mutlak alt sınır olarak 300 civarı bir AFA örneklemi çoğu hakem için güven vericidir. Eksik veri ve uç değer incelemesi de bu aşamada tamamlanır.

Ölçek geliştirmede AFA: Çıkarım, faktör sayısı, döndürme

Çıkarım yönteminde temel eksen faktörleştirmesi (principal axis factoring) normallikten sapmalara dayanıklıdır; maksimum olabilirlik (ML) ise çok değişkenli normallik sağlandığında uyum testi ve güven aralığı üretme avantajı taşır. Temel bileşenler analizi (PCA) ise teknik olarak bir veri indirgeme yöntemidir; örtük yapı arayan ölçek çalışmalarında ilk tercih olmamalıdır.

Faktör sayısına karar verirken tek başına özdeğer > 1 (Kaiser) ölçütüne yaslanmak en bilinen hatadır: bu kural faktör sayısını sistematik biçimde olduğundan fazla gösterir. Güncel standart, üç kanıtın birlikte değerlendirilmesidir: yamaç-birikinti (scree) grafiğindeki kırılma noktası, paralel analiz (gerçek özdeğerlerin rastgele veriden üretilen özdeğerleri aştığı faktör sayısı) ve kuramsal yorumlanabilirlik. Döndürmede faktörlerin ilişkisiz olduğu varsayılabiliyorsa varimax (dik), sosyal bilimlerde neredeyse her zaman olduğu gibi faktörler arası korelasyon bekleniyorsa promax veya oblimin (eğik) seçilir; eğik döndürme sonrası faktör korelasyonları 0,30'un altındaysa varimax çözümü de raporlanabilir.

Yük eşiği: Birincil faktör yükü ≥ 0,40 olmayan madde atılır (kimi alanlarda 0,32 alt sınır kabul edilir).
Çapraz yük: İki faktörde de yüksek yük alan maddede yükler arası fark en az 0,20 olmalı; değilse madde binişiktir.
Ortak varyans: Communality değeri 0,30'un altındaki maddeler gözden geçirilir.
Tek seferde tek madde: Her atımdan sonra AFA yinelenir; toplu madde atımı çözümü bozar.

Altı maddelik bir alt boyutta AFA faktör yükleri (illüstratif): M5 sınırda, M6 atılır.

DFA: Ayrı örneklem ve uyum indeksleri

AFA ile bulunan yapı, aynı veriyle DFA yapılarak doğrulanamaz; bu döngüsel bir kanıttır. İdeal tasarım, ya yeni bir örneklem toplamak ya da yeterince büyük tek örneklemi rastgele ikiye bölmektir. DFA, AMOS, lavaan (R) veya Mplus ile kurulur; her madde yalnızca kendi faktörüne yüklenir ve standartlaştırılmış yükler ile uyum indeksleri birlikte raporlanır. Modelin reddi hâlinde modifikasyon indeksleri yalnızca kuramsal gerekçeyle (ör. benzer ifade kökü taşıyan iki maddenin hata kovaryansı) kullanılmalıdır. Model karşılaştırma ve yazılım seçimi için YEM rehberimize bakabilirsiniz.

Kestirim yöntemi veri düzeyine göre seçilmelidir: beş ve üzeri kategorili, yaklaşık normal dağılan Likert maddelerinde maksimum olabilirlik yeterlidir; dört ve daha az kategorili ya da belirgin çarpık maddelerde ağırlıklandırılmış en küçük kareler (WLSMV) türü dayanıklı kestiriciler tercih edilir. χ² testinin büyük örneklemlerde küçük sapmaları bile anlamlı bulduğu unutulmamalı; bu nedenle karar tek bir indeksle değil, aşağıdaki setin bütünüyle verilmelidir.

DFA uyum indeksleri ve eşik değerleri
İndeks	Kabul edilebilir	İyi uyum
χ²/sd	≤ 3	≤ 2
RMSEA	≤ 0,08	≤ 0,05
CFI	≥ 0,90	≥ 0,95
TLI	≥ 0,90	≥ 0,95
SRMR	≤ 0,08	≤ 0,05

Yapı geçerliği ve güvenirlik: AVE, CR, alfa

DFA'dan sonra yakınsak geçerlik için her faktörde ortalama açıklanan varyans (AVE) ≥ 0,50 ve bileşik güvenirlik (CR) ≥ 0,70 aranır; AVE 0,50'nin biraz altında kalsa bile CR ≥ 0,70 ise yakınsak geçerlik savunulabilir. Ayırt edici geçerlikte klasik ölçüt, her faktörün AVE karekökünün o faktörün diğer faktörlerle korelasyonlarından büyük olmasıdır (Fornell-Larcker ölçütü); güncel çalışmalar buna HTMT oranını da ekler. Güvenirlikte Cronbach alfa ≥ 0,70 yaygın eşiktir; ancak alfa, eşit yük varsayımına dayandığından McDonald omega değerinin birlikte raporlanması güncel beklentidir. Sonuçların yazımında SPSS tez analizi rehberindeki raporlama ilkeleri geçerlidir.

Ölçek farklı gruplarda (cinsiyet, kültür, uygulama biçimi) karşılaştırma amacıyla kullanılacaksa, son adım olarak ölçme değişmezliği (yapısal, metrik ve skaler düzeyde çok gruplu DFA) sınanmalıdır; skaler değişmezlik sağlanmadan grup ortalamaları karşılaştırılamaz. Raporda madde havuzundan nihai forma uzanan tüm atma kararlarının gerekçeleriyle birlikte bir akış tablosunda sunulması, hakem sürecini belirgin biçimde hızlandırır.

Ölçek, maddelerin hayatta kaldığı değil; yapının iki bağımsız örneklemde art arda kanıtlandığı yerde doğar.

Sık Sorulan Sorular

Ölçek geliştirme için kaç kişilik örneklem gerekir?

Yaygın kural madde başına 5–10 katılımcıdır; AFA için 300 civarı, DFA için ayrı bir 200–300 kişilik örneklem güvenli bir hedeftir. AFA ve DFA aynı katılımcılarla yapılmamalıdır; tek büyük örneklem rastgele ikiye bölünebilir.

AFA ve DFA aynı çalışmada raporlanabilir mi?

Evet, hatta beklenir; ancak iki analiz farklı örneklemlerde yürütülmelidir. Makalede genellikle Çalışma 1 (AFA) ve Çalışma 2 (DFA) biçiminde iki aşamalı bir tasarım sunulur.

Faktör yükü 0,40'ın altındaki madde kesin atılır mı?

Hayır, eşik bir karar başlangıcıdır. Kuramsal olarak vazgeçilmez bir madde 0,32–0,40 aralığındaysa korunabilir; bu durumda gerekçe açıkça yazılmalı ve maddenin DFA ile güvenirlikteki davranışı izlenmelidir.

Celsus ölçek geliştirme sürecinde hangi destekleri sunuyor?

Madde havuzu ve uzman paneli tasarımı, CVR hesaplama, AFA ve paralel analiz, ayrı örneklemde DFA, AVE-CR ve güvenirlik analizleri ile tez ve makale formatında raporlama desteği veriyoruz. Analizler SPSS, R veya AMOS çıktılarıyla birlikte teslim edilir.