Ki-Kare İstatistiği Nedir?
Ki-kare ( χ 2) istatistik, beklentilerin gözlemlenen gerçek verilerle (veya model sonuçlarla) nasıl karşılaştırıldığını ölçen bir testtir. Ki-kare istatistiğinin hesaplanmasında kullanılan veriler rastgele, ham, birbirini dışlayan, bağımsız değişkenlerden alınmış ve yeterince büyük bir örnekten alınmış olmalıdır. Örneğin, madalyonun 100 kez atılmasının sonuçları bu kriterleri karşılamaktadır.
Ki-kare testleri genellikle hipotez testlerinde kullanılır.
Chi-Square için formül
χc2 = ∑ (Oi − Ei) 2Eiwhere: c = serbestlik derecesiO = gözlemlenen değer (ler) E = beklenen değer (ler) begin {align} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \ & \ textbf {burada:} \ & c = \ text {serbestlik derecesi} \ & O = \ text {gözlenen değerler} \ & E = \ text {beklenen değerler } \ \ end {align} χc2 = ∑Ei (Oi −Ei) 2 burada: c = serbestlik derecesiO = gözlenen değerler E = beklenen değerler
Ki-Kare İstatistiği Size Ne Anlatıyor?
İki ana tip ki-kare testi vardır: “Cinsiyet ve SAT puanları arasında bir ilişki var mı?” Gibi bir ilişki sorusu soran bağımsızlık testi; ve "Bir madeni para 100 kez atılırsa, 50 kez kafalar ve 50 kez kuyruklar mı?" gibi bir soru soran uyum iyiliği testi.
Bu testler için, deney içindeki değişkenlerin ve örneklerin toplam sayısına bağlı olarak belirli bir sıfır hipotezinin reddedilip reddedilemeyeceğini belirlemek için serbestlik dereceleri kullanılır.
Örneğin, öğrencileri ve ders seçimini düşünürken, 30 veya 40 öğrenciden oluşan bir örneklem büyük olasılıkla önemli veriler üretecek kadar büyük değildir. 400 veya 500 öğrencilik bir örneklem kullanarak bir araştırmadan aynı veya benzer sonuçları almak daha geçerlidir.
Başka bir örnekte, bozuk parayı 100 kez atmayı düşünün. Adil bir madeni parayı 100 kez atmanın beklenen sonucu, kafaların 50 kez ve kuyrukların 50 kez çıkmasıdır. Gerçek sonuç, kafaların 45 kez, kuyrukların 55 kez çıkması olabilir. Ki-kare istatistiği, beklenen sonuçlar ile gerçek sonuçlar arasındaki tutarsızlıkları gösterir.
Ki-Kare Testi Örneği
Hem erkek hem de kadın olmak üzere 2.000 farklı seçmen arasında rastgele bir anket yapıldığını düşünün. Yanıt veren insanlar cinsiyetlerine ve cumhuriyetçi mi, demokratik mi yoksa bağımsız mı olduklarına göre sınıflandırıldı. Cumhuriyetçi, demokrat ve bağımsız, erkek ve kadın olarak etiketlenmiş iki sıra içeren bir ızgara düşünün. 2.000 katılımcıdan elde edilen verilerin aşağıdaki gibi olduğunu varsayalım:
Chi kare istatistiğini hesaplamanın ilk adımı beklenen frekansları bulmaktır. Bunlar ızgaradaki her bir "hücre" için hesaplanır. İki cinsiyet kategorisi ve üç siyasi görüş kategorisi olduğundan, beklenen toplam altı frekans vardır. Beklenen frekans için formül:
E (r, c) = n (r) × c (r) n yerde: r = soru c'deki satır = sorudaki sütun = karşılık gelen toplam \ begin {align} & E (r, c) = \ frac {n (r) çarpı c (r)} {n} \ & \ textbf {burada:} \ & r = \ text {söz konusu satır} \ & c = \ text {söz konusu sütun} \ & n = \ text {ilgili toplam} \ \ end {align} E (r, c) = nn (r) × c (r) burada: r = sorudaki satırc = sorudaki sütun = karşılık gelen toplam
Bu örnekte, beklenen frekanslar:
- E (1, 1) = (900 x 800) / 2, 000 = 360E (1, 2) = (900 x 800) / 2, 000 = 360E (1, 3) = (200 x 800) / 2, 000 = 80E (2, 1) = (900 x 1.200) / 2.000 = 540E (2, 2) = (900 x 1.200) / 2.000 = 540E (2, 3) = (200 x 1.200) / 2.000 = 120
Daha sonra, bunlar aşağıdaki formülü kullanarak ki kare istatistiklerini hesaplamak için kullanılan değerlerdir:
Chi-squared = ∑2E (r, c) burada: O (r, c) = verilen satır ve sütun için gözlenen veriler \ begin {align} & \ text {Chi-squared} = \ sum \ frac {^ 2} {E (r, c)} \ & \ textbf {burada:} \ & O (r, c) = \ text {verilen satır ve sütun için gözlenen veriler} \ \ end {align} Chi-squared = ∑E (r, c) 2 burada: O (r, c) = verilen satır ve sütun için gözlenen veriler
Bu örnekte, gözlenen her değerin ifadesi şöyledir:
- O (1, 1) = (400 - 360) 2/360 = 4, 44O (1, 2) = (300-360) 2/360 = 10O (1, 3) = (100-80) 2/80 = 5O (2, 1) = (500 - 540) 2/540 = 2, 96O (2, 2) = (600 - 540) 2/540 = 6, 67O (2, 3) = (100 - 120) 2/120 = 3, 33
Ki-kare istatistiği daha sonra bu değerin toplamına eşittir (32.41). Sonuçta istatistiksel olarak anlamlı olup olmadığı kurulumumuzdaki serbestlik dereceleri göz önüne alındığında, ki kare şeklinde bir istatistik tablosuna bakabiliriz.