İçeriğe atla

Ki-kare testi

Ki-kare testi veya χ² testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan bazıları parametrik olmayan sınama ve diğerleri parametrik sınama yöntemidir. Bu çeşit istatistiksel sınamalarda test istatistiği için "örnekleme dağılımı", sıfır hipotez gerçek olursa ki-kare dağılımı gösterir veya sıfır hipotez "asimptotik olarak gerçek" olursa, eğer sıfır hipotez gerçekse ve eğer örnekleme hacmi istenilen kadar yeterli olarak büyük ise bir ki-kare dağılımına çok yakın olarak yaklaşım gösterir.

Çeşitli ki-kare testleri

Ki-kare dağılımının yaklaşık olarak geçerli olduğu ki-kare testlerinin en çok kullanılan örnekleri şunlardır:

Pearson'un ki-kare testleri ve gelişmeleri

Örneklem verileri ikiden çok kategorili satırdan ve ikiden çok kategorili sütundan oluşan kontenjans tablosu olarak özetlenir ve (r-satırlı ve c-sütunlu) (rxc) tablo, hesaplar için ana veri olarak kullanılır. Bu test "bağımsızlık için ki-kare testi" veya "homojenlik testi" olarak istatistiksel çıkartımasal problemlere uygulanır. Bu çeşit problemlerde "sıfır hipotez" bir rassal değişkenin istatiksel parametre değerini sınamadığı için bu test parametrik olmayan sınama olduğu kabul edilir. Genellikle "Pearson'un ki-kare testi" en iyi bilinen "ki-kare testi" olup çok kere "ki-kare-testi" sözcüğü bu tip Pearson'un testi için kullanılır. "Pearson'un ki-kare testi"'nin çözümleme yöntemi iki değişik sınama sorunu için kullanılır ve bu iki çeşit örneklem veriler bir "kontenjans tablosu"nda özetlendikten sonra aynı şekilde uygulanır.

  • "Bağımsızlık için ki-kare testi":

Bu tip için ki-kare testinin uygulandığı değişik kategorik değerler taşıyan (satır için değişkende r tane kategorili bir değişken ve sütün için değişkende c tane kategorili değişken) iki tane rassal değişken bulunduğu kabul edilir. Bu iki kategorik rassal değişkenin birbirinden "bağımsız" olup olmadıkları araştırma sorusu için uygulanır. Bu tip testte, sıfır hipotez satır rassal değişkeni ile sütun rassal değişkeninin birbirinden "bağımsız" olduğudur ve "alternatif hipotez" "satır değişkeni ile sütun değişkeni birbirinden "bağımsız değildir" önerisidir. Dikkat edilirse bu testin sonucu simetrik değildir; hatta "zayıftır". Eğer sıfır hipotez test ile kabul edilirse sonuç "güçlü"dür ve uygulanmalara katkı yapabilir. Ama sıfır hipotez test ile rededilirse, yani iki rassal değişken "bağımsız değil" ise, sonuç "zayıftır ve ne derecede iki degiskenin ne derecede bağımlı oldukları bu testle gösterilmez.

  • "Homojenlik için ki-kare testi"'

Bu testte ise ikiden çok kategorik değerler taşıyan (yani c tane kategorili sütunla gösterilen) tek bir rassal değişken bulunduğu; ama anakitlenin içinde iki veya daha fazla sayıda (yani r tane kategorili satırla gösterilen) "kitle grubu" bulunduğu sorunu araştırma sorunu olur ve bu iki veya daha fazla kitle grubunun tek bir homojen anakitleden gelip gelmediği sınanır.

2x2 kontenjans tablosu testleri

"İki satır iki sütunlu (2z2)" kontenjans tablosu çoklu satırlı ve çoklu sütunlu kontenjans tablolarında gösterilebilinen verilerin en basitidir.. Onun için bu tip tablolarla özetlenebilen veriler üzerindeki ki-kare testleri özel şekiller alırlar. 2x2 kontenjanss tabloları halinde verilen veriler için kullanılan özel "ki-kare test"lerinden önemlileri şunlardır:

  • Yates'in ki-kare testi: Bu test de "bağımsızlık için ki-kare testi" olarak "iki satır iki sütunlu (2z2)" kontenjans tablosu halinde verilen veriler için istatistiksel çıkartımsal problemlere uygulanır. Bu şekilde özetlenen iki değişkenli veriler, her iki değişkende de (0-1) isimsel veya sırasal değerleri olan değişkenlerdir. Bu testin önemli niteliği 2x2 veri tablosunun her hücresine Yates'in süreklilik düzeltmesi uygulanması yani her hücre için "gözlenmiş değer - beklenen değer" çıkartımından 0,5 değerinin çıkarılmasını ve böylece istatistiğinin "hesaplanmış ki-kare değeri"'ni azaltıp "p-değeri"'ni yükseltmesidir. Hesaplanan ki-kare formülü için be değişim uygulanması haricinde istatistiksel çıkartım için kullanılan yöntemler "Pearson ki-kare testi" ile yöntemi ile aynıdır.
  • Eğer örneklem hacimi küçük ise Fisher'in kesin ki-kare testi Pearson'un ki-kare testi yerine kullanılır.
  • Medyan sınaması: Rastgele iki örneklem verileri için bulunan iki örneklem meydanının tek özdeş medyanı olan iki ayrı istatistiksel yığından mı veya tek bir medyanı olan tek bir istatistiksel yığından mı ortaya çıktığı sınanır.
  • McNemar'ın sınaması: Eğer her iki (0-1) değer alan değişkenlerin gözümlenmesi "eşli karşılaştırma" (örneğin bir sağaltımın uygulanmasınındın önce ve sonra elde edilen veriler) şeklinde örneklem gibi toplanmışsa elde edilen 2×2 kontenjans tablosundaki iki değişkenin bağımsız olup olmadığını sınamaktadır.

G-testleri

G-testleri "maksimum olabilirlik" ve "olabilirlik-oranı" prensiplerine dayanan hipotez sınaması olup günümüzde Pearson'un ki-kare testi ve 2x2 kontenjans tabloları için ki-kare testleri yerine kullanılmaya başlanmıştır.

Ki-kare değerinde ile "birliktelik" ölçümü

"Ki-kare testi"'nin bağımsızlık testinin sonucu simetrik değildir; hatta "zayıftır". Eğer bağımsızlık sıfır hipotezi, test hesaplaması sonucunda kabul edilirse sonuç "güçlü"dür ve yapılan ki-kare testi sonucu uygulanmalara katkı yapabilir. Ama "sıfır hipotez" "Pearson'un ki-kare testi" sonucunda reddedilirse, yani iki değişken "bağımsız değilse", sonuç "zayıf"tır. Çünkü bu iki kategorik değişkenin "birliktelikleri (associaton)" (yanı ne derecede birbirine bağımlı oldukları) bu testle öğrenilmez. Onun için iki kategorik değişken arasında bağımsızlık sıfır hipotezi Pearson'un ki-kare testi ile reddedilirse ve bu iki kategorik değişken arasında "birliktelik" (yani bağımlılık derecesi) bulunması için ekstra analiz uygulanması gerekir. Bu ekstra analiz ile iki kategorik değişken arasında "birliktelik" (İngilizce "association") katsayıları bulunması, iki niceliksel değişken arasında bulunması istenilen korelasyon ilişkisine kavramsal olarak çok yakındır. İlk defa ortaya atılan "birliktelik" katsayıları kavramsal ve pratik olarak, önceden eldeki verilerle "hesaplanan ki-kare" değerlerini kullanmasına dayanmaktadır. Bu tip "birliktelik katasayıları" onun için, eğer "bağımsızlık bulunmazsa" ne derece bağımlılık bulmak hedefiyle yapılan ek işlemler halinde görülmektedir. Ama daha sonradan diğer görüşlerle ede edilen "birliktelik" analizleri ve katsayısıları ortaya atılmıştır;; örneğin Goodman ve Kruskal'ın lambda katsayıları, entropi katsayısı vb.

Hesaplanan "Ki-kare" değeri kullanılarak elde edilen "birliktelik katsayı"ları değişik isimli ve nispeten küçük fark gösteren șu nitelikli katsayilar olabilirler:

İki tane iki-değerli isimsel değişken için 2x2 kontenjans tabloları ile özetlenen veri kullanarak bulunur. Bu katsayının en yüksek değeri eldeki veri sayısına bağlı olmaktadır ve 0.707'ye eşittir.

  • Kontenjans katsayısı:

İki tane çoklu-kategorili isimsel değişken için rxc kontenjans tabloları ile özetlenen veri kullanarak bulunur. Bu katsayının en yüksek değeri de (phi- katsayısına benzer olarak) eldeki veri sayısına ve en büyük sayıda kategori sayısına bağlı olmaktadır.

  • Cramér'un V katsayısı:

İki tane çoklu-kategorili isimsel değişken için bulunur. Bu katsayının değeri (iki niceliksel değişken arasındaki korelasyon katsayısına benzer olarak) -1 ile +1 arasında değişebilmektedir.

  • Tschuprow'un T katsayısı:

Bu katsayi da iki tane çoklu-kategorili isimsel değişken için bulunur ama bu katsayının değeri 0 ile +1 arasında değişebilmektedir.

Ki-kare uygunluk iyiliği sınaması

Bu tip uygunluk iyiliği sınaması için hesaplama yöntemi "Pearson'un ki-kare testi"'ne gayet çok benzeyerek, tek bir "kategorik veri" halinde olan kategorik değişkenin veya kontenjans tablosu içinde sıniflanma yapılarak özetilmiş bir niceliksel değişken verilerinin ne türlü dağılım gösterdiğini test eder. Veriler değişkenin kategori değeri halinde özellikle "tekdüze ayrık dağılım'a uygunluk", binom dağılım'a uygunluk", Poisson dağılım'a uygunluk" ve eğer normal değerler sınıflandırılıp sınıf ortalaması kategori değeri gibi kullanılırsa "normal dağılım'a uygunluk" testleri olabilirler. Bu halde dağılımı kesin belirlemek için dağılım parametreleri "sıfır hipotez" içinde verilmesi gerekir. Bu nedenle genellikle bu tip test "parametrik olmayan istatistik" olarak kabul edilmekle beraber, sıfır hipotezde anakütle parametre değerleri belirtilmesi gerektiği için "parametrik çıkartım" nitelikleri de taşımaktadır.

Varyans değeri testi

Tek niceliksel değişken verisi için basit rassal örnekleme ile elde edilen veriler, eğer yeter derecede büyük sayıda ise elde edilen örneklem özetlenme değerleri için örnekleme varyansı hesaplanıp anakütle varyansının belirli hakkında sınama yapmak kullanılabilir. Bu varyans değeri testi genel olarak pratikte çok kullanılmaktadır çünkü verilerin varyansı hakkında çok kere araştırma sorusu çıkmamaktadır.

Diğer ki-kare testleri

  • Zaman serisi analizi konusunda zaman serisi verileri bulunan tek bir değişken için n tane arkaya gözlenen veri serisinde 1'den başlayarak belli bir gecikmeye (pratik olarak genellikle n/3 donem gecikmeye) kadar olan otokorelasyon bağlantısının olup olmadığını bulmak için yapılan portmanto testi.
  • "Genel istatistik modelleme" yönteminde arka arkaya birbirine "iç-içe" yuvalanmış şekilde en basit modelden daha karmaşık modele geçiş gerekip gerekmediği hakkında yeterli delil olup olmadığını test eden olabilirlik oran sınaması,

Ayrıca bakınız

Notlar

Dış bağlantılar


İlgili Araştırma Makaleleri

Varyans Analizi istatistik bilim dalında, grup ortalamaları ve bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans Analizi kullanılmaktayken belirlenmiş bir değişkenin gözlemlenen varyansı farklı değişim kaynaklarına dayandırılabilen varyans bileşenine ayrılır. En basit şekliyle varyans analizi birkaç grubun ortalamalarının birbirine eşit mi eşit değil mi olduğunu sınamak için bir çıkarımsal istatistik sınaması olur ve bu sınama iki-grup için yapılan t-test sınamasını çoklu-gruplar için genelleştirir. Eğer, çoklu değişkenli analiz için birbiri arkasından çoklu iki-örneklemli-t-sınaması yapmak istenirse bunun I. tip hata yapma olasılığını artırma sonucu doğurduğu aşikardır. Bu nedenle, üç veya daha fazla sayıda ortalamaların ististiksel anlamlığının sınama ile karşılaştırılması için Varyans Analizleri daha faydalı olacağı gerçeği ortaya çıkmaktadır.

İstatistiksel terimler, kavramlar ve konular listesi matematik biliminin çok önemli bir alt-bölümü olan istatistik biliminde içeriğinde bulunan konuların çok ayrıntılı olarak sınıflandırılması ile ortaya çıkarılmıştır. Milletlerarası İstatistik Enstitüsü bir enternasyonal bilim kurumu olarak istatistik bilimi konu ve terimlerini bir araya toplayıp 28 bilim dilinde karşılıklı olarak yayınlamıştır. Bu uğraşın sonucunun milletlerarası bilim camiasının büyük başarılarından biri olduğu kabul edilmektedir. Ortaya çıkartılan, istatistik bilimi içinde kullanılan ve bu bilime ait özel kavramların ve terimlerin listesi, tam kapsamlı olma hedeflidir ve böylelikle istatistik bilimi için bir Türkçe yol haritası yapılmış olmaktadır.

İstatistik biliminde normallik sınamaları bir seri parametrik olmayan istatistik sınamalar çeşididir. Normallik sınamalarının amacı verilmiş bir veri dizisinin normal dağılıma uygunluk iyiliğinin incelenmesidir. Bir sıra parametrik olmayan sınama geliştirilmiş bulunmasına rağmen birçok istatistikçi pratikte daha az kesin ve daha çok subjektif sağduyu ve ekpertiz gerektiren gösterim karşılaştırmalarını kullanmaktadır. Normallik sınamaları yalnız örneklem verilerinin doğrudan doğruya incelenmesinde kullanılmamakta, fakat özellikle ekonometrik analizlerde tek regresyon denklemi tahmininden sonra çıkan hataların normal olup olmadıklarının araştırılması için de çok kullanılmaktadırlar.

İstatistik biliminde önemli bir yeri olan parametrik olmayan istatistik parametrik olmayan istatistiksel modeller ve parametrik olmayan çıkarımsal istatistik, özellikle parametrik olmayan istatistiksel hipotez sınamalar ile ilgilenir. Parametrik olmayan yöntemler çok defa dağılımlardan serbest yöntemler olarak da anılmaktadır, çünkü verilerin bilinen belirli olasılık dağılımı gösteren kaynaklardan geldiği varsayımına dayanmamaktadır.

İstatistik bilim dalında Kruskal-Wallis sıralamalı tek yönlü varyans analizi, bağımsız gruplar arası anakütle medyanlarının eşitliğini sınamak amacı ile kullanılan bir parametrik olmayan istatistik sınamasıdır. Adı bu yöntemi ilk defa ortaya koyan William Kruskal ve W. Allen Wallis atıfla konmuştur. Matematiksel olarak ayrı olmakla beraber, tek yönlü varyans analizinin bir değişik şekli olarak görülebilir. Diğer bir görüşe göre Mann-Whitney U sınamasının 3 veya daha çoklu gruplara genişletilmesidir.

İstatistik bilim dalı içinde Friedman sıralamalı iki yönlü varyans analizi sonradan çok tanınmış bir iktisatçı olan Amerikan Milton Friedman tarafından ortaya atılan bir parametrik olmayan istatistik sınamasıdır.

Mann-Whitney U testi niceliksel ölçekli gözlemleri verilen iki örneklemin aynı dağılımdan gelip gelmediğini incelemek kullanılan bir parametrik olmayan istatistik testdir. Aynı zamanda Wilcoxon sıralama toplamı testi veya Wilcoxon-Mann-Whitney testi) olarak da bilinmektedir. Bu testi ilk defa eşit hacimli iki örneklem verileri için Wilcoxon (1945) ortaya atmıştır. Sonradan, Mann and Whitney (1947) tarafından değişik büyüklükte iki örneklem problemleri analizleri için uygulanıp geliştirilmiştir.

İstatistik bilim dalında Yates süreklilik düzeltmesi veya Yates'in ki-kare sınamasıisimsel ölçekli' veya sırasal ölçekli iki değişken için gözlemlenmiş örneklem verileri bir bağımlılık tablosu halinde betimlenmiş iken, ilişkili iki değişken arasında bağımsızlık sınaması yapmak için bazı özel hallerde kullanılır.

İstatistik bilim dalı içinde tekrarlama sınaması iki değer (0-1) alan veya iki değer alma şekline dönüştürülmüş bir kategorik değişken için örneklem veri serisinin ardı ardına bir rastgele sıralama ile gelip gelmediğini sınamak için kullanılan bir parametrik olmayan istatistik yöntemidir.

İstatistik bilim dalında, Spearman'ın sıralama korelasyon katsayısı veya Spearman'ın rho, bu istatistiksel ölçüyü ilk ortaya atan İngiliz psikolog Charles Edward Spearman'a atfen adlandırılmıştır. Matematik notasyon olarak çok defa eski Yunan harfi ρ ile belirtilir. Bir parametrik olmayan istatistik ölçüsüdür ve iki değişken arasındaki bağımlılık, yani korelasyon, ölçüsü olarak bulunup kullanılır. Bu demektir ki Spearman'in rho (ρ) katsayısı iki değişken için çokluluklar dağılımı hakkında hiçbir varsayım yapmayarak, bu iki değişken arasında bulunan bağlantının herhangi bir monotonik fonksiyon ile ne kadar iyi betimlenebilineceğini değerlendirmek amaçlı incelemedir.

Shapiro-Wilk Testi, örneklemelerde temel alınan istatistiksel yığının normal dağıldığı bir hipotezin sağlamasını yapan istatistiksel bir hipotez testidir. Parametrik olmayan istatistikte normallik testleri arasında yer almaktadır. Shapiro-Wilk Testi, Amerikalı istatistikçi Samuel Shapiro ile Kanadalı istatistikçi Martin Wilk tarafından 1965 yılında ortaya konuldu. Normal dağılım için analizin grafiksel bilgisini bir anahtar şeklinde normal olasılık grafiği kullanarak özetlemeye yönelik tezlerinin sonucudur.

İstatistik bilim dalında, Kolmogorov-Smirnov (K-S) sınaması parametrik olmayan istatistik olup Andrey Kolmogorov ve Nikolai Smirnov adlarındaki iki Sovyet bilim insanı tarafından oluşturulmuştur.

Medyan testi, bir örneklem kümesinin belirli bir medyan değerine sahip olan bir anakütleden gelip gelmediğinin araştırılmasında kullanılan çift taraflı bir testtir. istatistik biliminde çıkarımsal istatistik alanında bir parametrik olmayan istatistik aletidir ve Pearson'un ki-kare testinın özel bir halidir. Mood'un-medyan-testi veya Westenberg-Mood-medyan-testi veya Brown-Mood-medyan-testi olarak da anılır.

F-testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan parameterik çıkarımsal sınama yöntemidir. F-testi sıfır hipotezine göre gerçekte bir F-dağılımı gösteren sınama istatistiği bulunduğu kabul edilen hallerde, herhangi bir istatistiksel sınama yapma şeklidir. Bu çeşit bir istatistiksel sınama önce Ronald Fisher tarafından 1920'li yıllarda tek yönlü varyans analizi için ortaya atılıp kullanılmış ve sonradan diğer şekillerde F-dağılım kullanan sınamalar da ortaya atılınca, bu çeşit sınamalara genel isim olarak F-testi adı verilmesi Ronald Fisher anısına George W. Snecedor tarafından teklif edilip, istatistikçiler tarafından F-testi bir genel isim olarak kabul edilmiştir.

<span class="mw-page-title-main">Anlamlılık seviyesi</span>

Anlamlılık seviyesi, istatistik biliminde, İngiliz istatistikçi Ronald Fisher tarafından çıkartımsal hipotez sınama yönteminin kurulması sırasında kavramlaştırılmış özel bir manası olan bir bilimsel ve istatistiksel terimdir. İstatistiksel anlamlılık eğer bir sonucun gerçekleşme olasılık değerlendirilmesine göre olabilirliği düşük değil ise ortaya çıkar.

Tek anakütle ortalaması için parametrik hipotez sınaması veya tek-örneklem için sınama veya μ için sınama, bir rastgele örneklem ortalaması ile bu örneklemin çekilmiş olduğunu düşündüğümüz anakütlenin μ ile belirtilen "anakütle ortalaması" hakkında bir hipotez değeri belirtilmesinin anlamlı olup olmadığını araştırmamızı sağlayan parametrik hipotez sınamasıdır.

Phi katsayısı veya Φ - katsayısı veya ortalama kare kontenjansı katsayısı olarak isimlendirilen ve matematik notasyonla by φ olarak ifade edilen iki tane iki-değerli isimsel veya sırasal değişkenin birbirine "birliktelik (association)" ilişkisini gösteren ölçü katsayılarıdır.

Pearson ki-kare testi nicel veya nitel değişkenler arasında bağımlılık olup olmadığının, örnek sonuçlarının belirli bir teorik olasılık dağılımına uygun olup olmadığının, iki veya daha fazla örneğin aynı anakütleden gelip gelmediğinin, ikiden fazla anakütle oranının birbirine eşit olup olmadığının ve çeşitli anakütle oranlarının belirli değere eşit olup olmadığının araştırılmasında kullanılır. İstatistik biliminin çıkarımsal istatistik bölümünde ele alınan iki-değişirli parametrik olmayan test analizlerinden olan ve ki-kare dağılımı'nı esas olarak kullanan ki-kare testlerinden en çok kullanılanıdır. İngiliz istatistikçi olan Karl Pearson tarafından 1900'da ortaya çıkartılmıştır.

Student'ın t-testi istatistik bilimi içinde incelenen, eğer sıfır hipotez desteklenmekte ise test istatistiğinin bir Student's t-dağılımı gösterdiği hallerde uygulanan çıkartımsal istatistiksel hipotez sınamasıdır. Verilen iki değişik grup sayısal verinin birbirinden anlamlı olarak farklılık gösterip göstermemesini sınamak için kullanılabilir. En sıkça uygulanma örnekleri eğer test istatistiği içinde bulunan ölçek parametre faktörünün değerinin bir normal dağılım gösterdiği bilinmekte olduğu hallerde tatbik edilmektedir. Eğer test istatistiği içinde bulunan ölçek parametresi faktörünün değeri bilinmiyorsa ve bu faktör veriye dayayan bir kestirim ile ifade edilmekte ise test istatistiği bir Student'ın t-dağılımı gösterebilir.

<span class="mw-page-title-main">Matematiksel istatistik</span> matematiksel yöntemlerin kullanıldığı olası istatistikler

Matematiksel istatistik, istatistiksel veri toplama tekniklerinin aksine, matematiğin bir dalı olan olasılık teorisinin istatistiğe uygulanmasıdır. Bunun için kullanılan özel matematiksel teknikler arasında matematiksel analiz, doğrusal cebir, stokastik analiz, diferansiyel denklemler ve ölçü teorisi bulunur.