Medyan testi
Medyan testi, bir örneklem kümesinin belirli bir medyan değerine sahip olan bir anakütleden gelip gelmediğinin araştırılmasında kullanılan çift taraflı bir testtir. istatistik biliminde çıkarımsal istatistik alanında bir parametrik olmayan istatistik aletidir ve Pearson'un ki-kare testinın özel bir halidir. Mood'un-medyan-testi veya Westenberg-Mood-medyan-testi veya Brown-Mood-medyan-testi olarak da anılır.
Hipotez testi
Bu, "parametrik olmayan test"de sıfır hipotez H0 iki rastgele örneklem için bulunan iki örneklem medyanının tek özdeş medyanı olan iki ayrı istatistiksel yığından veya daha kapsamlı bir çıkartım olarak, tek bir medyanı olan tek bir istatistiksel yığından ortaya çıktığı önerisidir. Karşıt hipotez H1 ise iki örneklemin birbirine özdeş medyanı olan yani tek bir anakütleden gelmediğidir. Dikkat edilirse H1 bir menfi sonuç verir ve veri iki örneklemin ne türlü iki anakütleden geldiğini açıklamaz. Daha genel bir lisanla ve daha matematiksel olmayan bir şekilde ifadeyle, eğer H0 kabul edilirse, iki örneklemin tek bir anakütleden gelmiş olduğu, eğer H0 reddedilirse tek bir anakütleden gelmiş olmadığı sonucu çıkartılır.
Test hesapları
Teste biri V1 n1 diğeri V2 n2 büyüklüklerde iki basit rastgele örneklem verileri elde etmekle başlanır. Önce bu iki grup veri birleştirilip (N=n1+n2 büyüklüğünde bir birleşik veri serisi elde edilip ve bu birleşik verilerin birleşik medyanı bulunur. Sonra iki örneklem verisi V1 ve V2 ayrı ayrı ele alınır. Her bir örneklemde, her bir veri değeri birleşik medyan değeri ile karşılaştırılır ve veri değerine ya birleşik medyan altında olan yani (-) işareti verilerek ya da birleşik medyan üstünde olan yani (+) işareti verilerek, örneklem verileri iki kısma (- ve + işaretliler) ayrılır. Eğer herhangi bir örneklem verisi birleşik medyan ile ayni değerde ise, Siegel ve Castellan (1988) eğer n1, n1 ve N büyükse bunların analizden elimine edilmesini tavsiye ederler. Böylelikle 4 değer elde edilir:
- A: V1 örneklem verilerinden birleşik medyan değerinin üstünde olan + işaretli veri sayısı;
- B: V2 örneklem verilerinden birleşik medyan değerinin üstünde olan + işaretli veri sayısı;
- C: V1 orneklem verilerinden birleşik medyan değerinin altında olan - işaretli veri sayisi;
- D: V2 örneklem verilerinden birleşik medyan değerinin altında olan - işaretli veri sayısı.
Boylece hesaplarla 2x2 (yani iki sıralı ve iki sütunlu) şu "kontanjans tablosu" ortaya çıkartılır:
1. Örneklem V1 | 2. Örneklem V2 | Toplam | |
---|---|---|---|
(+) işaretli veri sayısı | A | B | A + B |
(-) işaretli veri sayısı | C | D | C + D |
Toplam | n1 | n2 | N=n1+n2 |
Test istatistikleri ve çıkartım
Eger Orneklem V1 ve Orneklem V2 ayni ozdes medyan değeri anakutleden gelmislerse; her bir orneklem için bilesik yigin medyaninin altinda olan gozlem sayisi bilesik medyanin ustunde bulunan gozlem sayisi ile ayni olacaktir. Bu demektir ki bu orneklemler tek bir anakutleden gelirlerse
- A = (½)n1 ve
- B = (½)n1
olacaktir. C ise A ile ayni degerde ve D ise B ile ayni degerde olacaktir. Birazdan gorulecegi gibi bu sınama icin kullanılacak "Fisher kesin sinamasi" veya "ki-kare sinamasi" olacaktir ve A, B, C ve D "gozlenen degerleri", bu degerler ise bu sinama için gereken "beklenen deger"leri verecektir.
Medyan testinde sifir hipotez iki orneklemin ayni medyani olan anakutleden geldigi sinanmaktadir; yani bunu matematiksel ifade edersek
H0: A = (½) n1 ve B = (½) n2
olarak yazilir. Karsit hipotez ise bunlarin dogru olmayacagidir; yani matematik ifade ile
H1: A ‡ (½) n1 ve B ‡ (½) n2
Mood (1950 say.394-395) makalesinde ispat edilmiştir ki eğer H0 A = (½) n1 ve B = (½) n2 ise A ve B için ornekleme olasılık dağılımı şu şekilde ifade edilen bir hipergeometrik dağılım gosteririr:
Bu nedenle, eger toplam orneklem buyuklugu (n1 + n2) gore degisik turlu sinama kullanilamasi gerekir:
- Eger toplam orneklem buyuklugu 20'den daha kucukse, yani
(n1 + n2) <= 20
veya dort hucrenin herhangi birinde "beklenen deger" 5in altinda ise H0 sifir hipotezini test etmek icin Fisher kesin sinamasi kullanilabilir.
- Eger toplam orneklem buyuklugu 20 ile 40 arasinda ise ve dort hucrenin hicbirinde "beklenen deger" 5'in altinda degilse
20 <= (n1 + n2) <= 40 ve her dort hucre de beklenen degerler 5'in ustundeyse
- Eger toplam orneklem buyuklugu 40'in ustundeyse yani
(n1 + n2) >= 40
o halde, serbestlik derecesi 1'e esit olan bir Pearson'un χ2s.d=1 sinamasi kullanilabilir.
Değerlendirme
Bu testin, örneklem veri büyüklüklerinin (n1 ve n1) orta ve büyük hacimde olması halinde etkinliği düşüktür, yani istatistiksel gücü azdır. Küçük hacimli örneklemeler için kullanılması hiç tavsiye edilmez. Bu nedenle araştırmalarda bu türlü hipotezli test için Wilcoxon-Mann-Whitney U testinin kullanılması tercih edilmelidir. Bu iki test türü arasındaki fark "medyan testi"nin her verinin birleşik medyana nispeten verinin pozisyonunu ele alması; buna karşıt "Wilcoxon-Mann-Whitney U-testi"nin her gözlemin veri sıralaması içindeki yerini ele almasıdır. Bunun için Wilcoxon-Mann-Whitney U sınanmasının gücü daha büyüktür.
Fakat, eğer örneklem verilerinin bir veya birkaçı çok aykırı (outlier) değer göstermekte ise Siegel ve Castellan (1988, say. 124) medyan testini kullanmaktan başka çare olmadığını bildirirler.
Dış bağlantılar
- İngilizce Wikipedia Median test maddesi 6 Aralık 2010 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişme: 5.2.2010).
- Mood, Alexander McFarlane (1950) Introduction to the Theory of Statistics. New York:McGraw-Hill Book Co., say,394−398 (İngilizce)
- Siegel, Sidney ve Castellan, N.John (1988), Nonparametric Statistics for the Behavioral Sciences, New York:McGraw-Hill, ISBN 978-0-07-057357-4 (İngilizce)
- The median test for independent samples. In: Sheskin, David (2007) Handbook of Parametric and Nonparametric Statistical Procedures. Boca Racon:CRC Press, Boca Raton ISBN 1-58488-814-8, S. 645/646 (İngilizce)
- J.D. Gibbons: Median Test, Brown–Mood. In: Encyclopedia of Statistical Sciences. John Wiley & Sons, 2006, (İngilizce)
- Friedlin, Boris ve Joseph L. Gastwirth (2005) Should the Median Test Be Retired From General Use? In: The American Statistician. American Statistical Association Cilt 54 say.161−16, (İngilizce)