İçeriğe atla

Friedman sıralamalı iki yönlü varyans analizi

İstatistik bilim dalı içinde Friedman sıralamalı iki yönlü varyans analizi sonradan çok tanınmış bir iktisatçı olan Amerikan Milton Friedman tarafından ortaya atılan bir parametrik olmayan istatistik sınamasıdır.[1][2][3]

Bu sınama için veriler k sayıda birbirine eşlenen örneklem halindedir. Örneğin aynı örneklem elemanları k değişik koşullar altında ölçülebilir veya k tane eleman bulup bunları değişik koşullar altına rastgele dağıtarak ölçümler yapmak suretiyle olabilir. Bu çeşit deneysel tasarım için benzer parametrik sınama tekrar edilir ölçümler varyans analizi adını taşır; Ayni zamanda tamamlanmış blok tasarımı adlı deneysel tasarım verileri için kullanılan parametrik Durbin testine benzer.

Bu sınamanın kullanılmış olduğu bilinen klasik pratik problemler arasında şunlar bulunur:

  • n sayıda şarap ekperi k sayıda değişik şarabı tadım yapmak suretiyle değerlendirmektedirler. Değişik ekperlerin değerlendirmeleri birbirlerine uygun mudur?
  • n sayıda kaynakçı k sayıda değişik kaynak makinesi kullanmaktadırlar ve yaptıkları kaynaklar merkezi kalite kontrolü tarafından tekrar kontrol edilmektedir. Diğerlerinden daha iyi kaynaklar ortaya çıkartan özel bir kaynak makinası bulunmakta mıdır?

Friedman sınaması için örneklem verisi n satırlı k sütunlu bir veri tablosu halindedir. Her bir satır bir elemanı veya hali veya bloku ve her bir sütun da bu satır nesnelerinin tabi oldukları değişik koşulları gösterir. Ancak analiz yapmak için bu veriler değiştirilip yeni bir tablo kurulur. Bu her bir satır için sıralama düzeni uygulanması suretiyle başarılır; yani her bir satır elemanının sütunları 1,....,k arasında bir sıra numarası verilerek sıralanır. Friedman sınamasının amacı, her değişik koşul için sıralama düzeninin tek bir anakütleden mi geldiğini yoksa ayrı anakütlelerden mi geldiğini incelemektir. Bu sınamayı sağlamak için her sütun için sıralama numaraları toplamlarının birbirine benzer mi yoksa birbirinden çok değişik mi olduğu incelenir.

Friedman sınaması sıralama düzeni kullanılması nedeniyle Kruskal-Wallis sıralamalı tek yönlü varyans analizi hesaplarına da benzemektedir..

Yöntem

  • Birbirlerine eşli olan n sayıda eleman veya hal için k değişken hakkında sayısal veri toplanır. Birbirine eşli olduğu için bu verilerin bulunması için özel deneysel tasarım uygulanması gerekmektedir. Bu tamamlanmıs blok tasarımı şeklinde olduğu için varyans analizi terimleri ile satırlara blok ismi verilir. Böylece n satırlı k sütunlu (bir matris şeklinde) bir veri tablosu elde edilir ve bu veri tablosunda da her bir hücrede tek bir sayısal ölçüm bulunur. Bu i blokunun tabi olduğu j koşuldan ortaya çıkan niceliksel ölçekli sayısal bir ölçümdür ve bütün veri ölçümleri aynı birimlerdedir.
  • Sınamanın amacı anakütlenin k sayıda koşula göre bölünmesinin etkili olup olmadığıdır. Eğer k sayıdakı koşul anakütlenin k bölüme ayrılmasına neden olursa eldeki örneklemde her koşula ait sıralamalar toplamı birbirinden değişik toplam verecektir. Eğer koşul değişmesi anakütle bölünmesine neden olmuyorsa, örneklem için her bir sütun birbirine eşit sıralama toplamı verecektir. Buna göre Friedman sınaması için sıfır hipotez ve karşıt hipotez şöyle verilir: H0 : k koşul etkilerinin tümü birbirine aynıdır yani koşul değişikliği anakütlenin bölünmesini sağlamaz. H1 : k koşullardan bazılarının etkileri birbirine eşittir ve diğerleri eşit olmayıp anakütlenin bölünmesini sağlarlar.
  • İlk yapılan hesaplar ile yeni bir veri tablosu elde edilir. Bu yeni tabloda n sayıda blok veya eleman satırı ve k sayıda da koşul sütunu bulunur. Her bir blok için koşullar sıralama düzenine konulmuştur yani yeni veri tablosunda her satırdaki veriler '1' den 'k'ye kadar sıra numarasıdır. Eğer ilk veri matrisinde bir blok satırı içinde beraberlikler bulunursa kullanılacak sıralama stratejisi beraberliklerin sıralama ortalamasının her beraberlik için kullanmasıdır; bu halde kesirler sıralama numaraları bulunabilir. Bu yeni tablodaki her eleman i=1,..,k ve j=1,...n için sıra numaraları olur.
  • Bu yeni veri tablosu kullanılarak şu ortalama ve toplam kare değerleri bulunur:
  1. (Sütun ortalaması)
  2. (Toplam ortalaması)
  3. (Toplam toplam-kare);
  4. (Hatalar toplam kare)
  • Toplam kare hesapları kullanılarak sınama istatistiği şu ifade olarak bulunur:

Burada dikkate değer bir nokta bu formüle göre hesaplanan Q istatistiğini verilerin sıralama düzenine koyuldukları zaman bulunan beraberlikler için hiç düzeltme istemediğidir.

  • En son aşamada sıfır hipotez hakkında sonuç çıkartılır:
  1. Eğer n veya k büyükse (yani n>15 veya k>4 ise), Q için olasılık dağılımı yaklaşık olarak (k-1) serbestlik dereceli bir ki-kare dağılımı gösterir. Bu halde p-değeri ile bulunur. Bulunan p-değeri anlamlılık düzeyi yüzdeleri (%5 veya %1) ile karşılaştırılır. Eğer p-değeri daha küçükse sıfır hipotez reddedilir.
  2. Eğer n veya k küçükse (yani n=<15 veya k=<4 ise), Friedman sınaması için hazırlanmış Q tabloları kullanılıp %5 veya %1 anlamlılık düzeyi değerleri bulunup bu tablo değerleri hesaplanmış Q değeri ile karşılaştırılır. Eğer hesaplanmış Q değeri daha büyükse sıfır hipotez reddedilir.
  3. Eğer sınama sonucu olarak sıfır hipotez reddedilirse, problem sonucu kesin değildir ve kesin hangi koşulların birlikte etki yaptıklarını incelemek için (post-hoc analiz) çoklu karşılıklar sınamaları kullanmak gereklidir.

İlişkili sınamalar

Eğer bu türlü deneysel tasarım iki kategorili veri ortaya çıkartırsa, Cochran sınaması kullanılması gereklidir.

Kaynakça

  1. ^ Friedman, Milton (1937) "The use of ranks to avoid the assumption of normality implicit in the analysis of variance", Journal of the American Statistical Association C.32 No.200 say.675–701 [1]
  2. ^ Friedman, Milton (1939) "A correction: The use of ranks to avoid the assumption of normality implicit in the analysis of variance" Journal of the American Statistical Association C.34 No.109 say.109 [2]
  3. ^ Friedman, Milton (1940) "A comparison of alternative tests of significance for the problem of m rankings", The Annals of Mathematical Statistics C.11 No.1 say.86–92 [3]

Dışsal kaynaklar

İlgili Araştırma Makaleleri

Olasılık kuramı ve istatistik bilim dallarında varyans bir rassal değişken, bir olasılık dağılımı veya örneklem için istatistiksel yayılımın, mümkün bütün değerlerin beklenen değer veya ortalamadan uzaklıklarının karelerinin ortalaması şeklinde bulunan bir ölçüdür. Ortalama bir dağılımın merkezsel konum noktasını bulmaya çalışırken, varyans değerlerin ne ölçekte veya ne derecede yaygın olduklarını tanımlamayı hedef alır. Varyans için ölçülme birimi orijinal değişkenin biriminin karesidir. Varyansın karekökü standart sapma olarak adlandırılır; bunun ölçme birimi orijinal değişkenle aynı birimde olur ve bu nedenle daha kolayca yorumlanabilir.

Regresyon analizi, iki ya da daha çok nicel değişken arasındaki ilişkiyi ölçmek için kullanılan analiz metodudur. Eğer tek bir değişken kullanılarak analiz yapılıyorsa buna tek değişkenli regresyon, birden çok değişken kullanılıyorsa çok değişkenli regresyon analizi olarak isimlendirilir. Regresyon analizi ile değişkenler arasındaki ilişkinin varlığı, eğer ilişki var ise bunun gücü hakkında bilgi edinilebilir. Regresyon terimi için öz Türkçe olarak bağlanım sözcüğü kullanılması teklif edilmiş ise de Türk ekonometriciler arasında bu kullanım yaygın değildir.

<span class="mw-page-title-main">Normal dağılım</span> sürekli olasılık dağılım ailesi

Normal dağılım, aynı zamanda Gauss dağılımı veya Gauss tipi dağılım olarak isimlendirilen, birçok alanda pratik uygulaması olan, çok önemli bir sürekli olasılık dağılım ailesidir.

Varyans Analizi istatistik bilim dalında, grup ortalamaları ve bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans Analizi kullanılmaktayken belirlenmiş bir değişkenin gözlemlenen varyansı farklı değişim kaynaklarına dayandırılabilen varyans bileşenine ayrılır. En basit şekliyle varyans analizi birkaç grubun ortalamalarının birbirine eşit mi eşit değil mi olduğunu sınamak için bir çıkarımsal istatistik sınaması olur ve bu sınama iki-grup için yapılan t-test sınamasını çoklu-gruplar için genelleştirir. Eğer, çoklu değişkenli analiz için birbiri arkasından çoklu iki-örneklemli-t-sınaması yapmak istenirse bunun I. tip hata yapma olasılığını artırma sonucu doğurduğu aşikardır. Bu nedenle, üç veya daha fazla sayıda ortalamaların ististiksel anlamlığının sınama ile karşılaştırılması için Varyans Analizleri daha faydalı olacağı gerçeği ortaya çıkmaktadır.

İstatistik biliminde normallik sınamaları bir seri parametrik olmayan istatistik sınamalar çeşididir. Normallik sınamalarının amacı verilmiş bir veri dizisinin normal dağılıma uygunluk iyiliğinin incelenmesidir. Bir sıra parametrik olmayan sınama geliştirilmiş bulunmasına rağmen birçok istatistikçi pratikte daha az kesin ve daha çok subjektif sağduyu ve ekpertiz gerektiren gösterim karşılaştırmalarını kullanmaktadır. Normallik sınamaları yalnız örneklem verilerinin doğrudan doğruya incelenmesinde kullanılmamakta, fakat özellikle ekonometrik analizlerde tek regresyon denklemi tahmininden sonra çıkan hataların normal olup olmadıklarının araştırılması için de çok kullanılmaktadırlar.

İstatistik bilim dalında, Jarque-Bera sınaması normal dağılımdan ayrılmayı ölçmek için kullanılan bir uygulama iyiliği ölçüsüdür. İlk defa bu sınamayi ortaya atan ekonometrici A.K.Bera ve C.M.Jarque adları ile anılmaktadır.

İstatistik biliminde önemli bir yeri olan parametrik olmayan istatistik parametrik olmayan istatistiksel modeller ve parametrik olmayan çıkarımsal istatistik, özellikle parametrik olmayan istatistiksel hipotez sınamalar ile ilgilenir. Parametrik olmayan yöntemler çok defa dağılımlardan serbest yöntemler olarak da anılmaktadır, çünkü verilerin bilinen belirli olasılık dağılımı gösteren kaynaklardan geldiği varsayımına dayanmamaktadır.

İstatistik bilim dalında Kruskal-Wallis sıralamalı tek yönlü varyans analizi, bağımsız gruplar arası anakütle medyanlarının eşitliğini sınamak amacı ile kullanılan bir parametrik olmayan istatistik sınamasıdır. Adı bu yöntemi ilk defa ortaya koyan William Kruskal ve W. Allen Wallis atıfla konmuştur. Matematiksel olarak ayrı olmakla beraber, tek yönlü varyans analizinin bir değişik şekli olarak görülebilir. Diğer bir görüşe göre Mann-Whitney U sınamasının 3 veya daha çoklu gruplara genişletilmesidir.

Mann-Whitney U testi niceliksel ölçekli gözlemleri verilen iki örneklemin aynı dağılımdan gelip gelmediğini incelemek kullanılan bir parametrik olmayan istatistik testdir. Aynı zamanda Wilcoxon sıralama toplamı testi veya Wilcoxon-Mann-Whitney testi) olarak da bilinmektedir. Bu testi ilk defa eşit hacimli iki örneklem verileri için Wilcoxon (1945) ortaya atmıştır. Sonradan, Mann and Whitney (1947) tarafından değişik büyüklükte iki örneklem problemleri analizleri için uygulanıp geliştirilmiştir.

İstatistik bilim dalında Yates süreklilik düzeltmesi veya Yates'in ki-kare sınamasıisimsel ölçekli' veya sırasal ölçekli iki değişken için gözlemlenmiş örneklem verileri bir bağımlılık tablosu halinde betimlenmiş iken, ilişkili iki değişken arasında bağımsızlık sınaması yapmak için bazı özel hallerde kullanılır.

İstatistik bilim dalı içinde tekrarlama sınaması iki değer (0-1) alan veya iki değer alma şekline dönüştürülmüş bir kategorik değişken için örneklem veri serisinin ardı ardına bir rastgele sıralama ile gelip gelmediğini sınamak için kullanılan bir parametrik olmayan istatistik yöntemidir.

İstatistik bilim dalında, Spearman'ın sıralama korelasyon katsayısı veya Spearman'ın rho, bu istatistiksel ölçüyü ilk ortaya atan İngiliz psikolog Charles Edward Spearman'a atfen adlandırılmıştır. Matematik notasyon olarak çok defa eski Yunan harfi ρ ile belirtilir. Bir parametrik olmayan istatistik ölçüsüdür ve iki değişken arasındaki bağımlılık, yani korelasyon, ölçüsü olarak bulunup kullanılır. Bu demektir ki Spearman'in rho (ρ) katsayısı iki değişken için çokluluklar dağılımı hakkında hiçbir varsayım yapmayarak, bu iki değişken arasında bulunan bağlantının herhangi bir monotonik fonksiyon ile ne kadar iyi betimlenebilineceğini değerlendirmek amaçlı incelemedir.

Shapiro-Wilk Testi, örneklemelerde temel alınan istatistiksel yığının normal dağıldığı bir hipotezin sağlamasını yapan istatistiksel bir hipotez testidir. Parametrik olmayan istatistikte normallik testleri arasında yer almaktadır. Shapiro-Wilk Testi, Amerikalı istatistikçi Samuel Shapiro ile Kanadalı istatistikçi Martin Wilk tarafından 1965 yılında ortaya konuldu. Normal dağılım için analizin grafiksel bilgisini bir anahtar şeklinde normal olasılık grafiği kullanarak özetlemeye yönelik tezlerinin sonucudur.

Anderson-Darling sınaması, istatistik bilim dalında, bir parametrik olmayan istatistik sınaması olup örneklem verilerinin belirli bir olasılık dağılımı gösterip göstermediğini sınamak için, yani uygunluk iyiliği sınaması için, kullanılmaktadır. Bu sınama ilk defa 1952'de Amerikan istatistikçileri T.W.Anderson Jr. ile D.A.Darling tarafından yayınlanmıştır. Bu sınama Kolmogorov-Smirnov sınamasının değiştirilmesi ve olasılık dağılımının kuyruklarına daha çok ağırlık verilmesi ile ortaya çıkartılmıştır.

İstatistik bilim dalında, Kolmogorov-Smirnov (K-S) sınaması parametrik olmayan istatistik olup Andrey Kolmogorov ve Nikolai Smirnov adlarındaki iki Sovyet bilim insanı tarafından oluşturulmuştur.

F-testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan parameterik çıkarımsal sınama yöntemidir. F-testi sıfır hipotezine göre gerçekte bir F-dağılımı gösteren sınama istatistiği bulunduğu kabul edilen hallerde, herhangi bir istatistiksel sınama yapma şeklidir. Bu çeşit bir istatistiksel sınama önce Ronald Fisher tarafından 1920'li yıllarda tek yönlü varyans analizi için ortaya atılıp kullanılmış ve sonradan diğer şekillerde F-dağılım kullanan sınamalar da ortaya atılınca, bu çeşit sınamalara genel isim olarak F-testi adı verilmesi Ronald Fisher anısına George W. Snecedor tarafından teklif edilip, istatistikçiler tarafından F-testi bir genel isim olarak kabul edilmiştir.

Tek anakütle ortalaması için parametrik hipotez sınaması veya tek-örneklem için sınama veya μ için sınama, bir rastgele örneklem ortalaması ile bu örneklemin çekilmiş olduğunu düşündüğümüz anakütlenin μ ile belirtilen "anakütle ortalaması" hakkında bir hipotez değeri belirtilmesinin anlamlı olup olmadığını araştırmamızı sağlayan parametrik hipotez sınamasıdır.

Ki-kare testi veya χ² testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan bazıları parametrik olmayan sınama ve diğerleri parametrik sınama yöntemidir. Bu çeşit istatistiksel sınamalarda test istatistiği için "örnekleme dağılımı", sıfır hipotez gerçek olursa ki-kare dağılımı gösterir veya sıfır hipotez "asimptotik olarak gerçek" olursa, eğer sıfır hipotez gerçekse ve eğer örnekleme hacmi istenilen kadar yeterli olarak büyük ise bir ki-kare dağılımına çok yakın olarak yaklaşım gösterir.

Pearson ki-kare testi nicel veya nitel değişkenler arasında bağımlılık olup olmadığının, örnek sonuçlarının belirli bir teorik olasılık dağılımına uygun olup olmadığının, iki veya daha fazla örneğin aynı anakütleden gelip gelmediğinin, ikiden fazla anakütle oranının birbirine eşit olup olmadığının ve çeşitli anakütle oranlarının belirli değere eşit olup olmadığının araştırılmasında kullanılır. İstatistik biliminin çıkarımsal istatistik bölümünde ele alınan iki-değişirli parametrik olmayan test analizlerinden olan ve ki-kare dağılımı'nı esas olarak kullanan ki-kare testlerinden en çok kullanılanıdır. İngiliz istatistikçi olan Karl Pearson tarafından 1900'da ortaya çıkartılmıştır.

Student'ın t-testi istatistik bilimi içinde incelenen, eğer sıfır hipotez desteklenmekte ise test istatistiğinin bir Student's t-dağılımı gösterdiği hallerde uygulanan çıkartımsal istatistiksel hipotez sınamasıdır. Verilen iki değişik grup sayısal verinin birbirinden anlamlı olarak farklılık gösterip göstermemesini sınamak için kullanılabilir. En sıkça uygulanma örnekleri eğer test istatistiği içinde bulunan ölçek parametre faktörünün değerinin bir normal dağılım gösterdiği bilinmekte olduğu hallerde tatbik edilmektedir. Eğer test istatistiği içinde bulunan ölçek parametresi faktörünün değeri bilinmiyorsa ve bu faktör veriye dayayan bir kestirim ile ifade edilmekte ise test istatistiği bir Student'ın t-dağılımı gösterebilir.