İçeriğe atla

Boş hipotez

Çıkarımsal istatistikte, boş hipotez, sıfır hipotez ya da sıfır hipotezi, beklenenin dışında bir durumun olmadığını, mesela gruplar ya da değişkenler arasında bir ilişki bulunmadığını veya ölçülen iki olgunun arasında bir fark olmadığını kabul eden genel bir önermedir.[1][2] Örneğin tıpta, denenen bir tedavinin etkisiz olması; hukukta, sanığın suçsuz olması birer boş hipotezdir. Modern bilim hipotezler üretip bunları test ederek ilerler; bir boş hipotezinin belirli bir güvenilirlik aralığında istatistiksel olarak kabul ya da reddedilmesi hipotez testleriyle yapılmaktadır.

"Boş hipotez" terimi ilk olarak İngiliz asıllı istatistikçi ve genetikçi Ronald Fisher tarafından tanımlanıp kullanılmıştır.[3][4]

Tipik olarak çıkarımsal analiz için "boş hipotez" yanında "alternatif hipotez" adı verilen bir ikiz hipotez ile birlikte ortaya konulur. "Alternatif hipotez" kavramı R.Fisher'in formülasyonunda bulunmamaktadır. Jerzy Neyman ve Egon Pearson adlı Amerikalı istatistikçiler tarafından "alternatif hipotez" kavramı geliştirilmiştir. "Alternatif hipotez"'in mantıken "boş hipotez"in aksi olması gerekli değildir. Eğer bir deney yapılırsa "alternatif hipotez" gerçek ise, bu deneylerin sonucunu tahmin edip edilemeyeceğinin olasılığına işaret eder. Günümüzde istatistiksel çıkarımsal analizlerde hem "boş hipotez" hem de "alternatif hipotez" kullanılması bir gelenek haline girmiştir.

Prensip

"Hipotez sınaması", toplanan verinin, boş hipotezin doğru olduğunu varsayarak, bunun ne olasılıkla mümkün olduğunu ölçerek yapılır. Veriler fazla olanak dışıysa (genellikle %5'inden daha az olasılıkla gözlemlenecek şekilde iseler) o zaman araştırıcı boş hipotezin yanlış olduğu çıkarımına varır. Şayet veriler boş hipotez ile çelişmiyorsa o zaman hiçbir çıkarıma varmaz. Bu halde boş hipotez doğru da olabilir yanlış da; veriler herhangi bir çıkarım yapabilmek için yeterli kanıt vermemektedir.

Mesela, belirli bir ilaç kalp krizi geçirme tesadüfünü düşürebiliyorsa; muhtemel boş hipotezler "bu ilaç kalp krizi geçirme olasılığını azaltmaz" veya "bu ilacın bir kalp krizi geçirme olasılığına bir etkisi yoktur" şeklinde olur. Hipotez sınaması, bir "denetimli deney (controlled experiment)" olarak çalışma grubundaki insanların yarısına bu ilacı vermek şeklinde olur. Veriler, ilacı alan insanlarda istatistiksel anlamlı bir değişiklik gösterirse, boş hipotez reddedilir.

Boş hipotez (H0) seçimi

Boş hipotezin seçimi ve (eğer "tek-kuyruklu sınama" ise) yönlenmesi hakkında fikirler hipotez sınaması için çok kritiktir. Bir yazı-tura deneyinde havaya atılan madeni paranın yansız olup olmadığı (yani çok sayıda yapılan deneylerde %50 defa 'yazı' gelip gelmediği) sorusunu sorduğumuzu kabul edelim. Bu deney için mümkün olan bir boş hipotez "bu madeni para 'yazı' gelmesi için yanlı değildir" olabilir. Deney madeni parayı tekrar tekrar çok defa havaya atıp ne tarafına (yazı mı tura mı) düştüğünü kaydetmektir. Madeni parayı 5 defa havaya atarsak mümkün olan bir sonuç 5 tane 'yazı' gelmesidir. Yapılmış olan boş hipoteze göre, bu verilerin ortaya çıkmış olması çok az olasıdır, çünkü eğer madeni para yansız" ise ide bu deneyde 5 'yazı' gelmesi olasılığı %3 olacaktır. Bu deney verisi, boş hipotezi yanıtlamamaktadır; bundan çıkarım, atılan madeni para yanlı olduğudur.

Alternatif olarak "madeni para yansızdır" boş hipotezi, 'yazı' sonuçları yanında 'tura' sonuçlarının da ele alınmasına izin verir. Bu halde 5 'yazı' veya 5 'tura' gelmesi olasılığı, (iki-kuyruklu sınama ile) %6'ya yükselir ve bu da boş hipotezi korumak için istatiksel olarak anlamlı olmamaktadır.[5]

Bu gösterim hipotez sınama tekniğinin tehlikesini ortaya koymaktadır; tek bir veri setini kullanarak değişik boş hipotezler verilerek sınamalar yapmak, verisetindeki onu alınamaz "gürültü" nedeniyle sınanan bazı "boş hipotezlerin" yanlış olarak reddedilmesine yol açacaktır.

Farkların sınaması

Ele alınan iki rastgele örnek içinde hem erkek hem de kadınlar rastgele bulunmakta ve örnek bunları bir test notu olduğunu farzedelim ve acaba "erkekler ortalama notu" ile "kadınlar ortalama notu" arasında bir fark olup olmadığını inceleyelim. Bir mümkün boş hipotez, "erkekler ortalama notu" ile "kadınlar ortalama notu"'nun aynı olduğudur; yani

H0: μ1 = μ2

burada

H0 = boş hipotez
μ1 = anakitle 1 (erkekler) ortalaması
μ2 = anakitle 2 (kadınlar) ortalaması.

Aynı anakitleden rastgele örneklem ile elde edilen veri-setinden daha güçlü boş hipotezler de ele alınabilirdi: örneğin notların varyanslarının eşitliği veya notların dağılımların belirli bir teorik olasılık dağılımı şekilde olması.

Terminoloji

Boş hipotezlerle bağlantılı terminoloji burada kısmen ele alınacaktır ve bunlar doğrudan istatistiksel hipotez sınaması konusu ile ilgilidirler. Fakat bu terimler daha ayrıntılı ve daha ince analizle de ele edilmektedir ve bunun için daha detaylı için bakılacak bilgiler istatistiksel hipotez sınaması maddesindedir.

Ele alınan ilk terimler

Basit hipotez
Anakitle dağılımını tüm olarak "tanımlayan" herhangi bir hipotez;
Bileşik hipotez
Anakitle dağılımını tüm olarak "tanımlamayan" herhangi bir hipotez

olur.

Nokta hipotez terimini tanımlamak çok karmaşık olabilir. Bu terim bütün mümkün anakitle dağılımlarının parametrik formda alınmaları halinde kullanılır. Bir "nokta hipotez" ya parametrelerin tümünün veya parametrelerin bir kısmı setinin tamamiyle gerçek olarak tanımlanması halleridir. Formel olarak, sadece parametrelerin bir kısmının tanımlanması halinde "bileşik hipotez" ortaya çıkar; ama buna rağmen pratikte "nokta hipotez" terimi çok kere yine de kullanılmaktadır. Özellikle bu halde hipotez sınaması öyle yapılanmıştır ki test istatistiğinin dağılımı (yani boş hipoteze uygun olarak verilmiş dağılımı), nokta boş hipoteze uygun olarak tanımlanmayan değerleri olmayan parametrelere bağlı olmaz.

Parametrelerin bir kısım altsetinde nokta hipotezlerin dikkatli olarak ele alınmaları, onların bileşik hipotez olacak incelenmesine yol açar. Böylelikle test istatistiğinin sabit kritik değeri için p-değeri ile nokta boş hipotezle tanımlanmayan parametrelerin birlikte değişmesi incelenir,

Bir tek-kuyruklu hipotez, bir parametrenin değerinin ya

  • belirlenen bir değerden yüksek olacağını veya
  • belirlenen bir değerin altında olacağını

tanımlayan bir hipotezdir.

Tıp alanında bir tek-kuyruklu hipotez örneği, halen bilinen bir tedavi olan A tedavisinin yeni bir tedavi olan B tedavisinden hiç olmazsa daha fena sonuç verip vermeyeceğinin incelenmesidir. Buna tekabül eden alternatif hipotez tedavi B'nin tedavi A'dan daha iyi tedavi sonucu vereceğidir. Burada eğer boş hipotez kabul edilirse (yani, tedavi A'nın tedavi B'ye kıyasla hiç olmazsa daha iyi olacağı hipotezinin reddedilmesi için hiçbir neden bulunmaması halinde), yapılacak çıkarım tedavi A'nın kullanılmasına devam edilmesidir. Eğer boş hipotez reddedilirse çıkarım, yeni tedavi B'nin gelecekte kullanılmasıdır; çünkü bu tedavinin A tedavisinden daha iyi olacağı hakkında kanıt bulunmaktadır. Bu halde sınama ve çıkarım A ve B tedavilerinin değişik olup olmadığı sorusunu inceleme ile yetinmemektedir; hipotez sınaması ile aranan kanıt, tedavi B'nin tedavi A'dan iyi olup olmadığı hakkındadır. Hipotezi "daha iyidir" şekilde karşılaştırma olarak formüle etme, hipoteze bir "yönleme sağlama" olarak ifade edilmektedir.

Boş hipotezin yönü

Ōrneklem büyüklüğü

Kaynakça

  1. ^ Everitt, Brian (1998). The Cambridge Dictionary of Statistics. Cambridge, UK New York: Cambridge University Press. ISBN 978-0521593465. 
  2. ^ "H0 ve H1 hipotezi nasıl kurulur". biistatistik.com. 8 Temmuz 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Şubat 2020. 
  3. ^ "Glossary". Statistics.berkeley.edu. 25 Temmuz 2010. 8 Mart 2013 tarihinde kaynağından arşivlendi. Erişim tarihi: 29 Temmuz 2010. 
  4. ^ Oxford Lügatı: 1935 R. A. Fisher, Design Experience ıı. 19, "Bu hipotezi 'boş hipotez' olarak adlandırabiliriz. Ama şu anlaşılmalıdır ki boş hipotez hiçbir zaman ispat edilemez veya kurulu prensip olarak kabul edilemez; fakat deneyler yapıldıkça kanıtılıp çürütülebilirler.
  5. ^ Bu deney veri seti sadece bir konuyu göstermek için kullanılmaktadır; gerçekte madeni parayı 5 defa havaya atma deneyi çok küçük sayıdadır ve bir sınama çıkarımı yapmak için yeterli değildir. 30 deneyimden daha az sayıda deney herhangi bir belirli sınama çıkarımının rizikosunu artırmaktadır.

Ayrica bakınız

  • İstatistiksel hipotez sınaması

Dış bağlantılar

İlgili Araştırma Makaleleri

Hipotez testi, bir hipotezin doğruluğunun istatistiksel bir güvenilirlik aralığında saptanması için kullanılan yöntem.

Varyans Analizi istatistik bilim dalında, grup ortalamaları ve bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans Analizi kullanılmaktayken belirlenmiş bir değişkenin gözlemlenen varyansı farklı değişim kaynaklarına dayandırılabilen varyans bileşenine ayrılır. En basit şekliyle varyans analizi birkaç grubun ortalamalarının birbirine eşit mi eşit değil mi olduğunu sınamak için bir çıkarımsal istatistik sınaması olur ve bu sınama iki-grup için yapılan t-test sınamasını çoklu-gruplar için genelleştirir. Eğer, çoklu değişkenli analiz için birbiri arkasından çoklu iki-örneklemli-t-sınaması yapmak istenirse bunun I. tip hata yapma olasılığını artırma sonucu doğurduğu aşikardır. Bu nedenle, üç veya daha fazla sayıda ortalamaların ististiksel anlamlığının sınama ile karşılaştırılması için Varyans Analizleri daha faydalı olacağı gerçeği ortaya çıkmaktadır.

<span class="mw-page-title-main">Betimsel istatistik</span>

Betimsel istatistik veya betimsel sayımlama istatistik bilim alanında üç temel kısmından biridir. Sayısal verilerinin derlenmesi, toplanması, özetlenmesi ve analiz edinilmesi ile ilgili istatistiktir.

İstatistiksel yığın yahut anakütle yahut evren kavramı istatistik biliminde belirli bir konudaki tüm değişkenlerin ölçülebilecek değerlerini ifade eder. Örneğin; Türkiye'de bulunan kişiler bir istatistiksel yığın değil, bunların mümkün sayısı bir istatistiksel yığın olmaktadır. Ankara'nın sayılması mümkün nüfusu ise Türkiye yığınından alınmış bir örneklemdir. Dikkat edilirse istatistiksel yığın kavramı ile, herhangi bir değişkeni içeren elemanlara değil, değişkenlerin mümkün olarak ölçülebilen veya sayılabilen içerik karakteristiğine atıf yapılmaktadır. Böylece istatistikte istatistiksel yığın ya ölçülebilir ya sayılabilir karekteristiktir ve sayısal olarak ortaya çıkabilmesi mümkündür.

İstatistiksel terimler, kavramlar ve konular listesi matematik biliminin çok önemli bir alt-bölümü olan istatistik biliminde içeriğinde bulunan konuların çok ayrıntılı olarak sınıflandırılması ile ortaya çıkarılmıştır. Milletlerarası İstatistik Enstitüsü bir enternasyonal bilim kurumu olarak istatistik bilimi konu ve terimlerini bir araya toplayıp 28 bilim dilinde karşılıklı olarak yayınlamıştır. Bu uğraşın sonucunun milletlerarası bilim camiasının büyük başarılarından biri olduğu kabul edilmektedir. Ortaya çıkartılan, istatistik bilimi içinde kullanılan ve bu bilime ait özel kavramların ve terimlerin listesi, tam kapsamlı olma hedeflidir ve böylelikle istatistik bilimi için bir Türkçe yol haritası yapılmış olmaktadır.

İstatistik biliminde normallik sınamaları bir seri parametrik olmayan istatistik sınamalar çeşididir. Normallik sınamalarının amacı verilmiş bir veri dizisinin normal dağılıma uygunluk iyiliğinin incelenmesidir. Bir sıra parametrik olmayan sınama geliştirilmiş bulunmasına rağmen birçok istatistikçi pratikte daha az kesin ve daha çok subjektif sağduyu ve ekpertiz gerektiren gösterim karşılaştırmalarını kullanmaktadır. Normallik sınamaları yalnız örneklem verilerinin doğrudan doğruya incelenmesinde kullanılmamakta, fakat özellikle ekonometrik analizlerde tek regresyon denklemi tahmininden sonra çıkan hataların normal olup olmadıklarının araştırılması için de çok kullanılmaktadırlar.

İstatistik biliminde önemli bir yeri olan parametrik olmayan istatistik parametrik olmayan istatistiksel modeller ve parametrik olmayan çıkarımsal istatistik, özellikle parametrik olmayan istatistiksel hipotez sınamalar ile ilgilenir. Parametrik olmayan yöntemler çok defa dağılımlardan serbest yöntemler olarak da anılmaktadır, çünkü verilerin bilinen belirli olasılık dağılımı gösteren kaynaklardan geldiği varsayımına dayanmamaktadır.

Mann-Whitney U testi niceliksel ölçekli gözlemleri verilen iki örneklemin aynı dağılımdan gelip gelmediğini incelemek kullanılan bir parametrik olmayan istatistik testdir. Aynı zamanda Wilcoxon sıralama toplamı testi veya Wilcoxon-Mann-Whitney testi) olarak da bilinmektedir. Bu testi ilk defa eşit hacimli iki örneklem verileri için Wilcoxon (1945) ortaya atmıştır. Sonradan, Mann and Whitney (1947) tarafından değişik büyüklükte iki örneklem problemleri analizleri için uygulanıp geliştirilmiştir.

Shapiro-Wilk Testi, örneklemelerde temel alınan istatistiksel yığının normal dağıldığı bir hipotezin sağlamasını yapan istatistiksel bir hipotez testidir. Parametrik olmayan istatistikte normallik testleri arasında yer almaktadır. Shapiro-Wilk Testi, Amerikalı istatistikçi Samuel Shapiro ile Kanadalı istatistikçi Martin Wilk tarafından 1965 yılında ortaya konuldu. Normal dağılım için analizin grafiksel bilgisini bir anahtar şeklinde normal olasılık grafiği kullanarak özetlemeye yönelik tezlerinin sonucudur.

Anderson-Darling sınaması, istatistik bilim dalında, bir parametrik olmayan istatistik sınaması olup örneklem verilerinin belirli bir olasılık dağılımı gösterip göstermediğini sınamak için, yani uygunluk iyiliği sınaması için, kullanılmaktadır. Bu sınama ilk defa 1952'de Amerikan istatistikçileri T.W.Anderson Jr. ile D.A.Darling tarafından yayınlanmıştır. Bu sınama Kolmogorov-Smirnov sınamasının değiştirilmesi ve olasılık dağılımının kuyruklarına daha çok ağırlık verilmesi ile ortaya çıkartılmıştır.

İstatistik bilim dalında, Kolmogorov-Smirnov (K-S) sınaması parametrik olmayan istatistik olup Andrey Kolmogorov ve Nikolai Smirnov adlarındaki iki Sovyet bilim insanı tarafından oluşturulmuştur.

Medyan testi, bir örneklem kümesinin belirli bir medyan değerine sahip olan bir anakütleden gelip gelmediğinin araştırılmasında kullanılan çift taraflı bir testtir. istatistik biliminde çıkarımsal istatistik alanında bir parametrik olmayan istatistik aletidir ve Pearson'un ki-kare testinın özel bir halidir. Mood'un-medyan-testi veya Westenberg-Mood-medyan-testi veya Brown-Mood-medyan-testi olarak da anılır.

F-testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan parameterik çıkarımsal sınama yöntemidir. F-testi sıfır hipotezine göre gerçekte bir F-dağılımı gösteren sınama istatistiği bulunduğu kabul edilen hallerde, herhangi bir istatistiksel sınama yapma şeklidir. Bu çeşit bir istatistiksel sınama önce Ronald Fisher tarafından 1920'li yıllarda tek yönlü varyans analizi için ortaya atılıp kullanılmış ve sonradan diğer şekillerde F-dağılım kullanan sınamalar da ortaya atılınca, bu çeşit sınamalara genel isim olarak F-testi adı verilmesi Ronald Fisher anısına George W. Snecedor tarafından teklif edilip, istatistikçiler tarafından F-testi bir genel isim olarak kabul edilmiştir.

Güven aralığı, istatistik biliminde bir anakütle parametresi için bir çeşit aralık kestirimi olup bir çıkarımsal istatistik çözüm aracıdır. Bir anakütle parametre değerinin tek bir sayı ile kestirimi yapılacağına, bu parametre değerini kapsayabilecek iki sayıdan oluşan bir aralık bulunur. Böylece güven aralıkları bir kestirimin ne kadar güvenilir olduğunu gösterir.

<span class="mw-page-title-main">Anlamlılık seviyesi</span>

Anlamlılık seviyesi, istatistik biliminde, İngiliz istatistikçi Ronald Fisher tarafından çıkartımsal hipotez sınama yönteminin kurulması sırasında kavramlaştırılmış özel bir manası olan bir bilimsel ve istatistiksel terimdir. İstatistiksel anlamlılık eğer bir sonucun gerçekleşme olasılık değerlendirilmesine göre olabilirliği düşük değil ise ortaya çıkar.

Tek anakütle ortalaması için parametrik hipotez sınaması veya tek-örneklem için sınama veya μ için sınama, bir rastgele örneklem ortalaması ile bu örneklemin çekilmiş olduğunu düşündüğümüz anakütlenin μ ile belirtilen "anakütle ortalaması" hakkında bir hipotez değeri belirtilmesinin anlamlı olup olmadığını araştırmamızı sağlayan parametrik hipotez sınamasıdır.

Ki-kare testi veya χ² testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan bazıları parametrik olmayan sınama ve diğerleri parametrik sınama yöntemidir. Bu çeşit istatistiksel sınamalarda test istatistiği için "örnekleme dağılımı", sıfır hipotez gerçek olursa ki-kare dağılımı gösterir veya sıfır hipotez "asimptotik olarak gerçek" olursa, eğer sıfır hipotez gerçekse ve eğer örnekleme hacmi istenilen kadar yeterli olarak büyük ise bir ki-kare dağılımına çok yakın olarak yaklaşım gösterir.

Pearson ki-kare testi nicel veya nitel değişkenler arasında bağımlılık olup olmadığının, örnek sonuçlarının belirli bir teorik olasılık dağılımına uygun olup olmadığının, iki veya daha fazla örneğin aynı anakütleden gelip gelmediğinin, ikiden fazla anakütle oranının birbirine eşit olup olmadığının ve çeşitli anakütle oranlarının belirli değere eşit olup olmadığının araştırılmasında kullanılır. İstatistik biliminin çıkarımsal istatistik bölümünde ele alınan iki-değişirli parametrik olmayan test analizlerinden olan ve ki-kare dağılımı'nı esas olarak kullanan ki-kare testlerinden en çok kullanılanıdır. İngiliz istatistikçi olan Karl Pearson tarafından 1900'da ortaya çıkartılmıştır.

Student'ın t-testi istatistik bilimi içinde incelenen, eğer sıfır hipotez desteklenmekte ise test istatistiğinin bir Student's t-dağılımı gösterdiği hallerde uygulanan çıkartımsal istatistiksel hipotez sınamasıdır. Verilen iki değişik grup sayısal verinin birbirinden anlamlı olarak farklılık gösterip göstermemesini sınamak için kullanılabilir. En sıkça uygulanma örnekleri eğer test istatistiği içinde bulunan ölçek parametre faktörünün değerinin bir normal dağılım gösterdiği bilinmekte olduğu hallerde tatbik edilmektedir. Eğer test istatistiği içinde bulunan ölçek parametresi faktörünün değeri bilinmiyorsa ve bu faktör veriye dayayan bir kestirim ile ifade edilmekte ise test istatistiği bir Student'ın t-dağılımı gösterebilir.

<span class="mw-page-title-main">Matematiksel istatistik</span> matematiksel yöntemlerin kullanıldığı olası istatistikler

Matematiksel istatistik, istatistiksel veri toplama tekniklerinin aksine, matematiğin bir dalı olan olasılık teorisinin istatistiğe uygulanmasıdır. Bunun için kullanılan özel matematiksel teknikler arasında matematiksel analiz, doğrusal cebir, stokastik analiz, diferansiyel denklemler ve ölçü teorisi bulunur.