İçeriğe atla

Aralık tahmini

İstatistik ana bilim dalında, aralık tahmini örneklem verisi kullanarak bir değeri bilinmeyen anakütle parametresi için mümkün bulunan (veya doğru olma olasılığı yüksek) değerleri bir aralık halinde hesaplama işlemidir. Tahmin aralığı için kestirim aralığı terimi de kullanılmaktadır. Böylece aralık tahmini özellikle çıkarımsal istatistik ve bu konular içinde tahmin etme ve parametrik istatistik alanlarında önemli bir yer almaktadır.

Aralık tahmini türleri

Genel olarak, pratik istatistik kullanımı için de iki ana türde aralık tahmini bulunmaktadır:

  • Güven aralığı: Bu tip aralık tahmini olasılık açıklaması türleri içinde çoklulukçu taraftarları tarafından geliştirilmiş bir işlem tipi olup daha cok ya genis istatistik bilgisi olmayan pratik veri analizcileri ya da çokluluklu olasılık açıklamasına inananlar tarafından kullanılmaktadır. Güven aralığı yaklaşımı pratikte popüler olarak kullanılan çıkarımsal istatistiklerin başında gelmektedir.
  • Bayes tipi güvenilir aralık: Bayes-tipi olasılık açıklaması taraftarlarının bulup geliştirdikleri bir seri aralık tahmin kavramı ve pratik işlem teknikleridir.

Bu aralık tahmini türleri yanında diğer aralık tahmini yöntemleri de bulunmaktadır. Diğer birkaç aralık tahminlerinden ayrıntısız şöyle bahis edilebilir:

  • Tolerans aralıkları
  • Öngörü aralıkları . Özellikle regresyon ve zaman serisi ile öngörü konuları içinde kullanılır.
  • Fisher tarafından geliştirilmeye başlanan güvenilir sonuçlandırma (en:fiducial inference).
  • Bulanık mantık temelli ve şu anda istatistik bilimi içinde olduğu genel olarak kabul edilmeyen veri tahmin aralıkları.

Kritik tartışma

Aralık tahmini konusu, 20. yüzyılda başlayan ve halen devam etmekte olan, özellikle bilimsel kuramcılar arasında, büyük tartışmalara konu olmuştur. Bu tartışma temelini değişik objektif veya subjektif olasılık açıklamaları tartışmaları temeline bağlanabilirse de özel olarak aralık tahmini konusu için de bilimsel tartışma sürmektedir ve bunlar şöyle özetlenebilir:

  • Bildirilerde aralık tahminleri ortaya atıldıkları zaman, bunların bilimsel topluluk içinde (ve hatta genel toplum içinde) yaygınca kabul edilmiş tanımlanmalarının bilinmesi gerekir. Güven aralığı konusu birçok üniversite bölümü ve birçok ilim dalı mensupları tarafından İstatistiğe Giriş derslerinde incelenmekte ve mezuniyetten sonra (umulur ki) bilinip kullanılmaktadır. Ancak bunun ne kadar pratikte önemli olduğu hakkında bilimsel araştırmalar yapılmamıştır. Diğer taraftan bu türlü eğitimden geçmemişler (hatta geçmiş ama konuyu çok zor görüp üstünkörü öğrenmiş olanlar) için güven aralığı altındaki teorik açıklama, kavramsal olarak çok zor görülmektedir. Özel istatistik bölümü içinde spesialize olmayan öğrenciler tarafından üniversite ve okullarda kurs değerlendirme anketlerine verilen yanıtlar bu gerçeği tekrar ve tekrar ortaya çıkartmaktadır. Bazı istatikçilere göre bulanik mantık kurallarına göre ortaya atılan tahmin aralıkları kavramsal olarak en kolay anlaşılmakta; bunu Bayes tipi güvenilir aralık ve en sonra güven aralığı takip etmektedir.
  • Pratikte kullanımlarda tahmin aralığı kurmak için standart yordamlar açıkça ortaya atılmalı ve bu yordamlar kullanılırken veri çevresinin ve veri elde edilmesini teorik varsayımlara uygun olup olmadığının kontrol edilip sınaması gerekmektedir. Bu öneriye hem güven aralığı hem de Bayes tipi güvenilir aralıklari uygunluk göstermektedirler:
  • Güven aralığı kavramı araştırmacılara daha fazla esneklik sağlamakta olduğu bilinmektedir ve Bayes tipi güvenilir aralıka kıyasla daha çok alanlarda kullanılabilmektedir. Ancak parametrik olmayan istatistik kullanma alanlarında Bayes tipi güvenilir aralık çok daha uygunluk ve esneklik sağlamaktadir.
  • Bayes tipi güvenilir aralık önsel bilgileri hemen içinde kapsamakta ve veri değişmelerine göre sonuç değiştirme imkânı sağlamaktadır. Objektif olasılığı bağlı olan güven aralığı kavramı ise önsel bilgileri tamamıyle bir kenara atmakta ve veri veya bilgi değişmelerinin hiçbir şekilde analize girişine elverişli olmamaktadır.
  • Pratikte aralık tahminlerinin ortaya çıkartıldıktan sonra tahmin başarı veya başarısızlıklarını inceleyip sınamak gerekmektedir. Bu türlü değerleyici çalışmalar her iki yaklaşımda da ya yapılmamış ya da yapılmışsa bunlar bilimsel topluluk içinde önemsenmemiştir.
  • Aralık tahmin işlemlerinin performansini teorik olarak sınama yolları bulunmalıdır. Bunun önemi pratikte kullanılan aralık tahminlerinin çok kere çeşitli yaklaşımlara bağlı olduğunu göz altına alınacak daha da önemle ortaya çıkar. Güven aralık tahminleri için bu türlü teorik performans sınaması stokastik simulasyon kullanılarak kavramsal olarak kolayca yapılabilir. Ancak Bayes tipi güvenilir aralık tahminleri önsel bilgiye dayanamaktadır ve önsel bilgilerin teorik simülasyonu pratik olarak bir nerede ise imkânsız bir uğraştır. Bu nedenle Bayes tipi güvenilirlik araliki tahminlerinin uzun-dönem çokluluk özelliklerini incelemek gerekmektedir ve bunlar hiçbir-önsel-bilgi-olmama varsayımına dayanması gerekir.
  • Son olarak bir kolay olarak tanımlanan fakat çözümü zor olan bir özel ististiksel problem için bu iki yaklaşımın nasıl sonuçlar elde ettiği pratik olarak incelenebilir. Bu problem iki küçük hacimli örneklem verileri ile iki mümkün anakütle ortalaması arasındaki fark için bir aralık tahmini ile ilgilidir ve bu problem Behrens-Fisher problemi olarak adlandirılmaktadır. Bu problem için çoklulukçu olasılık açıklamaya dayanan güven aralığı tam kesin bir sonuç sağlayamamaktadır; bazı yaklaşım sonuçlar bulunmaktadır. Bayes-tipi olasılık açıklamasına dayanan Bayes-tipi güvenilirlik aralığı da basit bir formülle ifade edilebilen bir sonuç ortaya çıkarmamıştır; ancak biraz karmaşık olan modern bilgisayar işlemleri ile bir tam kesin sonuç çıkartmak imkânı bulunduğu bilinmektedir.

Bu tartışmadan anlaşıldığı gibi iki yaklaşımın da avantajları ve dezavantajları bulunmakta ve şu anda bile istatistik kuramcılar tartışma ile uğraştırmaktadır.

Ayrıca bakınız

Dışsal kaynaklar

  • Kendall, M.G. and Stuart, A. (1973). The Advanced Theory of Statistics. Vol 2: Inference and Relationship (3uncu Ed.). Griffin, London.

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">İstatistik</span>

İstatistik veya sayım bilimi, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir. Belirli bir amaç için verilerin toplanması, sınıflandırılması, çözümlenmesi ve sonuçlarının yorumlanması esasına dayanır. Bu çerçevede yapılan işlemlerin tümüne sayımlama denir.

<span class="mw-page-title-main">Student'in t dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında t-dağılımı ya da Student'in t dağılımı genel olarak örneklem sayısı veya sayıları küçük ise ve anakütle normal dağılım gösterdiği varsayılırsa çıkartımsal istatistik uygulaması için çok kullanılan bir sürekli olasılık dağılımıdır. Çok popüler olarak tek bir anakütle ortalaması için güven aralığı veya hipotez sınaması ve iki anakütle ortalamasının arasındaki fark için güven aralığı veya hipotez sınamasında, yani çıkarımsal istatistik analizlerde, uygulama görmektedir.

Regresyon analizi, iki ya da daha çok nicel değişken arasındaki ilişkiyi ölçmek için kullanılan analiz metodudur. Eğer tek bir değişken kullanılarak analiz yapılıyorsa buna tek değişkenli regresyon, birden çok değişken kullanılıyorsa çok değişkenli regresyon analizi olarak isimlendirilir. Regresyon analizi ile değişkenler arasındaki ilişkinin varlığı, eğer ilişki var ise bunun gücü hakkında bilgi edinilebilir. Regresyon terimi için öz Türkçe olarak bağlanım sözcüğü kullanılması teklif edilmiş ise de Türk ekonometriciler arasında bu kullanım yaygın değildir.

Örnekleme istatistikte belirli bir yığından alınan kümeyi ifade eder. Örneğin; Türkiye'deki tüm üniversite sayıları bir yığın iken Ankara'daki üniversite sayısı bu yığından alınmış bir örnektir.

Varyans Analizi istatistik bilim dalında, grup ortalamaları ve bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans Analizi kullanılmaktayken belirlenmiş bir değişkenin gözlemlenen varyansı farklı değişim kaynaklarına dayandırılabilen varyans bileşenine ayrılır. En basit şekliyle varyans analizi birkaç grubun ortalamalarının birbirine eşit mi eşit değil mi olduğunu sınamak için bir çıkarımsal istatistik sınaması olur ve bu sınama iki-grup için yapılan t-test sınamasını çoklu-gruplar için genelleştirir. Eğer, çoklu değişkenli analiz için birbiri arkasından çoklu iki-örneklemli-t-sınaması yapmak istenirse bunun I. tip hata yapma olasılığını artırma sonucu doğurduğu aşikardır. Bu nedenle, üç veya daha fazla sayıda ortalamaların ististiksel anlamlığının sınama ile karşılaştırılması için Varyans Analizleri daha faydalı olacağı gerçeği ortaya çıkmaktadır.

<span class="mw-page-title-main">Betimsel istatistik</span>

Betimsel istatistik veya betimsel sayımlama istatistik bilim alanında üç temel kısmından biridir. Sayısal verilerinin derlenmesi, toplanması, özetlenmesi ve analiz edinilmesi ile ilgili istatistiktir.

İstatistiksel yığın yahut anakütle yahut evren kavramı istatistik biliminde belirli bir konudaki tüm değişkenlerin ölçülebilecek değerlerini ifade eder. Örneğin; Türkiye'de bulunan kişiler bir istatistiksel yığın değil, bunların mümkün sayısı bir istatistiksel yığın olmaktadır. Ankara'nın sayılması mümkün nüfusu ise Türkiye yığınından alınmış bir örneklemdir. Dikkat edilirse istatistiksel yığın kavramı ile, herhangi bir değişkeni içeren elemanlara değil, değişkenlerin mümkün olarak ölçülebilen veya sayılabilen içerik karakteristiğine atıf yapılmaktadır. Böylece istatistikte istatistiksel yığın ya ölçülebilir ya sayılabilir karekteristiktir ve sayısal olarak ortaya çıkabilmesi mümkündür.

İstatistiksel terimler, kavramlar ve konular listesi matematik biliminin çok önemli bir alt-bölümü olan istatistik biliminde içeriğinde bulunan konuların çok ayrıntılı olarak sınıflandırılması ile ortaya çıkarılmıştır. Milletlerarası İstatistik Enstitüsü bir enternasyonal bilim kurumu olarak istatistik bilimi konu ve terimlerini bir araya toplayıp 28 bilim dilinde karşılıklı olarak yayınlamıştır. Bu uğraşın sonucunun milletlerarası bilim camiasının büyük başarılarından biri olduğu kabul edilmektedir. Ortaya çıkartılan, istatistik bilimi içinde kullanılan ve bu bilime ait özel kavramların ve terimlerin listesi, tam kapsamlı olma hedeflidir ve böylelikle istatistik bilimi için bir Türkçe yol haritası yapılmış olmaktadır.

Küme örneklemesi, istatistik bilimi içinde örneklem kullanılarak betimsel veya çıkarımsal sonuç istenirse, olasılıksal örnekleme kurallarına uyan bir örneklem veri toplama yöntemidir. Genel olarak bu yöntemin uygulanması anakütle içinde veri elamanları "kümeler" halinde ise uygundur. Bir küme içindeki elemanlar belirli karakter özelliklerine göre birbirine "yakınlık" göstermekte ve diğer anakütle içindeki kümelerden daha "uzak" olmaktadır. "Yakınlık" veya "uzaklık" genel olarak veri toplama para veya zaman maliyetine göre tanımlanır.

Bayes teoremi, olasılık kuramı içinde incelenen önemli bir konudur. Bu teorem bir rassal değişken için olasılık dağılımı içinde koşullu olasılıklar ile marjinal olasılıklar arasındaki ilişkiyi gösterir. Bu şekli ile Bayes teoremi bütün istatistikçiler için kabul edilir bir ilişkiyi açıklar. Bu kavram için Bayes kuralı veya Bayes savı veya Bayes kanunu adları da kullanılır.

İstatistik biliminde önemli bir yeri olan parametrik olmayan istatistik parametrik olmayan istatistiksel modeller ve parametrik olmayan çıkarımsal istatistik, özellikle parametrik olmayan istatistiksel hipotez sınamalar ile ilgilenir. Parametrik olmayan yöntemler çok defa dağılımlardan serbest yöntemler olarak da anılmaktadır, çünkü verilerin bilinen belirli olasılık dağılımı gösteren kaynaklardan geldiği varsayımına dayanmamaktadır.

Mann-Whitney U testi niceliksel ölçekli gözlemleri verilen iki örneklemin aynı dağılımdan gelip gelmediğini incelemek kullanılan bir parametrik olmayan istatistik testdir. Aynı zamanda Wilcoxon sıralama toplamı testi veya Wilcoxon-Mann-Whitney testi) olarak da bilinmektedir. Bu testi ilk defa eşit hacimli iki örneklem verileri için Wilcoxon (1945) ortaya atmıştır. Sonradan, Mann and Whitney (1947) tarafından değişik büyüklükte iki örneklem problemleri analizleri için uygulanıp geliştirilmiştir.

Güven aralığı, istatistik biliminde bir anakütle parametresi için bir çeşit aralık kestirimi olup bir çıkarımsal istatistik çözüm aracıdır. Bir anakütle parametre değerinin tek bir sayı ile kestirimi yapılacağına, bu parametre değerini kapsayabilecek iki sayıdan oluşan bir aralık bulunur. Böylece güven aralıkları bir kestirimin ne kadar güvenilir olduğunu gösterir.

<span class="mw-page-title-main">Anlamlılık seviyesi</span>

Anlamlılık seviyesi, istatistik biliminde, İngiliz istatistikçi Ronald Fisher tarafından çıkartımsal hipotez sınama yönteminin kurulması sırasında kavramlaştırılmış özel bir manası olan bir bilimsel ve istatistiksel terimdir. İstatistiksel anlamlılık eğer bir sonucun gerçekleşme olasılık değerlendirilmesine göre olabilirliği düşük değil ise ortaya çıkar.

Tek anakütle ortalaması için parametrik hipotez sınaması veya tek-örneklem için sınama veya μ için sınama, bir rastgele örneklem ortalaması ile bu örneklemin çekilmiş olduğunu düşündüğümüz anakütlenin μ ile belirtilen "anakütle ortalaması" hakkında bir hipotez değeri belirtilmesinin anlamlı olup olmadığını araştırmamızı sağlayan parametrik hipotez sınamasıdır.

Ki-kare testi veya χ² testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan bazıları parametrik olmayan sınama ve diğerleri parametrik sınama yöntemidir. Bu çeşit istatistiksel sınamalarda test istatistiği için "örnekleme dağılımı", sıfır hipotez gerçek olursa ki-kare dağılımı gösterir veya sıfır hipotez "asimptotik olarak gerçek" olursa, eğer sıfır hipotez gerçekse ve eğer örnekleme hacmi istenilen kadar yeterli olarak büyük ise bir ki-kare dağılımına çok yakın olarak yaklaşım gösterir.

Pearson ki-kare testi nicel veya nitel değişkenler arasında bağımlılık olup olmadığının, örnek sonuçlarının belirli bir teorik olasılık dağılımına uygun olup olmadığının, iki veya daha fazla örneğin aynı anakütleden gelip gelmediğinin, ikiden fazla anakütle oranının birbirine eşit olup olmadığının ve çeşitli anakütle oranlarının belirli değere eşit olup olmadığının araştırılmasında kullanılır. İstatistik biliminin çıkarımsal istatistik bölümünde ele alınan iki-değişirli parametrik olmayan test analizlerinden olan ve ki-kare dağılımı'nı esas olarak kullanan ki-kare testlerinden en çok kullanılanıdır. İngiliz istatistikçi olan Karl Pearson tarafından 1900'da ortaya çıkartılmıştır.

Student'ın t-testi istatistik bilimi içinde incelenen, eğer sıfır hipotez desteklenmekte ise test istatistiğinin bir Student's t-dağılımı gösterdiği hallerde uygulanan çıkartımsal istatistiksel hipotez sınamasıdır. Verilen iki değişik grup sayısal verinin birbirinden anlamlı olarak farklılık gösterip göstermemesini sınamak için kullanılabilir. En sıkça uygulanma örnekleri eğer test istatistiği içinde bulunan ölçek parametre faktörünün değerinin bir normal dağılım gösterdiği bilinmekte olduğu hallerde tatbik edilmektedir. Eğer test istatistiği içinde bulunan ölçek parametresi faktörünün değeri bilinmiyorsa ve bu faktör veriye dayayan bir kestirim ile ifade edilmekte ise test istatistiği bir Student'ın t-dağılımı gösterebilir.

<span class="mw-page-title-main">Matematiksel istatistik</span> matematiksel yöntemlerin kullanıldığı olası istatistikler

Matematiksel istatistik, istatistiksel veri toplama tekniklerinin aksine, matematiğin bir dalı olan olasılık teorisinin istatistiğe uygulanmasıdır. Bunun için kullanılan özel matematiksel teknikler arasında matematiksel analiz, doğrusal cebir, stokastik analiz, diferansiyel denklemler ve ölçü teorisi bulunur.

<span class="mw-page-title-main">Bayesci istatistik</span>

Bayesci istatistik, Bayesyen istatistik veya Bayesgil istatistik, olasılığın bir olaya olan inancın bir derecesini ifade ettiği Bayesci olasılık yorumuna dayanan istatistik alanındaki bir teoridir. İnanç derecesi, önceki deneylerin sonuçları gibi olay hakkında önceki bilgilere veya olayla ilgili kişisel inançlara dayanabilir. Bu, olasılığı birçok denemeden sonra bir olayın göreceli sıklığının sınırı olarak gören sıklıkçı olasılık yorumlaması gibi bir dizi başka olasılık yorumundan farklıdır.