İçeriğe atla

İstatistiksel yayılma ve sapma

İstatistiksel yayılma ve sapma (diğer adlarıyla istatistiksel değişkenlik veya varyasyon) istatistik biliminde bir sayısal kantitatif değişkenin ölçülen veya ölçülebilen değerlerinin veya bir olasılık dağılımı'nın genel olarak veya bir merkez noktasından yaygınlığı veya değişebilirliği özelliğidir. İstatistiksel yayılma veya sapma kantitatif değişkenlerin veya rassal değişkenlerin diğer bir özelliği olan merkezsel konum ölçüleri ile birlikte istatistikçilerin en çok ilgilendikleri konulardır. Genel olarak günlük hayatta en çok kullanılan yayılma ölçüsü açıklık olmakla beraber, bunun gayet bariz olarak aykırı değerlerden çok etkilenmesi dolayısı ile çeyrekler açıklığı, standart sapma ve varyans gibi diğer çok kullanılan yayılma ölçüleri geliştirilmiştir.

İstatistiksel yayılma

Eğer bir değişkenin tüm değerleri veya gözlemlenen değerleri birbirine özdeş olarak tek ve sadece tek bir değer alırsa istatistiksel yayılım sıfırdır. Değişken değerleri daha farklı değerler almaya başladıkça yayılma artmaya başlayarak yayılma ölçüsü sıfırdan başka değerler alır.

İstatistiksel yayılma ölçüleri için değişik sınıflama şekilleri vardır. Bir çeşit sınıflama yayılımın ölçümünün herhangi bir belli merkezsel noktaya referansla yapılıp yapılmadığına göredir. Açıklık veya çeyrekler açıklığı yayılım ölçüleri için herhangi bir diğer merkezsel noktaya referans verilmez. Ortalama mutlak sapma, standart sapma veya varyans için ise belirli bir merkezsel konum noktası, aritmetik ortalama, bir çapa noktası gibi bir referans noktası olur ve yayılma bu merkezsel referans noktasından sapmalar ile ölçülür.

Diğer bir sınıflama yayılma ölçülerinin ölçülme birimlerinin özelliklerine dayanır:

Bazı yayılım ölçleri boyutsuz olup ölçülmeleri için hiçbir birimi olmayıp sade ve sade hiçbir birimi olmayan bir saf sayı olarak ifade edilirler. Ama bu halde değişken verileri için boyut veya birim bulunmamaktadır. Bunlara örnek:

Yayılım ölçülerinin çok büyük bir kısmı için "yayılım ölçüsü değişkenin ölçüldüğü birim" ile ölçülür. Örneğin değişkenler metre veya dakika ile ölçülmekte ise yayılma ölçüleri de ayni birimde olan metre veya dakika ile ölçülürler. Bunlara örnek:

Bu türdeki istatistiksel yayılma ölçüleri sadece değişmez-birimli olmayıp değişmez konumluluk" ve boyuta göre doğrusal olma özelliklerine de sahiptirler. Böylece bir rassal değişken olan X için SX olan yayılım ölçüsü ise, bunun bir doğrusal dönüşümü olan

Y = aX + b    a ve b reel sayıları için

ifadesi için de yayılım ölçüsü

SY = |a|SX

olur.

Diğer istatistiksel yayılım ölçüleri değişken değerleri ile ilgili ama değişik birimlerdedir. Varyans standart sapmanın karesi olduğu için, değişkenin ölçme biriminin karesi birimindedir. Örneğin değişken metre ile ölçülürse varyans metre kare birimlidir. Bu nedenle varyansın konumu değişmez ama boyuta göre doğrusal değildir.

Bazı yayılma ölçüleri özel maksatlarla geliştirilmişlerdir. Bunlar arasında (saatler, osiloskoplar, amplifikatörler vb için) ve frekanslarla ilgili olarak "Allan varyansı" ve "Hadarmand varyansı" kayda değer yayılım ölçülerdir.

Kategorik değişkenler için yayılma ve sapmanın tanımlanıp ölçülmesi kavramsal olarak daha zor açıklanmaktadır ve genellikle fen ve teorik matematik temelli istatistikçiler tarafından kategorik veri yayılma ölçüleripek kullanılmamakta olduğu için geldirilmemişlerdir. Ancak kategorik veriler ile çok uğrasan sosyal bilimler içinde bu çeşit kalitatif yayılma ölçüleri geliştirilmiştir.

İstatistiksel yayılmanın kaynakları

Fiziksel bilimlerde yayılma ve değişkenlik ölçülme hatalarının rassal olmalarından doğmaktadır. Ölçüm enstrümanları hiçbir zaman hiç kusursuz ve tam mükemmel değildirler. Bu bilimlerde ölçülen kantitenin sabit ve hiç değişmediği genellikle kabul edilir ve böylece değişkenlik ölçümlerin arasında farklardan, yani gözlem hatası nedeni ile ortaya çıkar.

Bu varsayım biyolojik bilimlerde doğru değildir. Gözlemlenen fenomen incelenen fenomenin kendine özel karakteri dolayısıyla diğerlerinden farklıdır ve anakütlenin değişik üyeleri birbirlerinde çok genel ayrılıklar gösterirler.

Sosyal bilimlere gelince biyolojik bilimlerden çok daha fazla sayıda değişkenlik doğuran faktörler (tarihsel, fizyolojik, psikolojik, politik, sosyal) nedenlerle incelenen karakterlerde büyük yayılma gösterebilirler.

Dipnotlar

Ayrıca bakınız

Dış bağlantılar

  • İngilizce Wikipedia "Statistical dispersion" maddesi:[1] 4 Mart 2010 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişim: 7.5.2010)

İlgili Araştırma Makaleleri

Olasılık kuramı ve istatistik bilim dallarında varyans bir rassal değişken, bir olasılık dağılımı veya örneklem için istatistiksel yayılımın, mümkün bütün değerlerin beklenen değer veya ortalamadan uzaklıklarının karelerinin ortalaması şeklinde bulunan bir ölçüdür. Ortalama bir dağılımın merkezsel konum noktasını bulmaya çalışırken, varyans değerlerin ne ölçekte veya ne derecede yaygın olduklarını tanımlamayı hedef alır. Varyans için ölçülme birimi orijinal değişkenin biriminin karesidir. Varyansın karekökü standart sapma olarak adlandırılır; bunun ölçme birimi orijinal değişkenle aynı birimde olur ve bu nedenle daha kolayca yorumlanabilir.

Korelasyon, olasılık kuramı ve istatistikte iki rassal değişken arasındaki doğrusal ilişkinin yönünü ve gücünü belirtir. Genel istatistiksel kullanımda korelasyon, bağımsızlık durumundan ne kadar uzaklaşıldığını gösterir.

Varyans Analizi istatistik bilim dalında, grup ortalamaları ve bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans Analizi kullanılmaktayken belirlenmiş bir değişkenin gözlemlenen varyansı farklı değişim kaynaklarına dayandırılabilen varyans bileşenine ayrılır. En basit şekliyle varyans analizi birkaç grubun ortalamalarının birbirine eşit mi eşit değil mi olduğunu sınamak için bir çıkarımsal istatistik sınaması olur ve bu sınama iki-grup için yapılan t-test sınamasını çoklu-gruplar için genelleştirir. Eğer, çoklu değişkenli analiz için birbiri arkasından çoklu iki-örneklemli-t-sınaması yapmak istenirse bunun I. tip hata yapma olasılığını artırma sonucu doğurduğu aşikardır. Bu nedenle, üç veya daha fazla sayıda ortalamaların ististiksel anlamlığının sınama ile karşılaştırılması için Varyans Analizleri daha faydalı olacağı gerçeği ortaya çıkmaktadır.

<span class="mw-page-title-main">Betimsel istatistik</span>

Betimsel istatistik veya betimsel sayımlama istatistik bilim alanında üç temel kısmından biridir. Sayısal verilerinin derlenmesi, toplanması, özetlenmesi ve analiz edinilmesi ile ilgili istatistiktir.

<span class="mw-page-title-main">Standart sapma</span> İstatistikte bir varyasyon ölçüsü

Standart sapma, Olasılık kuramı ve istatistik bilim dallarında, bir anakütle, bir örneklem, bir olasılık dağılımı veya bir rassal değişken, veri değerlerinin yayılımının özetlenmesi için kullanılan bir ölçüdür. Matematik notasyonunda genel olarak, bir anakütle veya bir rassal değişken veya bir olasılık dağılımı için standart sapma σ ile ifade edilir; örneklem verileri için standart sapma için ise s veya s'

Açıklık, betimsel istatistikte bütün veri dizisini içinde kapsayan en küçük aralıktır. Bir veri dizisindeki ya en büyük değer ile en küçük değer arasındaki fark olarak ya da en küçük ve en büyük değerler aralığı verilerek ifade edilir. Örnek olarak; veri dizisi 5,9,1,23,12,23 ise dizisinin açıklığı ya 23-1=22 yahut da 1-23 olarak bildirilir. Bu nedenle açıklık için ölçüm birimi veri ölçüm biriminin aynısıdır.

İstatistiksel yığın yahut anakütle yahut evren kavramı istatistik biliminde belirli bir konudaki tüm değişkenlerin ölçülebilecek değerlerini ifade eder. Örneğin; Türkiye'de bulunan kişiler bir istatistiksel yığın değil, bunların mümkün sayısı bir istatistiksel yığın olmaktadır. Ankara'nın sayılması mümkün nüfusu ise Türkiye yığınından alınmış bir örneklemdir. Dikkat edilirse istatistiksel yığın kavramı ile, herhangi bir değişkeni içeren elemanlara değil, değişkenlerin mümkün olarak ölçülebilen veya sayılabilen içerik karakteristiğine atıf yapılmaktadır. Böylece istatistikte istatistiksel yığın ya ölçülebilir ya sayılabilir karekteristiktir ve sayısal olarak ortaya çıkabilmesi mümkündür.

İstatistik bilimi için mod bir veri kümesi içinde en sık görülen değerdir. Tepedeğer olarak da adlandırılır. Bazı kullanım alanlarında, özellikle eğitim alanında, örnek veriler çok kere puan olarak anılmakta ve örnek mod değerine ise mod puanı adı verilmektedir.

İstatistiksel terimler, kavramlar ve konular listesi matematik biliminin çok önemli bir alt-bölümü olan istatistik biliminde içeriğinde bulunan konuların çok ayrıntılı olarak sınıflandırılması ile ortaya çıkarılmıştır. Milletlerarası İstatistik Enstitüsü bir enternasyonal bilim kurumu olarak istatistik bilimi konu ve terimlerini bir araya toplayıp 28 bilim dilinde karşılıklı olarak yayınlamıştır. Bu uğraşın sonucunun milletlerarası bilim camiasının büyük başarılarından biri olduğu kabul edilmektedir. Ortaya çıkartılan, istatistik bilimi içinde kullanılan ve bu bilime ait özel kavramların ve terimlerin listesi, tam kapsamlı olma hedeflidir ve böylelikle istatistik bilimi için bir Türkçe yol haritası yapılmış olmaktadır.

Bir olasılık dağılımı bir rassal olayın ortaya çıkabilmesi için değerleri ve olasılıkları tanımlar. Değerler olay için mümkün olan tüm sonuçları kapsamalıdır ve olasılıkların toplamı bire eşit olmalıdır. Örneğin, bir rassal olay olarak madeni paranın tek bir defa havaya atılıp yere düşmesi ele alınsın; değerler 'yazı' veya 'tura' veya bunlar isimsel değişken ölçeğinde ifade edilirse 0 (yazı) veya 1 (tura) olur; olasılıklar ise her iki değer için ½ olacaktır. Böylece madeni bir paranın tek bir defa atılma olayı için iki değer ve ilişkili iki olasılık bu rassal olayın olasılık dağılımı olur. Bu dağılım ayrık olasılık dağılımıdır; çünkü sayılabilir şekilde ayrı ayrı sonuçlar ve bunlara bağlı olan pozitif olasılıklar vardır.

<span class="mw-page-title-main">Çarpıklık</span>

Çarpıklık olasılık kuramı ve istatistik bilim dallarında bir reel-değerli rassal değişkenin olasılık dağılımının simetrik olamayışının ölçülmesidir.

Olasılık kuramı ve bir dereceye kadar istatistik bilim dallarında basıklık kavramı 1905da K. Pearson tarafından ilk defa açıklanmıştır. Basıklık kavramı bir reel değerli rassal değişken için olasılık dağılımının, grafik gösteriminden tanımlanarak ortaya çıkarılan bir kavram olan, sivriliği veya basıklığı özelliğinin ölçümüdür. Basıklık kavramının ayrıntıları olasılık kuramı içinde geliştirilmiştir. Betimsel istatistik için bir veri setinin basıklık karakteri pek dikkate alınmayan bir özellik olarak görülmektedir. Buna bir neden parametrik çıkarımsal istatistik alanında basıklık hakkında hemen hemen hiçbir kestirim veya sınama bulunmamasındandır ve pratik istatistik kullanımda basıklık pek önemsiz bir karakter olarak görülmektedir. Belki de basıklık ölçüsünün elle hesaplanmasının hemen hemen imkânsızlığı buna bir neden olmuştur.

Matematik ve istatistik bilim dallarında, bir değişken için sayısal veri ölçülme ölçeği, o değişken içindeki nesneleri temsil eden sayısal değerlerin kapsadıkları bilgilerin özelliklerinin belirli bir şekilde sınıflandırmasıdır. İncelenen kavramlar Amerikan uygulamalı matematikçi Stanley Smith Stevens tarafından teklif edilip geliştirilmiştir. Stevens'in ölçekler kuramına göre bir değişken için sayısal veriler dört değişik şekilde ölçülme ölçeğine sahip olabilirler: isimsel, sırasal, aralıksal ve oransal. Bu değişik ölçeklere göre değişken verilerine, değişik matematik ve istatistiksel işlemlerin ve ölçümlerin değişik şekilde uygulanması gerekmektedir.

Betimsel istatistikte çeyrekler açıklığı sıralanmış bir veri dizisinin orta yarısını (%50'sini) kapsayan ve üçüncü dörtte birlik ve birinci dörtte birlik aralığını veya farkını gösteren bir istatistiksel yayılma ölçüsüdür. Birinci dörtte birlik sıralanmış veri dizisinin ilk %25'inden büyük ve üçüncü dörtte birlik sıralanmış veri dizisinin %25'inden daha küçük olduğu için, bu iki dörtte birlik arasında kalan veri yüzdesi %50'dir. Çeyrekler açıklığı ölçüm birimi veri ölçüm birimi ile aynıdır. İngilizcesi IQR'dir.

Olasılık kuramı ve istatistik bilim dallarında varyasyon katsayısı bir olasılık dağılımı için bir normalize edilmiş istatistiksel yayılma ölçüsüdür. Standart sapma, yani ,nin ortalamaya yani degerine orantisi olarak şöyle tanımlanır:

Olasılık kuramı ve istatistik bilimsel dallarında bir reel-değerli rassal değişken için k-ıncı ortalama etrafındaki moment, E beklenen değer operatörü olursa

μk := E[(X - E[X])k]

Matematik bilimi içinde moment kavramı fizik bilimi için ortaya çıkartılmış olan moment kavramından geliştirilmiştir. Bir bir reel değişkenin reel-değerli fonksiyon olan f(x)in c değeri etrafında ninci momenti şöyle ifade edilir:

F-testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan parameterik çıkarımsal sınama yöntemidir. F-testi sıfır hipotezine göre gerçekte bir F-dağılımı gösteren sınama istatistiği bulunduğu kabul edilen hallerde, herhangi bir istatistiksel sınama yapma şeklidir. Bu çeşit bir istatistiksel sınama önce Ronald Fisher tarafından 1920'li yıllarda tek yönlü varyans analizi için ortaya atılıp kullanılmış ve sonradan diğer şekillerde F-dağılım kullanan sınamalar da ortaya atılınca, bu çeşit sınamalara genel isim olarak F-testi adı verilmesi Ronald Fisher anısına George W. Snecedor tarafından teklif edilip, istatistikçiler tarafından F-testi bir genel isim olarak kabul edilmiştir.

Ki-kare testi veya χ² testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan bazıları parametrik olmayan sınama ve diğerleri parametrik sınama yöntemidir. Bu çeşit istatistiksel sınamalarda test istatistiği için "örnekleme dağılımı", sıfır hipotez gerçek olursa ki-kare dağılımı gösterir veya sıfır hipotez "asimptotik olarak gerçek" olursa, eğer sıfır hipotez gerçekse ve eğer örnekleme hacmi istenilen kadar yeterli olarak büyük ise bir ki-kare dağılımına çok yakın olarak yaklaşım gösterir.

<span class="mw-page-title-main">Matematiksel istatistik</span> matematiksel yöntemlerin kullanıldığı olası istatistikler

Matematiksel istatistik, istatistiksel veri toplama tekniklerinin aksine, matematiğin bir dalı olan olasılık teorisinin istatistiğe uygulanmasıdır. Bunun için kullanılan özel matematiksel teknikler arasında matematiksel analiz, doğrusal cebir, stokastik analiz, diferansiyel denklemler ve ölçü teorisi bulunur.