İçeriğe atla

Çeyrekler açıklığı

Betimsel istatistikte çeyrekler açıklığı sıralanmış bir veri dizisinin orta yarısını (%50'sini) kapsayan ve üçüncü dörtte birlik ve birinci dörtte birlik aralığını veya farkını (yani Q3 - Q1) gösteren bir istatistiksel yayılma ölçüsüdür. Birinci dörtte birlik sıralanmış veri dizisinin ilk %25'inden büyük ve üçüncü dörtte birlik sıralanmış veri dizisinin %25'inden daha küçük olduğu için, bu iki dörtte birlik arasında kalan veri yüzdesi %50'dir. Çeyrekler açıklığı ölçüm birimi veri ölçüm birimi ile aynıdır. İngilizcesi IQR'dir (Inter Quantile Range).

Çeyrekler açıklığı sıralanmış veriler içinde aşırı küçük veya aşırı büyük uçsal değerlerden (yani aykırı değerlerden) etkilenmez. Özel bir istatistiksel terimle çeyrekler açıklığı güçlü (en:robust) bir yayılma ölçüsüdür. Bu nedenle "istatistiksel yayılma" ölçüsü olarak açıklıka tercih edilir. Eğer alışılagelen yayılma ölçüsü olarak genellikle kullanılan varyans veya standart sapma için mevcut olduğu bilinen dezavantajlar (ilk akla gelen; çarpıklık) pratik bir problem için sorun yaratıyorsa (örneğin veri dizisi içinde çok aşırı bir veya birkaç aykırı değer varsa) çeyrekler açıklığı varyans ve standart sapma yerine tercih edilir.

Örnekler

Kutu grafiği (bir çeyrekler açıklığı ile) ve bir Normal N(0,1σ2) anakitle için olasılık yoğunluk fonksiyonu

Tablo şeklinde veri ile

i x[i] Dörttebirlik
1102
2104
3105Q1
4107
5108
6109Q2 (medyan)
7110
8112
9115Q3
10116
11118

Bu tabloda verilmiş veriler için "çeyrekler açıklığı"

= = 115 − 105 = 10.

Veriler bir basit kutu grafiği ile verilirse

                    |                   |
                    |       +-----+-+   | 
  o           *     |-------|     | |---|
                    |       +-----+-+   |
                    |                   | 
+---+---+---+---+---+---+---+---+---+---+---+---+   Sayılar ekseni
0   1   2   3   4   5   6   7   8   9   10  11  12

Bu veri seti için

  • birinci (alt) dörttebirlik (, ) = 7
  • medyan (ikinci dörttebirlik) (, ) = 8.5
  • üçüncü (üst) dörttebirlik (, ) = 9
  • çeyrekler açıklığı,

Olasılık dağılımları için çeyrekler açıklığı

Bir sürekli olasılık dağılımı için çeyrekler açıklığı, önce cebirsel olarak, olasılık yoğunluk fonksiyonunun integralini alarak hesaplanır ve bu yığmalı dağılım fonksiyonunu verir. Yığmalı dağılım fonksiyonunun negatif sonsuz (-∞) değerden 0,25 değere kadar bulunan integral değeri birinci dörttebirliği verir. Yine negatif sonsuzdan (-∞) 0,75 değere kadar alınan integral ise dörttebirliği verir. Bunlar formüller halinde şöyle ifade edilir:


Burada Q1: birinci dörttebirlik, Q3: üçüncü dörttebirlik ve CDF:yığmalı dağılım fonksiyonu olur.

Ancak birçok sürekli olasılık dağılımı için olasılık yoğunluk fonksiyonunun integralını almanın çok zor olduğu bilinmektedir. Herhangi başka bir yöntemle yığmalı dağılım fonksiyonu da bulunabilirse de uygun olur. Bir başka yöntem olarak yığmalı dağılım gösterimi kullanılabilir. Eğer gösterim çok iyi ve uygun ölçekli yapılmış ise, gösterimsel olarak da yığmalı olasılık dağılımı eğrisi üzerinde dörttebirlikler hemen bulunabilir.

Bazı olasılık dağılımları için medyan ve çeyrekler açıklığı değerleri şunlardır:

Dağılım Medyan Çeyrekler açıklığı
Normal dağılımμ 2 Φ−1(0.75) ≈ 1.349
Laplace dağılımıμ 2b ln(2)
Cauchy dağılımıμ

Ayrıca bakınız

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Monte Carlo yöntemi</span>

Monte Carlo benzetimi, çok sayıda tekrarlanan rastgele örneklemelerle, bir takım nümerik sonuçlar elde etmeye yarayan ve bilimin birçok alanında yaygın olarak kullanılan bir sayısal hesaplama algoritmaları sınıfıdır. Stokastik olayların yer aldığı fiziksel süreçlerin sonuçlarının tahmin edilmesinde çok kullanışlıdır. Ayrıca, rastgele seçimlerin işe yaradığı ve prensipte deterministik olan bir takım problemlerin çözümünde de kullanılmaktadır. Monte-Carlo yöntemi, Nicholas Constantine Metropolis (1915-1999) tarafından bulunmuştur ve Atom bombasının geliştirildiği Los Alamos Ulusal Labratuvarında, bombanın patlamasından sonra dağılan nötronlara karşı kalkan modellemek için Stanislaw Ulam tarafından günümüze taşınmıştır.

<span class="mw-page-title-main">Betimsel istatistik</span>

Betimsel istatistik veya betimsel sayımlama istatistik bilim alanında üç temel kısmından biridir. Sayısal verilerinin derlenmesi, toplanması, özetlenmesi ve analiz edinilmesi ile ilgili istatistiktir.

<span class="mw-page-title-main">Standart sapma</span> İstatistikte bir varyasyon ölçüsü

Standart sapma, Olasılık kuramı ve istatistik bilim dallarında, bir anakütle, bir örneklem, bir olasılık dağılımı veya bir rassal değişken, veri değerlerinin yayılımının özetlenmesi için kullanılan bir ölçüdür. Matematik notasyonunda genel olarak, bir anakütle veya bir rassal değişken veya bir olasılık dağılımı için standart sapma σ ile ifade edilir; örneklem verileri için standart sapma için ise s veya s'

Açıklık, betimsel istatistikte bütün veri dizisini içinde kapsayan en küçük aralıktır. Bir veri dizisindeki ya en büyük değer ile en küçük değer arasındaki fark olarak ya da en küçük ve en büyük değerler aralığı verilerek ifade edilir. Örnek olarak; veri dizisi 5,9,1,23,12,23 ise dizisinin açıklığı ya 23-1=22 yahut da 1-23 olarak bildirilir. Bu nedenle açıklık için ölçüm birimi veri ölçüm biriminin aynısıdır.

Bir olasılık dağılımı bir rassal olayın ortaya çıkabilmesi için değerleri ve olasılıkları tanımlar. Değerler olay için mümkün olan tüm sonuçları kapsamalıdır ve olasılıkların toplamı bire eşit olmalıdır. Örneğin, bir rassal olay olarak madeni paranın tek bir defa havaya atılıp yere düşmesi ele alınsın; değerler 'yazı' veya 'tura' veya bunlar isimsel değişken ölçeğinde ifade edilirse 0 (yazı) veya 1 (tura) olur; olasılıklar ise her iki değer için ½ olacaktır. Böylece madeni bir paranın tek bir defa atılma olayı için iki değer ve ilişkili iki olasılık bu rassal olayın olasılık dağılımı olur. Bu dağılım ayrık olasılık dağılımıdır; çünkü sayılabilir şekilde ayrı ayrı sonuçlar ve bunlara bağlı olan pozitif olasılıklar vardır.

<span class="mw-page-title-main">Weibull dağılımı</span> Olasılık dağılımı

Olasılık kuramı ve istatistik bilim dallarında Weibull dağılımı ) bir sürekli olasılık dağılımı olup olasılık yoğunluk fonksiyonu şöyle ifade edilir:

<span class="mw-page-title-main">Tekdüze dağılım (sürekli)</span> Özel olasılık dağılımı

Sürekli tekdüze dağılım (İngilizce: continuous uniform distribution) olasılık kuramı ve istatistik bilim dallarında, her elemanı, olasılığın desteklendiği aynı büyüklükteki aralık içinde bulunabilir, her sürekli değer için aynı sabit olasılık gösteren bir olasılık dağılımları ailesidir. Desteklenen aralık iki parametre ile, yani minimum değer a ve maksimum değer b ile, tanımlanmaktadır. Bu dağılım kısa olarak U(a,b) olarak anılır.

Betimsel istatistik içinde, bir dörttebirlik sıralanmış bir veri setini dört eşit parçaya bölen ve böylece her bir bölünen parçanın anakütle veya örneklem verilerinin 1/4ini kapsadığı, üç tane özetleme değeridir. Çeyreklik olarak da isimlendirilmektedir.

Olasılık teorisi ya da ihtimaliyet teorisi rastgele olayların analizi ile ilgilenen bir matematik bilim dalıdır. Olasılık teorisinin ana ögeleri rassal değişkenler, saf rassal süreçler, olaylar olarak sayılabilir. Bunlar ya tek olarak ortaya çıkan veya bir zaman dönemi içinde gelişerek meydana gelen, ilk görünüşü rastgele bir şekilde olan deterministik olmayan olayların veya ölçülebilir miktarların matematiksel soyutlamalarıdır. Bir madeni parayı yazı-tura denemesi için havaya atmak veya bir zarı atmak ile ortaya çıkan sonuç ilk bakışta rastgele bir olay olarak görülebilirse bile eğer birbirini takip eden rastgele olaylar tekrar tekrar ortaya çıkartılırsa incelenebilecek ve tahmin edilebilecek belirli bir istatistiksel seyir takip ettikleri görülecektir. Bu türlü olaylar ve sonuçların seyirlerini betimleyen iki temsilci matematiksel sonuç büyük sayılar yasası ve merkezsel limit teoremidir.

<span class="mw-page-title-main">Olasılık kütle fonksiyonu</span>

Olasılık kuramı bilim dalında bir olasılık kütle fonksiyonu bir ayrık rassal değişkenin olasılığının tıpatıp belli bir değere eşit olduğunu gösteren bir fonksiyondur. Olasılık kütle fonksiyonu, olasılık yoğunluk fonksiyonundan farklıdır; çünkü olasılık yoğunluk fonksiyonu yalnızca sürekli rassal değişkenler için tanımlanmış olup doğrudan doğruya olasılık değerini vermezler. Olasılık yoğunluk fonksiyonunun bir belli değer aralığı için integrali alınırsa bu rassal değişkenin belirlenen değer aralığı için olasılığını verir.

Olasılık kuramı ve istatistik bilim dallarında bir rassal değişken X için olasılık yoğunluk fonksiyonu bir reel sayılı sürekli fonksiyonu olup f ile ifade edilir ve şu özellikleri olması gereklidir:

Olasılık kuramı içinde herhangi bir rassal değişken için karakteristik fonksiyon, bu değişkenin olasılık dağılımını tüm olarak tanımlar. Herhangi bir rassal değişken X için, gerçel doğru üzerinde, bu fonksiyonu tanımlayan formül şöyle yazılır:

Olasılık kuramı ve istatistik bilim dallarında varyasyon katsayısı bir olasılık dağılımı için bir normalize edilmiş istatistiksel yayılma ölçüsüdür. Standart sapma, yani ,nin ortalamaya yani degerine orantisi olarak şöyle tanımlanır:

Betimsel istatistik içinde, bir yüzdebirlik sıralanmış bir veri serisini yüz eşit parçaya bölen ve böylece her bir bölünen parçanın anakütle veya örneklem verilerinin 1/100'ini kapsadığı, 99 tane özetleme değeridir. Betimsel istatistikte yüzdebirlikler çok popüler olarak kullanılır. Yüzdebirliklerin diğer bir popüler kullanım alanı, özellikle ABD'de, eğitimciler ve psikologlar tarafından uygulanan testlerin sonuçlarının normal eğri kestirimi uygulanarak yüzdeliklerin bulunması suretiyle verilmesidir.

Matematik bilimi içinde moment kavramı fizik bilimi için ortaya çıkartılmış olan moment kavramından geliştirilmiştir. Bir bir reel değişkenin reel-değerli fonksiyon olan f(x)in c değeri etrafında ninci momenti şöyle ifade edilir:

İstatistiksel yayılma ve sapma istatistik biliminde bir sayısal kantitatif değişkenin ölçülen veya ölçülebilen değerlerinin veya bir olasılık dağılımı'nın genel olarak veya bir merkez noktasından yaygınlığı veya değişebilirliği özelliğidir. İstatistiksel yayılma veya sapma kantitatif değişkenlerin veya rassal değişkenlerin diğer bir özelliği olan merkezsel konum ölçüleri ile birlikte istatistikçilerin en çok ilgilendikleri konulardır. Genel olarak günlük hayatta en çok kullanılan yayılma ölçüsü açıklık olmakla beraber, bunun gayet bariz olarak aykırı değerlerden çok etkilenmesi dolayısı ile çeyrekler açıklığı, standart sapma ve varyans gibi diğer çok kullanılan yayılma ölçüleri geliştirilmiştir.

<span class="mw-page-title-main">Kutu grafiği</span>

İstatistik biliminde kutu grafiği bir betimsel istatistik ve istatistiksel grafik aleti olup niceliksel verileri görsel şekilde özetlemek için Amerikan istatistikçi John Tukey tarafından kutu-ve-bıyıklar grafiği adı altında bir açıklayıcı veri analizi aracı olarak ilk defa geliştirilmiştir. Kutu grafiği, ilgili değişken bakımından veri için hazırlanan beş sayılı özetleme tablosu gösterimini grafiksel olarak özetlemeye dayalıdır. Özellikle merkezsel konum, yayılma, çarpıklık ve basıklık yönünden verileri özetlemek ve aykırı değerleri tanımlamak için kullanılır.

Çoklu sayılı özetleme tablosu betimsel istatistik alanında kullanılan genellikle aralıksal ölçekli veya oransal ölçekli tek değişirli sayısal verilerinin iki değişik tip özetleme araçlarıdır. Bu iki değişik özetleme araçları şunlardır:

  1. beş sayılı özetleme tablosu;
  2. yedi sayılı özetleme tablosu.

Medyan bir anakütle ya da örneklem veri serisini küçükten büyüğe doğru sıraladığımızda, seriyi ortadan ikiye ayıran değere denir. İstatistiğin bir alt dalı olan betimsel istatistikde medyan bir merkezsel konum ölçüsü kabul edilir.

<span class="mw-page-title-main">Parametre</span> belirli bir sistemi tanımlamak veya sınıflandırmak için yardımcı olabilecek herhangi bir özellik

Parametre belirli bir sistemi tanımlamak veya sınıflandırmak için yardımcı olabilecek herhangi bir özellik. Parametre, sistemi tanımlarken veya performansını, durumunu değerlendirirken yararlı veya kritik olan bir sistem unsurudur.