İçeriğe atla

Dörttebirlik

Betimsel istatistik içinde, bir dörttebirlik sıralanmış bir veri setini dört eşit parçaya bölen ve böylece her bir bölünen parçanın anakütle veya örneklem verilerinin 1/4ini kapsadığı, üç tane özetleme değeridir. Çeyreklik olarak da isimlendirilmektedir.

Değişik dörttebirlikler

Böylece

  • Birinci dörttebirlik (matematik notasyonla Q1) = alt dörttebirlik = verinin en aşağı değerde olan %25ini kapsar ve bunu daha fazla değerde olan %75inden ayırır. = 25inci yüzdebirlik
  • İkinci dörttebirlik (matematik notasyonla Q2) = medyan = sıralanmış veriyi tam ortadan ikiye böler = 50inci yüzdebirlik
  • Üçüncü dörttebirlik (matematik notasyonla Q3) = üst dörttebirlik = verinin en aşağı değerde olan %75ini kapsar ve en üstden %25inden ayırır = 75inci yüzdebirlik

Üçüncü dörttebirlik ile birinci dörttebirlik arasındaki fark bir yayılım ölçüsü olarak kullanılıp, çeyrekler açıklığı veya dörttebirlikler açıklığı' diye anılır.

Dörttebirlik bulma

Önce veriler sıralama düzenine koyulur ve sıralanmış her bir veriye bir sıra numarası verilir. Sonra dörttebirlik bulmak için iki genel aşama vardır:

  1. Birinci aşamada sıralama düzeni içinde incelen dörtebirlik gösteren verilerinin sıra numarası bulunur. Bu sıra numarası kesirli da olabilir.
  2. İkinci aşamada bu sıra numarasına tekabül eden veri değeri bulunur. Eğer dorttebirlik sıra numarası kesirli ise bu interpolasyon yolu ile bulunur.

Sıralama düzeni içinde dörttebirlik sıra numarası

Eğer sıralanan verilerin sayısı tam dörde bölünemiyorsa, her dörttebirlik iki belirlenen sıra numarası taşıyan değerler arasında olacaktır. Ne yazıktır ki, bu arada interpolasyon ile hangi değerin bulunacağı hakkında istatistikçiler arasında bir mutabakata varılamamıştır.[1]

Dörttebirlik değerlerinin bulunması şu hesap basamakları kullanılabilinir:

  • Anakütle veya örneklem verileri önce sıralanırlar ve bir sıralama düzeni her bir veri için bulunur yani her bir verinin sıra numarası bilinir.
  • Alt dörttebirlik, medyan (ikinci dörttebirlik) ve üst dörtebirlik için sıra numarası şu formüle göre bulunur
Pinci Q = P/Q (N+1)

Dörttebirlikler için Q=4 olur; N = veri sayısıdır; eğer P=1 ise (P/Q=1/4) alt dörttebirlik; eğer P=2 ise (P/Q=2/4=1/2) medyan ve eğer P=3 ise (P/Q=3/4) üst dörttebir olur. Bu formüle göre her bir dörttebirlik için bulunan ham sıra numarası kesirli olabilir.

Sıralı veri dizisi içinde dörttebirlik değerleri

Her bir dörttebirlik için bulunan sıra numarası kesirsiz ise hemen o sıra numarasına tekabül eden veri dörttebirlik değeri olarak bulunur.

Eğer dörttebirlik sıra numarası kesirli ise enterpolasyon yapmak gerekir:

  • Önce kesirli sıra numarasında tam sayı atılıp sadece kesir bulunur.
  • Sonra da bulunan kesirli sıra numarasının kesiri atılıp kalan tam sayı alt sıra numarası olur ve buna 1 eklenerek üst sıra numarası hesaplanır.
  • Dörttebirlik, bulunan üst sıra numarasına tekabül eden veri ile alt sıra numarasına tekabül eden veri arasındaki farkın bulunan kesir ile çarpılması ile edilen değerin, alt sıra numarasına tekabül eden değere eklenmesi ile bulunur.

Örnek 1: Bu sefer bir diğer örneklem için gözlem sayısı 41 olsun. Bu 41 veri (N=41) sıraya dizilsin ve verilere bir sıralama düzeni verilsin yani her bir veriye sıra numarası verilsin.
- Alt dörttebirlik bulmak için:

 Sıra numarası = (P/Q)(N+1) = (1/4)(41+1) = 10,5  (kesirli)
 Kesir kısmı 0,5   
 Alt sıra numarası 10. Tekabül eden sıralanmış veri 25  
 Üst sıra numarası 11 ve tekabül eden veri 29
 Birinci dörttebirlik Q1 = 10,5 sırada veri = 25 + (0,5)(29-25) = 27 

- İkinci dörttebirlik yani medyan bulmak için:

 Sıra numarası = (P/Q)(N+1) = (2/4)(41+1) = 21 (kesirsiz)
 Medyan = 21inci sıra numaralı veri 54 

- Üst dorttebirlik bulmak için:

 Sıra numarası = (P/Q)(N+1) = (3/4)(41+1) = 31,5 (kesirli)   
 Kesir kısmı 0,5
 Alt sıra numarası 31  Tekabül eden sıralanmış veri değeri 63  
 Üst sıra numaralı 32  Tekabül eden sıralanmış veri değeri 67
 Üçüncü dörttebirlik Q3 = 63 + (0,5)(67-63) = 65

Başka türlü yapılan hesaplamalarda önce medyan değeri bulunup; sonra bu değer atılıp, kalan iki taraf yine ikiye bölünmektedir. Bu türlü ortaya çıkan dörttebirlikler değişik olabilmektedir.

Çokluk dağılımı içinde dörttebirlik

Eğer veri değerleri gruplanmış ve çokluk dağılımları olarak verilmişler ise, enterpolasyon kullanarak alt dörttebirlik ve üst dörttebirlik bulunabilir.

Alt dörttebirlik için sıralama düzeni içinde N/4 sıra numarasının içine düştüğü sınıf bulunur ve şu değerler bulunur:

  • L1: alt dörttebirlik sınıfın alt değeri;
  • c1: alt dörttebirlik sınıfın aralığı;
  • f1: alt dörttebirlik sınıfın frekansı;
  • d1: alt dörttebirlik sınıftan bir önceki sınıfın yiğmali frekansı.

Sonra entrepolasyon ile ortaya çıkartılan şu formül kullanılır:

Alt dörttebirlik

burada Q1: alt dörttebirlik ve N: toplam birim sayısıdır.

Üst dörttebirlik için 3N/4 sıra numarasının içine düştüğü sınıf bulunur ve şu değerler elde edilir:

  • L3: üst dörttebirlik sınıfın alt değeri;
  • c3: üst döorttebirlik sınıfın aralığı;
  • f3: üst dörttebirlik sınıfın frekansı;
  • d3: üst dörttebirlik sınıftan bir önceki sınıfın yiğmalı frekansı.

Entrepolasyon ile ortaya çıkartılan formül şudur:

Üst dörttebirlik :

burada Q3: üst dörttebirlik ve N: toplam birim sayısıdır.

Dörttebirlikler ve kutu gösterimi

Bu ikinci türlü hesaplama özellikle 1970'li yıllarda Amerikan istatistikçi Tukey tarafından geliştirilen Açıklayıcı veri analizi yaklaşımlarda kullanılmaktadır. Bu istatistikçi özel (bazen gülünç) terim isimleri bulmakla da tanınmıştır. Dörttebirlikleri, özellikle geliştirdiği kutu ve bıyıklar gösterimi için kullanır. Kutu ve bıyıklar gösterimi bir ölçekli dikey veya yatay doğru üzerinde kurulur. Doğrunun en alt ve en üst uçları verinin en küçük ve en büyük değerleridir. Bir kutu doğrunun üstünde ortada kurulur. Birinci ve üçüncü dörttebirlikler kutunun alt ve üst kenarlarını ifade ettikleri için Tukey (ve yandaşları)tarafından alt menteşe ve üst menteşe adı ile anılırlar. Medyan kutunun içinde veri dizi ortası olarak işaret edilir. Bu gösterimde kutu çeyrekler açıklığı olarak veri yayılımını; doğru veri açıklığını yani genel yayılımı; medyan da ortalama konumu gösterir.

Ayrıca bakınız

Dipnotlar

  1. ^ "Arşivlenmiş kopya". 8 Mart 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 31 Mart 2008. 

Dış bağlantılar

İlgili Araştırma Makaleleri

Matematikte reel sayılar kümesi, Fransızca réel “gerçek” den gelmektedir. Oranlı sayılar kümesinin evrim sürecinden elde edilen bir varsayım kombinasyonudur. Reel sayılar kümesi sembolüyle gösterilir.

<span class="mw-page-title-main">Rasyonel sayılar</span>

Rasyonel sayılar, iki tam sayı arasındaki oranı temsil eden, bir pay p ve sıfırdan farklı bir payda q olmak üzere, bir bölme işlemi veya kesir formunda ifade edilebilen sayıları tanımlar. Örneğin, rasyonel bir sayı olarak kabul edilir, bu kapsamda her tam sayı da rasyonel sayılar kategorisindedir. Rasyonel sayılar kümesi, çoğunlukla kalın harf biçimindeki Q veya karatahta vurgusu kullanılarak şeklinde ifade edilir.

<span class="mw-page-title-main">Betimsel istatistik</span>

Betimsel istatistik veya betimsel sayımlama istatistik bilim alanında üç temel kısmından biridir. Sayısal verilerinin derlenmesi, toplanması, özetlenmesi ve analiz edinilmesi ile ilgili istatistiktir.

İstatistik bilimi için mod bir veri kümesi içinde en sık görülen değerdir. Tepedeğer olarak da adlandırılır. Bazı kullanım alanlarında, özellikle eğitim alanında, örnek veriler çok kere puan olarak anılmakta ve örnek mod değerine ise mod puanı adı verilmektedir.

İstatistik biliminde normallik sınamaları bir seri parametrik olmayan istatistik sınamalar çeşididir. Normallik sınamalarının amacı verilmiş bir veri dizisinin normal dağılıma uygunluk iyiliğinin incelenmesidir. Bir sıra parametrik olmayan sınama geliştirilmiş bulunmasına rağmen birçok istatistikçi pratikte daha az kesin ve daha çok subjektif sağduyu ve ekpertiz gerektiren gösterim karşılaştırmalarını kullanmaktadır. Normallik sınamaları yalnız örneklem verilerinin doğrudan doğruya incelenmesinde kullanılmamakta, fakat özellikle ekonometrik analizlerde tek regresyon denklemi tahmininden sonra çıkan hataların normal olup olmadıklarının araştırılması için de çok kullanılmaktadırlar.

Matematik ve istatistik bilim dallarında, bir değişken için sayısal veri ölçülme ölçeği, o değişken içindeki nesneleri temsil eden sayısal değerlerin kapsadıkları bilgilerin özelliklerinin belirli bir şekilde sınıflandırmasıdır. İncelenen kavramlar Amerikan uygulamalı matematikçi Stanley Smith Stevens tarafından teklif edilip geliştirilmiştir. Stevens'in ölçekler kuramına göre bir değişken için sayısal veriler dört değişik şekilde ölçülme ölçeğine sahip olabilirler: isimsel, sırasal, aralıksal ve oransal. Bu değişik ölçeklere göre değişken verilerine, değişik matematik ve istatistiksel işlemlerin ve ölçümlerin değişik şekilde uygulanması gerekmektedir.

İstatistik bilim dalı içinde sıralama düzeni veri dizisinin özel bir şekle dönüştürülmesini kapsar. Bir örneklem veya anakütle içinde bulunan her bir sayısal elemana bir sıralama numarası verilerek öyle bir sıralanır ki bu sıralanma sonucunda herhangi bir iki eleman ele alınırsa iki elemandan hangisinin sıralama düzeninde önde geldiği bilinebilir. Yani sıralama düzeni bir sayı dizisi olup bir örneklem veya anakütledeki her bir elemana bir sıralama numarası verilmesi ile elde edilir. Matematik terimi ile bu işlem nesnelerin tüm ön-sıralanması veya zayıf sıralanması olarak adlandırılır. Bu tüm sıralanma değildir, çünkü iki veya daha çok sayıda değişik elamanın beraber aynı sırada olmalarına imkân sağlanmaktadır. Ayrıca sayısal veriler bir özelliğe göre tüm olarak sıralanmamaktadır; yani veri elemanlarının veri dizisi içindeki yerleri değişmemektedir. Ama sıralama düzeni için her veri elemanına verilen sıra numaraları tüm sıralanma halindedir.Böylece sonradan bu sıra numaraları kullanılarak veri elemanlarını tüm sıralamaya sokmak kolay bir işlem olur. Örneğin, bir jeolojik örneklem elemanları jeoloğun uygun gördüğü kaya parçaları olsun; elaman ağırlığına göre sıra numaraları verilip örneklemdeki gerçek elemanlar hiç gerçekte sıraya sokulmadan, örnek ağırlıkları için sıralama düzen sayıları kullanılarak istatistiksel analizler yapılabilir. Böylece elde bulunan örneklemin kapsadığı, ölçülebilmesi çok karmaşık ve masraflı olabilen bir değişken için incelemeyi kolaylaştırmak mümkün olabilir. Örneklem elemanlarını sıralama düzenine sokan sıra numaraların istatistiksel incelenmesi, parametrik olmayan istatistik alanı kapsamı içine girmekte ve bu tip istatistik analiz de pratikte de önemli bir rol oynamaktadır.

İstatistik bilim dalında Kruskal-Wallis sıralamalı tek yönlü varyans analizi, bağımsız gruplar arası anakütle medyanlarının eşitliğini sınamak amacı ile kullanılan bir parametrik olmayan istatistik sınamasıdır. Adı bu yöntemi ilk defa ortaya koyan William Kruskal ve W. Allen Wallis atıfla konmuştur. Matematiksel olarak ayrı olmakla beraber, tek yönlü varyans analizinin bir değişik şekli olarak görülebilir. Diğer bir görüşe göre Mann-Whitney U sınamasının 3 veya daha çoklu gruplara genişletilmesidir.

İstatistik bilim dalı içinde Friedman sıralamalı iki yönlü varyans analizi sonradan çok tanınmış bir iktisatçı olan Amerikan Milton Friedman tarafından ortaya atılan bir parametrik olmayan istatistik sınamasıdır.

Mann-Whitney U testi niceliksel ölçekli gözlemleri verilen iki örneklemin aynı dağılımdan gelip gelmediğini incelemek kullanılan bir parametrik olmayan istatistik testdir. Aynı zamanda Wilcoxon sıralama toplamı testi veya Wilcoxon-Mann-Whitney testi) olarak da bilinmektedir. Bu testi ilk defa eşit hacimli iki örneklem verileri için Wilcoxon (1945) ortaya atmıştır. Sonradan, Mann and Whitney (1947) tarafından değişik büyüklükte iki örneklem problemleri analizleri için uygulanıp geliştirilmiştir.

İstatistik bilim dalı içinde tekrarlama sınaması iki değer (0-1) alan veya iki değer alma şekline dönüştürülmüş bir kategorik değişken için örneklem veri serisinin ardı ardına bir rastgele sıralama ile gelip gelmediğini sınamak için kullanılan bir parametrik olmayan istatistik yöntemidir.

İstatistik bilim dalında, Spearman'ın sıralama korelasyon katsayısı veya Spearman'ın rho, bu istatistiksel ölçüyü ilk ortaya atan İngiliz psikolog Charles Edward Spearman'a atfen adlandırılmıştır. Matematik notasyon olarak çok defa eski Yunan harfi ρ ile belirtilir. Bir parametrik olmayan istatistik ölçüsüdür ve iki değişken arasındaki bağımlılık, yani korelasyon, ölçüsü olarak bulunup kullanılır. Bu demektir ki Spearman'in rho (ρ) katsayısı iki değişken için çokluluklar dağılımı hakkında hiçbir varsayım yapmayarak, bu iki değişken arasında bulunan bağlantının herhangi bir monotonik fonksiyon ile ne kadar iyi betimlenebilineceğini değerlendirmek amaçlı incelemedir.

Betimsel istatistikte çeyrekler açıklığı sıralanmış bir veri dizisinin orta yarısını (%50'sini) kapsayan ve üçüncü dörtte birlik ve birinci dörtte birlik aralığını veya farkını gösteren bir istatistiksel yayılma ölçüsüdür. Birinci dörtte birlik sıralanmış veri dizisinin ilk %25'inden büyük ve üçüncü dörtte birlik sıralanmış veri dizisinin %25'inden daha küçük olduğu için, bu iki dörtte birlik arasında kalan veri yüzdesi %50'dir. Çeyrekler açıklığı ölçüm birimi veri ölçüm birimi ile aynıdır. İngilizcesi IQR'dir.

Betimsel istatistik içinde, bir yüzdebirlik sıralanmış bir veri serisini yüz eşit parçaya bölen ve böylece her bir bölünen parçanın anakütle veya örneklem verilerinin 1/100'ini kapsadığı, 99 tane özetleme değeridir. Betimsel istatistikte yüzdebirlikler çok popüler olarak kullanılır. Yüzdebirliklerin diğer bir popüler kullanım alanı, özellikle ABD'de, eğitimciler ve psikologlar tarafından uygulanan testlerin sonuçlarının normal eğri kestirimi uygulanarak yüzdeliklerin bulunması suretiyle verilmesidir.

Medyan testi, bir örneklem kümesinin belirli bir medyan değerine sahip olan bir anakütleden gelip gelmediğinin araştırılmasında kullanılan çift taraflı bir testtir. istatistik biliminde çıkarımsal istatistik alanında bir parametrik olmayan istatistik aletidir ve Pearson'un ki-kare testinın özel bir halidir. Mood'un-medyan-testi veya Westenberg-Mood-medyan-testi veya Brown-Mood-medyan-testi olarak da anılır.

<span class="mw-page-title-main">Kutu grafiği</span>

İstatistik biliminde kutu grafiği bir betimsel istatistik ve istatistiksel grafik aleti olup niceliksel verileri görsel şekilde özetlemek için Amerikan istatistikçi John Tukey tarafından kutu-ve-bıyıklar grafiği adı altında bir açıklayıcı veri analizi aracı olarak ilk defa geliştirilmiştir. Kutu grafiği, ilgili değişken bakımından veri için hazırlanan beş sayılı özetleme tablosu gösterimini grafiksel olarak özetlemeye dayalıdır. Özellikle merkezsel konum, yayılma, çarpıklık ve basıklık yönünden verileri özetlemek ve aykırı değerleri tanımlamak için kullanılır.

Ondabirlik istatistik biliminin betimsel istatistik kısmında, sıralanmış bir veri setinin 10 eşit sayıda parçaya bölünüp, elde edilen her örneklem veya anakütle veri seti kısmının tümün ondabiri olmasını sağlayan 9 tane ölçüdür.

Çoklu sayılı özetleme tablosu betimsel istatistik alanında kullanılan genellikle aralıksal ölçekli veya oransal ölçekli tek değişirli sayısal verilerinin iki değişik tip özetleme araçlarıdır. Bu iki değişik özetleme araçları şunlardır:

  1. beş sayılı özetleme tablosu;
  2. yedi sayılı özetleme tablosu.

Medyan bir anakütle ya da örneklem veri serisini küçükten büyüğe doğru sıraladığımızda, seriyi ortadan ikiye ayıran değere denir. İstatistiğin bir alt dalı olan betimsel istatistikde medyan bir merkezsel konum ölçüsü kabul edilir.

Birinci normal form veya Birinci normal biçim (1NF), ilişkisel bir veritabanındaki bir ilişkinin özelliğidir. Bir ilişki, ancak ve ancak her bir öznitelik yalnızca atomik (bölünemez) değerler içeriyorsa ve her özniteliğin değeri, bu etki alanından yalnızca tek bir değer içeriyorsa birinci normal biçimdedir (1NF). Terimin ilk tanımı, Edgar Codd'un 1971 tarihli bir konferans makalesinde yapılmıştır.