İçeriğe atla

Açıklık (istatistik)

Açıklık, betimsel istatistikte bütün veri dizisini içinde kapsayan en küçük aralıktır. Bir veri dizisindeki ya en büyük değer ile en küçük değer arasındaki fark olarak ya da en küçük ve en büyük değerler aralığı verilerek ifade edilir. Örnek olarak; veri dizisi 5,9,1,23,12,23 ise dizisinin açıklığı ya 23-1=22 yahut da 1-23 olarak bildirilir. Bu nedenle açıklık için ölçüm birimi veri ölçüm biriminin aynısıdır.

Bazen sayısal veriler çokluk dağılımı olarak sadece önceden özetlenmiş halde görülebilirler. Bu halde açıklık değerinin ancak yaklaşık olarak kestirimi yapılabilir. Bu yaklaşık açıklık en son sınıfın üst sınır sayısı ile ilk sınıfın alt sınır sayısı veya bunlar arasındaki farktır.

Ölçülme gereğine göre bazen imkân dahilindeki veri değerleri arasında bir potansiyel açıklık ortaya çıkar. Bu potansiyel açıklık ölçülmesi mümkün olan en küçük veri değeri ile mümkün olan en büyük değeri veya bunlar arasındaki farktır. Ancak bir veri dizisi ortaya çıkınca veri için açıklık veri dizisinin en küçük ve en büyük değerlerine bağlıdır. Örneğin imtihan notlarının 0 ile 100 arasında değişme imkânı vardır ve potansiyel açıklık 0-100 veya 100 olur ama belli bir imtihanda verilen notlar 20 ile 93 arasında olup açıklık 20-93 veya 73 olarak ifade edilir.

Açıklık, istatistiksel yayılma için bir ölçüdür. Kavram olarak anlaması ve ifade edilmesi çok kolay olduğundan pratik günlük hayatta en çok kullanılan yayılım ölçüsüdür. Ancak uçsal değerler ile kurulu olduğu için, büyüklüğü bunların aşırı büyük veya aşırı küçük olmasından (yani aykırı değer ler olmasından) etkilenir ve bu nedenle güçsüz (İngilizce:non-robust) olduğu kabul edilir. Daha uygun bir istatistiksel yayılım ölçüsü olarak çeyrekler açıklığı kullanılması tavsiye edilir.

Açıklık ortası noktası en küçük ve en büyük uçsal noktaların tam ortasıdır ve veri dizisi için bir merkezsel konum ölçüsü olarak kullanılabilir. Ancak bu da açıklık kavramı gibi güçsüz bir ölçüdür.

İlgili Araştırma Makaleleri

Desibel (dB), belirli bir referans güç ya da miktar seviyeye olan oranı belirten, genelde ses şiddeti için kullanılan logaritmik ve boyutsuz bir birimdir. Desibel daima iki değer arasındaki karşılaştırmadır. Bunun sonucu olarak da çoğu kez ölçülen güç değeri değişik olmasına rağmen desibel sayısı aynıdır. Desibelin yaygın olarak ses şiddeti birimi olduğu sanılır ama aslında ses şiddeti karşılaştırmalarında da kullanılabilen bir karşılaştırmadır. Telefon kullanılmaya başlandığında ilgili kurumlar bir iletim birimi bulmak/kullanmak sorunu ile karşılaşmışlardı. Doğal olarak o zaman iletim ya da haberleşme denince akla çoğunlukla telefon gelmekte idi.

<span class="mw-page-title-main">Aritmetik ortalama</span>

Aritmetik ortalama, bir sayı dizisindeki elemanların toplamının eleman sayısına bölünmesi ile elde edilir. İstatistik bilim dalında hem betimsel istatistik alanında hem de çıkarımsal istatistik alanında en çok kullanan merkezi eğilim ölçüsü' dür.

<span class="mw-page-title-main">Magnitüd</span> Vikimedya anlam ayrımı sayfası

Magnitüd, yer kabuğunun veya levhaların bir deprem anında boşalan jeolojik enerji potansiyelinin (düzeyinin), sismik aletler tarafından ölçülen değeridir.

Ortalama veya merkezsel konum ölçüleri, istatistik bilim dalında ve veri analizinde kullanılan bir veri dizisinin orta konumunu, tek bir sayı ile ifade eden betimsel istatistik ölçüsüdür. Günlük hayatta ortalama dendiğinde genellikle kast edilen aritmetik ortalama olmakla beraber bu ölçünün çok belirli bazı dezavantajları söz konusudur. Bu yüzden matematik ve istatistikte, bir anakütle veya örneklem veri dizisi değerlerini temsil eden tek bir orta değer veya beklenen değer, olarak medyan (ortanca), mod (tepedeğer), geometrik ortalama, harmonik ortalama vb adlari verilen birçok değişik merkezsel konum ölçüleri geliştirilmiş ve pratikte kullanılmaktadır.

<span class="mw-page-title-main">Standart sapma</span> İstatistikte bir varyasyon ölçüsü

Standart sapma, Olasılık kuramı ve istatistik bilim dallarında, bir anakütle, bir örneklem, bir olasılık dağılımı veya bir rassal değişken, veri değerlerinin yayılımının özetlenmesi için kullanılan bir ölçüdür. Matematik notasyonunda genel olarak, bir anakütle veya bir rassal değişken veya bir olasılık dağılımı için standart sapma σ ile ifade edilir; örneklem verileri için standart sapma için ise s veya s'

İstatistiksel yığın yahut anakütle yahut evren kavramı istatistik biliminde belirli bir konudaki tüm değişkenlerin ölçülebilecek değerlerini ifade eder. Örneğin; Türkiye'de bulunan kişiler bir istatistiksel yığın değil, bunların mümkün sayısı bir istatistiksel yığın olmaktadır. Ankara'nın sayılması mümkün nüfusu ise Türkiye yığınından alınmış bir örneklemdir. Dikkat edilirse istatistiksel yığın kavramı ile, herhangi bir değişkeni içeren elemanlara değil, değişkenlerin mümkün olarak ölçülebilen veya sayılabilen içerik karakteristiğine atıf yapılmaktadır. Böylece istatistikte istatistiksel yığın ya ölçülebilir ya sayılabilir karekteristiktir ve sayısal olarak ortaya çıkabilmesi mümkündür.

İstatistik bilimi için mod bir veri kümesi içinde en sık görülen değerdir. Tepedeğer olarak da adlandırılır. Bazı kullanım alanlarında, özellikle eğitim alanında, örnek veriler çok kere puan olarak anılmakta ve örnek mod değerine ise mod puanı adı verilmektedir.

Olasılık kuramı ve bir dereceye kadar istatistik bilim dallarında basıklık kavramı 1905da K. Pearson tarafından ilk defa açıklanmıştır. Basıklık kavramı bir reel değerli rassal değişken için olasılık dağılımının, grafik gösteriminden tanımlanarak ortaya çıkarılan bir kavram olan, sivriliği veya basıklığı özelliğinin ölçümüdür. Basıklık kavramının ayrıntıları olasılık kuramı içinde geliştirilmiştir. Betimsel istatistik için bir veri setinin basıklık karakteri pek dikkate alınmayan bir özellik olarak görülmektedir. Buna bir neden parametrik çıkarımsal istatistik alanında basıklık hakkında hemen hemen hiçbir kestirim veya sınama bulunmamasındandır ve pratik istatistik kullanımda basıklık pek önemsiz bir karakter olarak görülmektedir. Belki de basıklık ölçüsünün elle hesaplanmasının hemen hemen imkânsızlığı buna bir neden olmuştur.

Betimsel istatistik içinde, bir dörttebirlik sıralanmış bir veri setini dört eşit parçaya bölen ve böylece her bir bölünen parçanın anakütle veya örneklem verilerinin 1/4ini kapsadığı, üç tane özetleme değeridir. Çeyreklik olarak da isimlendirilmektedir.

Olasılık teorisi ya da ihtimaliyet teorisi rastgele olayların analizi ile ilgilenen bir matematik bilim dalıdır. Olasılık teorisinin ana ögeleri rassal değişkenler, saf rassal süreçler, olaylar olarak sayılabilir. Bunlar ya tek olarak ortaya çıkan veya bir zaman dönemi içinde gelişerek meydana gelen, ilk görünüşü rastgele bir şekilde olan deterministik olmayan olayların veya ölçülebilir miktarların matematiksel soyutlamalarıdır. Bir madeni parayı yazı-tura denemesi için havaya atmak veya bir zarı atmak ile ortaya çıkan sonuç ilk bakışta rastgele bir olay olarak görülebilirse bile eğer birbirini takip eden rastgele olaylar tekrar tekrar ortaya çıkartılırsa incelenebilecek ve tahmin edilebilecek belirli bir istatistiksel seyir takip ettikleri görülecektir. Bu türlü olaylar ve sonuçların seyirlerini betimleyen iki temsilci matematiksel sonuç büyük sayılar yasası ve merkezsel limit teoremidir.

Matematik ve istatistik bilim dallarında, bir değişken için sayısal veri ölçülme ölçeği, o değişken içindeki nesneleri temsil eden sayısal değerlerin kapsadıkları bilgilerin özelliklerinin belirli bir şekilde sınıflandırmasıdır. İncelenen kavramlar Amerikan uygulamalı matematikçi Stanley Smith Stevens tarafından teklif edilip geliştirilmiştir. Stevens'in ölçekler kuramına göre bir değişken için sayısal veriler dört değişik şekilde ölçülme ölçeğine sahip olabilirler: isimsel, sırasal, aralıksal ve oransal. Bu değişik ölçeklere göre değişken verilerine, değişik matematik ve istatistiksel işlemlerin ve ölçümlerin değişik şekilde uygulanması gerekmektedir.

Betimsel istatistikte çeyrekler açıklığı sıralanmış bir veri dizisinin orta yarısını (%50'sini) kapsayan ve üçüncü dörtte birlik ve birinci dörtte birlik aralığını veya farkını gösteren bir istatistiksel yayılma ölçüsüdür. Birinci dörtte birlik sıralanmış veri dizisinin ilk %25'inden büyük ve üçüncü dörtte birlik sıralanmış veri dizisinin %25'inden daha küçük olduğu için, bu iki dörtte birlik arasında kalan veri yüzdesi %50'dir. Çeyrekler açıklığı ölçüm birimi veri ölçüm birimi ile aynıdır. İngilizcesi IQR'dir.

Olasılık kuramı ve istatistik bilim dallarında varyasyon katsayısı bir olasılık dağılımı için bir normalize edilmiş istatistiksel yayılma ölçüsüdür. Standart sapma, yani ,nin ortalamaya yani degerine orantisi olarak şöyle tanımlanır:

Matematik bilimi içinde moment kavramı fizik bilimi için ortaya çıkartılmış olan moment kavramından geliştirilmiştir. Bir bir reel değişkenin reel-değerli fonksiyon olan f(x)in c değeri etrafında ninci momenti şöyle ifade edilir:

<span class="mw-page-title-main">Dal-yaprak grafikleri</span>

Dal-yaprak grafikleri, betimsel istatistik ve "istatistiksel grafik" konusu olup sayısal olarak elde edilen verilerin grafik olarak görsel şekilde özetlemek amacıyla çizilir. Bu çizimi tek değişkenli verileri incelerken kullanılır. Bu gösterim şekli veri setinin yapısını, örüntüsünü veya genel eğilimini gösterir.

<span class="mw-page-title-main">Anlamlılık seviyesi</span>

Anlamlılık seviyesi, istatistik biliminde, İngiliz istatistikçi Ronald Fisher tarafından çıkartımsal hipotez sınama yönteminin kurulması sırasında kavramlaştırılmış özel bir manası olan bir bilimsel ve istatistiksel terimdir. İstatistiksel anlamlılık eğer bir sonucun gerçekleşme olasılık değerlendirilmesine göre olabilirliği düşük değil ise ortaya çıkar.

İstatistiksel yayılma ve sapma istatistik biliminde bir sayısal kantitatif değişkenin ölçülen veya ölçülebilen değerlerinin veya bir olasılık dağılımı'nın genel olarak veya bir merkez noktasından yaygınlığı veya değişebilirliği özelliğidir. İstatistiksel yayılma veya sapma kantitatif değişkenlerin veya rassal değişkenlerin diğer bir özelliği olan merkezsel konum ölçüleri ile birlikte istatistikçilerin en çok ilgilendikleri konulardır. Genel olarak günlük hayatta en çok kullanılan yayılma ölçüsü açıklık olmakla beraber, bunun gayet bariz olarak aykırı değerlerden çok etkilenmesi dolayısı ile çeyrekler açıklığı, standart sapma ve varyans gibi diğer çok kullanılan yayılma ölçüleri geliştirilmiştir.

<span class="mw-page-title-main">Kutu grafiği</span>

İstatistik biliminde kutu grafiği bir betimsel istatistik ve istatistiksel grafik aleti olup niceliksel verileri görsel şekilde özetlemek için Amerikan istatistikçi John Tukey tarafından kutu-ve-bıyıklar grafiği adı altında bir açıklayıcı veri analizi aracı olarak ilk defa geliştirilmiştir. Kutu grafiği, ilgili değişken bakımından veri için hazırlanan beş sayılı özetleme tablosu gösterimini grafiksel olarak özetlemeye dayalıdır. Özellikle merkezsel konum, yayılma, çarpıklık ve basıklık yönünden verileri özetlemek ve aykırı değerleri tanımlamak için kullanılır.

Yunan harfleri; matematikte, bilimde ve mühendislikte ayrıca sabitler ve özel fonksiyonlar için sembollerle matematiksel notasyonun yapıldığı her yerde, özellikle belirli nicelikleri temsil eden değişkenler için kullanılır. Bu bağlamda, büyük ve küçük harfler farklı ve alakasız şeyleri simgelerler. Latin harfi biçimindeki Yunan harfleri genellikle kullanılmazlar: büyük A, B, E, H, I, K, M, N, O, P, T, X, Y, Z gibi. "i, o ve u" Latin harflerine yakından benzediklerinden, küçük ι (iota), ο (omikron) ve υ (ipsilon) nadiren kullanılır. Bazen Yunan harflerinin değişik fontları matematikte bambaşka semboller için kullanılır, özellikle de φ (fi) ve π (pi).

Medyan bir anakütle ya da örneklem veri serisini küçükten büyüğe doğru sıraladığımızda, seriyi ortadan ikiye ayıran değere denir. İstatistiğin bir alt dalı olan betimsel istatistikde medyan bir merkezsel konum ölçüsü kabul edilir.