İçeriğe atla

Mod

İstatistik bilimi için mod bir veri kümesi içinde en sık görülen değerdir.[1] Tepedeğer olarak da adlandırılır. Bazı kullanım alanlarında, özellikle eğitim alanında, örnek veriler çok kere puan olarak anılmakta ve örnek mod değerine ise mod puanı adı verilmektedir.[2]

İstatiksel ortalama ve medyan gibi mod bir önemli veri bilgilerini kapsayan tek bir istatistiksel özetleme dir. Genellikle, bir veri için ortalama ve medyandan değişik değerdedir ve özellikle yüksek çarpıklık özelliği gösteren dağılımlar için bu farklılık daha da açıkça olarak görülür.

Mod mutlaka eşsiz tek olmayabilir. Bazı verilerde hiç tekrarlama olmazsa hiçbir mod bulunmaz. Diğer taraftan değişik veri değerleri ayni maksimum çokluk değerine yetişebilirler. Olasılık dağılımları için çoklu mod değerine aşırı örnekler aralıklı tekdüze dağılım ve sürekli tekdüze dağılımdır; bu dağılımlar için rassal değişkenin mümkün tüm değerleri aynı olasılıkla mod değerleridir

Mod için örnek

Mod bir veri serisi içinde en çok tekrar edilen sayıdır.

Örneğin: 10 gözlemi kapsayan bir örneklem alınsın. Veriler şunlardır:

1,2,3,1,2,3,2,2,2,2

Bu veri serisinde tekrarlar bulunmakta ve çokluk sayımı şöyle verilebilmektedir:

 Veri değeri          1      2     3
 Frekans sayımı       2      6     2

Bu veri dizisinin modu 2dir; çünkü bu değer en çok tekrar edilmektedir.

Eğer veri dizisi içinde hiçbir tekrarlama bulunmuyorsa, veri için mod bulunmayabilir. Diğer taraftan, iki veya daha fazla veri aynı tekrarlamayı gösterebilirler; bu halde çoklu mod ortaya çıkar.

Örneğin: Büyüklüğü 15 olan bir örneklem veri dizisi şu olsun:

1,5,5,8,5,5,9,10,10,12,2,8,12,10,12,10

Bu veri dizisinin çokluk sayımı şöyle verilir:

  Veri değeri     1    2   5   8   10  12
  Frekans sayımı  1    1   4   2    4   3

Veri dizisinde en çok (4 defa) tekrarlanan sayı 5 ve 10 olduğu için veri dizisinin iki tane modu bulunmaktadır: 5 ile 10.

Eğer örneklem niceliksel değerler gösterip hacmi büyük ise veya değerleri orijini biraz olsun saklanmak istenmekte ise, örnek veri dizileri sıralanır; gruplanır ve çokluk dağılımı tablosu olarak verilir. Bu çokluk dağılım tablosundaki en büyük frekans gösteren gruba mod sınıfı adı verilir ve bu sınıfın kapsadığı değerler arasında bir sayı çokluk dağılım modu olarak bulunabilir. Bunun için formül şöyle verilebilir:

  • L: Mod sınıfının alt değeri
  • fs: Mod sınıfından bir sonraki sınıfın frekansı
  • fo: Mod sınıfından bir önceki sınıfın frekansı
  • c: Mod sınıfının aralığı

Bu formül ile bir çokluk dağılımından elde edilen mod değeri orijinal veri serisi içinde bulunan herhangi bir veri değerine tekabül etmeyebilir. Bu formül sadece tek modlu çokluk dağılımları için uygundur ve veri dağılımı çoklu doruk gösteriyorsa mod bulunması uygun değildir.

Hemen şunu da eklemek gerekir ki veri dizisinden elde edilen mod; bu veri dizisinin bir çeşit gruplanması ile elde edilen çokluk dağılımı mod değeri ve bu veri dizisinin diğer çeşit gruplanması ile elde edilen diğer bir çokluk dağılımının mod değerinin birbirine mutlaka eşit olmaları gerekmez; gerçekten pratikte bunların değişik olması çok büyük imkân dahilindedir. Yani aynı veri için değişik mod olması olağandır.

Olasılık dağılımı için mod

Bir aralıklı olasılık dağılımı için mod bir rassal sayı olan xdir ve bu x değerinde olasılık kütle fonksiyonu maksimum değere varır. Diğer bir deyimle, mod rassal sayı değeri en olabilir şekilde örnek alınan değerdir.

Bir sürekli olasılık dağılımı için mod bir rassal sayı olan x olup bu sayıda olasılık yoğunluk fonksiyonu maksimum değerine varır; daha gayriresmî bir ifade ile mod olasılık yoğunluk fonksiyonu için bir doruk değeridir.

Bir olasılık kütle fonksiyonu veya olasılık yoğunluk fonksiyonu için maksimum değere birkaç noktada x1, x2, vb. bulunabilinirliğinden mod mutlaka eşsiz tek değerde değildir.

Olasılık yoğunluk fonksiyonunun çoklu olarak yöresel maksimum değerleri varsa, tüm yöresel maksimum değerlerin hepsi dağılımın mod değeri olarak anılır. Ancak yukarıdaki verilen tanımlamaya göre sadece global maksimum değer mod olup bu global maksimumdan daha küçük olan yöresel maksimum değerlerinin mod sayılmaması gerekir. Bununla beraber bu şekilde çoklu yöresel maksimum değerleri bulunan sürekli olasılık dağılımları çoklu modlu dağılım olarak anılır.

Mod, ortalama ve medyan karşılaştırılması

Gelişigüzel bir olasılık dağılımı için mod, ortalama ve medyanın geometrik temsili.

Bir olasılık dağılımı için ortalama, rassal değişkenin beklenen değeri olarak adlandırılır. Diğer taraftan, eğer veri örneklemden gelmişse örneklem ortalaması adı verilir.

Tek modlu olan ve ve yansıtıcı simetri gösteren olasılık dağılımları arasında simetrik çan grafiği şeklinde olasılık yoğunluk fonksiyonu olan normal dağılım için ortalama, medyan ve mod birbirine aynıdır.

Mod kavramı isimsel ölçekli veri serileri için merkezsel konum ölçüsü olarak kullanılabilir ama bu halde anlamı biraz bulanıktır. Buna karşılık medyan ve ortalama hiç anlamsızdır.

Özellikler

Mod için şu özellikler ilgi çeker:

  • Mod, aynı medyan ve ortalama gibi, doğrusal veya afin dönüşümden etkilenmez. Afin dönüşüm Xin yerine aX+b koymakla elde edilir.
  • Çok küçük sayıda örneklemler dışında, mod değeri örneklem aykırı değerlerinden etki görmez, yani mod güçlü ölçü olur. Medyan da bir güçlü ölçüdür.

. Ortalama ise bunların aksine eğer aykırı değerlerden çok etkilenir.

  • Karl Pearsonun ortaya attığı bir pratik kurala göre sürekli tek modlu dağılımlar için, medyan değeri, mod ve ortalama değerlerinin ortasında ortalama ve mod aralığının üçte biri noktasında bulunur. Bu formül olarak şöyle ifade edilir:
medyan ≈ (2 × ortalama + mod)/3.

Bu bir pratik kural olarak, bir normal dağılımı andıran çok az asimetri gösteren dağılımlar için doğrudur. Ancak bu kural her zaman doğru olamaz ve bu üç-zet konum istatistiğinin herhangi bir sırada olması mümkündür.[3][4]

Çarpık bir dağılım için örnek

Bir sınıf dağılım tipi isteğe göre çarpıklık gösterebilir. Bu log-normal dağılımıdır. Bu dağılım bir normal dağılım gösteren X rassal değişkenin logaritması alınarak bir Y rassal değişkenine (yani Y= exp (X) yaparak) dönüştürmekle elde edilir. Y rassal değişkenin logaritması normal dağılım gösterir ve bu nedenle Y dağılımına log-normal adı verilir.

Özel bir X seçilerek ortalaması μ=0 olursa, Ynin medyanı 1 olacaktır ve bu X'in standart sapması olan σdan bağımsızdır. Buna neden X normal dağılım gösterdiği için ortalama ve medyan (ve mod) ayni olmakta ve ortalama 0 olursa medyan da 0 olmaktadır. Xden Y dönüşümü u monotonik olduğu için Y için medyan değerinin 1 olduğu (exp(0)=1) açıktır.

Eğer X standart sapması σ=0,2 olursa, Y dağılımı çok çarpıklık göstermez. Ortalama ve mod değerleri sırasıyla μ=1,0202 ve mod=0,9608 olur. Bu halde medyan ortalama ile mod arasında üçte bir mesafededir.

Eğer X standart sapması çok daha büyük, (diyelim σ=5) olursa, Y dağılımı büyük ölçekte çarpıklık gösterir. Ortalama ve mod değerleri sırasıyla μ=7,3891 ve mod=0,0183 olur. Bu halde Pearson'un ortaya attığı empirik ilişki kuralı, yani medyanın ortalama ile mod arasında üçte bir mesafede olması, doğru olmaz.

Ayrıca bakınız

Kaynakça

  1. ^ Damodar N. Gujarati f Econometrics. McGraw-Hill Irwin. 3. basım, 2006: p. 110.probability distribution]]
  2. ^ [1] 8 Ekim 2007 tarihinde Wayback Machine sitesinde arşivlendi. Ingilizce matematik sözlüğü tanımlarından çeviri.
  3. ^ Kaynak: Paul T. von Hippel (2005) "Mean, Median, and Skew: Correcting a Textbook Rule", J. of Statistics Education C.3 :2 [2] 14 Ekim 2008 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişme tarihi:15.9.2009)
  4. ^ Medyan ve diğer ortalamalar "Median". 20 Temmuz 2012 tarihinde kaynağından arşivlendi. Erişim tarihi: 4 Mart 2008.  (İngilizce)(Erişme tarihi:15.9.2009)

Dış bağlantılar

  • [3] Mod kavramını anlamak ve hesaplamak için bir kılavuz.(İngilizce)(Erişme tarihi:20.3.2008)
  • [4]23 Temmuz 2011 tarihinde Wayback Machine sitesinde arşivlendi. Ortalama, medyan ve mod içeren bir problem. (İngilizce)(Erişme tarihi:20.3.2008)

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Normal dağılım</span> sürekli olasılık dağılım ailesi

Normal dağılım, aynı zamanda Gauss dağılımı veya Gauss tipi dağılım olarak isimlendirilen, birçok alanda pratik uygulaması olan, çok önemli bir sürekli olasılık dağılım ailesidir.

<span class="mw-page-title-main">Betimsel istatistik</span>

Betimsel istatistik veya betimsel sayımlama istatistik bilim alanında üç temel kısmından biridir. Sayısal verilerinin derlenmesi, toplanması, özetlenmesi ve analiz edinilmesi ile ilgili istatistiktir.

Ortalama veya merkezsel konum ölçüleri, istatistik bilim dalında ve veri analizinde kullanılan bir veri dizisinin orta konumunu, tek bir sayı ile ifade eden betimsel istatistik ölçüsüdür. Günlük hayatta ortalama dendiğinde genellikle kast edilen aritmetik ortalama olmakla beraber bu ölçünün çok belirli bazı dezavantajları söz konusudur. Bu yüzden matematik ve istatistikte, bir anakütle veya örneklem veri dizisi değerlerini temsil eden tek bir orta değer veya beklenen değer, olarak medyan (ortanca), mod (tepedeğer), geometrik ortalama, harmonik ortalama vb adlari verilen birçok değişik merkezsel konum ölçüleri geliştirilmiş ve pratikte kullanılmaktadır.

Rassal değişken kavramının geliştirilmesi ile, sezgi yoluyla anlaşılan şans kavramı, soyutlaştırarak teorik matematik analiz alanına sokulmuş ve bu geliştirilen matematik kavram ile olasılık kuramı ve matematiksel istatistiğin temeli kurulmuştur.

Merkezi limit teoremi büyük bir sayıda olan bağımsız ve aynı dağılım gösteren rassal değişkenlerin aritmetik ortalamasının, yaklaşık olarak normal dağılım göstereceğini ifade eden bir teoremdir. Matematiksel bir ifadeyle, bir merkezi limit teoremi olasılık kuramı içinde bulunan bir zayıf yakınsama sonucu setidir. Bunların hepsi, birçok bağımsız aynı dağılım gösteren rassal değişkenlerin herhangi bir toplam değerinin limitte belirli bir "çekim gücü gösteren dağılıma" göre dağılım gösterme eğiliminde olduğu gerçeğini önerir.

Bir olasılık dağılımı bir rassal olayın ortaya çıkabilmesi için değerleri ve olasılıkları tanımlar. Değerler olay için mümkün olan tüm sonuçları kapsamalıdır ve olasılıkların toplamı bire eşit olmalıdır. Örneğin, bir rassal olay olarak madeni paranın tek bir defa havaya atılıp yere düşmesi ele alınsın; değerler 'yazı' veya 'tura' veya bunlar isimsel değişken ölçeğinde ifade edilirse 0 (yazı) veya 1 (tura) olur; olasılıklar ise her iki değer için ½ olacaktır. Böylece madeni bir paranın tek bir defa atılma olayı için iki değer ve ilişkili iki olasılık bu rassal olayın olasılık dağılımı olur. Bu dağılım ayrık olasılık dağılımıdır; çünkü sayılabilir şekilde ayrı ayrı sonuçlar ve bunlara bağlı olan pozitif olasılıklar vardır.

<span class="mw-page-title-main">Çarpıklık</span>

Çarpıklık olasılık kuramı ve istatistik bilim dallarında bir reel-değerli rassal değişkenin olasılık dağılımının simetrik olamayışının ölçülmesidir.

<span class="mw-page-title-main">Beta dağılımı</span>

Olasılık kuramı ve istatistikte, beta dağılımı, [0,1] aralığında iki tane pozitif şekil parametresi ile ifade edilmiş bir sürekli olasılık dağılımları ailesidir. Çok değişkenli genellemesi Dirichlet dağılımıdır.

<span class="mw-page-title-main">Tekdüze dağılım (sürekli)</span> Özel olasılık dağılımı

Sürekli tekdüze dağılım (İngilizce: continuous uniform distribution) olasılık kuramı ve istatistik bilim dallarında, her elemanı, olasılığın desteklendiği aynı büyüklükteki aralık içinde bulunabilir, her sürekli değer için aynı sabit olasılık gösteren bir olasılık dağılımları ailesidir. Desteklenen aralık iki parametre ile, yani minimum değer a ve maksimum değer b ile, tanımlanmaktadır. Bu dağılım kısa olarak U(a,b) olarak anılır.

Olasılık kuramı ve bir dereceye kadar istatistik bilim dallarında basıklık kavramı 1905da K. Pearson tarafından ilk defa açıklanmıştır. Basıklık kavramı bir reel değerli rassal değişken için olasılık dağılımının, grafik gösteriminden tanımlanarak ortaya çıkarılan bir kavram olan, sivriliği veya basıklığı özelliğinin ölçümüdür. Basıklık kavramının ayrıntıları olasılık kuramı içinde geliştirilmiştir. Betimsel istatistik için bir veri setinin basıklık karakteri pek dikkate alınmayan bir özellik olarak görülmektedir. Buna bir neden parametrik çıkarımsal istatistik alanında basıklık hakkında hemen hemen hiçbir kestirim veya sınama bulunmamasındandır ve pratik istatistik kullanımda basıklık pek önemsiz bir karakter olarak görülmektedir. Belki de basıklık ölçüsünün elle hesaplanmasının hemen hemen imkânsızlığı buna bir neden olmuştur.

<span class="mw-page-title-main">Laplace dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında Laplace dağılımı Pierre-Simon Laplace anısına isimlendirilmiş bir sürekli olasılık dağılımıdır. Arka arkaya birbiriyle yapıştırılmış şekilde ve bir de konum parametresi dahil edilerek birleştirilmiş iki üstel dağılımdan oluştuğu için, çift üstel dağılımı adı ile de anılmaktadır. İki bağımsız ve tıpatıp aynı şekilde üstel dağılım gösteren bir rassal değişken bir Laplace dağılımı ile işlev görürler. Bu, aynen üstel dağılım gösteren rassal zamanda değerlendirilen Brown devinimine benzer.

Olasılık teorisi ya da ihtimaliyet teorisi rastgele olayların analizi ile ilgilenen bir matematik bilim dalıdır. Olasılık teorisinin ana ögeleri rassal değişkenler, saf rassal süreçler, olaylar olarak sayılabilir. Bunlar ya tek olarak ortaya çıkan veya bir zaman dönemi içinde gelişerek meydana gelen, ilk görünüşü rastgele bir şekilde olan deterministik olmayan olayların veya ölçülebilir miktarların matematiksel soyutlamalarıdır. Bir madeni parayı yazı-tura denemesi için havaya atmak veya bir zarı atmak ile ortaya çıkan sonuç ilk bakışta rastgele bir olay olarak görülebilirse bile eğer birbirini takip eden rastgele olaylar tekrar tekrar ortaya çıkartılırsa incelenebilecek ve tahmin edilebilecek belirli bir istatistiksel seyir takip ettikleri görülecektir. Bu türlü olaylar ve sonuçların seyirlerini betimleyen iki temsilci matematiksel sonuç büyük sayılar yasası ve merkezsel limit teoremidir.

Olasılık kuramı içinde bir olasılık dağılımı, eğer yığmalı dağılım fonksiyonu bir sürekli fonksiyon ise dağılım da sürekli olarak anılır. Bu demektir ki incelenmekte olan dağılımı gösteren X rassal değişkeni için; tüm reel sayı olan a için

Pr[X = a] = 0
<span class="mw-page-title-main">Olasılık kütle fonksiyonu</span>

Olasılık kuramı bilim dalında bir olasılık kütle fonksiyonu bir ayrık rassal değişkenin olasılığının tıpatıp belli bir değere eşit olduğunu gösteren bir fonksiyondur. Olasılık kütle fonksiyonu, olasılık yoğunluk fonksiyonundan farklıdır; çünkü olasılık yoğunluk fonksiyonu yalnızca sürekli rassal değişkenler için tanımlanmış olup doğrudan doğruya olasılık değerini vermezler. Olasılık yoğunluk fonksiyonunun bir belli değer aralığı için integrali alınırsa bu rassal değişkenin belirlenen değer aralığı için olasılığını verir.

Olasılık kuramı ve istatistik bilim dallarında bir rassal değişken X için olasılık yoğunluk fonksiyonu bir reel sayılı sürekli fonksiyonu olup f ile ifade edilir ve şu özellikleri olması gereklidir:

Olasılık kuramı içinde herhangi bir rassal değişken için karakteristik fonksiyon, bu değişkenin olasılık dağılımını tüm olarak tanımlar. Herhangi bir rassal değişken X için, gerçel doğru üzerinde, bu fonksiyonu tanımlayan formül şöyle yazılır:

<span class="mw-page-title-main">Cauchy dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında Cauchy-Lorentz dağılımı bir sürekli olasılık dağılımı olup, bu dağılımı ilk ortaya atan Augustin Cauchy ve Hendrik Lorentz anısına adlandırılmıştır. Matematik istatistikçiler genel olarak Cauchy dağılımı adını tercih edip kullanmaktadırlar ama fizikçiler arasında Lorentz dağılımı veya Lorentz(yen) fonksiyon veya Breit-Wigner dağılımı olarak bilinip kullanılmaktadır.

Matematik bilimi içinde moment kavramı fizik bilimi için ortaya çıkartılmış olan moment kavramından geliştirilmiştir. Bir bir reel değişkenin reel-değerli fonksiyon olan f(x)in c değeri etrafında ninci momenti şöyle ifade edilir:

Medyan bir anakütle ya da örneklem veri serisini küçükten büyüğe doğru sıraladığımızda, seriyi ortadan ikiye ayıran değere denir. İstatistiğin bir alt dalı olan betimsel istatistikde medyan bir merkezsel konum ölçüsü kabul edilir.

<span class="mw-page-title-main">Matematiksel istatistik</span> matematiksel yöntemlerin kullanıldığı olası istatistikler

Matematiksel istatistik, istatistiksel veri toplama tekniklerinin aksine, matematiğin bir dalı olan olasılık teorisinin istatistiğe uygulanmasıdır. Bunun için kullanılan özel matematiksel teknikler arasında matematiksel analiz, doğrusal cebir, stokastik analiz, diferansiyel denklemler ve ölçü teorisi bulunur.