İçeriğe atla

Pareto dağılımı

Pareto
Olasılık yoğunluk fonksiyonu
Çeşitli k değerleri için Pareto olasılık yoğunluk fonksiyonları
xm = 1 oldugu halde çeşitli k değerleri için Pareto olasılık yoğunluk fonksiyonları. Yatay eksen x parametredir. Limitte k → ∞, dağılım δ(x - xm) yaklaşır; burada δ Dirac delta fonksiyonudur.
Yığmalı dağılım fonksiyonu
Çeşitli k değerleri için Pareto yığmalı dağılım fonksiyonları
xm = 1 oldugu halde çeşitli k değerleri icin Pareto yığmalı dağılım fonksiyonları. Yatay eksen x parametredir.
Parametreler ölçek (reel)
shape (reel)
Destek
Olasılık yoğunluk fonksiyonu (OYF) {{{OYF}}}
Birikimli dağılım fonksiyonu (YDF) {{{YDF}}}
Ortalama for
Medyan
Mod
Varyans icin
Çarpıklık icin
Fazladan basıklık icin
Entropi
Moment üreten fonksiyon (mf) tanımlanmaz; ham momentler icin metine bakın
Karakteristik fonksiyon

Pareto dağılımı, olasılık kuramı ve istatistik bilim dallarında birçok pratik uygulaması bulunan ve "küçük" bir nesnenin bir "büyük" nesneye dağılımında kararlılık elde edildiği hallerde kullanılan bir sürekli olasılık dağılımı veya bir güç kuramıdır. İlk olarak bir İtalyan iktisatçısı olan Vilfredo Pareto tarafından ekonomilerde bireylerin servet dağılımını göstermek için kullanılmıştır. İktisat bilim dalı dışında bu dağılım Bradford dağılımı adı altında da bilinmektedir.

Uygulama alanları

Pareto dağılımı iktisat dışında, sosyal bilimler, fen, geofizik, sigortacılık ve birçok gözümlenen doal fonomen incelemeleri için geniş bir alanda uygulanabilimektedir.

  • İktisatta, Wilfredo Pareto'nun ilk defa gösterdiği gibi, herhangi bir ülke veya idarî birim içinde servetin veya gelirin büyük bir kısmının incelenen sosyetenin küçük bir bireyler grubu tarafından sahip olunduğunu bu dağılım çok bariz bir şekilde göstermektedir. Bu öneri biraz daha az bilimsel olarak bazen Pareto prensibi veya 80-20 ilkesi olarak açıklanmakta ve bir ülkenin nüfusunun %20'si, servetin veya gelirin %80'ine sahip olduğu bu şekilde ifade edilmektedir.
  • Tek hisse senedi için standardize edilmiş fiyat getirileri dağılımı.
  • İçinde çok büyük sayıda sözcük bulunan ve bazı sözcükler çok tekrarlanırken diğer sözcüklerin nadir olarak kullanıldığı uzun metinlerde sözcük uzunluğu dağılımı.
  • Değişik dillerde ve ülkelerde insanlara verilmiş olan isimlerin çokluluk dağılımları.
  • TCP protokolunu kullanan İnternet trafiği için dosya büyüklüğü dağılımı.
  • Mutlak sıfır yakınında Bose-Einstein yoğunlaşmaları grupları.
  • Kum parçacıklarının büyüklük dağılımları.
  • Metoritlerin büyüklük dağılımları.
  • Orman yangınlarında yanan alanların yüzölçüm dağılımları.

Özellikler

Tanınım

Eğer X bir Pareto dağılım gösteren rassal değişken ise, Xin olasılığının değerini herhangi bir reel sayı olan xden daha büyük olması, yani tüm xxm için, şu ifade ile verilir:

Burada xm mutlaka X için verilen en küçük sayı değeri ve k ise pozitif değerde bir parametredir.

Pareto dağılımları ailesinin tanımlanması için iki tane sayısal parametre gerekmektedir:

ve

Pareto dağılımı iktisatda servet veya gelir dağılımı modelinde kullanıldığı zaman k parametresi Pareto endeksi olarak adlandırılır.

Olasılık yoğunluk fonksiyonu

Bu tanınımdan hemen şu Pareto dağılımı için olasılık yoğunluk fonksiyonu ortaya çıkartılır:

Diğer özellikler

Eğer k ≤ 1 ise beklenen değer sonsuz olacaktır.

Eğer ise, varyans sonsuzdur.

  • Ham momentler şöyle verilir:

Ancak bu momentler sadece için anlamlıdır.

  • Bu demektir ki, katsayıları ile olan bir Taylor serisi şeklinde tanımlanan moment üreten fonksiyon tanımlanmamıştır.
  • Karakteristik fonksiyonu şöyle verilir:

Burada Γ(a,x) bir tamamalanmamış Gamma fonksiyonu olur.

Bir karakterizasyon teoremi

Bağımsız ve hepsi aynı dağılımlı rassal değiskenler olan Xi, i = 1, 2, 3, ... in k > 0 değerleri için [k, ∞) aralığında desteklenen olasılık dağılımları bulunduğu kabul edilsin. Ayrıca, tüm n değerleri için şu iki rassal değişken olan

min{ X1, ..., Xn } ve :(X1 + ... + Xn)/min{ X1, ..., Xn }

birbirinden bağımsız değişkenler oldukları varsayılsın.

Bu halde her iki değişken de Pareto dağılım gösterir.

Zipf'in yasası ile ilişki

Pareto dağılımı sürekli olasılık dağılımdır. Zipf'in yasası veya diğer adı ile zeta dağılımı sürekli Pareto dağılımının araklıklı dağılım karşılığıdır.

Pareto, Lorenz ve Gini

Birkaç Pareto dağılımı için Lorenz eğrileri. k = ∞ kusursuzca eşit dağılımı gösterir (G = 0) ve k = 1 doğrusu ise tüm olarak eşitsiz dağılım gösterimidir (G = 1)

Lorenz eğrisi gösterimi çok kere servet veya gelir dağılımını karakterize etmek için kullanılır.[1] Herhangi bir gelir veya servet dağılımı için Lorenz eğrisi L(F) olarak ifade edilip ya bir olasılık yoğunluk fonksiyonu olan veya yığımlı dağılım fonksiyonu olan ile şöyle ifade edilebilir:

Burada x(F) yığımlı dağılım fonksiyonunun tersidir.

Şu Pareto dağılımı için

Lorenz eğrisi şöyle hesaplanabilir:

L(F) ifadesinin paydası x in ortalama değeri olduğu için, k değeri 1'e eşit veya 1den büyük olmalıdır. Birkaç Pareto dağılımı ile ilişkili Lorenz eğrileri yukarıdaki gösterimde görülebilir.

Gini katsayısı Lorenz eğrisi ile dağılımda-eşitlik ifade eden [0,0] ile [1,1] noktalarını bağlayan çapraz doğru arasındaki farkı, yani eşitlikten sapmayı, ölçen bir katsayıdır. Özellikle gösterilmiştir ki, Gini katsaysı, Lorenz eğrisi ile dağılımda-eşitlik doğrusu arasındaki alanın yuzolçümünün iki mislidir.[2]

Bu halde Pareto dağılımı için Gini katsayısı şöyle hesaplanır:

Parametre kestirimi

Verilmiş bir rastgele orneklem veri dizisi olan için k ve parametreli Paretoi dagilimi için olabilirlilik fonksiyonu soyle verilir:

Böylece logaritmik olabilirlilik fonskiyonu su olur:

Bu fonksiyondan gorulmektedir ki terimi ile monotonik artis göstermektedir. Yani değeri ne kadar büyük olursa olabilirlilik fonksiyonun değeri de oylece büyük olacaktır. olduğu için sonuç olarak

cikartılmaktadır.

k için bir kestrimci bulmak için, bunun gerekli kismi turevini almak; yani

ve bunun nerede ifira esit olduğunu bulmak gereklidir. Böylece, k için maksimum olabilirlilik kestirimi su olur:

Bunun beklenen istatistiksel hatasi soyle ifade edilir:

[3]

Grafik olarak gösterim

Pareto dağılımı için doğrusal ölçek kullanılarak elde edilen gösterimdeki eğrinin genel olarak ortaya çıkarttığı uzun kuyruk özelliği, ayni veri dizisi logaritma-logaritma ölçekli bir grafikte gösterilince ortadan kalkmakta ve negatif eğim gösteren bir doğru ortaya çıkmaktadır.

Pareto dağılımı simulasyonu

Pareto olasilik dagilimi simulasyonu için birçok komputer istatistik paketinden yardım gorme imkâni su anda bulunmamaktadır. Oysaki Pareto dagilimi özellikle aktureya hesapları için, özellikle portfoy maliyetlerinin hesaplaması için, çok sik olarak kullanılması gerekmektedir ve bu hesaplar için istatistik paketleri özel Pareto dagilimi simulasyonları vermemektedirler.

Diger taraftan istatistik paketlerinin verdikleri bazı özel olasilik dagilimi simulasyonlarını birbirine ekleyerek Pareto dagilimi gösteren rassal değişken simulasyon sonuçları cikartmak zor degildir. Bu surec kolayca basarılması icik yordam soyle verilebilir:

Birinci şekilde bir gamma dagilimi tarafında uretilen bir rastgele orneklem için bulunan λ ile bir ustel dagilimdan rastgele sayılar ortaya cikartilir; yani

ve

Bu hesaplar 0da başlayan bir rastgele veri serisi uretirler. Bunun üstüne eklemek gerekir.

Diger bir şekilde simulasyon, ters donusum orneklem alma islemi kullanılarak elde edilir. birim araklita bulunan surekli tekduze dagilimdan değişebiliri için rastgele olarak elde edilir. Bu değişebilir için

fonksiyonu Pareto-dagilimi gösterir.[4]

Ayrıca bakınız

  • Pareto prensibi
  • Pareto enterpolasyonu
  • Pareto etkinliği
  • Pareto analizi
  • The Long Tail

Kaynakça

  1. ^ Lorenz,M.O. (1905). "Methods of measuring the concentration of wealth." Publications of the American Statistical Association. C.9 say.209–219.
  2. ^ Aabergé,R. (2005) kaynak International Conference to Honor Two Eminent Social Scientists 9 Ocak 2009 tarihinde Wayback Machine sitesinde arşivlendi., Mayıs 2005 toplantısında bildiri -- http://www.unisi.it/eventi/GiniLorenz05/25%20may%20paper/PAPER_Aaberge.pdf 10 Eylül 2008 tarihinde Wayback Machine sitesinde arşivlendi.
  3. ^ "Arşivlenmiş kopya" (PDF). 5 Mart 2016 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 21 Haziran 2008. 
  4. ^ "Arşivlenmiş kopya". 23 Mayıs 2007 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Haziran 2008. 

Dış bağlantılar

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Student'in t dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında t-dağılımı ya da Student'in t dağılımı genel olarak örneklem sayısı veya sayıları küçük ise ve anakütle normal dağılım gösterdiği varsayılırsa çıkartımsal istatistik uygulaması için çok kullanılan bir sürekli olasılık dağılımıdır. Çok popüler olarak tek bir anakütle ortalaması için güven aralığı veya hipotez sınaması ve iki anakütle ortalamasının arasındaki fark için güven aralığı veya hipotez sınamasında, yani çıkarımsal istatistik analizlerde, uygulama görmektedir.

Olasılık kuramı ve istatistik bilim dallarında varyans bir rassal değişken, bir olasılık dağılımı veya örneklem için istatistiksel yayılımın, mümkün bütün değerlerin beklenen değer veya ortalamadan uzaklıklarının karelerinin ortalaması şeklinde bulunan bir ölçüdür. Ortalama bir dağılımın merkezsel konum noktasını bulmaya çalışırken, varyans değerlerin ne ölçekte veya ne derecede yaygın olduklarını tanımlamayı hedef alır. Varyans için ölçülme birimi orijinal değişkenin biriminin karesidir. Varyansın karekökü standart sapma olarak adlandırılır; bunun ölçme birimi orijinal değişkenle aynı birimde olur ve bu nedenle daha kolayca yorumlanabilir.

<span class="mw-page-title-main">Ki-kare dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında ki-kare dağılım özellikle çıkarımsal istatistik analizde çok geniş bir pratik kullanım alanı bulmuştur.

<span class="mw-page-title-main">Normal dağılım</span> sürekli olasılık dağılım ailesi

Normal dağılım, aynı zamanda Gauss dağılımı veya Gauss tipi dağılım olarak isimlendirilen, birçok alanda pratik uygulaması olan, çok önemli bir sürekli olasılık dağılım ailesidir.

Rassal değişken kavramının geliştirilmesi ile, sezgi yoluyla anlaşılan şans kavramı, soyutlaştırarak teorik matematik analiz alanına sokulmuş ve bu geliştirilen matematik kavram ile olasılık kuramı ve matematiksel istatistiğin temeli kurulmuştur.

<span class="mw-page-title-main">Poisson dağılımı</span>

Poisson dağılımı, olasılık kuramı ve istatistik bilim kollarında bir ayrık olasılık dağılımı olup belli bir sabit zaman birim aralığında meydana gelme sayısının olasılığını ifade eder. Bu zaman aralığında ortalama olay meydana gelme sayısının bilindiği ve herhangi bir olayla onu hemen takip eden olay arasındaki zaman farkının, önceki zaman farklarından bağımsız oluştuğu kabul edilir.

<span class="mw-page-title-main">Geometrik dağılım</span>

Olasılık kuramı ve istatistik bilim dallarında geometrik dağılım şu iki şekilde ifade edilebilen ayrık olasılık dağılımıdır:

<span class="mw-page-title-main">Negatif binom dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında negatif binom dağılım bir ayrık olasılık dağılım tipi olup Pascal dağılımı ve Polya dağılımı bu dağılımın özel halleridir.

<span class="mw-page-title-main">Zeta dağılımı</span>

Olasılık kuramı ve istatistik bilim kollarında, zeta dağılımı bir ayrık olasılık dağılımıdır. Eğer X s parametresi ile zeta dağılımı gösteren bir bir rassal değişken ise, Xin k tam sayısı değerini almasının olasılığı şu olasılık kütle fonksiyonu ile belirtilir:

<span class="mw-page-title-main">Beta dağılımı</span>

Olasılık kuramı ve istatistikte, beta dağılımı, [0,1] aralığında iki tane pozitif şekil parametresi ile ifade edilmiş bir sürekli olasılık dağılımları ailesidir. Çok değişkenli genellemesi Dirichlet dağılımıdır.

<span class="mw-page-title-main">Gamma dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında gamma dağılımı iki parametreli bir sürekli olasılık dağılımıdır. Bu parametrelerden biri ölçek parametresi θ; diğeri ise şekil parametresi k olarak anılır. Eğer k tam sayı ise, gamma dağılımı k tane üstel dağılım gösteren rassal değişkenlerin toplamını temsil eder; rassal değişkenlerin her biri nin üstel dağılımı için parametre olur.

<span class="mw-page-title-main">Üstel dağılım</span>

Olasılık kuramı ve istatistik bilim dallarında üstel dağılımı bir sürekli olasılık dağılımları grubudur. Sabit ortalama değişme haddinde ortaya çıkan bağımsız olaylar arasındaki zaman aralığını modelleştirirken bir üstel dağılım doğal olarak ortaya çıkar.

<span class="mw-page-title-main">Weibull dağılımı</span> Olasılık dağılımı

Olasılık kuramı ve istatistik bilim dallarında Weibull dağılımı ) bir sürekli olasılık dağılımı olup olasılık yoğunluk fonksiyonu şöyle ifade edilir:

<span class="mw-page-title-main">Tekdüze dağılım (sürekli)</span> Özel olasılık dağılımı

Sürekli tekdüze dağılım (İngilizce: continuous uniform distribution) olasılık kuramı ve istatistik bilim dallarında, her elemanı, olasılığın desteklendiği aynı büyüklükteki aralık içinde bulunabilir, her sürekli değer için aynı sabit olasılık gösteren bir olasılık dağılımları ailesidir. Desteklenen aralık iki parametre ile, yani minimum değer a ve maksimum değer b ile, tanımlanmaktadır. Bu dağılım kısa olarak U(a,b) olarak anılır.

<span class="mw-page-title-main">Laplace dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında Laplace dağılımı Pierre-Simon Laplace anısına isimlendirilmiş bir sürekli olasılık dağılımıdır. Arka arkaya birbiriyle yapıştırılmış şekilde ve bir de konum parametresi dahil edilerek birleştirilmiş iki üstel dağılımdan oluştuğu için, çift üstel dağılımı adı ile de anılmaktadır. İki bağımsız ve tıpatıp aynı şekilde üstel dağılım gösteren bir rassal değişken bir Laplace dağılımı ile işlev görürler. Bu, aynen üstel dağılım gösteren rassal zamanda değerlendirilen Brown devinimine benzer.

Olasılık kuramı ve istatistik bilim kollarında, çokdeğişirli normal dağılım veya çokdeğişirli Gauss-tipi dağılım, tek değişirli bir dağılım olan normal dağılımın çoklu değişirli hallere genelleştirilmesidir.

Olasılık kuramı ve istatistik bilim dallarında, bir rassal değişken X için, eğer beklenen değer var ise, moment üreten fonksiyon şöyle tanımlanır:

<span class="mw-page-title-main">Log-normal dağılım</span>

Olasılık kuramı ve istatistik bilim dallarında log-normal dağılım logaritması normal dağılım gösteren herhangi bir rassal değişken için tek-kuyruklu bir olasılık dağılımdır. Eğer Y normal dağılım gösteren bir rassal değişken ise, bu halde X= exp(Y) için olasılık dağılımı bir log-normal dağılımdır; aynı şekilde eğer X log-normal dağılım gösterirse o halde log(X) normal dağılım gösterir. Logaritma fonksiyonu için bazın ne olduğu önemli değildir: Herhangi iki pozitif sayı olan ab ≠ 1 için eğer loga(X) normal dağılım gösterirse, logb(X) fonksiyonu da normaldir.

<span class="mw-page-title-main">Cauchy dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında Cauchy-Lorentz dağılımı bir sürekli olasılık dağılımı olup, bu dağılımı ilk ortaya atan Augustin Cauchy ve Hendrik Lorentz anısına adlandırılmıştır. Matematik istatistikçiler genel olarak Cauchy dağılımı adını tercih edip kullanmaktadırlar ama fizikçiler arasında Lorentz dağılımı veya Lorentz(yen) fonksiyon veya Breit-Wigner dağılımı olarak bilinip kullanılmaktadır.

Medyan bir anakütle ya da örneklem veri serisini küçükten büyüğe doğru sıraladığımızda, seriyi ortadan ikiye ayıran değere denir. İstatistiğin bir alt dalı olan betimsel istatistikde medyan bir merkezsel konum ölçüsü kabul edilir.