İçeriğe atla

Negatif binom dağılımı

Negatif binom
Olasılık kütle fonksiyonu
Kırmızı çizgi ortalamayı gösterir ve yeşil çizgi için yaklaşık uzunluk 2σ olur.
Yığmalı dağılım fonksiyonu
Parametreler (rerl)
(real)
Destek
Olasılık kütle fonksiyonu (OYF)
Birikimli dağılım fonksiyonu (YDF) tanzim edilmis tamam olmayan beta fonksiyonudur
Ortalama
Medyan
Mod
Varyans
Çarpıklık
Fazladan basıklık
Entropi
Moment üreten fonksiyon (mf)
Karakteristik fonksiyon

Olasılık kuramı ve istatistik bilim dallarında negatif binom dağılım bir ayrık olasılık dağılım tipi olup Pascal dağılımı ve Polya dağılımı bu dağılımın özel halleridir.

Negatif binom dağılımın tanımlanması

Olasılık kütle fonksiyonu

Negatif binom dağılımları iki parametre ile tam olarak tanımlanan bir dağılımlar ailesidir. Bu nedenle istatistik tanıtıcı yazınlarında değişik şekilde tanımlar ortaya atılmıştır. Popüler olarak kullanılan bir tanım açıklanacaktır: Bu tanıma göre negatif binom dairesi için iki reel-değerli parametre p, 0 < p < 1 ve r, r > 0 olur. Matematik notasyon ile negatif binom dağılım gösteren bir rassal değişken X şöyle gösterilir:

X ~ NegBin(r, p).
Bu halde olasılık kütle fonksiyonu şöyle verilir:

burada k = 0,1,2,... ve

ve Γ(r) = (r - 1)! .

Sınırsal hal

Alternatif ikinci bir tanımda ise λ ve p parametreleri şöyle tanımlanır:

ve olasılık kütle fonksiyonu şöyle verilir:

Burada λ ve r negatif olmayan reel parametrelerdir.

Bu tanıma göre şu eşitlik ifadesi ortaya çıkar:

Bu ifade ise bir Poisson dağılımı gösteren ve Poisson oranı λ olan bir Poisson dağılım için olasılık kütle fonksiyonudur. Böylece bu ikinci tanımla negatif binom dağılımının limitte Poisson dağılımına yaklaşan bir dağılım olduğu ve r parametresinin da bu yaklaşımı kontrol parametresi olduğu açıklaşır; r değeri büyüdükçe negatif binom Poissona daha çok yaklaşacaktır. Böylece negatif binom dağılımı Poisson dağılım yerine kullanılan daha sağlam bir dağılım olmaktadır. Büyük r değeri için Poisson'a yaklaşılır ve uygun değerler daha kolayca bulunur; ama büyük r değerlerinde varyanslar küçük r değerlerinden daha büyük olur.

Gamma-Poisson bileşiği

Üçüncü değişik bir tanım ise, nagatif binom dağılımının Poisson dağılımlarının sürekli bir bileşiğinden ortaya çıktığı ve bu bileşiği temin eden Poisson oranlı dağılımın bir gamma dağılımı olması gerçeğine dayanır. O zaman formel notasyon ile negatif binom için olasılık kütle fonksiyonu şöyle olur:

Bu nedenle negatif binom fonksiyonu aynı zamanda gamma-Poisson bileşiği dağılım olarak da bilinmektedir.

Yığmalı dağılım fonksiyonu

Yığmalı dağılım fonksiyonu bir tanzim edilmiş beta fonksiyonu terimleri ile şöyle verilir:

Ortaya çıkma

Bir Bernoulli tipi süreçde bekleme zamanı

r değerinin bir tam sayı olduğu özel hal için negatif binom dağılımı Paskal dağılımı olarak bilinir. Paskal dağılımı bağımsız ve aynı şekilde dağılmış bir seri Bernoulli deneyi sonucunda başarı ve belli sayıda başarısızlık sonucu doğmasi için gerekli olasılık dağılımıdır. k+r sayıda p başarı olasılıklı Bernoulli deneyi k sayıda başarısızlık ve r sayıda başarı için, en son deney sonucu başarı ise, bir negatif binom dağılımı kullanmak uygun ve yeterlidir. Diğer bir ifade ile, nagatif binom dağılımı bir Bernoulli süreci için her denemede başarı olasılığı p olan ve r tane başarı elde etmek için gerekli başarısızlık sayısının olasılığını açıklayan bir dağılımdır.

Örneğin olarak bir tekrar tekrar zar atıp en son olarak 3 defa 6 gelme denemesine bakılsın. Burada her bir zar atışı için 'başarı' (6 gelmesi) 1/6dir. 3 defa bu başarı elde edilmesi için deneme sayısı (2,3,4,5,6,...) değerde bir sonsuz seridir. Bu sayıda deneme yapma olasılığı bir (kaydırılmış) negatif-binom dağılımı gösteren rassal değişkendir. 3 tane başarı (6) gelmeden önce gereken başarısızlık sayısı ise (0, 1, 2, 3, ...) yine bir sonsuz seridir. Böylece başarısızlık sayısı da bir negatif binom dağılım gösteren bir diğer rassal değişkendir.

Eğer r=1 ise ilk başarıyı elde etmeden başarısızlıklar sayısının (yani (k+1)inci denemede başarının} olasılık dağılımı elde edilir ve bu şu geometrik dağılımdır:

Fazla sapmalı bir Poisson

Yukarıda açıklanan bir tanıma göre negatif binom dağılımı Poisson dağılımına yaklaşık olduğu zamanlar Poisson dağılımı yerine kullanılabilir. Eğer veriler aralıklı, bir yukarı limit olmadan pozitif iseler ve örnek varyansı örnek ortalama değerinden büyük ise özellikle bu yaklaşım kullanışlı olmaya başlar. Bu tip verilerde eğer ornek ortalaması ve varyansı birbirine eşitse, Poisson dağılımı kullanılması uygundur. Fakat varyans değeri artıp ortalama değerini geçince, yani fazla sapma olan bir Poisson süreç ortaya çıkarsa, negatif binom yaklaşımı kullanma uygunluğu daha da önem kazanır.

Diğer dağılımlara bağlantılar

  • Geometrik dağılım negatif binom dağılımının özel bir halidir; yani
  • Şu anlamda negatif binom dağılımı Poisson dağılımına yaklaşır:
  • Negatif binom dağılımı aralıklı faz tipli dağılımın bir özel halidir.

Özellikler

p parametresi için örnekleme ve nokta tahmini

p parametresi bilinmediği farzedilsin ve bir deneme yapıp bu denemeyi uygulamaya başlamadan örnek almanın ta r sayıda başarı elde edilmesine kadar devam edileceğine karar verilmiş olsun. Bu deney için yeterli istatistik k başarısızlık sayısı olur. Bu deneyle p tahmin yapmak için en küçük varyans ortaya çıkaracak yansız nokta kestirim

olur. Bazı kişiler sağduyu ile

ifadesini uygun bir kestirim olarak ortaya atmışlardır; ancak bunu yanlı bir kestirim olduğu ispat edilmiştir.[1]

Örnekler

Bir sokak satıcısı 30 tane daire bulunan bir küçük sokağa gelmiştir. Bu sokakta 5 tane kavun satıncaya kadar sırayla her bir dairenin kapısını çalmaya karar vermiştir. Her bir dairede tek bir kavun satışı için olasılığın %40 olduğunu ve tek kavun için satış yapmama olasılığının %60 olduğunu hayat deneyiminden bilmektedir.

Çok iyi düşünür ama pek iş bulamamış bir üniversite matematik mezunu kavun satıcısının şu soru aklını çeler:

"Son beşinci kavunu ninci daireye satmak için 'olasılık kütle fonksiyonu' ne olmalıdır?"

İleri istatistik bilgisine göre k + r sayıda Bernoulli denemesinde son denemede başarı kazanması için k sayıda başarısızlık ve r sayıda başarı kazanmanın olasılığı bir negatif binom dağılımı olan NegBin(r, p) ile bulunur. 5 tane kavun satma 5 tane başarı kazanma olmakta ve bunu başarmak için kapısını çalmasi gereken daire sayısı k+5=n olmalıdır. İlgilendiği rassal değişken daire sayısıdır; bu nedenle k=n - 5 değerini bir NegBin(5,0.40) kütle fonksiyonuna koyması gerekir. Dairelerin dağılımı için, yani (n > 5) için, şu kütle fonksiyonu elde edilir:

Şimdi iyi matematik bilen kavuncu olasılık sorularını cevap verecek hale gelmiştir ve birkaç soruya kafasını yorar:

1. 10uncu dairenin kapısını çaldiktan sonra 5 kavun satma hedefine erişme olasılığı nedir?

2. 8inci dairenin kapısını çalmadan veya kapısını çaldıktan hemen sonra hedefine erişme olasılığı ne olur?

8inci dairede ve daha önce hedefine varmayı bulmak için, 5inci, 6inci, 7inci veya 8inci dairede hedefe varma olasılıkların bulunması ve birbirine toplanması gerekir:

3. Matematik mezunu kavuncunun 30 daire kapısını çalıp da hedefine varamaması olasılığı nedir?

Kavunmu yiyenlere afiyet olsun diye düşünür matematikçi kavuncu!!

Ayrıca bakınız

  • Kupon toplayıcısı problemi

Kaynakça

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Ki-kare dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında ki-kare dağılım özellikle çıkarımsal istatistik analizde çok geniş bir pratik kullanım alanı bulmuştur.

<span class="mw-page-title-main">Normal dağılım</span> sürekli olasılık dağılım ailesi

Normal dağılım, aynı zamanda Gauss dağılımı veya Gauss tipi dağılım olarak isimlendirilen, birçok alanda pratik uygulaması olan, çok önemli bir sürekli olasılık dağılım ailesidir.

<span class="mw-page-title-main">Binom dağılımı</span>

Olasılık kuramı ve istatistik bilim kollarında, binom dağılımı n sayıda iki kategori (yani başarı/başarısızlık, evet / hayır, 1/0 vb) sonucu veren denemelere uygulanır. Araştırıcının ilgi gösterdiği kategori başarı olarak adlandırılır. Bu türlü her bir deneyde, bağımsız olarak, başarı (=evet=1) olasılığının p olduğu (ve yalnızca iki kategori sonuç mümkün olduğu için başarısızlık olasılığının 1 - p olduğu) bilinir. Bu türlü bağımsız n sayıda denemeler serisi içinde elde edilen başarı sayısının ayrık olasılık dağılımı binom dağılım olarak tanımlanır. Bir binom dağılım sadece iki parametre ile, yani n ve p ile tam olarak tanımlanır. Matematik notasyon olarak bir rassal değişken X binom dağılım gösterirse şöyle ifade edilir:

X ~ B(n,p)

Olasılık kuramında ve istatistikte, hipergeometrik dağılım sonlu bir ana kütle içinden tekrar geri koymadan birbiri arkasına n tane nesnenin çekilmesi işlemi için başarı sayısının dağılımını bir ayrık olasılık dağılımı şekilde betimler.

<span class="mw-page-title-main">Poisson dağılımı</span>

Poisson dağılımı, olasılık kuramı ve istatistik bilim kollarında bir ayrık olasılık dağılımı olup belli bir sabit zaman birim aralığında meydana gelme sayısının olasılığını ifade eder. Bu zaman aralığında ortalama olay meydana gelme sayısının bilindiği ve herhangi bir olayla onu hemen takip eden olay arasındaki zaman farkının, önceki zaman farklarından bağımsız oluştuğu kabul edilir.

Bernoulli dağılımı olasılık kuramı ve istatistik bilim dallarında, p olasılıkla başarı ile 1 değeri alan ve olasılıkla başarısızlık ile 0 değeri alan bir ayrık olasılık dağılımıdır. İsmi ilk açıklamayı yapan İsviçreli bilim insanı Jakob Bernoulli anısına verilmiştir.

<span class="mw-page-title-main">Geometrik dağılım</span>

Olasılık kuramı ve istatistik bilim dallarında geometrik dağılım şu iki şekilde ifade edilebilen ayrık olasılık dağılımıdır:

<span class="mw-page-title-main">Üstel dağılım</span>

Olasılık kuramı ve istatistik bilim dallarında üstel dağılımı bir sürekli olasılık dağılımları grubudur. Sabit ortalama değişme haddinde ortaya çıkan bağımsız olaylar arasındaki zaman aralığını modelleştirirken bir üstel dağılım doğal olarak ortaya çıkar.

<span class="mw-page-title-main">Weibull dağılımı</span> Olasılık dağılımı

Olasılık kuramı ve istatistik bilim dallarında Weibull dağılımı ) bir sürekli olasılık dağılımı olup olasılık yoğunluk fonksiyonu şöyle ifade edilir:

<span class="mw-page-title-main">Tekdüze dağılım (sürekli)</span> Özel olasılık dağılımı

Sürekli tekdüze dağılım (İngilizce: continuous uniform distribution) olasılık kuramı ve istatistik bilim dallarında, her elemanı, olasılığın desteklendiği aynı büyüklükteki aralık içinde bulunabilir, her sürekli değer için aynı sabit olasılık gösteren bir olasılık dağılımları ailesidir. Desteklenen aralık iki parametre ile, yani minimum değer a ve maksimum değer b ile, tanımlanmaktadır. Bu dağılım kısa olarak U(a,b) olarak anılır.

Olasılık kuramı ve istatistik bilim kollarında, multinom dağılımı binom dağılımının genelleştirilmesidir.

<span class="mw-page-title-main">Laplace dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında Laplace dağılımı Pierre-Simon Laplace anısına isimlendirilmiş bir sürekli olasılık dağılımıdır. Arka arkaya birbiriyle yapıştırılmış şekilde ve bir de konum parametresi dahil edilerek birleştirilmiş iki üstel dağılımdan oluştuğu için, çift üstel dağılımı adı ile de anılmaktadır. İki bağımsız ve tıpatıp aynı şekilde üstel dağılım gösteren bir rassal değişken bir Laplace dağılımı ile işlev görürler. Bu, aynen üstel dağılım gösteren rassal zamanda değerlendirilen Brown devinimine benzer.

Olasılık kuramı ve istatistik bilim kollarında, çokdeğişirli normal dağılım veya çokdeğişirli Gauss-tipi dağılım, tek değişirli bir dağılım olan normal dağılımın çoklu değişirli hallere genelleştirilmesidir.

Olasılık teorisi ya da ihtimaliyet teorisi rastgele olayların analizi ile ilgilenen bir matematik bilim dalıdır. Olasılık teorisinin ana ögeleri rassal değişkenler, saf rassal süreçler, olaylar olarak sayılabilir. Bunlar ya tek olarak ortaya çıkan veya bir zaman dönemi içinde gelişerek meydana gelen, ilk görünüşü rastgele bir şekilde olan deterministik olmayan olayların veya ölçülebilir miktarların matematiksel soyutlamalarıdır. Bir madeni parayı yazı-tura denemesi için havaya atmak veya bir zarı atmak ile ortaya çıkan sonuç ilk bakışta rastgele bir olay olarak görülebilirse bile eğer birbirini takip eden rastgele olaylar tekrar tekrar ortaya çıkartılırsa incelenebilecek ve tahmin edilebilecek belirli bir istatistiksel seyir takip ettikleri görülecektir. Bu türlü olaylar ve sonuçların seyirlerini betimleyen iki temsilci matematiksel sonuç büyük sayılar yasası ve merkezsel limit teoremidir.

İstatistik bilim dalında ağırlıklı ortalama betimsel istatistik alanında, genellikle örneklem, veri dizisini özetlemek için bir merkezsel konum ölçüsüdür. En çok kullanan ağırlıklı ortalama tipi ağırlıklı aritmetik ortalamadır. Burada genel olarak bir örnekle bu kavram açıklanmaktadır. Değişik özel tipli ağırlıklar alan özel ağırlıklı aritmetik ortalamalar bulunmaktadır. Diğer ağırlıklı ortalamalar ağırlıklı geometrik ortalama ve ağırlıklı harmonik ortalamadir. Ağırlıklı ortalama kavramı ile ilişkili teorik açıklamalar son kısımda ele alınacakdır.

Sağkalım analizi, biyolojik organizmalarda ölüm ve mekanik sistemlerde başarısızlık ile ilgilenen bir istatistik dalıdır. Bu konu mühendislikte güvenilirlik teorisi veya güvenilirlik analizi, iktisat ve sosyolojide ise süre analizi veya süre modellemesi olarak adlandırılır.

Fizikte, Sönümlü Poisson Denklemi :

Pearson ki-kare testi nicel veya nitel değişkenler arasında bağımlılık olup olmadığının, örnek sonuçlarının belirli bir teorik olasılık dağılımına uygun olup olmadığının, iki veya daha fazla örneğin aynı anakütleden gelip gelmediğinin, ikiden fazla anakütle oranının birbirine eşit olup olmadığının ve çeşitli anakütle oranlarının belirli değere eşit olup olmadığının araştırılmasında kullanılır. İstatistik biliminin çıkarımsal istatistik bölümünde ele alınan iki-değişirli parametrik olmayan test analizlerinden olan ve ki-kare dağılımı'nı esas olarak kullanan ki-kare testlerinden en çok kullanılanıdır. İngiliz istatistikçi olan Karl Pearson tarafından 1900'da ortaya çıkartılmıştır.

Normalleştirme sabiti, olasılık kuramı ve matematiğin diğer çeşitli alanlarında ortaya çıkar. Örneğin normal dağılımın normalleştirme sabitini hesaplamak için Gauss integrali kullanılabilir.

Yineleme aralığı veya tekrar aralığı; depremler, seller, heyelanlar veya nehir deşarjları gibi olayların meydana gelmesi arasındaki ortalama süre veya tahmini ortalama süredir.