İçeriğe atla

Varyans

Olasılık kuramı ve istatistik bilim dallarında varyans bir rassal değişken, bir olasılık dağılımı veya örneklem için istatistiksel yayılımın, mümkün bütün değerlerin beklenen değer veya ortalamadan uzaklıklarının karelerinin ortalaması şeklinde bulunan bir ölçüdür. Ortalama bir dağılımın merkezsel konum noktasını bulmaya çalışırken, varyans değerlerin ne ölçekte veya ne derecede yaygın olduklarını tanımlamayı hedef alır. Varyans için ölçülme birimi orijinal değişkenin biriminin karesidir. Varyansın karekökü standart sapma olarak adlandırılır; bunun ölçme birimi orijinal değişkenle aynı birimde olur ve bu nedenle daha kolayca yorumlanabilir.

Bir reel sayı hâlinde olan rassal değişkenin varyansı o rassal değişkenin ikinci merkezsel momenti ve aynı zamanda ikinci kümülantı olur. Eğer varyans değeri var ise, ortalama değeri de vardır. Ama bunun aksi doğru değildir.

Tanımlama

Formüller

Eğer beklenen değer varsa, bir olasılık dağılımı için varyans dağılımın kendi ortalamasından sapmasının karesinin beklenen değeridir. Varyans kavramı dağılıma ait her bir değerin dağılımın ortalamasından ne kadar uzak olduğuyla ilgilidir. Varyans söz konusu sapmaların ortalama değerini ölçmektedir.

X değişkeninin beklenen değeri μ = E(X) olmak üzere, varyans şöyle tanımlanır:

Matematik notasyon kullanılarak bir rassal değişken X için varyans ya Var(X) ya ya da daha basitçe σ2 olarak gösterilir..

Bu tanımlama, eğer beklenen değer varsa, hem ayrık rassal değişkenler hem sürekli rassal değişkenler hem de karışık değişkenler için genel olarak doğrudur. Bu tanımdan ve beklenen değerlerin doğrusal olma niteliğinden varyans için şu formül çıkartılabilir:

Buna hesaplama formülü adı da verilir. Bu formüle göre

Varyans, karelerin ortalaması eksi ortalamanın karesine eşittir.

Bir X ayrık rassal değişkeni için, x değerleri olasılığa eşit olan olasılık kütle fonksiyonu bulunur; yani x1p1, ..., xnpn, olur. Bu halde aralıklı olasılık dağılımları için varyans şöyle de ifade edilebilir:

Buna göre varyans Xin kendi ortalamasından sapma karesinin beklenen değeri olur. Daha basit bir ifade ile

Aralıklı rassal değişken için, varyans her bir veri noktasının veri ortalamasından uzaklıklarının karelerinin ortalamasıdır; yani ortalama sapma kareleridir.

Bir X sürekli rassal değişkeni için beklenen değer E(X) operatörü yerine olasılık yoğunluk fonksiyonu yani i kapsayan ve entegrasyon gereken formül konulursa, varyans şu şekilde ifade edilebilir:

,

Ancak bazı olasılık dağılımları (örnegin Cauchy dağılımı) için beklenen değer anlamsızdır ve bu halde varyans da anlamlı değildir. Diğer bazı olasılık dağılımlarında ise beklenen değer bulunmakla beraber sonlu sayılı bir varyans bulunamaz, çünkü sürekli değişkenler için varyans değeri bulmak için gereken entegral yakınsama göstermez (örneğin Pareto dağılımı).

Örnekler

Varyans; verilerin aritmetik ortalamadan sapmalarının karelerinin aritmetik ortalaması olduğuna göre,

2,2,3,5,3 serisinin varyansı şu şekilde bulunur;

1) Verilerin aritmetik ortalaması (A.O) hesaplanır.

2) 1. maddedeki ortalamadan, verilerin sapmalarının karelerinin aritmetik ortalaması alınarak varyans bulunur.

Örneğin 1: Tablo ile verilmiş bir aralıklı deneysel dağılım

Bu örnekte bir X rastlantı değişkeninin i=1,2,3 için aldığı değerler ve X in bu değerleri alması olasılığı bir tablo olarak verilmiştir.

i123
xi-112
P(xi)0,50,30,2

Beklenen değer şöyle hesaplanır:

Genel formülle, varyans şöyle bulunur:

Hesaplama formülu ile ise varyans şöyle hesaplanır ve aynı sonuç verir:

Örneğin 2: Olasılık yoğunluk fonksiyonu verilmiş bir sürekli dağılım

Sürekli rassal değişken X için olasılık yoğunluk fonksiyonu şöyle verilmiştir:

Beklenen değer E(X) şöyle hesaplanır:

Varyans değeri Var(X) şöyle bulunur:

Anakütle varyansı ve örneklem varyansı

Teorik olasılık kuramı incelemeleri için varyans: formülü kullanılarak tanımlanır.

Sonlu bir anakütlenin varyansı aşağıdaki şekilde gösterilir:

. Bu özel bir varyans tanımı olarak sonlu anakütlelere özgü bir tanımdır.

Örneklem varyansı ise şu şekilde tanımlanmaktadır:

Örneklem varyansı, anakütle varyansının yansız bir kestirmicisidir. İspatı ise aşağıdaki şekilde gösterilir:

Bu özellikten faydalanılarak örneklem varyansının hesaplanması ile anakütle varyansına ilişkin kestirimlerde bulunulabilir. Bu durumda örneklemin rastsal bir örneklem olması önemlidir. Aksi takdirde örnekleme dayalı kestirimler sağlıklı sonuçlar vermeyecektir.

Varyansın biçimsel özellikleri

Varyansın şu özellikleri bulunmaktadır:

Aralarında korelasyon bulunmayan değişkenlerin toplamı için varyans

Varyansin diğer istatistiksel yayılım ölçülerine kıyasla tercihli olarak kullanılmasına nedenlerden birisi, birbirleri arasında korelasyon olmayan rassal değişkenlerin toplamının (veya farkının) varyansının, her bir rassal değişkenin tek başına olan varyanslarının toplamına (veya farkına) eşit olmasıdır; yani

Bu öneri çok kere korelasyon yerine daha güçlü bir ilişki olan değişkenlerin bağımsızlığı şartı kullanılarak verilir, ama korelasyon ilişkisi de yeterlidir.

Bu nedenle eğer değişkenlerin varyansları tüm ayni ise (yani hepsi σ2 ise), hemen bu formüle göre bunların ortalamasının varyansının şu ifade

olduğu görülür; çünkü n ile bölme bir doğrusal dönüşümdür.

Bu gerçek, merkezsel limit teoremi içinde özellikle kullanılan, örneklem ortalamasının standart hatasını belirler.

Aralarında korelasyon bulunan değişkenlerin toplamının varyansı

Genel olarak, değişkenler birbirleriyle aralarında korelasyon gösteriyorlarsa, toplamlarının varyansı kovaryanslarının toplamı olur:

Burada Kov kovaryanstır ve eğer herhangi bir rassal değişken bağımsız ise, bu değişkenle diğer değişkenler arasında bulunan her kovaryans değeri 0 olur. Verilen formül toplamın varyansının toplamı yapan parçaların kovaryans matrisinin bütün elemanlarına eşit olduğunu göstermektedir. Bu formül klasik sınama kuramında Cronbach'in alfa ölçüsü kavramını geliştirmek için de kullanılır.

Eğer değişkenlerin hep birbirine eğit varyansları, yani σ2, varsa ve ayrı ayrı değişkenler arasındaki korelasyonların ortalama değeri ρ ise, bu halde varyansların ortalaması şöyle ifade edilir:

Bu formüle göre ortalamanın varyansı korelasyonlar ortalaması ile birlikte artış gösterir.

Bunun yanında, eğer değişkenler için varyans 1 değerde ise (örneğin değişken değerleri standardize edilmişlerse) o halde bu formül daha da basitleştirilip şu sekli alır:

Bu formul klasik sinama teorisinde Spearman-Brown öngörü formülü için kullanılır. Eğer korelasyonlar sabit kalırlarsa veya aynı şekilde yakınsama gösterirlerse, bu ifade, n limitte sonsuz değere yakınsama gösterdikçe, ρ değerine yakınsama gösterir. Bunun bir sonucuna göre, eşit korelasyonları olan veya yakınsama gösteren ortalama korelasyonu olan standardize edilmiş değişkenler için ortalamanın varyansı şöyle ifade edilebilir:

Buna göre büyük sayıda standardize edilmiş değişkenlerin ortalamasının varyansı, yaklaşık olarak bunların ortalama korelasyonuna eşittir.

Bu formul diğer bir sonuç da ortaya çıkartır. Büyük sayılar yasası örneklem ortalamasının anakütle ortalamasına yakınsama göstereceğini önermesine rağmen, bu formülden açıktır ki, birbirine korelasyonu olan değişkenler bulunuyorsa örneklem ortalaması anakütle ortalamasına yakınsama göstermez.

Değişkenlerin ağırlıklı toplamının varyansı

Varyansın parçalara ayrılması

Varyans için hesaplama formülü

Varyans için hesaplama formülü hemen doğrudan doğruya beklenen değerlerin doğrusallarından ve yukarıda verilen tanımlamadan ortaya çıkar\;

Bu çok zaman pratikte varyans hesaplaması için kullanılır. Fakat eğer denklemin iki kısmının değerleri birbirine eşit veya çok yakınsa numerik yaklaşımlama hatasından etkilenip yanlış değerler verebilir.

Karakteristik özellik

Bir rassal değişkenin ikinci momentinin minimum değeri bu moment, rassal değişkenin ortalaması etrafında alınınca ortaya çıkar; yani

,

Bunun aksi olarak, eğer sürekli bir fonksiyon olan tüm X rassal değişkenleri için

koşulunu sağlıyorsa, o halde mutlaka (a > 0) şeklinde bir fonksiyon olması gerekmektedir. Bu koşul çoklu boyutlu hallerde de geçerlidir.[1]

Ayrıca bakınız

Kaynakça

  1. ^ Kaynak: A. Kagan and L. A. Shepp, "Why the variance?", Statistics and Probability Letters, C. 38, No 4, 1998, say. 329–333. (İngilizce)

Dış kaynaklar

  • Spiegel, Murray R ve Stephens, Larry J. (Tr.Çev.: Çelebioğlu, Salih) (2013) İstatistik, İstanbul: Nobel Akademik Yayıncılık ISBN 9786051337043


İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Kovaryans</span>

Olasılık teorisi ve istatistikte, kovaryans iki değişkenin birlikte ne kadar değiştiklerinin ölçüsüdür. Kovaryans, iki rastgele değişkenin beraber değişimlerini inceleyen bir istatistiktir. İki değişkenin birbirine benzer (eş) işlevli olması kovaryant; iki değişkenin birbirine zıt işlevli olması kontravaryant olarak ifade edilir.

<span class="mw-page-title-main">Ki-kare dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında ki-kare dağılım özellikle çıkarımsal istatistik analizde çok geniş bir pratik kullanım alanı bulmuştur.

Korelasyon, olasılık kuramı ve istatistikte iki rassal değişken arasındaki doğrusal ilişkinin yönünü ve gücünü belirtir. Genel istatistiksel kullanımda korelasyon, bağımsızlık durumundan ne kadar uzaklaşıldığını gösterir.

<span class="mw-page-title-main">Normal dağılım</span> sürekli olasılık dağılım ailesi

Normal dağılım, aynı zamanda Gauss dağılımı veya Gauss tipi dağılım olarak isimlendirilen, birçok alanda pratik uygulaması olan, çok önemli bir sürekli olasılık dağılım ailesidir.

<span class="mw-page-title-main">Standart sapma</span> İstatistikte bir varyasyon ölçüsü

Standart sapma, Olasılık kuramı ve istatistik bilim dallarında, bir anakütle, bir örneklem, bir olasılık dağılımı veya bir rassal değişken, veri değerlerinin yayılımının özetlenmesi için kullanılan bir ölçüdür. Matematik notasyonunda genel olarak, bir anakütle veya bir rassal değişken veya bir olasılık dağılımı için standart sapma σ ile ifade edilir; örneklem verileri için standart sapma için ise s veya s'

Merkezi limit teoremi büyük bir sayıda olan bağımsız ve aynı dağılım gösteren rassal değişkenlerin aritmetik ortalamasının, yaklaşık olarak normal dağılım göstereceğini ifade eden bir teoremdir. Matematiksel bir ifadeyle, bir merkezi limit teoremi olasılık kuramı içinde bulunan bir zayıf yakınsama sonucu setidir. Bunların hepsi, birçok bağımsız aynı dağılım gösteren rassal değişkenlerin herhangi bir toplam değerinin limitte belirli bir "çekim gücü gösteren dağılıma" göre dağılım gösterme eğiliminde olduğu gerçeğini önerir.

Parametrelerin tek bir değer olarak tahmin edilmelerine nokta tahmin adı verilir.

<span class="mw-page-title-main">Binom dağılımı</span>

Olasılık kuramı ve istatistik bilim kollarında, binom dağılımı n sayıda iki kategori (yani başarı/başarısızlık, evet / hayır, 1/0 vb) sonucu veren denemelere uygulanır. Araştırıcının ilgi gösterdiği kategori başarı olarak adlandırılır. Bu türlü her bir deneyde, bağımsız olarak, başarı (=evet=1) olasılığının p olduğu (ve yalnızca iki kategori sonuç mümkün olduğu için başarısızlık olasılığının 1 - p olduğu) bilinir. Bu türlü bağımsız n sayıda denemeler serisi içinde elde edilen başarı sayısının ayrık olasılık dağılımı binom dağılım olarak tanımlanır. Bir binom dağılım sadece iki parametre ile, yani n ve p ile tam olarak tanımlanır. Matematik notasyon olarak bir rassal değişken X binom dağılım gösterirse şöyle ifade edilir:

X ~ B(n,p)
<span class="mw-page-title-main">Geometrik dağılım</span>

Olasılık kuramı ve istatistik bilim dallarında geometrik dağılım şu iki şekilde ifade edilebilen ayrık olasılık dağılımıdır:

<span class="mw-page-title-main">Üstel dağılım</span>

Olasılık kuramı ve istatistik bilim dallarında üstel dağılımı bir sürekli olasılık dağılımları grubudur. Sabit ortalama değişme haddinde ortaya çıkan bağımsız olaylar arasındaki zaman aralığını modelleştirirken bir üstel dağılım doğal olarak ortaya çıkar.

Olasılık kuramı ve bir dereceye kadar istatistik bilim dallarında basıklık kavramı 1905da K. Pearson tarafından ilk defa açıklanmıştır. Basıklık kavramı bir reel değerli rassal değişken için olasılık dağılımının, grafik gösteriminden tanımlanarak ortaya çıkarılan bir kavram olan, sivriliği veya basıklığı özelliğinin ölçümüdür. Basıklık kavramının ayrıntıları olasılık kuramı içinde geliştirilmiştir. Betimsel istatistik için bir veri setinin basıklık karakteri pek dikkate alınmayan bir özellik olarak görülmektedir. Buna bir neden parametrik çıkarımsal istatistik alanında basıklık hakkında hemen hemen hiçbir kestirim veya sınama bulunmamasındandır ve pratik istatistik kullanımda basıklık pek önemsiz bir karakter olarak görülmektedir. Belki de basıklık ölçüsünün elle hesaplanmasının hemen hemen imkânsızlığı buna bir neden olmuştur.

<span class="mw-page-title-main">Laplace dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında Laplace dağılımı Pierre-Simon Laplace anısına isimlendirilmiş bir sürekli olasılık dağılımıdır. Arka arkaya birbiriyle yapıştırılmış şekilde ve bir de konum parametresi dahil edilerek birleştirilmiş iki üstel dağılımdan oluştuğu için, çift üstel dağılımı adı ile de anılmaktadır. İki bağımsız ve tıpatıp aynı şekilde üstel dağılım gösteren bir rassal değişken bir Laplace dağılımı ile işlev görürler. Bu, aynen üstel dağılım gösteren rassal zamanda değerlendirilen Brown devinimine benzer.

Olasılık kuramı ve istatistik bilim kollarında, çokdeğişirli normal dağılım veya çokdeğişirli Gauss-tipi dağılım, tek değişirli bir dağılım olan normal dağılımın çoklu değişirli hallere genelleştirilmesidir.

Olasılık kuramı içinde herhangi bir rassal değişken için karakteristik fonksiyon, bu değişkenin olasılık dağılımını tüm olarak tanımlar. Herhangi bir rassal değişken X için, gerçel doğru üzerinde, bu fonksiyonu tanımlayan formül şöyle yazılır:

<span class="mw-page-title-main">Büyük sayılar yasası</span>

Büyük Sayılar Kanunu ya da Büyük Sayılar Yasası, bir rassal değişkenin uzun vadeli kararlılığını tanımlayan bir olasılık teoremidir. Sonlu bir beklenen değere sahip birbirinden bağımsız ve eşit dağılıma sahip bir rassal değişkenler örneklemi verildiğinde, bu gözlemlerin ortalaması sonuçta bu beklenen değere yakınsayacak ve bu değere yakın bir seyir izleyecektir.

<span class="mw-page-title-main">Log-normal dağılım</span>

Olasılık kuramı ve istatistik bilim dallarında log-normal dağılım logaritması normal dağılım gösteren herhangi bir rassal değişken için tek-kuyruklu bir olasılık dağılımdır. Eğer Y normal dağılım gösteren bir rassal değişken ise, bu halde X= exp(Y) için olasılık dağılımı bir log-normal dağılımdır; aynı şekilde eğer X log-normal dağılım gösterirse o halde log(X) normal dağılım gösterir. Logaritma fonksiyonu için bazın ne olduğu önemli değildir: Herhangi iki pozitif sayı olan ab ≠ 1 için eğer loga(X) normal dağılım gösterirse, logb(X) fonksiyonu da normaldir.

İstatistik bilim dalında ağırlıklı ortalama betimsel istatistik alanında, genellikle örneklem, veri dizisini özetlemek için bir merkezsel konum ölçüsüdür. En çok kullanan ağırlıklı ortalama tipi ağırlıklı aritmetik ortalamadır. Burada genel olarak bir örnekle bu kavram açıklanmaktadır. Değişik özel tipli ağırlıklar alan özel ağırlıklı aritmetik ortalamalar bulunmaktadır. Diğer ağırlıklı ortalamalar ağırlıklı geometrik ortalama ve ağırlıklı harmonik ortalamadir. Ağırlıklı ortalama kavramı ile ilişkili teorik açıklamalar son kısımda ele alınacakdır.

Olasılık kuramı bilim dalında matematiksel beklenti veya beklenen değer veya ortalama birçok defa tekrarlanan ve her tekrarda mümkün tüm olasılıklarını değiştirmeyen rastgele deneyler sonuçlarından beklenen ortalama değeri temsil eder. Bir ayrık rassal değişkennin alabileceği bütün sonuç değerlerin olasılıklarıyla çarpılması ve bu işlemin bütün değerler üzerinden toplanmasıyla elde edilen değerdir. Bir sürekli rassal değişken için rassal değişken ile olasılık yoğunluk fonksiyonunun çarpımının aralığı belirsiz integralidir. Fakat dikkat edilmelidir ki bu değerin genel pratik anlamla rasyonel olarak beklenmesi pek uygun olmayabilir, çünkü matematiksel beklentiin olasılığı çok düşük belki sıfıra çok yakın olabilir ve hatta pratikte matematiksel beklenti bulunmaz. Ağırlıklı ortalama olarak da düşünülebilir ki değerler ağırlık katsayıları verilen olasılık kütle fonksiyonu veya olasılık yoğunluk fonksiyonudur.

Delta metodu istatistikte, bir asimtotik normal istatistiki tahmin edicinin fonksiyonu için bu tahmin edicinin sınırlayıcı varyans bilgisi kullanılarak yaklaşık bir olasılık dağılımı türetme metodudur. Delta metodu merkezi limit teoreminin genelleştirilmiş hali olarak ele alınabilir.

<span class="mw-page-title-main">Kovaryans matrisi</span>

İstatistik'te, kovaryans matrisi, rassal vektörlerin elemanları arasındaki kovaryansları içeren matristir. Kovaryans matrisi, skaler-değerli rassal değişkenler için var olan varyans kavramının çok boyutlu durumlara genelleştirilmesidir.