İçeriğe atla

Korelasyon

Korelasyon, olasılık kuramı ve istatistikte iki rassal değişken arasındaki doğrusal ilişkinin yönünü ve gücünü belirtir. Genel istatistiksel kullanımda korelasyon, bağımsızlık durumundan ne kadar uzaklaşıldığını gösterir.

Farklı durumlar için farklı korelasyon katsayıları geliştirilmiştir. Bunlardan en iyi bilineni Pearson çarpım-moment korelasyon katsayısıdır. İki değişkenin kovaryansının, yine bu değişkenlerin standart sapmalarının çarpımına bölünmesiyle elde edilir. Pearson ismiyle bilinmesine rağmen ilk olarak Francis Galton tarafından bulunmuştur.

Pearson çarpım-moment korelasyon katsayısı

İsimlendirme

Pearson çarpım-moment korelasyon katsayısı isminde, kovaryans hesaplanırken yapılan işlemin fiziksel moment hesabına benzerliği etkili olmuştur. Çift taraflı bir kaldıraçın iki yük kolundaki ağırlıkların momenti hesaplanırken kullanılan, ağırlık ile ağırlığın destek noktasına olan uzaklığın çarpımı ile her bir değişkenin ortalamaya olan uzaklıklarının bulunması arasındaki benzerlik bu isimlendirmeye neden olmuştur.[1]

Matematiksel özellikleri

Korelasyon katsayısı, bağımsız değişkenler arasındaki ilişkinin yönü ve büyüklüğünü belirten katsayıdır. Bu katsayı, (-1) ile (+1) arasında bir değer alır. Pozitif değerler direkt yönlü doğrusal ilişkiyi; negatif değerler ise ters yönlü bir doğrusal ilişkiyi belirtir. Korelasyon katsayısı 0 ise söz konusu değişkenler arasında doğrusal bir ilişki yoktur.

Matematik beklenti değerleri μX ve μY, standart sapmaları σX ve σY olan iki bağımsız değişken X ve Y arasındaki Pearson'un çarpım-moment korelasyon katsayısıX, Y), şu şekilde tanımlanır:

E değişkenin matematiksel beklenti değerini, cov ise kovaryansı ifade eder,

μX = E(X) olduğundan, σX2 = E(X2) - E2(X) ve

Y, için de aynısı geçerli olduğundan, şu ifadeyi yazabiliriz:

Korelasyon, yalnızca standart hataların ikisi de sonlu ve sıfırdan farklı ise, tanımlıdır. Korelasyon katsayısının 1'i (mutlak değer olarak) geçemeyeceği ise Cauchy-Schwarz eşitsizliğinin doğal bir sonucudur.

Tam bir artan doğrusal ilişkinin varlığı halinde korelasyon katsayısı 1 değerini alır, tam bir azalan ilişkinin varlığı halinde ise korelasyon katsayısı -1 değerini alır. Katsayının alabileceği diğer tüm değerler ise ilişkinin doğrusallığına bağlı olarak bu iki değer arasında olacaktır. Katsayı +1'e veya -1'e ne kadar yakınsa ilişkinin doğrusallığı o kadar güçlüdür.

Değişkenler istatistiksel olarak bağımsız ise korelasyon 0'dır fakat bunun tersi doğru değildir, çünkü korelasyon katsayısı yalnızca doğrusal olan ilişkiyi belirler.

Bir seri (x, y) noktalar ve her set için x ile y arasındaki korelasyon katsayısı değeri. Yukarı sıradan görüldüğü gibi korelasyon bir doğrusal ilişkinin yönünü ve rastgele yayılımını yansıtır. Orta sıradan anlaşılmaktadır ki korelasyon ilişkinin eğiliminden etkilenmez. Dikkat edilirse tam merkezdeki gösterimde ilişki 0'dır ama Y varyansı 0 olduğu için korelasyon katsayısı tanımlanamamaktadır. Son sıranın amacı korelasyonun doğrusal olmayan bağlantılardan da etkilenmediğini göstermektir.

Bir örnek: Rastgele X değişkeninin -1 ve +1 aralığında tekdüze dağılımına göre dağıldığını varsayalım ve Y = X2 ilişkisi geçerli olsun. Bu durumda Y tamamen X tarafından belirlenmiştir, öyle ki X ve Y birbirlerine bağımlıdır, fakat Pearson anlamdaki korelasyon 0 olacaktır. Ne var ki, X ve Y'nin birlikte normal dağıldığı durumda, istatistiksel bağımsızlık aynı zamanda korelasyonun da olmaması anlamına gelir..

Pearson'un çarpım-moment korelasyon katsayısı örneklem kestirimi

Bir rastgele örneklem olarak n büyüklükte X ve Y değişkenleri için aralıksal ölçekli veya oransal ölçekli sayısal veri serileri bulunmaktadır ve bu seriler n satırlı ve 2 sütunlu bir veri matrisi olarak ifade edilir. Bu veriler i = 1, 2, ..., n için xi ve yi olarak yazılır. Anakütle Pearson'un çarpım-moment korelasyon katsayısı olan ρXY; için, kestirim korelasyon katsayısı olan rxy şu formül ile hesaplanır:

Burada ve xi ve yi için örneklem aritmetik ortalamaları; sx and sy xi ve yi için örneklem standart sapmaları ve toplama Σ i=1 ile n arasındadır. Bu formül biraz değişme ile şöyle de verilebilir:

Eğer X ve Y verileri normal dağılım gösteren bir anakütleden gelmişlerse, Pearson'un örneklem korelasyon katsayısı bu iki anakütle değişkeni arasında bulunan korelasyon için en iyi korelasyon kestirimi olduğu ispat edilmiştir. Yine, anakütle korelasyonu için doğru olduğu gibi, örneklem korelasyon katsayısı da -1 ile +1 arasında değişme gösterir.

Verilen formül kullanılarak, komputer kullanarak tek geçişli algoritm olarak örneklem korelasyon katsayısı hesaplanması kolay görülmesine rağmen, pratikte özellikle bu formülün kullanışı sayısal kararsız olarak pek şöhret kazanmıştır. Aşağıda daha kararlı ve kesin sonuç veren örneklem korelasyon katsayı hesaplaması verilecektir.

Örneklem korelasyon katsayısının karesi (belirtme katsayısı), xi'in yi'ye doğrusal uygunluğunun sağlanması halinde, açıklanan yi varyansı olarak da tanımlanabilir. Bu matematiksel biçimde şöyle yazılır:

Burada σy|x2 terimi xi'in yi'ye arasındaki ilişkinin bir y = a + bx doğrusu ile ifade edilmesinin kestirimi sırasında ortaya çıkan hata karelerinin toplamıdır.

ile σy2 y için varyansdır; yani

Örneklem korelasyon katsayısı hem xi'e hem yi'ya göre simetrik olduğu için, eğer bağımlı değişken olarak xi seçilip yi'in buna doğrusal uygunluğunun kestirimi elde edilirse, aynı değer

elde edilir.

Bu denklem daha yüksek boyutlarda korelasyon katsayısı bulunması için bazı ipuçları vermektedir. Yukarıda Euclid uzayı içinde bir 2-boyutlu vektör grubu için tek-boyutlu bir ölçü uygulaması halinde ortaya çıkartılan açıklanan varyans kısmı örneklem korelasyon olarak tanımlanmıştır. Aynı şekilde m boyutlu bir doğrusal alt-manifoldta n boyutlu vektörlerin uygulanması olan çoklu korelasyon katsayısı tanımlanabilir. Örneğin z için x ile y'ye göre bir düzey olan z = a + bx + cy uygulanırsa, 'z'nin x ile y'ye göre korelasyonu şöyle verilir:

Korelasyonun açıklanması

Örneklem korelasyon katsayısı iki rassal değişken olan X ve Y'yi temsil eden vektörlerin kosinus değeri olarak açıklanabilir.

Örneklem korelasyon katsayısı mümkün uçsal değerler olan -1 veya +1 olursa, çok iyi iki değişken arasında çok iyi bir doğrusal bağlantı bulunduğu kabul edilir. Eğer örneklem korelasyon katsayısı 0'a eşitse, iki değişken arasında hiç doğrusal bağlantı bulunmaz. Dikkat edilirse hep örneklem korelasyon katsayısı ile doğrusal bağlantı açıklanmakta ve genel olarak bağlantıdan bahis edilmemektedir. Örneğin iki değişken arasında çok yakın bir daire şeklinde bağlantı bulunsa, örneklem korelasyon katsayısı 0'a yakın olacaktır.

Değişik istatistikçiler örneklem korelasyon katsayısının değerlerini daha ayrıntılı olarak açıklamaktadırlar. Burada Cohen(1988),[2] tarafından, özellikle psikoloji ilim dalında uygulamalı olarak, verilen ayrıntılı açıklama şu tabloda gösterilmektedir:

KorelasyonNegatifPozitif
Düşük-0,29 to -0,100,10 to 0,29
Orta derecede-0,49 to -0,300,30 to 0,49
Yüksek-0,50 to -1,000,50 to 1,00

Bu ayrıntılı açıklama çok subjektifdir ve belli bir bilim dalı için (psikoloji) uygundur ama genelleştirilmesi uygun değildir. Değişik bilim dalları korelasyon katsayısı değerlerinin değişik olarak açıklamasını kabul etmektedirler. Örneğin çok dakik ölçüm aletleri ile ortaya çıkarılan ölçüler arasında bulunan 0,9 korelasyon değerinin çok düşük olduğu kabul edilebilir; halbuki ayni katsayı değeri bir sosyal bilimci veya iktisatçı tarafından çok yüksek (hatta gerçekliğine şüphe yaratırcasına büyük) olarak kabul edilmektedir.

Korelasyon hakkında yaygın bazı hatalı düşünceler

Korelasyon ve nedensellik

İstatistikte korelasyon hakkında çok kullanılan ve her istatistik kullananın bilmesi gerek bir cümle şudur:

Korelasyon veya doğrusal ilişki nedensellik değildir.

Genellikle çok kişi iki değişken arasında bir ilişki kurulunca birinin sebep diğerinin sonuç olduğuna ve birinin diğerine neden olduğuna inanmış görünürler. Gerçekten nedensellik ve korelasyon birbirine bağlı kavramlardır: nedensellik ispat edilmesi için korelasyonun bulunması gereklidir ama bu nedensellik göstermek için yeterli değildir. Nedensellik ve korelasyon birbirlerine eşit değillerdir ama daha uygun cümleler ile

Empirik olarak gözümlenen birlikte değişme nedensellik açıklaması için gereklidir ama yeterli değildir.
Korelasyon nedensellik değildir; ama nedenseliğin daha ayrıntılı incelenmesini gerektiren ipucunu sağlar.

İstatistikte birbiri ile çok yakından doğrusal ilişkili gibi görülen ama biri diğerine sebep-sonuç olmayan birçok pratik örnek bilinmektedir. Genellikle bu türlü nedensellikden doğmayan yakın ilişkiye sahte korelasyon adı verilmektedir. Genellikle bu sahte korelasyon iki değişkenin de bir başka saklı olan değişken tarafından etkilenmesi dolayısı ile ortaya çıkar. Biraz abstre olarak A ve B arasında bulunan yakın korelasyon daha objektif olarak dikkatle incelenince üç tür mümkün ilişki olabilceği görülür:

A nedendir B sonuçtur;
B nedendir A sonuçtur;

yahut

C neden A sonuçtur VE C neden B sonuçtur.

İşte sahte korelasyon üçüncü halde ortaya çıkar. A ve B arasında görülen yakın ilişki birbirinin sebep-sonuç olmasından doğmaz. Yakın korelasyon her hâlde sebep-sonuç ilişkisi ifade etmez: "korelasyon nedensellik değildir".

Sahte korelasyon hakkında birçok örnek verilmiştir ve bunlar bazen alaycı, bazen şaşırtıcı ve bazen gülünçtür. Bunlardan bazılarını verip niçin sahte korelasyon bulunduğunu açıklayalım:

  • İskandinavya'da 19. yüzyıl sonu ve 20. yüzyıl için yıllık leylek sayısı ve yıllık çocuk doğumları inceleyince çok yakın bir pozitif korelasyon bulunmaktadır. Bu, doğan çocukların leylekler tarafından getirildikleri önermesini doğrulamaz. Hem çocuk doğum sayısı hem de leylek sayısı ekonomik gelişme ve şehirleşme dolayısıyla azalmış ve bu iki azalma birinin diğerine sebep-sonuç olmasından ortaya çıkmamıştır.
  • Bir sahil şehrinde aylık dondurma satışları ile aylık denizde boğulma sayıları yıl içinde birlikte artıp eksilme gösterip yakın pozitif korelasyon gösterirler. Bu demek değildir ki fazla dondurma fazla boğulmalara sebep-sonuç olmakta veya boğulmaların azalması dondurma satışlarına aksi tesirde bulunmaktadır. Her ikisi de mevsim değiştiği için aynı yönde değişik etki görmektedir.
  • Ayakkabı ile uyumak, baş ağrısı ile uyanmakla yakın pozitif korelasyon gösterir. Bu demek değildir ki ayakkabı ile yatmak baş ağrısı doğurur. Çok daha uygun bir açıklama, her ikisinin de fazla alkollü içki kullanımı sonucu ortaya çıkmasıdır.
  • Bir yangına müdahale eden itfaiye mensuplarının sayısı ile yangından ortaya çıkan maddi hasar birbirleri ile yakın korelasyon gösterirler. Bu demek değildir ki itfaiye mensubu sayısı artışı (yağmacı artışı gibi) daha çok maddi hasar çıkmasına neden olur. Asıl açıklama yangının büyüklüğü ve şiddetine dayanır; büyük yangınlar daha çok itfaiyeci gerektirir ve daha çok hasar doğurur.
  • 1950'lerden beri hava kirliliği göstergeleri ile polise bildirilen hırsızlık olayları sayısı pozitif korelasyon göstermektedir. Bu demek değildir ki hava kirliliği artışı hırsızlık olaylarının artışına; yahut hava kirliliğinin artışı hırsızlık sayısı artışına neden olmuştur. Her iki değişkende de hızlı şehirleşme dolayısı ile artış görülmektedir.

Korelasyon ve doğrusallık

Korelasyon katsayı değeri aynı r=0,81 olan dört değişik örneklem veri

Pearson'un korelasyon katsayısı iki değişken arasındaki doğrusal ilişkinin gücünü göstermekle beraber, kestirim olarak bulunan katsayı değeri bu ilişkiyi tam olarak açıklamak için yeterli değildir. Bu sonuç eğer veriler normal dağılım göstermiyorlarsa daha da önem kazanmaktadır.

Dört değişik veri çiftini ve dört serpme diyagramını kapsayan ve istatistikçiler arasında çok iyi bilinen yandaki gösterimler İngiliz asıllı Amerikan istatistikçi Francis Anscombe tarafından hazırlanan bir yazıda gösterilmiştir.[3] Gösterilen 4 değişik y değişkeninin hepsi için de aynı olan ortalama (7,5), standart sapma (4,12), korelasyon katsayısı (0,81) ve regresyon doğrusu () bulunmaktadır. Fakat gösterimden açıkça görülmektedir ki dört Y değişkenin dağılımları çok farklıdır. Sol yukarıdaki göstergede iki değişken birbirine korelasyon ile ilişkili olup her iki değişkenin de normal dağılıma uyduğu varsayımlarının gerçeğe uygun olduğu kabul edilebilir. Üst sağdaki gösterim de değişkenlerin normal dağılım gösterdikleri kabul edilemez; iki değişken arasında ilişki olmakla beraber bunun doğrusal olduğu da kabul edilemez ve bu nedenle yüksek korelasyon katsayısı bu ilişkiyi açıklayamaz. Alt soldaki göstergeden görülmektedir ki iki değişken arasında tam bir doğrusal ilişki vardır, ancak tek bir aykırı değer bulunmakta ve bu da korelasyon katsayı değerini 1'den 0.81'e düşürmektedir. Alt sağdaki son gösterimden iki değişken arasındaki ilişkinin doğrusal olmadığı ve bulunan tek bir aykırı noktanın hesaplanan yüksek korelasyon katsayısına neden olduğu görülmektedir.

Bu örnek açıkça göstermektedir ki bir özetleme istatistiğine (burada korelasyon katsayı değerine) dayanarak, verilerin daha ayrıntılı incelenmesi yapılmadan, ortaya sonuç çıkartma iyi inceleme için gayet yetersizdir.

Korelasyon katsayısının kesin olarak tek-geçişli olarak bilgisayarla hesaplanması

Sayısal olarak kararlılığı ve kesinliği iyi olan Pearson'un çarpan-moment korelasyon katsayısı hesaplama algoritması için şu sözdekod verilmiştir:

sum_sq_x = 0
sum_sq_y = 0
sum_xy = 0
mean_x = x[1]
mean_y = y[1]
for i in 2 to N:
    sweep = (i - 1.0) / i
    delta_x = x[i] - mean_x
    delta_y = y[i] - mean_y
    sum_sq_x += delta_x * delta_x * sweep
    sum_sq_y += delta_y * delta_y * sweep
    sum_xy += delta_x * delta_y * sweep
    mean_x += delta_x / i
    mean_y += delta_y / i 
pop_sd_x = sqrt(sum_sq_x / N)
pop_sd_y = sqrt(sum_sq_y / N)
cov_x_y = sum_coproduct / N
korelasyon = cov_x_y / (pop_sd_x * pop_sd_y)

Ayrıca bakınız

Kaynakça

  1. ^ Miles, J., & Banyard, P. (2007). Understanding and using statistics in psychology: a practical introduction. Sage.
  2. ^ Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.) Hillsdale, NJ: Lawrence Erlbaum Associates.
  3. ^ Anscombe, Francis J. (1973) Graphs in statistical analysis. American Statistician, C.27 say. 17-21.

Dış bağlantılar


İlgili Araştırma Makaleleri

Olasılık kuramı ve istatistik bilim dallarında varyans bir rassal değişken, bir olasılık dağılımı veya örneklem için istatistiksel yayılımın, mümkün bütün değerlerin beklenen değer veya ortalamadan uzaklıklarının karelerinin ortalaması şeklinde bulunan bir ölçüdür. Ortalama bir dağılımın merkezsel konum noktasını bulmaya çalışırken, varyans değerlerin ne ölçekte veya ne derecede yaygın olduklarını tanımlamayı hedef alır. Varyans için ölçülme birimi orijinal değişkenin biriminin karesidir. Varyansın karekökü standart sapma olarak adlandırılır; bunun ölçme birimi orijinal değişkenle aynı birimde olur ve bu nedenle daha kolayca yorumlanabilir.

<span class="mw-page-title-main">Kovaryans</span>

Olasılık teorisi ve istatistikte, kovaryans iki değişkenin birlikte ne kadar değiştiklerinin ölçüsüdür. Kovaryans, iki rastgele değişkenin beraber değişimlerini inceleyen bir istatistiktir. İki değişkenin birbirine benzer (eş) işlevli olması kovaryant; iki değişkenin birbirine zıt işlevli olması kontravaryant olarak ifade edilir.

Regresyon analizi, iki ya da daha çok nicel değişken arasındaki ilişkiyi ölçmek için kullanılan analiz metodudur. Eğer tek bir değişken kullanılarak analiz yapılıyorsa buna tek değişkenli regresyon, birden çok değişken kullanılıyorsa çok değişkenli regresyon analizi olarak isimlendirilir. Regresyon analizi ile değişkenler arasındaki ilişkinin varlığı, eğer ilişki var ise bunun gücü hakkında bilgi edinilebilir. Regresyon terimi için öz Türkçe olarak bağlanım sözcüğü kullanılması teklif edilmiş ise de Türk ekonometriciler arasında bu kullanım yaygın değildir.

<span class="mw-page-title-main">Normal dağılım</span> sürekli olasılık dağılım ailesi

Normal dağılım, aynı zamanda Gauss dağılımı veya Gauss tipi dağılım olarak isimlendirilen, birçok alanda pratik uygulaması olan, çok önemli bir sürekli olasılık dağılım ailesidir.

Pauli matrisleri 2 × 2' lik, karmaşık sayılar içeren Hermisyen ve üniter matrislerden oluşan bir settir. Genellikle Yunan alfabesindeki 'sigma' (σ), harfiyle sembolize edilirler. Bu matrisler:

<span class="mw-page-title-main">Standart sapma</span> İstatistikte bir varyasyon ölçüsü

Standart sapma, Olasılık kuramı ve istatistik bilim dallarında, bir anakütle, bir örneklem, bir olasılık dağılımı veya bir rassal değişken, veri değerlerinin yayılımının özetlenmesi için kullanılan bir ölçüdür. Matematik notasyonunda genel olarak, bir anakütle veya bir rassal değişken veya bir olasılık dağılımı için standart sapma σ ile ifade edilir; örneklem verileri için standart sapma için ise s veya s'

Merkezi limit teoremi büyük bir sayıda olan bağımsız ve aynı dağılım gösteren rassal değişkenlerin aritmetik ortalamasının, yaklaşık olarak normal dağılım göstereceğini ifade eden bir teoremdir. Matematiksel bir ifadeyle, bir merkezi limit teoremi olasılık kuramı içinde bulunan bir zayıf yakınsama sonucu setidir. Bunların hepsi, birçok bağımsız aynı dağılım gösteren rassal değişkenlerin herhangi bir toplam değerinin limitte belirli bir "çekim gücü gösteren dağılıma" göre dağılım gösterme eğiliminde olduğu gerçeğini önerir.

<span class="mw-page-title-main">Çarpıklık</span>

Çarpıklık olasılık kuramı ve istatistik bilim dallarında bir reel-değerli rassal değişkenin olasılık dağılımının simetrik olamayışının ölçülmesidir.

Olasılık kuramı ve bir dereceye kadar istatistik bilim dallarında basıklık kavramı 1905da K. Pearson tarafından ilk defa açıklanmıştır. Basıklık kavramı bir reel değerli rassal değişken için olasılık dağılımının, grafik gösteriminden tanımlanarak ortaya çıkarılan bir kavram olan, sivriliği veya basıklığı özelliğinin ölçümüdür. Basıklık kavramının ayrıntıları olasılık kuramı içinde geliştirilmiştir. Betimsel istatistik için bir veri setinin basıklık karakteri pek dikkate alınmayan bir özellik olarak görülmektedir. Buna bir neden parametrik çıkarımsal istatistik alanında basıklık hakkında hemen hemen hiçbir kestirim veya sınama bulunmamasındandır ve pratik istatistik kullanımda basıklık pek önemsiz bir karakter olarak görülmektedir. Belki de basıklık ölçüsünün elle hesaplanmasının hemen hemen imkânsızlığı buna bir neden olmuştur.

Olasılık kuramı ve istatistik bilim kollarında, çokdeğişirli normal dağılım veya çokdeğişirli Gauss-tipi dağılım, tek değişirli bir dağılım olan normal dağılımın çoklu değişirli hallere genelleştirilmesidir.

İstatistik bilim dalında, Spearman'ın sıralama korelasyon katsayısı veya Spearman'ın rho, bu istatistiksel ölçüyü ilk ortaya atan İngiliz psikolog Charles Edward Spearman'a atfen adlandırılmıştır. Matematik notasyon olarak çok defa eski Yunan harfi ρ ile belirtilir. Bir parametrik olmayan istatistik ölçüsüdür ve iki değişken arasındaki bağımlılık, yani korelasyon, ölçüsü olarak bulunup kullanılır. Bu demektir ki Spearman'in rho (ρ) katsayısı iki değişken için çokluluklar dağılımı hakkında hiçbir varsayım yapmayarak, bu iki değişken arasında bulunan bağlantının herhangi bir monotonik fonksiyon ile ne kadar iyi betimlenebilineceğini değerlendirmek amaçlı incelemedir.

<span class="mw-page-title-main">Log-normal dağılım</span>

Olasılık kuramı ve istatistik bilim dallarında log-normal dağılım logaritması normal dağılım gösteren herhangi bir rassal değişken için tek-kuyruklu bir olasılık dağılımdır. Eğer Y normal dağılım gösteren bir rassal değişken ise, bu halde X= exp(Y) için olasılık dağılımı bir log-normal dağılımdır; aynı şekilde eğer X log-normal dağılım gösterirse o halde log(X) normal dağılım gösterir. Logaritma fonksiyonu için bazın ne olduğu önemli değildir: Herhangi iki pozitif sayı olan ab ≠ 1 için eğer loga(X) normal dağılım gösterirse, logb(X) fonksiyonu da normaldir.

İstatistik bilim dalında ağırlıklı ortalama betimsel istatistik alanında, genellikle örneklem, veri dizisini özetlemek için bir merkezsel konum ölçüsüdür. En çok kullanan ağırlıklı ortalama tipi ağırlıklı aritmetik ortalamadır. Burada genel olarak bir örnekle bu kavram açıklanmaktadır. Değişik özel tipli ağırlıklar alan özel ağırlıklı aritmetik ortalamalar bulunmaktadır. Diğer ağırlıklı ortalamalar ağırlıklı geometrik ortalama ve ağırlıklı harmonik ortalamadir. Ağırlıklı ortalama kavramı ile ilişkili teorik açıklamalar son kısımda ele alınacakdır.

Matematik bilimi içinde moment kavramı fizik bilimi için ortaya çıkartılmış olan moment kavramından geliştirilmiştir. Bir bir reel değişkenin reel-değerli fonksiyon olan f(x)in c değeri etrafında ninci momenti şöyle ifade edilir:

Olasılık kuramı bilim dalında matematiksel beklenti veya beklenen değer veya ortalama birçok defa tekrarlanan ve her tekrarda mümkün tüm olasılıklarını değiştirmeyen rastgele deneyler sonuçlarından beklenen ortalama değeri temsil eder. Bir ayrık rassal değişkennin alabileceği bütün sonuç değerlerin olasılıklarıyla çarpılması ve bu işlemin bütün değerler üzerinden toplanmasıyla elde edilen değerdir. Bir sürekli rassal değişken için rassal değişken ile olasılık yoğunluk fonksiyonunun çarpımının aralığı belirsiz integralidir. Fakat dikkat edilmelidir ki bu değerin genel pratik anlamla rasyonel olarak beklenmesi pek uygun olmayabilir, çünkü matematiksel beklentiin olasılığı çok düşük belki sıfıra çok yakın olabilir ve hatta pratikte matematiksel beklenti bulunmaz. Ağırlıklı ortalama olarak da düşünülebilir ki değerler ağırlık katsayıları verilen olasılık kütle fonksiyonu veya olasılık yoğunluk fonksiyonudur.

Sıralama korelasyonu istatistik bilimi içinde aynı istatistik birimlerinin değişik kriter değişkene gore iki değişik sıralama arasında bulunan bağlantıyı inceler. Örneklem verisi kullanarak hesaplanan sıralama korelasyon katsayısı iki sıralama arasındaki doğrusal ilişkiyi ölçer ve elde edilen katsayının istatistiksel anlamlılığını değerlendirir.

F-testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan parameterik çıkarımsal sınama yöntemidir. F-testi sıfır hipotezine göre gerçekte bir F-dağılımı gösteren sınama istatistiği bulunduğu kabul edilen hallerde, herhangi bir istatistiksel sınama yapma şeklidir. Bu çeşit bir istatistiksel sınama önce Ronald Fisher tarafından 1920'li yıllarda tek yönlü varyans analizi için ortaya atılıp kullanılmış ve sonradan diğer şekillerde F-dağılım kullanan sınamalar da ortaya atılınca, bu çeşit sınamalara genel isim olarak F-testi adı verilmesi Ronald Fisher anısına George W. Snecedor tarafından teklif edilip, istatistikçiler tarafından F-testi bir genel isim olarak kabul edilmiştir.

Ki-kare testi veya χ² testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan bazıları parametrik olmayan sınama ve diğerleri parametrik sınama yöntemidir. Bu çeşit istatistiksel sınamalarda test istatistiği için "örnekleme dağılımı", sıfır hipotez gerçek olursa ki-kare dağılımı gösterir veya sıfır hipotez "asimptotik olarak gerçek" olursa, eğer sıfır hipotez gerçekse ve eğer örnekleme hacmi istenilen kadar yeterli olarak büyük ise bir ki-kare dağılımına çok yakın olarak yaklaşım gösterir.

Phi katsayısı veya Φ - katsayısı veya ortalama kare kontenjansı katsayısı olarak isimlendirilen ve matematik notasyonla by φ olarak ifade edilen iki tane iki-değerli isimsel veya sırasal değişkenin birbirine "birliktelik (association)" ilişkisini gösteren ölçü katsayılarıdır.

Matematikte katsayı, polinomun bazı terimlerinde, herhangi bir ifadenin bir serisindeki çarpma faktörüdür. Genellikle bir sayıdır fakat ifadede herhangi bir değişken de olabilir. Örneğin;