İçeriğe atla

Değerleyici güvenebilirliği

Kontrol Edilmiş

Değerleyici güvenebilirliği, değerleyiciler arasında uyuşma veya konkordans değerleyiciler arasında bulunan uyuşma derecesini ölçmek amacı ile kullanılan istatistiksel yöntemleri kapsar.[1]

Bu yöntemlerin amacı yargı mevkiinde olan kişilerin yaptığı sayısal veya sayısala dönüştürülebilir değerlendirmelerde ne kadar hemfikir veya türdeş olduklarına bir sayısal değer bulmaktır. Özellikle aynı konuyu veya konumu değerlendiren insancıl değerleyicileri bu çeşit yargıya varma yeteneklerini geliştirmek ve değerlemelerinin daha da adilane olmasını sağlamak için bu yöntemler çok kullanışlıdır. Eğer belli bir değişkene göre yapılan değerlemelerde uyuşma yoksa ya kullanılan değişken veya seçim yapılabilecek kategoriler listesinde bazı eksiklikler veya hatalar vardır ya da değerleyicilerin yargılarında uyuşmayı iyileştirmek için yeniden veya daha fazla eğitim sağlamak gereği ortaya çıkar.

Değerleyiciler arasındaki uyuşmanın ölçülmesi için kullanılan birkaç istatistiksel yöntem bulunmaktadır. Değişik istatistiksel ölçüler değişik tipte ölçülme ölçeğindeki değiskenlerle ilişkilidir. Bazı seçilebilecek istatistiksel ölçüler şunlardır: uyuşma için ortak-olasılık, kappa katsayıları, değerleyiciler arası korelasyon katsayıları, konkordans korelasyon katsayısı ve sınıf içi korelasyon katsayısı.

Uyuşma için ortak olasılık

Uyuşma için ortak olasılık genellikle en basit ve bu nedenle güçlü ölçme sağlar. Bu ölçüyü hesaplamak için her sayısal değerleme kategorisi, yani değerleme puanı, için (örneğin 1, 2,.. 5) her değerleyicinin vermiş olduğu sayı o değerleme kategorisi için verilmiş olan toplam sayısı ile bölunüur. Bu ölçü verilerin tam olarak isimsel ölçekli olduğunu varsaymaktadır. Değerleyiciler arası uyuşmanın yalnızca rastgeleliğe bağlı olma ihtimalini de hesaba katmamaktadır.

Kappa istatistikleri

İki değerleyici problemine için uygun olan Cohen'in kappa katsayısı[2] ve bunun değişmiyen sabit çok sayıda değerleyici problemlerine adaptasyonu olan Fleiss'in kappa katsayısı[3] uyuşma için ortak olasılık ölçüsünden daha uygun sonuç verdiği kabul edilir; çünkü değerleyici uyuşmasının sırf rastgelelik dolayısı ile ortaya çıkması da kappa ölçülerine içeriktir. Ancak kappa olçüleri de, yine uyuşma için ortak olasılık ölçüsü gibi verilerin isimsel ölçekli yani kategori puanlarının arasında hiç doğal olarak sırasallık bulunmadığını varsaymaktadırlar. Hâlbuki pratikte birçok değerlendirme için kabul edilen kategoriler ve verilen puanlar sırasal ölçeklidirler.

Korelasyon katsayıları

Pearson'un çarpım-moment korelasyon katsayısı veya Spearman'in sıralama korelasyon katsayısı veya Kendall'ın sıralama korelasyon katsayısı değerleyicileri ikişer ikişer alarak değerlendirme puanları arasındaki doğrusal ilişkiyi bir korelasyon katsayısı olarak bulurlar. Her üç korelasyon katsayısı da -1 ile +1 arasında değişmekte ve eğer iki değerleyici arasında uyuşma varsa +1 yakın olması gerekmektedir. Pearson'un 'si için elemanlar verilen puanların (veya seçilen kategori sayılarının) aralıklı ölçekli veya orantılı ölçekli yani niceliksel olmaları gerekmektedir.

Pearson'un bu türlü ölçekli olduğu kabul edildiği gibi, genel olarak daha fazla çıkartımsal istatistik kullanılacaksa (örneğin için bir guvenilme araligi kurulacaksa), bu verilerin bir normal dağılım gösteren bir anakütleden geldiği varsayımı olduğu da kabul edilir. Hâlbuki Spearman'ın 'su ve Kendall'ın 'sı içinse puanların (veya seçilen kategori sayılarının) sırasal ölçekli olduğu varsayılır. Bu türlü korelasyon katsayıları parametrik olmayan istatistik veya dağılım gösteremeyen istatistik olarak kabul edilmektedir.

Dikkat edilirse bu üç değişik korelasyon katsayısı (, ve ) değerleyicileri çift çift karşılaştırmaktadır. Mümkün olan bütün çifter karşılaştırmalar hep birlikte bir korelasyon matrisi halinde ifade edilebilir. Bu korelasyon matrisi çapraza göre simetrik olduğundan yalnız bir üst üçgen veya alt üçgen şekilde gösterebilinir. Ama yine de çok sayıda değerleyici olduğu hallerde bu korelasyon matrisi tum uyuşmayı gösteremez.

Eğer ikiden daha çok sayıda değerleyici varsa ve bu çoklu sayıda değerleyici için tek bir konkordans katsayısı bulunmak istenirse bu halde Kendall'in konkordans katsayısı bulunabilir.[4] Kendall'in katsayısı için değişme aralığı 0 (hiç uyuşma olmaması) ile 1 (tam olarak uyuşma olması) olur. Kendall'in katsayısı parametrik olmayan istatistik olduğu için, özellikle verilerin normal dağılım gösterdiği varsayılan Pearson'un çarpım-momenti korelasyon katsayısı kiyasla, daha güçlü olduğu kabul edilir.

Sınıf-içi korelasyon katsayısı

Değerleyici güvenebilirliğinin sınanması için bir diğer yöntem de sınıf-içi korelasyon katsayısı hesaplanmasıdır.[5] Bu katsayı hesaplanması için birkaç değişik formül bulunmaktadır. Bir özel şekildeki formül

  • bir gözlemin varyansı ile gerçek puanlamanın gözümlenen elamanlar arasındaki değişkenliği ile orantısı

olarak tanımlanmaktadır.[6]

Bu şekil sınıf-içi korelasyon katsayısı 0.0 ve 1.0 değerleri arasında değişebilmektedir. (Daha önce popüler olarak kullanılan bir diğer şekilde hesaplanan katsayı için değişme aralığı -1 ile +1 olur). Her gözümlenen elamana değerleyiciler tarafından verilen değerleme puanları arasında çok az değişkenlik varsa (yani bütün değerleyiciler ya aynı ya da çok yakın değerleme puanı vermişlerse, sınıf-içi korelasyon katsayısı değeri yüksek (yani '+1'e yakın) olacaktır. Sınıf-içi korelasyon katsayısı hem değerleyiciler arasındaki korelasyonu ve hem de her bir eleman tabakasının değişik değerlendirilmesi ihtimalini de göz önüne aldığı için Pearson'un , Spearman'ın ve Kendall'ın korelasyon katsayılarından daha ayrıntılı ve uygun sonuç verdiği kabul edilebilir.

Uyuşma için limit

Bland-Altman gösterimi

Sadece iki degerleyici bulunduğu hallerde bir diğer degerleyici uyusmasini analiz iki degerleyici arasında bulunan farkları bulup bu farkların ortalamasını almaktır. Bu degerleme farklarının standart sapmasi da bulunarak anakutle ortalama farkları için bir guven araligi kurmak da mumkun olur. Eger iki degerleyici genellikle uyusmakta iseler ortalama sifira yakın olacaktir. Eger bir degerleyici surekli olarak diğerinden degismeyen sekilde devamli fark gösteriyorsa, ortalama sifirdan uzak olacaktir ama guven araligi dar olacaktir. Eger iki degerleyici birbiri ile uyusamuyor ise ama bu uyusmama bir tutarli sekilde degil de gayet rastgele oluyorsa, o zaman ortalama sifir yakınında olabilir ama guven araligi genis olacaktir.

Bland ve Altman[7] bu aciklamayi bir ozel gösterim ortaya cikarak daha da genisletmisler. Bu gösterimde her bir eleman için degerleme farkları gösterilmektedir. Yatay eksen her bir degerlenen eleman dikey eksende iki degerleyicinin arasındaki degerleme puan farki gösterilir; boylece gösterimin içinde her bir eleman için bir nokta bulkunacaktir. Farkların ortalaması bir yatay eksen paralel doğru ortaya cikartir ve bunun üstünde ust guven limiti ve altında alat guven limit cizilir.

Bland-Altman gösterimi bu grafik içinde gösterilen noktaların bu ortalama etrafında ve guven limitlerine gore nasil bir gorunum gösterdiğini incelemeye yardim eder. Anack bu arastirma cok defe subjektif goruse baglidir. Uyusma olmasi bu nokataların ortalama etrafında ve guven araligi içinde rastgele dagilmasi ile anlasilir. Aralik disina cikan dislak noktalar olup olmadığı, bir belli grup elaman için belli bir turlu fark olmamasi gibi olagandisi gorunuslerinde olup olmadığı arastirilabilir.

Kaynakça

  1. ^ Gwet,K. (2001) Handbook of Inter-Rater Reliability, (Gaithersburg : StatAxis Publishing) ISBN 0-9708062-0-5
  2. ^ Cohen, J. (1960) "A coefficient for agreement for nominal scales" in Education and Psychological Measurement. Cilt 20, say. 37-46
  3. ^ Fleiss, J. L. (1971) "Measuring nominal scale agreement among many raters" in Psychological Bulletin. Cilt 76, Sayı 5, say. 378-382
  4. ^ Kendall,M.G.; Babington Smith, B. (Sep 1939). "The Problem of m Rankings". The Annals of Mathematical Statistics Cilt 10 sayı 3) say. 275-287
  5. ^ Shrout,P. ve Fleiss,J.L. (1979) "Intraclass correlation: uses in assessing rater reliability" in Psychological Bulletin. Cilt 86, Sayı 2, say. 420-428
  6. ^ Everitt, B. (1996) Making Sense of Statistics in Psychology (Oxford : Oxford University Press) ISBN 0-19-852366-1
  7. ^ Bland,J.M. ve Altman,D.G. (1986). Statistical methods for assessing agreement between two methods of clinical measurement. Lancet i, pp. 307--310.

Dışsal kaynaklar

İlgili Araştırma Makaleleri

Klasik mekanikte momentum ya da devinirlik, bir nesnenin kütlesi ve hızının çarpımıdır; (p = mv). Hız gibi, momentum da vektörel bir niceliktir, yani büyüklüğünün yanı sıra bir yöne de sahiptir. Momentum korunumlu bir niceliktir ; yani bu, eğer kapalı bir sistem herhangi bir dış kuvvetin etkisi altında değilse, o kapalı sistemin toplam momentumunun değişemeyeceği anlamına gelir. Momentum benzer bir konu olan açısal momentum ile karışmasın diye, bazen çizgisel momentum olarak da anılır.

Fizikte moment, fiziksel niceliğin mesafe ile bileşimidir. Momentler, genellikle sabit bir referans noktasına ya da eksene göre tanımlanırlar, ilgili referans noktasından ya da ekseninden belirli bir mesafede ölçülen fiziksel nicelikleri ele alırlar. Mesela bir kuvvetin momenti, o kuvvetin kendisinin ve bir eksenden uzaklığının çarpımıdır ve ilgili eksenin etrafında dönmeye sebep olur. Prensip olarak herhangi bir fiziksel nicelik, moment oluşturmak üzere bir mesafe ile bileşebilir. Sıkça kullanılan nicelikler içinde kuvvetler, kütleler ve elektrik yük dağılımları bulunmaktadır.

Olasılık kuramı ve istatistik bilim dallarında varyans bir rassal değişken, bir olasılık dağılımı veya örneklem için istatistiksel yayılımın, mümkün bütün değerlerin beklenen değer veya ortalamadan uzaklıklarının karelerinin ortalaması şeklinde bulunan bir ölçüdür. Ortalama bir dağılımın merkezsel konum noktasını bulmaya çalışırken, varyans değerlerin ne ölçekte veya ne derecede yaygın olduklarını tanımlamayı hedef alır. Varyans için ölçülme birimi orijinal değişkenin biriminin karesidir. Varyansın karekökü standart sapma olarak adlandırılır; bunun ölçme birimi orijinal değişkenle aynı birimde olur ve bu nedenle daha kolayca yorumlanabilir.

Korelasyon, olasılık kuramı ve istatistikte iki rassal değişken arasındaki doğrusal ilişkinin yönünü ve gücünü belirtir. Genel istatistiksel kullanımda korelasyon, bağımsızlık durumundan ne kadar uzaklaşıldığını gösterir.

İstatistiksel terimler, kavramlar ve konular listesi matematik biliminin çok önemli bir alt-bölümü olan istatistik biliminde içeriğinde bulunan konuların çok ayrıntılı olarak sınıflandırılması ile ortaya çıkarılmıştır. Milletlerarası İstatistik Enstitüsü bir enternasyonal bilim kurumu olarak istatistik bilimi konu ve terimlerini bir araya toplayıp 28 bilim dilinde karşılıklı olarak yayınlamıştır. Bu uğraşın sonucunun milletlerarası bilim camiasının büyük başarılarından biri olduğu kabul edilmektedir. Ortaya çıkartılan, istatistik bilimi içinde kullanılan ve bu bilime ait özel kavramların ve terimlerin listesi, tam kapsamlı olma hedeflidir ve böylelikle istatistik bilimi için bir Türkçe yol haritası yapılmış olmaktadır.

İstatistik biliminde önemli bir yeri olan parametrik olmayan istatistik parametrik olmayan istatistiksel modeller ve parametrik olmayan çıkarımsal istatistik, özellikle parametrik olmayan istatistiksel hipotez sınamalar ile ilgilenir. Parametrik olmayan yöntemler çok defa dağılımlardan serbest yöntemler olarak da anılmaktadır, çünkü verilerin bilinen belirli olasılık dağılımı gösteren kaynaklardan geldiği varsayımına dayanmamaktadır.

Cohen'in kappa katsayısı iki değerleyici arasındaki karşılaştırmalı uyuşmanın güvenirliğini ölçen bir istatistik yöntemidir. Cohen'in kappa ölçüsü her biri N tane maddeyi C tane birbirinden karşılıklı hariç olan kategoriye ayıran iki değerleyicinin arasında bulunan uyuşmayı ölçer. Ortaya çıkan kategorik değişken olduğu için bir parametrik olmayan istatistik türüdür. Cohen'in kappa ölçüsü bu uyuşmanın bir şans eseri olabileceğini de ele aldığı için basit yüzde orantı olarak bulunan uyuşmadan daha güçlü bir sonuç verdiği kabul edilir.

Fleiss'in kappa katsayısı ikiden fazla sabit sayıda değerleyici arasındaki karşılaştırmalı uyuşmanın güvenirliğini ölçen bir istatistik yöntemidir. Fleiss'in kappa ölçüsü sabit sayıda değerleyicinin her birinin, maddeyi veya kişiyi birbirinden karşılıklı hariç olan kategoriye göre ayırmaları süreci sonunda ortaya çıkan değerleyiciler arasındaki uyuşmayı ölçer. Fleiss'in kappa ölçüsü bu uyuşmanın bir şans eseri olabileceğini de ele aldığı için basit yüzde orantı olarak bulunan uyuşmadan daha güçlü bir sonuç verdiği kabul edilir. Ortaya çıkan kategorik değişken olduğu için Fleiss'in kappa katsayısı bir parametrik olmayan istatistik türüdür.

Mann-Whitney U testi niceliksel ölçekli gözlemleri verilen iki örneklemin aynı dağılımdan gelip gelmediğini incelemek kullanılan bir parametrik olmayan istatistik testdir. Aynı zamanda Wilcoxon sıralama toplamı testi veya Wilcoxon-Mann-Whitney testi) olarak da bilinmektedir. Bu testi ilk defa eşit hacimli iki örneklem verileri için Wilcoxon (1945) ortaya atmıştır. Sonradan, Mann and Whitney (1947) tarafından değişik büyüklükte iki örneklem problemleri analizleri için uygulanıp geliştirilmiştir.

İstatistik bilim dalında, Spearman'ın sıralama korelasyon katsayısı veya Spearman'ın rho, bu istatistiksel ölçüyü ilk ortaya atan İngiliz psikolog Charles Edward Spearman'a atfen adlandırılmıştır. Matematik notasyon olarak çok defa eski Yunan harfi ρ ile belirtilir. Bir parametrik olmayan istatistik ölçüsüdür ve iki değişken arasındaki bağımlılık, yani korelasyon, ölçüsü olarak bulunup kullanılır. Bu demektir ki Spearman'in rho (ρ) katsayısı iki değişken için çokluluklar dağılımı hakkında hiçbir varsayım yapmayarak, bu iki değişken arasında bulunan bağlantının herhangi bir monotonik fonksiyon ile ne kadar iyi betimlenebilineceğini değerlendirmek amaçlı incelemedir.

Sıralama korelasyonu istatistik bilimi içinde aynı istatistik birimlerinin değişik kriter değişkene gore iki değişik sıralama arasında bulunan bağlantıyı inceler. Örneklem verisi kullanarak hesaplanan sıralama korelasyon katsayısı iki sıralama arasındaki doğrusal ilişkiyi ölçer ve elde edilen katsayının istatistiksel anlamlılığını değerlendirir.

<span class="mw-page-title-main">Beer-Lambert yasası</span>

Optikte Beer–Lambert yasası ışığın soğurulmasını ışığın içinden geçtiği malzemenin özelliklerine bağlar.

Ki-kare testi veya χ² testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan bazıları parametrik olmayan sınama ve diğerleri parametrik sınama yöntemidir. Bu çeşit istatistiksel sınamalarda test istatistiği için "örnekleme dağılımı", sıfır hipotez gerçek olursa ki-kare dağılımı gösterir veya sıfır hipotez "asimptotik olarak gerçek" olursa, eğer sıfır hipotez gerçekse ve eğer örnekleme hacmi istenilen kadar yeterli olarak büyük ise bir ki-kare dağılımına çok yakın olarak yaklaşım gösterir.

Yunan harfleri; matematikte, bilimde ve mühendislikte ayrıca sabitler ve özel fonksiyonlar için sembollerle matematiksel notasyonun yapıldığı her yerde, özellikle belirli nicelikleri temsil eden değişkenler için kullanılır. Bu bağlamda, büyük ve küçük harfler farklı ve alakasız şeyleri simgelerler. Latin harfi biçimindeki Yunan harfleri genellikle kullanılmazlar: büyük A, B, E, H, I, K, M, N, O, P, T, X, Y, Z gibi. "i, o ve u" Latin harflerine yakından benzediklerinden, küçük ι (iota), ο (omikron) ve υ (ipsilon) nadiren kullanılır. Bazen Yunan harflerinin değişik fontları matematikte bambaşka semboller için kullanılır, özellikle de φ (fi) ve π (pi).

<span class="mw-page-title-main">Elektriksel özdirenç ve iletkenlik</span> Wikimedia anlam ayrımı sayfası

Elektriksel öz direnç, belirli bir malzemenin elektrik akımının akışına karşı nicelleştiren bir özelliktir. Düşük bir direnç kolaylıkla elektrik akımının akışını sağlayan bir malzeme anlamına gelir. Karşıt değeri, elektrik akımının geçiş kolaylığını ölçen elektriksel iletkenliktir. Elektriksel direnç, mekanik sürtünme ile kavramsal paralelliklere sahiptir. Elektriksel direncin SI birimi ohm, elektriksel iletkenliğin birimi ise siemens (birim) (S)'dir.

<span class="mw-page-title-main">Dize titreşimi</span>

Bir dizedeki (tel) [[titreşim]] bir ses dalgasıdır. Rezonans titreşen bir dizenin sabit frekanslı, yani sabit perdeli bir ses üretmesine neden olur. Telin uzunluğu veya gerginliği doğru şekilde ayarlanırsa üretilen ses bir [[müzik tonu]] olur. Titreşimli teller gitar, [[Viyolonsel|çello]] ve piyano gibi yaylı çalgıların temelini oluşturur.

Fanning sürtünme faktörü veya Fanning sürtünme katsayısı, John Thomas Fanning'in adını taşıyan ve sürekli ortamlar mekaniği hesaplamalarında kullanılan boyutsuz bir sayıdır. Bu faktör, yerel kayma gerilmesi ile yerel akış kinetik enerji yoğunluğu arasındaki oranı ifade eder:

Akışkanlar mekaniğinde, Rayleigh sayısı (Ra, Lord Rayleigh'e ithafen) bir akışkan için kaldırma kuvveti ilişkili bir boyutsuz sayıdır. Bu sayı, akışkanın akış rejimini karakterize eder: belirli bir alt aralıkta bir değer laminer akışı belirtirken, daha yüksek bir aralıktaki değer türbülanslı akışı belirtir. Belirli bir kritik değerin altında, akışkan hareketi olmaz ve ısı transferi konveksiyon yerine ısı iletimi ile gerçekleşir. Çoğu mühendislik uygulaması için Rayleigh sayısı büyük olup, yaklaşık 106 ile 108 arasında bir değerdedir.

Finansal matematikte risk hassasiyeti bir türev ürününün ya da bir portföyün değerinin değişken veya parametrelere karşı olan değişimini veren niceliktir. Risk hassasiyetleri ise bu niceliklerin hepsine birden verilen addır.

MS 2. yüzyılda Mısır'da Yunan astronom, coğrafyacı ve jeolog Batlamyus tarafından oluşturulan kirişler tablosu, matematiksel astronomi üzerine bir inceleme olan Batlamyus'un Almagest adlı eserinin Kitap I, bölüm 11'inde yer alan bir trigonometrik tablodur. Esasen sinüs fonksiyonunun değer tablosuna eşdeğerdir. Astronomi de dahil olmak üzere birçok pratik amaç için yeterince kapsamlı olan en eski trigonometrik tablodur. 8. ve 9. yüzyıllardan beri sinüs ve diğer trigonometrik fonksiyonlar, İslam matematiği ve astronomisinde kullanılmış ve sinüs tablolarının üretiminde reformlar yapılmıştır. Daha sonra Muhammed ibn Musa el-Harezmi ve Habeş el-Hâsib bir dizi trigonometrik tablo üretmiştir.