İçeriğe atla

Küme örneklemesi

Küme örneklemesi, istatistik bilimi içinde örneklem kullanılarak betimsel veya çıkarımsal sonuç istenirse, olasılıksal örnekleme kurallarına uyan bir örneklem veri toplama yöntemidir. Genel olarak bu yöntemin uygulanması anakütle içinde veri elamanları "kümeler" halinde ise uygundur. Bir küme içindeki elemanlar belirli karakter özelliklerine göre (çoğunlukla coğrafî alana göre) birbirine "yakınlık" göstermekte ve diğer anakütle içindeki kümelerden daha "uzak" olmaktadır. "Yakınlık" veya "uzaklık" genel olarak veri toplama para veya zaman maliyetine göre tanımlanır.

Yöntem

Küme örnekleme genellikle örnekleme zaman ve para maliyetlerini düşük tutmak için kullanılmaktadır. Anakütle çerçevesi elamanlarının birbirine yakın kümeler oluşturduğu hallerde ve her bir küme genel olarak diğer kümelere çok benzerlerse, bu tipi örnekleme kullanılması uygun olabilir. Bu kümeler mekan içinde (örneğin şehrin değişik mahallelileri veya Amerika'daki gibi değişik şehir blokları) veya zaman içinde (belirli zaman dönemleri) olabilir.

Örneğin: Veri elde edilmesi gereken anakütle çerçevesi belli bir üniversite öğrencileri olsun. O üniversitenin bölümleri şehrin içinde ve hatta yakın şehirlerde ayrı yerleşkelerde (yani birbirinden ayrı mekanlarda) bulunabilir. (Eski belirli kampusu olmayan Ankara Üniversitesi veya İstanbul Üniversitesi güzel örnekler). Bu halde üniversiteyi tek bir çerçeve olarak kabul etmek ve değişik mekanlarda bulunan yerleşkelerin varlığını ele almadan örnekleme yapmak, ekstra para ve zaman masrafı yaratacaktır. Daha az maliyetli bir yaklaşım her yerleşkeyi bir "küme" olarak kabul etmekle mümkün olacaktır. Bu halde her bir ayrı yerleşke küme olarak kabul edilip, ayrı yerleşkeler ayrı kümeler olarak incelemeye taban olabilirler.

Küme örneklemesi iki aşamada yapılır:

  • Birinci aşamada çok iyi belirlenmiş kümeler tespit edilir. Her iyi belirlenmiş kümeye bir "küme kodu" numarası verilir. Bütün kod numaraları içinden basit rastgele örnekleme ile küçük sayıda "kümeler örneklemi" seçilir.

Örneğin, bir üniversite 15 tane ayrı yerleşke var olduğu kabul edilsin. Her öğrencinin bulunan yerleşkelerden sadece birine ait olduğu iyice tespit edilsin; yani bir öğrenci birden fazla yerleşkeye dahil olmasın. Bu zaman, önce her bir yerleşkeye küme-kodu verilir (Ele alınan halde, bu küme kodu 01 02.... 15 olabilir). Bunlar arasından "basit rastgele örnekleme" ile, diyelim, 5i seçilir. Bunlar "kümeler örneklemi" yani örneklemenin ikinci aşamasına girecek kümelerdir.

  • İkinci aşamada her bir örnekleme giren küme içinde bulunan bütün küme anakütle elemanları üzerinde gözlem yapılır. Yani her "örneklem küme" için tam sayım yapılır.

Örneğin, ilk aşamada seçilmiş olan 5 yerleşkede bulunan öğrenci elemanlarının tümüne gözlem uygulanır.

Eleştiri

Doğal olarak, tüm anakütle çerçevesi seçilmediği için zaman ve para maliyetleri tam sayımdan düşük olur. Dikkat edilirse bu çeşit örneklemede rastgele seçilme kümelerle ilgilidir. Bu seçim yapıldıktan sonra, seçilen kümeler içinde bulunan birbirine yakın elemanlar gözlendiği için de maliyetler (özellikle basit rastgele örneklemeye kıyasla) daha düşük olması çok mümkündür. Basit rastgele örneklemeye kıyasla küme örneklemesinin bir diğer avantajı, tüm anakütle elemanlarının her birinin kodlanmasının gerekmediğidir; bu tam-kodlama büyük maliyet gerektirir ve bazen de imkânsızdır. Buna karşılık küme örneklemesinde sadece birinci aşamada seçilmiş olan kümeler elemanları tespit edilip kodlanır.

Ancak küme örneklemesi, her bir kümenin diğer kümelere benzediğine ve sadece kendine has karakteri olan bir veya birkaç kümenin bulunmadığı varsayımına dayanır. Gerçekte bu varsayım her zaman ancak yaklaşık olarak doğru olacak ve bazı belirlenen kümeler kendine has karakter arz edecektir. Bu nedenle küme örneklemesinin yayılımı ayni anakütle için alınabilecek basit rastgele örneklemeden daha fazla olacaktır ve örneklemeden sonra elde edilecek kestirimler veya yapılan sınamalar daha az tutarlı olacak ve daha fazla yanlı olma olasılığı taşıyacaklardır.

Ayrıca bakınız

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Topoloji</span>

Topoloji, matematiğin ana dallarından biridir. Yunancada yer, yüzey veya uzay anlamına gelen topos ve bilim anlamına gelen logos sözcüklerinden türetilmiştir. Topoloji biliminin kuruluş aşamalarında yani 19. yüzyılın ortalarında, bu sözcük yerine aynı dalı ifade eden Latince analysis situs ür.

<span class="mw-page-title-main">İstatistik</span>

İstatistik veya sayım bilimi, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir. Belirli bir amaç için verilerin toplanması, sınıflandırılması, çözümlenmesi ve sonuçlarının yorumlanması esasına dayanır. Bu çerçevede yapılan işlemlerin tümüne sayımlama denir.

Hipotez testi, bir hipotezin doğruluğunun istatistiksel bir güvenilirlik aralığında saptanması için kullanılan yöntem.

Örnekleme istatistikte belirli bir yığından alınan kümeyi ifade eder. Örneğin; Türkiye'deki tüm üniversite sayıları bir yığın iken Ankara'daki üniversite sayısı bu yığından alınmış bir örnektir.

Varyans Analizi istatistik bilim dalında, grup ortalamaları ve bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans Analizi kullanılmaktayken belirlenmiş bir değişkenin gözlemlenen varyansı farklı değişim kaynaklarına dayandırılabilen varyans bileşenine ayrılır. En basit şekliyle varyans analizi birkaç grubun ortalamalarının birbirine eşit mi eşit değil mi olduğunu sınamak için bir çıkarımsal istatistik sınaması olur ve bu sınama iki-grup için yapılan t-test sınamasını çoklu-gruplar için genelleştirir. Eğer, çoklu değişkenli analiz için birbiri arkasından çoklu iki-örneklemli-t-sınaması yapmak istenirse bunun I. tip hata yapma olasılığını artırma sonucu doğurduğu aşikardır. Bu nedenle, üç veya daha fazla sayıda ortalamaların ististiksel anlamlığının sınama ile karşılaştırılması için Varyans Analizleri daha faydalı olacağı gerçeği ortaya çıkmaktadır.

Ortalama veya merkezsel konum ölçüleri, istatistik bilim dalında ve veri analizinde kullanılan bir veri dizisinin orta konumunu, tek bir sayı ile ifade eden betimsel istatistik ölçüsüdür. Günlük hayatta ortalama dendiğinde genellikle kast edilen aritmetik ortalama olmakla beraber bu ölçünün çok belirli bazı dezavantajları söz konusudur. Bu yüzden matematik ve istatistikte, bir anakütle veya örneklem veri dizisi değerlerini temsil eden tek bir orta değer veya beklenen değer, olarak medyan (ortanca), mod (tepedeğer), geometrik ortalama, harmonik ortalama vb adlari verilen birçok değişik merkezsel konum ölçüleri geliştirilmiş ve pratikte kullanılmaktadır.

Elverişlilik örneği, istatistik ve diğer araştırmalarda kullanılacak örnek verilerini elde etmek için kullanılan ve olasılık prensibine dayanmayan bir veri toplama yöntemidir. Bazen kapma örneklemesi veya fırsat örneklemesi adı da verilir.

İstatistik bilim dalında tabakalı örnekleme bir anakütleden özel bir şekil olasılık örnekleme yöntemi ile veri elde edilmesidir. Tabakalı örnekleme yöntemini diğer olasılık örnekleme yöntemlerden ayıran özelliği anakütlenin içindeki bütün elamanlar belli özelliklere göre kendi içlerinde birbirlerine benzeyen birkaç gruptan, tabakadan oluştuklarıdır. Tabaka elemanları birbirlerine benzerler fakat diğer tabaka elemanlarından çok bariz şekilde değişiktirler. Tabaka örneğinde örnek elemanları öyle seçilmektedir ki her bir anakütle tabakası için örnekte temsilci bulunmaktadır.

Örüntülü örnekleme istatistik bilimi içinde, örnekleme yoluyla veri toplamak için kullanılabilecek bir olasılık örneklemesi yöntemidir. Bu yöntemin ana prensibi bir anakütle çerçevesi içinde bulunan elemanlar numaralanıp sıra ile her elemana bir kod numarası verilebilirse, rastgele seçilmiş veya hesaplama ile bulunmuş bir kod aralığı olan k aralığı ile her kinci elemanın seçimidir.

İstatistik bilim dalı içinde sıralama düzeni veri dizisinin özel bir şekle dönüştürülmesini kapsar. Bir örneklem veya anakütle içinde bulunan her bir sayısal elemana bir sıralama numarası verilerek öyle bir sıralanır ki bu sıralanma sonucunda herhangi bir iki eleman ele alınırsa iki elemandan hangisinin sıralama düzeninde önde geldiği bilinebilir. Yani sıralama düzeni bir sayı dizisi olup bir örneklem veya anakütledeki her bir elemana bir sıralama numarası verilmesi ile elde edilir. Matematik terimi ile bu işlem nesnelerin tüm ön-sıralanması veya zayıf sıralanması olarak adlandırılır. Bu tüm sıralanma değildir, çünkü iki veya daha çok sayıda değişik elamanın beraber aynı sırada olmalarına imkân sağlanmaktadır. Ayrıca sayısal veriler bir özelliğe göre tüm olarak sıralanmamaktadır; yani veri elemanlarının veri dizisi içindeki yerleri değişmemektedir. Ama sıralama düzeni için her veri elemanına verilen sıra numaraları tüm sıralanma halindedir.Böylece sonradan bu sıra numaraları kullanılarak veri elemanlarını tüm sıralamaya sokmak kolay bir işlem olur. Örneğin, bir jeolojik örneklem elemanları jeoloğun uygun gördüğü kaya parçaları olsun; elaman ağırlığına göre sıra numaraları verilip örneklemdeki gerçek elemanlar hiç gerçekte sıraya sokulmadan, örnek ağırlıkları için sıralama düzen sayıları kullanılarak istatistiksel analizler yapılabilir. Böylece elde bulunan örneklemin kapsadığı, ölçülebilmesi çok karmaşık ve masraflı olabilen bir değişken için incelemeyi kolaylaştırmak mümkün olabilir. Örneklem elemanlarını sıralama düzenine sokan sıra numaraların istatistiksel incelenmesi, parametrik olmayan istatistik alanı kapsamı içine girmekte ve bu tip istatistik analiz de pratikte de önemli bir rol oynamaktadır.

İstatistik bilim dalı içinde Friedman sıralamalı iki yönlü varyans analizi sonradan çok tanınmış bir iktisatçı olan Amerikan Milton Friedman tarafından ortaya atılan bir parametrik olmayan istatistik sınamasıdır.

Mann-Whitney U testi niceliksel ölçekli gözlemleri verilen iki örneklemin aynı dağılımdan gelip gelmediğini incelemek kullanılan bir parametrik olmayan istatistik testdir. Aynı zamanda Wilcoxon sıralama toplamı testi veya Wilcoxon-Mann-Whitney testi) olarak da bilinmektedir. Bu testi ilk defa eşit hacimli iki örneklem verileri için Wilcoxon (1945) ortaya atmıştır. Sonradan, Mann and Whitney (1947) tarafından değişik büyüklükte iki örneklem problemleri analizleri için uygulanıp geliştirilmiştir.

Betimsel istatistik içinde, bir yüzdebirlik sıralanmış bir veri serisini yüz eşit parçaya bölen ve böylece her bir bölünen parçanın anakütle veya örneklem verilerinin 1/100'ini kapsadığı, 99 tane özetleme değeridir. Betimsel istatistikte yüzdebirlikler çok popüler olarak kullanılır. Yüzdebirliklerin diğer bir popüler kullanım alanı, özellikle ABD'de, eğitimciler ve psikologlar tarafından uygulanan testlerin sonuçlarının normal eğri kestirimi uygulanarak yüzdeliklerin bulunması suretiyle verilmesidir.

Güven aralığı, istatistik biliminde bir anakütle parametresi için bir çeşit aralık kestirimi olup bir çıkarımsal istatistik çözüm aracıdır. Bir anakütle parametre değerinin tek bir sayı ile kestirimi yapılacağına, bu parametre değerini kapsayabilecek iki sayıdan oluşan bir aralık bulunur. Böylece güven aralıkları bir kestirimin ne kadar güvenilir olduğunu gösterir.

Tek anakütle ortalaması için parametrik hipotez sınaması veya tek-örneklem için sınama veya μ için sınama, bir rastgele örneklem ortalaması ile bu örneklemin çekilmiş olduğunu düşündüğümüz anakütlenin μ ile belirtilen "anakütle ortalaması" hakkında bir hipotez değeri belirtilmesinin anlamlı olup olmadığını araştırmamızı sağlayan parametrik hipotez sınamasıdır.

Basit rastgele örneklem almanın ana prensibi her bir anakütle elemanının aynı olasılıkla örneğe girebilmesidir. Bu bir olasılık örneği tanımına uyar, çünkü her bir anakütle elemanı için örneklemde bulunma olasılığı bir Bernoulli dağılımı gösterir. Eğer anakütle büyüklüğü N ile ifade edilirse, her bir anakütle elemanı 1/N olasılıkla örnekde bulunur.

Ki-kare testi veya χ² testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan bazıları parametrik olmayan sınama ve diğerleri parametrik sınama yöntemidir. Bu çeşit istatistiksel sınamalarda test istatistiği için "örnekleme dağılımı", sıfır hipotez gerçek olursa ki-kare dağılımı gösterir veya sıfır hipotez "asimptotik olarak gerçek" olursa, eğer sıfır hipotez gerçekse ve eğer örnekleme hacmi istenilen kadar yeterli olarak büyük ise bir ki-kare dağılımına çok yakın olarak yaklaşım gösterir.

Student'ın t-testi istatistik bilimi içinde incelenen, eğer sıfır hipotez desteklenmekte ise test istatistiğinin bir Student's t-dağılımı gösterdiği hallerde uygulanan çıkartımsal istatistiksel hipotez sınamasıdır. Verilen iki değişik grup sayısal verinin birbirinden anlamlı olarak farklılık gösterip göstermemesini sınamak için kullanılabilir. En sıkça uygulanma örnekleri eğer test istatistiği içinde bulunan ölçek parametre faktörünün değerinin bir normal dağılım gösterdiği bilinmekte olduğu hallerde tatbik edilmektedir. Eğer test istatistiği içinde bulunan ölçek parametresi faktörünün değeri bilinmiyorsa ve bu faktör veriye dayayan bir kestirim ile ifade edilmekte ise test istatistiği bir Student'ın t-dağılımı gösterebilir.

<span class="mw-page-title-main">Sosyal araştırma</span>

Sosyal araştırma, sosyal bilimciler tarafından sistematik bir plan izlenerek yürütülen araştırmalardır. Sosyal araştırma metodolojileri nicel ve nitel olarak sınıflandırılabilir.

Maksatlı örnekleme, temasa geçilmesi veya ulaşılması kolay bir grup insandan alınan, rastgelelik içermeyen bir örnekleme yöntemi türüdür. Örneğin bir alışveriş merkezinde veya markette durup insanlardan soruları yanıtlamalarını istemek bir fırsat örneklemesidir. Bu örnekleme yönteminde, insanların müsait olması ve katılmaya istekli olması dışında başka bir kriter yoktur, dolayısıyla basit bir rastgele örneklem oluşturulmasını gerektirmez. Bu tür örnekleme daha çok hazırlık uygulamaları için kullanışlıdır.