İçeriğe atla

Tabakalı örnekleme

İstatistik bilim dalında tabakalı örnekleme bir anakütleden özel bir şekil olasılık örnekleme yöntemi ile veri elde edilmesidir. Tabakalı örnekleme yöntemini diğer olasılık örnekleme yöntemlerden ayıran özelliği anakütlenin içindeki bütün elamanlar belli özelliklere göre kendi içlerinde birbirlerine benzeyen birkaç gruptan, tabakadan oluştuklarıdır. Tabaka elemanları birbirlerine benzerler fakat diğer tabaka elemanlarından çok bariz şekilde değişiktirler. Tabaka örneğinde örnek elemanları öyle seçilmektedir ki her bir anakütle tabakası için örnekte temsilci bulunmaktadır.

Tabakalı örnekleme özellikleri

Eğer anakütlenin alt tabakaları çok bariz farklılıklar gösterirse, her bir alt-anakütleyi (yani tabakayı) ayrı ayrı örneklemek yararlıdır. Tabakalaştırmak örneklemeye başlamadan anakütle üyelerini göreli türdeş gruplara ayırma işlemidir. Tabakalar karşılıklı olarak dışlamalı olmalıdır ve böylece anakütlenin her bir elemanı sadece tek bir tabakaya tahsis edilmelidir. Tabakalar hep birlikte kapsayıcı olmalıdır: yani hiçbir anakütle elemanı mevcut tabakalara tahsis edilmeden dışarıda bırakılmamalıdır.

Her bir anakütle elemanı sadece tek bir tabakaya tahsis edilip sınıflandırıldıktan sonra her bir tabakadan ayrı ayrı örnek seçilme işlemine geçilir. Her bir tabakadan önceden tayin edilmiş büyüklükte tabaka örneği yine uygun bir olasılık örneklemesi kullanılarak (ya basit rastgele örnekleme ile ya da sistematik örnekleme ile) ele geçirilir. Bu türlü örnekleme örneklem hatasını azalttığı için örneklemin anakütleyi temsil etme gücünü artırır. Bir anakütleye bir basit rastgele örnekleme uyguladıktan sonra elde edilen aritmetik ortalama etrafındaki yayılım, tabakalanmış örneklemeden sonra hesaplanan ağırlıklı ortalama etrafındaki yayılımdan daha fazla olması beklenmektedir.

Tabakalı örnek seçme stratejileri

Her tabaka için örnek seçme için kullanılan strateji değişik tipte tabakalı örneklem elde edilmesini sağlar. Şu çeşitlerde stratejiler uygulanması mümkündür:

  • Orantılı ayırma: Bu tip tabakalı örnek almada her tabaka için örnekteki eleman sayısı o tabakanın anakütle içindeki bir dağılım özelliği oranına bağlanır.
    • Sayıya orantılı ayırma:

Bu çeşit orantılı ayrımda anakütle çerçevesi elemanları tabakalara ayrılır ve her tabaka elamanları sayısının anakütle büyüklüğüne oranı bulunur. Bu sayısal oranların da seçilecek örnekte de aynen korunması bu çeşit ayrımın ana prensibi olur. Örneğin bir üniversite öğrencileri anakütlesinde 1/10 Anadolu liseleri mezunları var olduğu biliniyorsa o üniversite öğrencilerinden seçilecek Anadolu liselileri tabakasına ait olan örnek elamanları tüm örnek içinde 1/10 oranında olmaları gerekir.

Bu çeşit ayrımın büyük dezavantajı bazı anakütle tabakaları mensupları sayısının ve tüm sayıya orantılarının çok küçük olup nispeten küçük sayıda bir tabaka örneği için kesirli yahut yanlı sonuç çıkarması çok muhtemel çok küçük örnek büyüklükleri gerektirmesidir. Örneğin, yine yukarıda bahsi geçen üniversiteden alınacak örnek büyüklüğü 30 olması kabul edilmişse ve anakütle Anadolu lise mezunları oranı olan 1/10 bu örnekte de korunacaksa, bu tabaka örnek büyüklüğü sadece 3 olacaktır. Bu kadar küçük bir örnekten elde edilecek bilgilerin yanlı olmak olasılığı çok yüksek olacaktır.

  • Yayılıma orantılı ayırma:

Bu şekilde, bir ayrıcı değişken için anakütle tüm varyansı ve her bir tabakanın bu varyansa katkısı oranı tespit edilir. Anakütle tabakaları için tüm varyansa katkı orantıları tespit edilir. Alınacak örnekte değişik tabakalardan alınacak örnek sayıları her tabaka için bu anakütle varyansa katkı oranını koruyacak şekilde saptanır.

Bu çeşit ayrımın en büyük dezavantajı ayrıcı değişken için anakütle verilerinin bulunup, kullanılması ve anakütle tabakalarının varyanslarının tüm anakütle varyansına katkı oranlarının hesaplanması gereğidir.

  • Ters orantılı ayırma:

Bazı araştırmalarda, araştırma konusu çok küçük sayıda ama ana önemi haiz bir tabakanın ayrıntılı olarak incelemesini gerektirir. Örneğin, yine bir üniversite öğrencileri davranışlarına ait bir çalışmada yabancı okul mezunlarının davranışlarını incelemek özellikle istenmektedir. Bu halde yabancı okul mezunları tabakası çok küçük olabilir ve eğer orantılı ayırma kullanılırsa örnekte çok ufak olarak temsil edilmeleri gerekir. Bu halde bazı Amerikan araştırmacılar ayrımın sayıya orantılı yapılmasını, ama orantıların ters olarak kullanılmasını tavsiye etmişlerdir. Böylece anakütlede küçük oranda olan tabakalar örnekte büyük oranda ve tersi olacaktır.

  • Orantısız ayırma:

Eğer istatistiksel sınamaların istatistiksel gücünü kullanıp tabakalar arasındaki farkları barizce sınama ile ortaya çıkartılması isteniyorsa, anakütle içindeki büyüklükleri bakımından birbirleri ile çok değişik olan her bir tabakadan aynı büyüklükte örnek alınabilir. Böylece bu çeşit ayırmada tabaka büyüklüklerinin veya yayılıma katkıların örnek alınırken seçilen tabaka elemanı sayısına hiçbir etkisi olmamaktadır.[1]

Diğer örnekleme yöntemleri ile karşılaştırma

Avantajları

  • Önemli alt anakütleler üzerine dikkati çeker ve araştırma başında önemsiz oldukları kabul edilen farklar bir kenara bırakılır.
  • Tahminlerin kesinliğini artırır
  • Etkendir

Dezavantajları

  • Kesinlikle tabakalamayı sağlayacak işe yarar tabaka ayırıcı değişken seçimi çok güç olabilir ve bu ayırıcı değişken için bilgi toplanması çok güç hatta imkânsiz olabilir.
  • Eğer kendi aralarında benzerlik gösteren birkaç alt-grup yoksa imkânsızdır
  • Örnekleme maliyeti yüksek olabilir
  • Anakütle hakkında kesin ve işe yarar bilgilerin örnek planlaması safhasında elde olması gerekir; eğer bu bilgi yoksa toplanan örnekte yanlilik problemi ortaya çıkar.
  • Sadece örnekleme surecinin en başında alt gruplara önem verir ve artırma içinde ortaya çıkabilecek gruplaşmalar ele alınmaz.

Örnek

Bir orantılı ayrım kullanılarak tabakalı örnek seçimine pratik örnek, bir firma için hazırlanan bir ankettir. Burada tabakayı teşhis eden özellikler araştırmacı tarafından seçilen iki anakütle özelliğidir: firmada çalışanların cinsiyeti ve tamzamanlı/yarızamanlı çalışıp çalışmadıkları. Anakütle çerçevesi 180 çalışandan oluşmaktadır. Seçilen 2 ayırma özelliğine göre bu anakütle çerçevesi şu dört tabakaya ayrılmışsa ve her tabaka içindeki eleman sayısı şöyle verilmiştir:

  • erkek, tam zamanlı: 90
  • erkek, yarızamanlı: 18
  • kadın, tamzamanlı: 9
  • kadın, yarızamanlı: 63
  • Toplam: 180

Dikkat edilirse istatistik için bu bir anakütle değildir; sadece anakütle çerçevesidir. Araştırmanın incelediği değişken hakkında verilebilecek değerler anakütleyi oluşturur.

Araştırıcı ne kadar kendi emek, zaman ve para sarf etmek istemediğine göre, örnek büyüklüğünü 40 olarak seçmiş olduğu varsayılsın ve orantılı ayırma yöntemi ile tabakalı örnek elde edilecektir

İlk olarak her bir tabakanın eleman sayısı ile anakütle çerçevesi içinde toplam arasındaki oran bulunur yani her bir tabaka eleman sayısı 180 ile bölünür ve yüzdeler elde edilir:

  • erkek, tam zamanlı yüzdesi = (90 / 180) x 100 = 50
  • erkek, yarızamanlı yüzdesi= (18 / 180) x100 = 10
  • kadın, tamzamanlı yüzdesi= (9 / 180) x 100 = 5
  • kadın, yarızamanlı yüzdesi= (63 / 180) x 100 = 35

Orantılı ayırma kullanılacağı için her bir tabaka elemanı oranı, örnek içinde de şöyle olması gerekir:

  • erkek, tam zamanlı: %50
  • erkek, yarızamanlı: %10
  • kadın, tamzamanlı: %5
  • kadın, yarızamanlı: %35

Örnek büyüklüğü 40 olarak seçildiği için örnek çerçevesi içinde her bir tabaka eleman sayısı şöyledir:

  • 40in %50i olur 20.
  • 40in %10u olur 4.
  • 40in %5i olur 2.
  • 40in %35i olur 14.[2]

Kaynakça

  1. ^ Aaker,D.A., V.Kumar and G.S.Day, [2007], Marketing Research, 9th ed., John Wiley
  2. ^ http://www.coventry.ac.uk/ec/~nhunt/meths/strati.html 23 Şubat 2009 tarihinde Wayback Machine sitesinde arşivlendi. Accessed 2008/01/27

İçsel bağlantılar

Kaynakça

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">İstatistik</span>

İstatistik veya sayım bilimi, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir. Belirli bir amaç için verilerin toplanması, sınıflandırılması, çözümlenmesi ve sonuçlarının yorumlanması esasına dayanır. Bu çerçevede yapılan işlemlerin tümüne sayımlama denir.

Regresyon analizi, iki ya da daha çok nicel değişken arasındaki ilişkiyi ölçmek için kullanılan analiz metodudur. Eğer tek bir değişken kullanılarak analiz yapılıyorsa buna tek değişkenli regresyon, birden çok değişken kullanılıyorsa çok değişkenli regresyon analizi olarak isimlendirilir. Regresyon analizi ile değişkenler arasındaki ilişkinin varlığı, eğer ilişki var ise bunun gücü hakkında bilgi edinilebilir. Regresyon terimi için öz Türkçe olarak bağlanım sözcüğü kullanılması teklif edilmiş ise de Türk ekonometriciler arasında bu kullanım yaygın değildir.

Hipotez testi, bir hipotezin doğruluğunun istatistiksel bir güvenilirlik aralığında saptanması için kullanılan yöntem.

Örnekleme istatistikte belirli bir yığından alınan kümeyi ifade eder. Örneğin; Türkiye'deki tüm üniversite sayıları bir yığın iken Ankara'daki üniversite sayısı bu yığından alınmış bir örnektir.

Varyans Analizi istatistik bilim dalında, grup ortalamaları ve bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans Analizi kullanılmaktayken belirlenmiş bir değişkenin gözlemlenen varyansı farklı değişim kaynaklarına dayandırılabilen varyans bileşenine ayrılır. En basit şekliyle varyans analizi birkaç grubun ortalamalarının birbirine eşit mi eşit değil mi olduğunu sınamak için bir çıkarımsal istatistik sınaması olur ve bu sınama iki-grup için yapılan t-test sınamasını çoklu-gruplar için genelleştirir. Eğer, çoklu değişkenli analiz için birbiri arkasından çoklu iki-örneklemli-t-sınaması yapmak istenirse bunun I. tip hata yapma olasılığını artırma sonucu doğurduğu aşikardır. Bu nedenle, üç veya daha fazla sayıda ortalamaların ististiksel anlamlığının sınama ile karşılaştırılması için Varyans Analizleri daha faydalı olacağı gerçeği ortaya çıkmaktadır.

<span class="mw-page-title-main">Aritmetik ortalama</span>

Aritmetik ortalama, bir sayı dizisindeki elemanların toplamının eleman sayısına bölünmesi ile elde edilir. İstatistik bilim dalında hem betimsel istatistik alanında hem de çıkarımsal istatistik alanında en çok kullanan merkezi eğilim ölçüsü' dür.

Ortalama veya merkezsel konum ölçüleri, istatistik bilim dalında ve veri analizinde kullanılan bir veri dizisinin orta konumunu, tek bir sayı ile ifade eden betimsel istatistik ölçüsüdür. Günlük hayatta ortalama dendiğinde genellikle kast edilen aritmetik ortalama olmakla beraber bu ölçünün çok belirli bazı dezavantajları söz konusudur. Bu yüzden matematik ve istatistikte, bir anakütle veya örneklem veri dizisi değerlerini temsil eden tek bir orta değer veya beklenen değer, olarak medyan (ortanca), mod (tepedeğer), geometrik ortalama, harmonik ortalama vb adlari verilen birçok değişik merkezsel konum ölçüleri geliştirilmiş ve pratikte kullanılmaktadır.

<span class="mw-page-title-main">Standart sapma</span> İstatistikte bir varyasyon ölçüsü

Standart sapma, Olasılık kuramı ve istatistik bilim dallarında, bir anakütle, bir örneklem, bir olasılık dağılımı veya bir rassal değişken, veri değerlerinin yayılımının özetlenmesi için kullanılan bir ölçüdür. Matematik notasyonunda genel olarak, bir anakütle veya bir rassal değişken veya bir olasılık dağılımı için standart sapma σ ile ifade edilir; örneklem verileri için standart sapma için ise s veya s'

<span class="mw-page-title-main">Çarpıklık</span>

Çarpıklık olasılık kuramı ve istatistik bilim dallarında bir reel-değerli rassal değişkenin olasılık dağılımının simetrik olamayışının ölçülmesidir.

Elverişlilik örneği, istatistik ve diğer araştırmalarda kullanılacak örnek verilerini elde etmek için kullanılan ve olasılık prensibine dayanmayan bir veri toplama yöntemidir. Bazen kapma örneklemesi veya fırsat örneklemesi adı da verilir.

Örüntülü örnekleme istatistik bilimi içinde, örnekleme yoluyla veri toplamak için kullanılabilecek bir olasılık örneklemesi yöntemidir. Bu yöntemin ana prensibi bir anakütle çerçevesi içinde bulunan elemanlar numaralanıp sıra ile her elemana bir kod numarası verilebilirse, rastgele seçilmiş veya hesaplama ile bulunmuş bir kod aralığı olan k aralığı ile her kinci elemanın seçimidir.

Küme örneklemesi, istatistik bilimi içinde örneklem kullanılarak betimsel veya çıkarımsal sonuç istenirse, olasılıksal örnekleme kurallarına uyan bir örneklem veri toplama yöntemidir. Genel olarak bu yöntemin uygulanması anakütle içinde veri elamanları "kümeler" halinde ise uygundur. Bir küme içindeki elemanlar belirli karakter özelliklerine göre birbirine "yakınlık" göstermekte ve diğer anakütle içindeki kümelerden daha "uzak" olmaktadır. "Yakınlık" veya "uzaklık" genel olarak veri toplama para veya zaman maliyetine göre tanımlanır.

İstatistik bilim dalı içinde sıralama düzeni veri dizisinin özel bir şekle dönüştürülmesini kapsar. Bir örneklem veya anakütle içinde bulunan her bir sayısal elemana bir sıralama numarası verilerek öyle bir sıralanır ki bu sıralanma sonucunda herhangi bir iki eleman ele alınırsa iki elemandan hangisinin sıralama düzeninde önde geldiği bilinebilir. Yani sıralama düzeni bir sayı dizisi olup bir örneklem veya anakütledeki her bir elemana bir sıralama numarası verilmesi ile elde edilir. Matematik terimi ile bu işlem nesnelerin tüm ön-sıralanması veya zayıf sıralanması olarak adlandırılır. Bu tüm sıralanma değildir, çünkü iki veya daha çok sayıda değişik elamanın beraber aynı sırada olmalarına imkân sağlanmaktadır. Ayrıca sayısal veriler bir özelliğe göre tüm olarak sıralanmamaktadır; yani veri elemanlarının veri dizisi içindeki yerleri değişmemektedir. Ama sıralama düzeni için her veri elemanına verilen sıra numaraları tüm sıralanma halindedir.Böylece sonradan bu sıra numaraları kullanılarak veri elemanlarını tüm sıralamaya sokmak kolay bir işlem olur. Örneğin, bir jeolojik örneklem elemanları jeoloğun uygun gördüğü kaya parçaları olsun; elaman ağırlığına göre sıra numaraları verilip örneklemdeki gerçek elemanlar hiç gerçekte sıraya sokulmadan, örnek ağırlıkları için sıralama düzen sayıları kullanılarak istatistiksel analizler yapılabilir. Böylece elde bulunan örneklemin kapsadığı, ölçülebilmesi çok karmaşık ve masraflı olabilen bir değişken için incelemeyi kolaylaştırmak mümkün olabilir. Örneklem elemanlarını sıralama düzenine sokan sıra numaraların istatistiksel incelenmesi, parametrik olmayan istatistik alanı kapsamı içine girmekte ve bu tip istatistik analiz de pratikte de önemli bir rol oynamaktadır.

İstatistik bilim dalı içinde Friedman sıralamalı iki yönlü varyans analizi sonradan çok tanınmış bir iktisatçı olan Amerikan Milton Friedman tarafından ortaya atılan bir parametrik olmayan istatistik sınamasıdır.

Mann-Whitney U testi niceliksel ölçekli gözlemleri verilen iki örneklemin aynı dağılımdan gelip gelmediğini incelemek kullanılan bir parametrik olmayan istatistik testdir. Aynı zamanda Wilcoxon sıralama toplamı testi veya Wilcoxon-Mann-Whitney testi) olarak da bilinmektedir. Bu testi ilk defa eşit hacimli iki örneklem verileri için Wilcoxon (1945) ortaya atmıştır. Sonradan, Mann and Whitney (1947) tarafından değişik büyüklükte iki örneklem problemleri analizleri için uygulanıp geliştirilmiştir.

F-testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan parameterik çıkarımsal sınama yöntemidir. F-testi sıfır hipotezine göre gerçekte bir F-dağılımı gösteren sınama istatistiği bulunduğu kabul edilen hallerde, herhangi bir istatistiksel sınama yapma şeklidir. Bu çeşit bir istatistiksel sınama önce Ronald Fisher tarafından 1920'li yıllarda tek yönlü varyans analizi için ortaya atılıp kullanılmış ve sonradan diğer şekillerde F-dağılım kullanan sınamalar da ortaya atılınca, bu çeşit sınamalara genel isim olarak F-testi adı verilmesi Ronald Fisher anısına George W. Snecedor tarafından teklif edilip, istatistikçiler tarafından F-testi bir genel isim olarak kabul edilmiştir.

Güven aralığı, istatistik biliminde bir anakütle parametresi için bir çeşit aralık kestirimi olup bir çıkarımsal istatistik çözüm aracıdır. Bir anakütle parametre değerinin tek bir sayı ile kestirimi yapılacağına, bu parametre değerini kapsayabilecek iki sayıdan oluşan bir aralık bulunur. Böylece güven aralıkları bir kestirimin ne kadar güvenilir olduğunu gösterir.

Tek anakütle ortalaması için parametrik hipotez sınaması veya tek-örneklem için sınama veya μ için sınama, bir rastgele örneklem ortalaması ile bu örneklemin çekilmiş olduğunu düşündüğümüz anakütlenin μ ile belirtilen "anakütle ortalaması" hakkında bir hipotez değeri belirtilmesinin anlamlı olup olmadığını araştırmamızı sağlayan parametrik hipotez sınamasıdır.

Basit rastgele örneklem almanın ana prensibi her bir anakütle elemanının aynı olasılıkla örneğe girebilmesidir. Bu bir olasılık örneği tanımına uyar, çünkü her bir anakütle elemanı için örneklemde bulunma olasılığı bir Bernoulli dağılımı gösterir. Eğer anakütle büyüklüğü N ile ifade edilirse, her bir anakütle elemanı 1/N olasılıkla örnekde bulunur.

Student'ın t-testi istatistik bilimi içinde incelenen, eğer sıfır hipotez desteklenmekte ise test istatistiğinin bir Student's t-dağılımı gösterdiği hallerde uygulanan çıkartımsal istatistiksel hipotez sınamasıdır. Verilen iki değişik grup sayısal verinin birbirinden anlamlı olarak farklılık gösterip göstermemesini sınamak için kullanılabilir. En sıkça uygulanma örnekleri eğer test istatistiği içinde bulunan ölçek parametre faktörünün değerinin bir normal dağılım gösterdiği bilinmekte olduğu hallerde tatbik edilmektedir. Eğer test istatistiği içinde bulunan ölçek parametresi faktörünün değeri bilinmiyorsa ve bu faktör veriye dayayan bir kestirim ile ifade edilmekte ise test istatistiği bir Student'ın t-dağılımı gösterebilir.