İçeriğe atla

Örüntülü örnekleme

Örüntülü örnekleme istatistik bilimi içinde, örnekleme yoluyla veri toplamak için kullanılabilecek bir olasılık örneklemesi yöntemidir. Bu yöntemin ana prensibi bir anakütle çerçevesi içinde bulunan elemanlar numaralanıp sıra ile her elemana bir kod numarası verilebilirse, rastgele seçilmiş veya hesaplama ile bulunmuş bir kod aralığı olan k aralığı ile her kinci elemanın seçimidir.

Bu örnekleme yöntemi için ilk uygulama aşaması her bir anakütle elemanının tespit edilip birbirini takip eden bir kod numarası verilmesidir. Bu işlem genel olarak basit rastgele örnekleme ile aynıdır. Bazen bu sıralayıp kod numarası verilmesi başka nedenlerle yapıldığı için bu işlem aşaması çok kolaylaşır. Örneğin, anakütle üniversite öğrencileri için birbirini takip edilen kayıt numaraları üniversiteye girişte verilmiş olabilir.

İkinci işlem ise tek bir başlangıç kod numarası ve tek bir k kod aralığı seçilmesidir. Başlangıç numarası, herhangi bir olasılık rastgele numara üreten bir alet kullanılarak, rastgele seçilmelidir. Birinci aşamada verilmiş olan kod numaralarının başlangıcının, başlangıç kod numarası olarak seçilmemesi nedeni, elde edilecek örnekleme biraz daha rastsallık karakteri sağlamaktır. Böylece her bir elemanın örnekleme seçiminin ayni olasılıkta olacaktır ve birinci kod numarası taşıyan eleman her ne olursa olsun örneklemde bulunmayacaktır. Kod aralığı olarak bilinen tek bir sayı olan k ise pratikte iki değişik şekilde seçilebilir:

  • Eğer bütün istenilen örneklem hacmi için bütün seçilecek kod sayıları (yani n sayıda eleman kodu) tek bir işlemle bulunmak istenirse, bu halde kod aralığı rastgele seçilmez ve şu hesapla bulunur. Eğer N:anakütle eleman sayısı ve n istenilen örneklem hacmi ise,
k = INT [ N / n]

Burada INT (tam sayı) operasyonu k nin sadece tam sayı olan kısmının bulunması ve kesirlerinin elimine edilmesi gereğine işaret etmektedir. Örnekleme alınacak eleman kod sayısı başlangıç kod numarasından başlayarak son elde edilen örneklem kod numarasına kod aralığını ekleyerek bulunur. knin INT işlemi ile bulunması nedeniyle son kod numarasının her halikarda örneklemde bulunması önlenmiş olmaktadır.

Örneğin, üniversitede 5230 öğrenci kayıtlı ise; kayıt numaraları 2500den başlıyorsa; ve 30 sayıda örneklem hacmi gözümlenmek isteniyorsa; bu halde

k= INT (5230/30) = INT (174.33) = 174

olur. Örnekleme şu kod(=kayıt) numarası olan öğrenciler dahil edilir:

2500 2674 2848 ..... 7546 7720 (30 tane kod numarası)
  • İkinci şekilde kod aralığı bir rassal numara üretici aleti kullanılarak rastgele olarak bulunur. Bu halde, özellikle elde edilen kod aralığı örneklem hacmi nye yakınsa, başlangıç sayısına kod aralığı ekleyerek elde edilen örnekleme girme kod sayıları istenilen örneklem hacminden küçük olacaktır ve bu halde yeni bir başlangıç numarası ve yeni bir kod aralığı sayıları bulunarak bu işlemin n sayıda örneklem kod numaraları bulununcaya kadar tekrar edilmesi tavsiye edilmektedir.

Bundan anlaşılır ki bu örneklemede bir rastgele başlangıç kod numarası ve bundan sonraki kod numaralarının muntazam olarak aynı aralıkla elde edilmeleri şeklinde bir sistem bulunmaktadır ve bu örüntü yaratmaktadır. Böylece anakütlenin her elemanı aynı olasılıkla örnekleme koyulmaktadır. Genellikle bu türlü örneklem seçimi basit rastgele örneklemeden daha az maliyetli ve daha etken sonuç örneklem ortaya çıkartır.

Örüntülü örnekleme eğer anakütle elamanları araştırma sorunu bakımından homojenlik gösteriyorsa uygulanmalıdır. Eğer anakütle içinde kendi aralarında homojen, diğer tabakalardan çok değişik olan tabakalar bulunuyorsa (yani tabakalı örnekleme daha uygunsa) veya veri toplama maliyetleri çok değişik veri kümeleri bulunuyorsa (yani küme örneklemesi veya çok aşamalı örneklemesi daha uygun ise örüntülü örneklem yerine bu daha uygun bir rastgele örnekleme yöntemi kullanılması tavsiye edilir. Diğer taraftan, eğer kullanılan kod sayıları (özellikle başka nedenle hazırlanmış kod numaraları kullanılıyorsa) içlerinde kendine has bir değişik bir sistem bulunuyorsa öruntülü örnekleme rastgele örneklem ortaya çıkartmayacaktır. Örneğin, eğer öğrencilere kayıt numarası verilirken öğrenciler önceden 'Üniversite Giriş Sınavları' sonuçlarına göre tasnif edilmişse ve ona göre kayıt numarası verilmişse, bazı sorunlar için örüntülü örneklem uygun olmayacaktır.

Dış bağlantılar

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">İstatistik</span>

İstatistik veya sayım bilimi, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir. Belirli bir amaç için verilerin toplanması, sınıflandırılması, çözümlenmesi ve sonuçlarının yorumlanması esasına dayanır. Bu çerçevede yapılan işlemlerin tümüne sayımlama denir.

Hipotez testi, bir hipotezin doğruluğunun istatistiksel bir güvenilirlik aralığında saptanması için kullanılan yöntem.

Örnekleme istatistikte belirli bir yığından alınan kümeyi ifade eder. Örneğin; Türkiye'deki tüm üniversite sayıları bir yığın iken Ankara'daki üniversite sayısı bu yığından alınmış bir örnektir.

Varyans Analizi istatistik bilim dalında, grup ortalamaları ve bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans Analizi kullanılmaktayken belirlenmiş bir değişkenin gözlemlenen varyansı farklı değişim kaynaklarına dayandırılabilen varyans bileşenine ayrılır. En basit şekliyle varyans analizi birkaç grubun ortalamalarının birbirine eşit mi eşit değil mi olduğunu sınamak için bir çıkarımsal istatistik sınaması olur ve bu sınama iki-grup için yapılan t-test sınamasını çoklu-gruplar için genelleştirir. Eğer, çoklu değişkenli analiz için birbiri arkasından çoklu iki-örneklemli-t-sınaması yapmak istenirse bunun I. tip hata yapma olasılığını artırma sonucu doğurduğu aşikardır. Bu nedenle, üç veya daha fazla sayıda ortalamaların ististiksel anlamlığının sınama ile karşılaştırılması için Varyans Analizleri daha faydalı olacağı gerçeği ortaya çıkmaktadır.

<span class="mw-page-title-main">Standart sapma</span> İstatistikte bir varyasyon ölçüsü

Standart sapma, Olasılık kuramı ve istatistik bilim dallarında, bir anakütle, bir örneklem, bir olasılık dağılımı veya bir rassal değişken, veri değerlerinin yayılımının özetlenmesi için kullanılan bir ölçüdür. Matematik notasyonunda genel olarak, bir anakütle veya bir rassal değişken veya bir olasılık dağılımı için standart sapma σ ile ifade edilir; örneklem verileri için standart sapma için ise s veya s'

<span class="mw-page-title-main">Çarpıklık</span>

Çarpıklık olasılık kuramı ve istatistik bilim dallarında bir reel-değerli rassal değişkenin olasılık dağılımının simetrik olamayışının ölçülmesidir.

İstatistik bilim dalında tabakalı örnekleme bir anakütleden özel bir şekil olasılık örnekleme yöntemi ile veri elde edilmesidir. Tabakalı örnekleme yöntemini diğer olasılık örnekleme yöntemlerden ayıran özelliği anakütlenin içindeki bütün elamanlar belli özelliklere göre kendi içlerinde birbirlerine benzeyen birkaç gruptan, tabakadan oluştuklarıdır. Tabaka elemanları birbirlerine benzerler fakat diğer tabaka elemanlarından çok bariz şekilde değişiktirler. Tabaka örneğinde örnek elemanları öyle seçilmektedir ki her bir anakütle tabakası için örnekte temsilci bulunmaktadır.

<span class="mw-page-title-main">Tekdüze dağılım (sürekli)</span> Özel olasılık dağılımı

Sürekli tekdüze dağılım (İngilizce: continuous uniform distribution) olasılık kuramı ve istatistik bilim dallarında, her elemanı, olasılığın desteklendiği aynı büyüklükteki aralık içinde bulunabilir, her sürekli değer için aynı sabit olasılık gösteren bir olasılık dağılımları ailesidir. Desteklenen aralık iki parametre ile, yani minimum değer a ve maksimum değer b ile, tanımlanmaktadır. Bu dağılım kısa olarak U(a,b) olarak anılır.

Küme örneklemesi, istatistik bilimi içinde örneklem kullanılarak betimsel veya çıkarımsal sonuç istenirse, olasılıksal örnekleme kurallarına uyan bir örneklem veri toplama yöntemidir. Genel olarak bu yöntemin uygulanması anakütle içinde veri elamanları "kümeler" halinde ise uygundur. Bir küme içindeki elemanlar belirli karakter özelliklerine göre birbirine "yakınlık" göstermekte ve diğer anakütle içindeki kümelerden daha "uzak" olmaktadır. "Yakınlık" veya "uzaklık" genel olarak veri toplama para veya zaman maliyetine göre tanımlanır.

İstatistik bilim dalı içinde sıralama düzeni veri dizisinin özel bir şekle dönüştürülmesini kapsar. Bir örneklem veya anakütle içinde bulunan her bir sayısal elemana bir sıralama numarası verilerek öyle bir sıralanır ki bu sıralanma sonucunda herhangi bir iki eleman ele alınırsa iki elemandan hangisinin sıralama düzeninde önde geldiği bilinebilir. Yani sıralama düzeni bir sayı dizisi olup bir örneklem veya anakütledeki her bir elemana bir sıralama numarası verilmesi ile elde edilir. Matematik terimi ile bu işlem nesnelerin tüm ön-sıralanması veya zayıf sıralanması olarak adlandırılır. Bu tüm sıralanma değildir, çünkü iki veya daha çok sayıda değişik elamanın beraber aynı sırada olmalarına imkân sağlanmaktadır. Ayrıca sayısal veriler bir özelliğe göre tüm olarak sıralanmamaktadır; yani veri elemanlarının veri dizisi içindeki yerleri değişmemektedir. Ama sıralama düzeni için her veri elemanına verilen sıra numaraları tüm sıralanma halindedir.Böylece sonradan bu sıra numaraları kullanılarak veri elemanlarını tüm sıralamaya sokmak kolay bir işlem olur. Örneğin, bir jeolojik örneklem elemanları jeoloğun uygun gördüğü kaya parçaları olsun; elaman ağırlığına göre sıra numaraları verilip örneklemdeki gerçek elemanlar hiç gerçekte sıraya sokulmadan, örnek ağırlıkları için sıralama düzen sayıları kullanılarak istatistiksel analizler yapılabilir. Böylece elde bulunan örneklemin kapsadığı, ölçülebilmesi çok karmaşık ve masraflı olabilen bir değişken için incelemeyi kolaylaştırmak mümkün olabilir. Örneklem elemanlarını sıralama düzenine sokan sıra numaraların istatistiksel incelenmesi, parametrik olmayan istatistik alanı kapsamı içine girmekte ve bu tip istatistik analiz de pratikte de önemli bir rol oynamaktadır.

İstatistik bilim dalı içinde Friedman sıralamalı iki yönlü varyans analizi sonradan çok tanınmış bir iktisatçı olan Amerikan Milton Friedman tarafından ortaya atılan bir parametrik olmayan istatistik sınamasıdır.

Mann-Whitney U testi niceliksel ölçekli gözlemleri verilen iki örneklemin aynı dağılımdan gelip gelmediğini incelemek kullanılan bir parametrik olmayan istatistik testdir. Aynı zamanda Wilcoxon sıralama toplamı testi veya Wilcoxon-Mann-Whitney testi) olarak da bilinmektedir. Bu testi ilk defa eşit hacimli iki örneklem verileri için Wilcoxon (1945) ortaya atmıştır. Sonradan, Mann and Whitney (1947) tarafından değişik büyüklükte iki örneklem problemleri analizleri için uygulanıp geliştirilmiştir.

İstatistik bilim dalında, Spearman'ın sıralama korelasyon katsayısı veya Spearman'ın rho, bu istatistiksel ölçüyü ilk ortaya atan İngiliz psikolog Charles Edward Spearman'a atfen adlandırılmıştır. Matematik notasyon olarak çok defa eski Yunan harfi ρ ile belirtilir. Bir parametrik olmayan istatistik ölçüsüdür ve iki değişken arasındaki bağımlılık, yani korelasyon, ölçüsü olarak bulunup kullanılır. Bu demektir ki Spearman'in rho (ρ) katsayısı iki değişken için çokluluklar dağılımı hakkında hiçbir varsayım yapmayarak, bu iki değişken arasında bulunan bağlantının herhangi bir monotonik fonksiyon ile ne kadar iyi betimlenebilineceğini değerlendirmek amaçlı incelemedir.

Betimsel istatistik içinde, bir yüzdebirlik sıralanmış bir veri serisini yüz eşit parçaya bölen ve böylece her bir bölünen parçanın anakütle veya örneklem verilerinin 1/100'ini kapsadığı, 99 tane özetleme değeridir. Betimsel istatistikte yüzdebirlikler çok popüler olarak kullanılır. Yüzdebirliklerin diğer bir popüler kullanım alanı, özellikle ABD'de, eğitimciler ve psikologlar tarafından uygulanan testlerin sonuçlarının normal eğri kestirimi uygulanarak yüzdeliklerin bulunması suretiyle verilmesidir.

Güven aralığı, istatistik biliminde bir anakütle parametresi için bir çeşit aralık kestirimi olup bir çıkarımsal istatistik çözüm aracıdır. Bir anakütle parametre değerinin tek bir sayı ile kestirimi yapılacağına, bu parametre değerini kapsayabilecek iki sayıdan oluşan bir aralık bulunur. Böylece güven aralıkları bir kestirimin ne kadar güvenilir olduğunu gösterir.

Tek anakütle ortalaması için parametrik hipotez sınaması veya tek-örneklem için sınama veya μ için sınama, bir rastgele örneklem ortalaması ile bu örneklemin çekilmiş olduğunu düşündüğümüz anakütlenin μ ile belirtilen "anakütle ortalaması" hakkında bir hipotez değeri belirtilmesinin anlamlı olup olmadığını araştırmamızı sağlayan parametrik hipotez sınamasıdır.

Basit rastgele örneklem almanın ana prensibi her bir anakütle elemanının aynı olasılıkla örneğe girebilmesidir. Bu bir olasılık örneği tanımına uyar, çünkü her bir anakütle elemanı için örneklemde bulunma olasılığı bir Bernoulli dağılımı gösterir. Eğer anakütle büyüklüğü N ile ifade edilirse, her bir anakütle elemanı 1/N olasılıkla örnekde bulunur.

Ondabirlik istatistik biliminin betimsel istatistik kısmında, sıralanmış bir veri setinin 10 eşit sayıda parçaya bölünüp, elde edilen her örneklem veya anakütle veri seti kısmının tümün ondabiri olmasını sağlayan 9 tane ölçüdür.

Kartopu örneklemesi sosyal bilimlerde özellikle nitel araştırmalarda kullanılan bir örnekleme yöntemidir. Kartopu örneklem bir olasılık dışı örnekleme yöntemidir, çünkü evren içerisindeki tüm elemanların seçilme şansı eşit değildir.

Maksatlı örnekleme, temasa geçilmesi veya ulaşılması kolay bir grup insandan alınan, rastgelelik içermeyen bir örnekleme yöntemi türüdür. Örneğin bir alışveriş merkezinde veya markette durup insanlardan soruları yanıtlamalarını istemek bir fırsat örneklemesidir. Bu örnekleme yönteminde, insanların müsait olması ve katılmaya istekli olması dışında başka bir kriter yoktur, dolayısıyla basit bir rastgele örneklem oluşturulmasını gerektirmez. Bu tür örnekleme daha çok hazırlık uygulamaları için kullanışlıdır.