İçeriğe atla

Örnekleme (istatistik)

Örnekleme istatistikte belirli bir yığından alınan kümeyi ifade eder. Örneğin; Türkiye'deki tüm üniversite sayıları bir yığın iken Ankara'daki üniversite sayısı bu yığından alınmış bir örnektir.

Örnek hesaplamalarında , , , , gibi semboller kullanılırken yığın hesaplamalarında ise bu simgelerin yerine sırası ile , , , , simgeleri kullanılır. İstatistik sadece örnekler üzerinde hesaplanabilir. Yığında ise parametre değerleri hesaplanır.

İstatistik bilim dalında örnekleme, N hacimli bir anakütleden, anakütleyi temsil edebilen n hacimli bir altküme elde edilmesidir. Tipik olarak anakütle çok büyüktür veya tüm anakütle elemanları hakkında bilgiler elde etmek imkânsızdır veya elde etmek için anakütleyi değiştirmek veya elemanlarına zarar vermek gerekecektir veya çok büyük masraf ve emek gerektirecektir. Bu nedenle tam sayım ile tüm sayısal değerlerin öğrenilmesi istenmez. Örnekleme ile kullanılabilir bir büyüklükte altküme elde edilir. Örnek verileri toplanır; örnek verileri hakkında istatistikler hesaplanır ve örnek istatistikleri üzerinde çıkarımsal istatistik veya ekstrapolasyonlar kullanarak anakütle hakkında bilgiler elde edilir.

Örneğin, Türkiye'de üniversite öğrencilerinin fen bilimleri hakkındaki tavırları ölçülmek istensin ve bu tavırları açıklayan 10 soruluk bir anket hazırlanabileceği bilinsin. "Türkiye'de 2006-2007 öğretim yılında üniversite öğrencisi" olanların tümünün bu 10 soruya sayısal şekilde yanıt verdiği varsayılsın. Her bir soruya verilen yanıtın sayısal değerlerinin tümü birer anakütle olur. Burada dikkat edilecek nokta, istatistik bilimi için anakütlenin sayısal değerler olması ve üniversite öğrencisi olmamasıdır. Üniversite öğrencilerinin hepsi anakütle çerçevesi olarak anılır. Bu türlü sonuç bulmak ya imkânsızdır; ya da büyük emek, para ve zaman istemektedir. Bu nedenle örnekleme metodunun uygulanması tercih edilir.

Bu anakütlenin örneklemini elde etmek için anakütle çerçevesi olan 2006-2007 öğretim yılında Türkiye'deki üniversitelerde okuyanlardan küçük bir grup seçilir. Bu, daha küçük grup elemanlarına örnekleme çerçevesi adı verilir. Eğer her üniversiteden uygun bir sayıda öğrenci çeşitli örnekleme tekniklerini kullanarak seçilirse, bunların tümü örnekleme çerçevesini oluşturur. Yine örneği açıklamaya devam edersek, bu daha nispeten küçük gruba (dikkat edilirse örneğinde verilen örnekleme çerçevesi yine de sayıca küçük olmaz) bu hazırlanmış on soruluk anket uygulanır. Her 10 soruya bu küçük grup elemanlarının verdiği sayısal yanıtlar birer örnekleme olur. Örnek, örnekleme çerçevesi üzerinde belirlenmiş bir değişken üzerinde yapılan sayım veya ölçüm ile elde edilen sayısal verilerdir. Tekrar dikkat çekilmelidir ki istatistik bilimi için örnek kavramı özel bir şekildedir ve genelde kullanılan örnek sözcüğü anlamından değişiktir. İstatistik için örnekleme çerçevesi elamanları (bu örnekte seçilen üniversite öğrencileri) örneği oluşturmazlar; her örnek çerçevesi elemanından bir değişken hakkında elde edilen sayısal veriler (bu örnekte her bir 10 soruya verilen sayısal yanıtlar) örnek oluştururlar.

Örnekleme teknikleri

Genel örnekleme tekniği tanımı

Yukarıda anakütle çerçevesinden uygun bir şekilde bir daha ufak örnekleme çerçevesi elde edilir denilmişti; işte bu uygun şekillerin incelenmesi örnekleme tekniklerinin incelenmesi demektir. Genel olarak örnekleme çerçevesinin anakütle çerçevesinden elde edilmesi için prensip örnekleme çerçevesinin anakütleyi temsil edici olmasıdır. Örnek verileri bir art fikirle bazı kişisel veya grupsal fikir ve prensiplere güya bilimsel bir destek sağlamak için kullanılmaması gerekmektedir; ama ne yazıktır ki pratikte birçok ticari, sınai, sosyal ve politik örnek bu niyetle elde edilip kullanılmakta ve genel gerçekte temsilci olma prensibinden uzaklaşılmaktadır. Bu istatistikle yalan söyleme şeklinde adlandırılabilen birçok araştırmalarda ele alınan bir konu olmuştur.[1]

Eğer temsilci olma prensibine uygunluk arzu edilmekte ise örnekleme tekniği seçimi için iki genel teknik grubu bulunmaktadır:

  • İstatistiksel olasılık prensiplerine dayanmayan teknikler ve
  • İstatistik olasılık prensiplerine dayanan rastgele örnekleme teknikleri.

Bu kavramsal ayrımı sağlayan prensip, olasılık prensipleridir ve bu prensiplere uyan örnekler rastgele örnek adı ile anılmaktadır. Rastgele örnek için kullanılan prensip genel olarak

anakütle çerçevesi içinde bulunan her elemanın örnek çerçevesi içine alınma olasılığının önceden belirlenmiş bir olasılık dağılımına göre olmasıdır.

Fakat genel olarak seçilen olasılık dağılımı Bernoulli dağılımı olduğu için birçok referansta bu prensip

anakütle çerçevesi içinde bulunan her elemanın örnek çerçevesi içine alınma olasılığının eşit ve aynı olmasıdır.

şeklinde ifade edilmektedir. Dikkat edilirse rastgele örnek için temsilcilik prensibi özel olarak matematik-istatistik içeriğine göre değiştirilmiştir; belirlenmiş bir dağılıma göre olasılık, eşit olasılık prensibi ön plana alınmıştır. Eğer anakütle elemanları için bu prensip uygulanırsa, bunun mantıksal olarak temsilcilik prensibine uyacağı da ima edilmektedir. Burada bu iki grup örnekleme tekniğine ait olan teknikler genel olarak detaya inmeden açıklanacaktır.

Olasılık prensiplerine uymayan örnekleme teknikleri

Elverişlilik örneği

Elverişlilik örneği metodunda örnek çerçevesine girecek anakütle elemanları araştırmayı yapanın keyfine göre plansız tasarımsız seçilir. Örnek seçiminde önemi olan prensip elde edilen örneğin istatistik araştırmayı yapan kişi için elverişli olmasıdır. Eğer araştırmacı bilinçli, inanılır ve güvenilir bir kişi ise örnekin anakütlenin temsilcisi olma imkânı vardır ama bunun gerçekte geçerli olup olmadığını kontrol edecek hiçbir alet veya kural ortada bulunmamaktadır. Bu çeşit örnekleme daha sonra bir rastgele örnek almak için bir pilot çalışma için kullanılması çok kere tavsiye edilmektedir.

Mekanik örnekleme

Laboratuvarlarda, fabrikalarda ve diğer üretim kurumlarında test ve kontrol maksadı ile katı maddeler, sıvılar veya gazlar mekanik araç ve gereçler kullanılarak örneklem alınır. Özellikle kalite kontrolü sürecinde ve diğer testler ve kontrollar için bu mekanik örneklerin anakütlelerinin temsilcisi olması gerekmektedir.

Yargısal örnekleme

Yargısal örnekleme bir uzman kişi veya bilirkişinin kendi özel bilgisini ve yargısını kullanarak temsilci olma niceliğini taşıyan elemanlar ile bir örnekleme çerçevesi kurmasıdır.

Bu çeşit örneklerde çok kere bilinmeyen ve daha önceden hiç tahmin edilme imkânı olmayan yanlılıklar ortaya çıkar. Örnek seçme usulu ve protokollerinin kuruluşu ve kullanışı sırasında şeffaflık olmadığı için bilinmezliklerin nerede ve nasıl ortaya çıkabilecekleri ve nasıl yanlılıkların aksi tesirlerinin, nasıl çarelerle giderilebileceği bilinmez.

Bazı hallerde yargısal örnekleme kullanışlı ve hatta tercih edilir örnek alma tekniği olabilir. Rastgele örneklemenin imkânsız veya çok büyük zaman, emek ve para sarfı gerektirdiği için kullanışsız olduğu hallerde yargısal örnekleme gayeye uygun veriler ortaya çıkartabilir. Diğer bir uygun olma hali eğer kullanılacak örnek çok küçük ise ('10' veya daha aşağı sayıda veri öngörülüyorsa), bir rastgele örneke nazaran, bir yargısal örnek bulmak daha güvenilir ve daha iyi temsilci olma özelliği taşıyan bir örneklem ortaya çıkartabilir. Bazen kasten hiç temsilci olmayan ve gayet yanlı bir örnek kasten seçilmek istenebilir ve bu halde yargısal örnek tercih edilir. Bu kasten yanlı olarak yargısal örnek seçimi, araştırma konusunun en fena alternatif halini incelemek için çok uygundur.

Kota örneği

Bu çeşit örneklemede anakütlede tabakalar bulunduğu ve bu tabakalara ait olan elemanların birbirlerine çok benzer özellikler gösterdiği, fakat değişik tabakaya mensup elemanların özelliklerinden açıkça farklı oldukları bilinmektedir. Araştırmacı önce bu tabakaların özelliklerini tam olarak saptar ve değişik tabakaları birbirinden ayırt eden özellikleri tespit eder. Çok kere bu tabakaları ayırt edici özellikler kişilerin sosyo-demografik özellikleri olur. Buraya kadar yapılan işlemler aynen olasılık prensibine uyan tabakalı örneklemede de uygulanır.

İkinci adım olarak kota örneklemede her veri toplayıcısına, tespit edilmiş her tabaka için aldıkları örnekte (çok kere anket sorularını cevaplandırıcı sayısı olan) kaç gözlem ile bulunacağını tespit eden bir kota sayısı verilir.

Bundan sonra veri toplayıcılar kendilerine verilen her tabaka için kota sayısına göre kendi şahsi yargılarını kullanarak veri toplarlar. Bu adım tıpkı bir yargısal örnekleme gibidir; ama yargıyı uygulayanlar çok defa, uzman kişi veya bilirkişiler değil, gerçek veri toplayıcılardır.

Kartopu örneklemesi

Bu örneklemede önce bir çekirdek örneklem, elverişlilik örneği gibi araştırmayı yapan tarafından kendi keyfine göre bulunur. Ondan sonraki örneklem elemanları ise daha önce bulunmuş olan (çekirdek elemanlar ve onların seçtiği diğer) elemanlar tarafından bulunurlar. Örnek böylece, sanki karda itilerek büyüyen, bir kartopu gibi büyüme gösterir.

Rastgele örnekleme

Rastgele örnekleme olasılık örneklemesi olarak da adlandırılır.[2]Rastgele örnek bulma ve kullanma için istenilen özellik:

"Her bir anakütle elemanının belirli olasılıkla örnekte bulunmasıdır."

Bundan açıktır ki istenilen özellik doğrudan doğruya örneğin anakütle için temsilci olması değildir. Temsilci olma prensibine rastgele örnekleme biraz dolaylı olarak varmaktadır. Rastgele örnekleme kavramı ve prensibi temsilci olmama riskini bir seri istatistik teori kavramı ile niceliksel olarak açığa çıkarmaya yöneliktir. Bu niceliksel sonuçlar önce hangi çeşit rastgele örneklemenin seçilmesi ve sonra ne kadar büyük bir örnek hacmi elde edilmesi gerektiğine karar vermekte kullanılır. Bu örnek alınmasından önce karar verme yanında, örnek alındıktan sonra ölçülmüş sonuçlara bağlı örnekleme hatasını hesaplamaya yardım sağlar.

Belirli olasılık teriminin tanımlanmasına göre değişik türlü rastgele örnek ortaya çıkabilir. Bunlardan en iyi bilineni basit rastgele örneklemedir. Bu türlü örneklemenin ana prensibi her bir anakütle elemanının aynı olasılıkla örnekleme girebilmesidir. Yani her bir anakütle elemanı için örnekte bulunma olasılığı bir Bernoulli dağılımı gösterir. Diğer türlü belirli olasılık her bir anakütle elemanının Poisson dağılımına göre (birbirine eşit olmayarak) örnek içinde bulunmasıdır.

Ancak rastgele örneklemeler için sınıflandırma (gösterilen olasılık dağılımına göre yapılmamakta) daha pratik olarak nasıl rastgele olmanın sağlanma yöntemine dayanılmaktadır. Bu sınıflandırmaya göre rastgele örnekleme sınıfı içinde şu değişik örnekleme tipi mevcuttur:

  1. Basit rastgele örnekleme
  2. Örüntülü örnekleme
  3. Tabakalı örnekleme
  4. Küme örneklemesi
  5. Çok aşamalı örnekleme
  6. Eşli rastgele örnekleme

Basit rastgele örnekleme

Basit rastgele örneklem almanın ana prensibi her bir anakütle elemanının aynı olasılıkla örneğe girebilmesidir. Bu bir olasılık örneği tanımına uyar, çünkü her bir anakütle elemanı için örneklemde bulunma olasılığı bir Bernoulli dağılımı gösterir. Eğer anakütle büyüklüğü N ile ifade edilirse, her bir anakütle elemanı 1/N olasılıkla örnekte bulunur.

Bu prensibi uygulamak için şu aşamalar uygulanır:

  1. Anakütlenin her bir elemanı tespit edilir ve tespit edilen elamanların her birine bir sayısal kod verilir. Genellikle kodlar birbirini takip eden sayılar halinde sıralama düzeni halindedir ve sanki sayısal bir isimdir.
  2. İkinci aşamada en uygun örneklem hacmi, yani n, tayin edilir.
  3. Bir rastgele numara üretici alet kullanılarak istenilen n sayıda (birbirinden değişik olması tercih edilir) rastgele sayı çıkartılır. Rassal sayılar gayet çok olduğu için bir çeşit geri koymadan örnek alma deneyim sonucu olan n tane rastgele sayı aynı olasılığa haizdir.
  4. Bu rastgele n numara anakütle elemanlarının kodları ile karşılaştırılır. Kod numarası, çekilmiş olan rastgele sayıya eşit olan elemanlar örnek elemanı olarak seçilirler.

Örüntülü örnekleme

Bu olasılık örnekleme yöntemin ana prensibi bir anakütle çerçevesi içinde bulunan her bir elemana sıra bir kod numarası verilebilirse, rastgele seçilmiş veya hesaplama ile bulunmuş bir kod aralığı olan k aralığı ile her kinci elemanın gözlem yapılacak örnekleme seçimidir. Örneğin, belli bir üniversitede kayıtlı öğrenci numaraları belli bir numaradan başlayıp giden bir sıraya tabi iseler ilk olarak bir rastgele kayıt numarası seçilir ve sonra bir rastgele aralık numarası seçilir; diyelim 54 başlangıç kayıt numarası ve 12 de kod aralığı rastgele seçilmiş olsun. Örüntülü örneklemede örneğe dahil edilecek öğrenci elamanlarin şu kayıt numaraları olmalıdır:

54 66 78 90 ...... önceden seçilmiş n tane örneklem hacmi elde edilinceye kadar..

Tabakalı örnekleme

Bu çeşit olasılık örnekleme yönteminde anakütlenin tabakalardan oluştuğu gerçeği kabul edilmektedir. Her tabaka elemanı bir veya bir grup teşhis edici değişken değeri dolayısıyla birbirlerine çok benzedikleri kabul edilirler. Bu çeşit teşhis edici değişken(ler) için değerler tabakalar arasında çok farklıdır. Birçok sosyal bilim araştırması için bu teşhis edici değişken bir veya birkaç şahsi veya ekonomik veya sosyal özelliklerden oluşur.

Örneğin temsilcilik prensibine uyması için anakütlenin her bir tabakasından değişik sayıda örnek seçilir ve örnek de (ayni anakütle gibi) tabakalı olur. Genel olarak her anakütle tabakası ve örnek tabakası elemanları arasında ilişki kurulabilir. Orantılı tabakalar denilebilen bir tipe göre anakütle içinde her bir tabakanın toplama oranı, örnek tabakasının örnek büyüklük hacmine oranı ile aynıdır. Bu oran en popüler olarak tabaka içindeki teşhis edici değişiklik karakteri taşıyan elemanların sayısı ile toplam orantılıdır. Diğer bir alternatif standart sapmaların oranı olabilir. Diğer alternatifte orantısız tabakalar adı verilir ve daha başka yargısal seçimlerle örnek tabaka elemanları anakütle tabakalarına temsilci olması sağlanır.

Küme örneklemesi

Bu şekilde örnekleme genellikle örnekleme zaman ve para maliyetlerini düşük tutmak için kullanılmaktadır. Anakütle çerçevesi elamanlarının birbirine yakın kümeler oluşturduğu hallerde ve her bir küme genel olarak diğer kümelere çok benzerlerse, bu tipi örnekleme kullanılması uygun olabilir. Örneğin, anakütle çerçevesi belli bir üniversite olursa, o üniversite içindeki değişik bölümlerde bulunan öğrencilerin benzer özellikler gösterdikleri kabul edilebilir ve bölümler incelenen sorun için birbirinden çok değişik değillerse, bölümler birer küme olarak incelemeye taban olabilirler. Bu kümeler mekan içinde (örneğin şehrin değişik mahalleleri veya Amerika'daki gibi değişik şehir blokları) veya zaman içinde (belirli zaman dönemleri) olabilir.

Küme örneklemesi iki aşamada yapılır:

  • Birinci aşamada çok iyi belirlenmiş kümeler tespit edilir. Her iyi belirlenmiş kümeye bir kod numarası verilir. Bütün kod numaraları içinden basit rastgele örnekleme ile küçük sayıda 'kümeler örneği' seçilir. Örneğin, bir üniversite 35 tane bölümden oluşmuşsa ve her bölüme ait öğrenci üyeler iyice tespit edilmişlerse; her bir bölüm kodlanır ve diyelim 8 tane bölüm bu 35 bölümden basit rastgele örnek olarak (yani 35 bölüm de örneğe dahil olmak için aynı olasılığı taşıyarak) seçilirler.
  • İkinci aşamada her bir örneğe giren küme içinde bulunan bütün anakütle elemanları üzerinde gözlem yapılır. Yani her örnek küme için tam sayım yapılır. Örneğin, ilk aşamada seçilmiş olan 8 bölümdeki her öğrenci elemanlarının tümüne gözlem uygulanır.

Doğal olarak, tüm anakütle çerçevesi seçilmediği için zaman ve para maliyetleri tam sayımdan düşük olur. Dikkat edilirse bu çeşit örneklemede rastgele seçilme kümelerle ilgilidir. Bu seçim yapıldıktan sonra seçilen kümeler içinde bulunan birbirine yakın elemanlar gözümlendiği için de maliyetler (özellikle basit rastgele örneklemeye kıyasla) daha düşük olması çok mümkündür. Basit rastgele örneklemeye kıyasla küme örneklemesinin bir diğer avantajı, tüm anakütle elemanlarının her birinin kodlanmasının gerekmediğidir; bu tüm kodlama büyük maliyet gerektirir ve bazen de imkânsızdır. Buna karşılık küme örneklemesinde sadece birinci aşamada seçilmiş olan kümeler elemanları tespit edilip kodlanır.

Ancak küme örneklemesi, her bir kümenin diğer kümelere benzediğine ve sadece kendine has karakteri olan bir veya birkaç kümenin bulunmadığı varsayımına dayanır. Gerçekte bu varsayım her zaman ancak yaklaşık olarak doğru olacak ve bazı belirlenen kümeler kendine has karakter arz edecektir. Bu nedenle küme örneklemesinin yayılımı ayni anakütle için alınabilecek basit rastgele örneklemeden daha fazla olacaktır ve örneklemeden sonra elde edilecek kestirimler veya yapılan sınamalar daha az tutarlı olacak ve daha fazla yanlı olma olasılığı taşıyacaklardır.

Çok aşamalı örnekleme

Çok aşamalı örnekleme küme örneklemesinin biraz daha karmaşık bir şeklidir. Küme örneklemesi için basit rastgele örnek olarak seçilmiş kümeler gerekmekte ve seçilen kümeler içinde tam sayım yapılması önerilmektedir. Bu tam sayım (ya parasal veya diğer kaynak kullanımına göre) çok maliyetli ve hatta imkânsız bile olabilir. İki aşamalı örneklem için birinci aşamada (aynı küme örneklemesi gibi) basit rastgele örnekleme ile belirli sayıda küme seçilir. Bundan sonra ikinci aşamada kullanılan çerçeveler ilk aşamada seçilmiş kümeler olur. Her seçilmiş küme için basit rastgele örnekleme uygulanıp tüm küme hacminden daha ufak sayıda örnekleme girecek elemanlar seçilir. Nadir hallerde ikiden fazla aşama da uygulanabilir. Bunda ilk aşama küme seçmektir; ondan sonraki aşama veya aşamalarda gittikçe birbiri içine girmiş alt-küme, alt-alt-küme vb. seçmek amaçtır ve en son aşamada ise seçilmiş alt-alt..-küme içinden basit rastgele örnek seçilir. Bu son aşamada elde edilecek örnek büyüklüğünün kaç eleman kapsayacağı kararı önemlidir. Eğer örnek büyüklüğü ile anakütledeki küme (veya alt-alt-..-küme oranında eşitlik istenirse herhangi bir seçilen küme içinde bulunan tüm anakütleye orantılı eleman sayısı son aşama örnek büyüklüğü seçiminde de aynen uygulanır.

Eşli rastgele örnekleme

'Eşli rastgele örnekleme birbirine bağlantısı olan iki değişik örneğe elaman seçimini kapsar. Anakütle elamanları önce diğer bir karakteristiğe veya değişkene göre eşlenerek o değişkeni inceleyecek örneklere seçilmiş olurlar. İnceleme yapılacak diğer bir karakteristik veya değişken için kullanılacak bu önceden eşlenmiş elamanları nasıl rastgele bu yeni değişken için örneklere tahsis edileceği eşli rastgele örnekleme yöntemi kullanılarak yapılır.

Bu çeşit olasılık örneklemi bulmak özellikle şu iki halde çok uygundur:

  • Araştırıcı birbirine doğal veya diğer özel karaktere göre eşli olan elemanları bulmuştur. Bu eşli elamanlar yeni bir araştırma sorunu incelemek için örneklenmeleri eşli rastgele örnekleme yöntemi ile yapılır. Örneğin önceden bulunan iki örneklemeden birine bir özdeş ikiz ve diğerine öbür ikiz tahsis edilmiştir. Yeni incelenecek sorun zeka testi sonuçlarıdır. Eşli rastgele örnekleme' yöntemi ile daha önceden iki örnekleme ayrılan özdeş ikizler için yeni bir örnek bulması yöntemidir.
  • Bir vasıf veya değişkene göre örnek elemanları üzerine iki defa ölçüm uygulanır; ikinci uygulama birinci örneğe özel bir sağaltım uyguladıktan sonra yapılır. Bu çeşit ölçüme tekrarlanan ölçümler adı verilir. İkinci ölçüm için örnek seçimi eşli rastgele örnekleme yöntemine göre yapılır. Örneğin, bir grup 1500m koşucusuna özel bir antrenman usulu tatbik etmeden önce ve ettikten sonra elde edilen koşu zamanı ölçümleri.

Formel matematiksel rastgele örneklem seçme tanımı

Matematik olarak rastgele örnekleme daha formel bir şekilde tanımlanır. X olasılık dağılımı F olan verilmiş bir rassal değişken olsun. n=1, 2,3,... büyüklüğü olan bir rastgele örnek F dağılımı olan n tane bağımsız ve her biri ayni şekilde dağılım gösteren n elemanı bulunan bir settir.[3]

Bir örnek somut şekilde, her bir denemede aynı miktar ölçülürse n tane denemeyi temsil eder. Örneğin, biz üniversite öğrencilerini boyu ile ilgili isek X bir öğrencinin boyu olur ve tane öğrenci boyu ölçümlenir ve i-inci öğrencinin boyunu ifade eder. Fakat (bir sıra ölçülebilir fonksiyondan oluşan) bir rassal değişkenler örneği ile bu rassal değişkenlerin gerçekleşmelerini (yani rassal değişkenin almış olduğu değerleri) kavramsal olarak ayrı tutmak gerekmektedir. Diğer bir deyişle, i-inci denemedeki ölçmeyi temsil eden bir fonksiyon olmakta ve gerçekte yapılan ölçmelerden elde edilen sayılar olmaktadır.

Böylece matematik açıklamaya göre örnek kavramı verilerin (yani rassal değişkenlerin) nasıl elde edilmeleri sürecini açıklamaktadır. Bu gereklidir çünkü örnek ve bundan elde edilen örnekleme istatistikleri hakkında matematik ifadelerin verilmesi gerekmektedir.

Kaynakça

  1. ^ D.Huff, [1993] How to lie with statistics, W.W.Norton & co.
  2. ^ Burada istatistik bilimine ait özel terimler kullanılmaktadır. Bu istatistik bilimi terimleri "ISI (Uluslararası İstatistik Enstitüsü) tarafından hazırlanmış aralarında Türkçe de bulunan 31 dilde karşılıklı olarak "Çoklu Dilli İstatistik Terimleri Lugati (ISI Multilingual Glossary of Statistical Terms)" adlı bilimsel eserde kabul edilmiştir. [1] 8 Şubat 2016 tarihinde Wayback Machine sitesinde arşivlendi.
  3. ^ Wilk, Samuel S. (1962), Mathematical Statistics, John Wiley, Bol.8.1

Ayrıca bakınız

Dış bağlantılar


İlgili Araştırma Makaleleri

<span class="mw-page-title-main">İstatistik</span>

İstatistik veya sayım bilimi, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir. Belirli bir amaç için verilerin toplanması, sınıflandırılması, çözümlenmesi ve sonuçlarının yorumlanması esasına dayanır. Bu çerçevede yapılan işlemlerin tümüne sayımlama denir.

Hipotez testi, bir hipotezin doğruluğunun istatistiksel bir güvenilirlik aralığında saptanması için kullanılan yöntem.

Varyans Analizi istatistik bilim dalında, grup ortalamaları ve bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans Analizi kullanılmaktayken belirlenmiş bir değişkenin gözlemlenen varyansı farklı değişim kaynaklarına dayandırılabilen varyans bileşenine ayrılır. En basit şekliyle varyans analizi birkaç grubun ortalamalarının birbirine eşit mi eşit değil mi olduğunu sınamak için bir çıkarımsal istatistik sınaması olur ve bu sınama iki-grup için yapılan t-test sınamasını çoklu-gruplar için genelleştirir. Eğer, çoklu değişkenli analiz için birbiri arkasından çoklu iki-örneklemli-t-sınaması yapmak istenirse bunun I. tip hata yapma olasılığını artırma sonucu doğurduğu aşikardır. Bu nedenle, üç veya daha fazla sayıda ortalamaların ististiksel anlamlığının sınama ile karşılaştırılması için Varyans Analizleri daha faydalı olacağı gerçeği ortaya çıkmaktadır.

Matematikte permütasyon, n elemanlı bir kümenin k elemanlı alt kümelerinin k kere yer değiştirme sayısıdır.

<span class="mw-page-title-main">Aritmetik ortalama</span>

Aritmetik ortalama, bir sayı dizisindeki elemanların toplamının eleman sayısına bölünmesi ile elde edilir. İstatistik bilim dalında hem betimsel istatistik alanında hem de çıkarımsal istatistik alanında en çok kullanan merkezi eğilim ölçüsü' dür.

<span class="mw-page-title-main">Monte Carlo yöntemi</span>

Monte Carlo benzetimi, çok sayıda tekrarlanan rastgele örneklemelerle, bir takım nümerik sonuçlar elde etmeye yarayan ve bilimin birçok alanında yaygın olarak kullanılan bir sayısal hesaplama algoritmaları sınıfıdır. Stokastik olayların yer aldığı fiziksel süreçlerin sonuçlarının tahmin edilmesinde çok kullanışlıdır. Ayrıca, rastgele seçimlerin işe yaradığı ve prensipte deterministik olan bir takım problemlerin çözümünde de kullanılmaktadır. Monte-Carlo yöntemi, Nicholas Constantine Metropolis (1915-1999) tarafından bulunmuştur ve Atom bombasının geliştirildiği Los Alamos Ulusal Labratuvarında, bombanın patlamasından sonra dağılan nötronlara karşı kalkan modellemek için Stanislaw Ulam tarafından günümüze taşınmıştır.

Ortalama veya merkezsel konum ölçüleri, istatistik bilim dalında ve veri analizinde kullanılan bir veri dizisinin orta konumunu, tek bir sayı ile ifade eden betimsel istatistik ölçüsüdür. Günlük hayatta ortalama dendiğinde genellikle kast edilen aritmetik ortalama olmakla beraber bu ölçünün çok belirli bazı dezavantajları söz konusudur. Bu yüzden matematik ve istatistikte, bir anakütle veya örneklem veri dizisi değerlerini temsil eden tek bir orta değer veya beklenen değer, olarak medyan (ortanca), mod (tepedeğer), geometrik ortalama, harmonik ortalama vb adlari verilen birçok değişik merkezsel konum ölçüleri geliştirilmiş ve pratikte kullanılmaktadır.

<span class="mw-page-title-main">Standart sapma</span> İstatistikte bir varyasyon ölçüsü

Standart sapma, Olasılık kuramı ve istatistik bilim dallarında, bir anakütle, bir örneklem, bir olasılık dağılımı veya bir rassal değişken, veri değerlerinin yayılımının özetlenmesi için kullanılan bir ölçüdür. Matematik notasyonunda genel olarak, bir anakütle veya bir rassal değişken veya bir olasılık dağılımı için standart sapma σ ile ifade edilir; örneklem verileri için standart sapma için ise s veya s'

İstatistiksel yığın yahut anakütle yahut evren kavramı istatistik biliminde belirli bir konudaki tüm değişkenlerin ölçülebilecek değerlerini ifade eder. Örneğin; Türkiye'de bulunan kişiler bir istatistiksel yığın değil, bunların mümkün sayısı bir istatistiksel yığın olmaktadır. Ankara'nın sayılması mümkün nüfusu ise Türkiye yığınından alınmış bir örneklemdir. Dikkat edilirse istatistiksel yığın kavramı ile, herhangi bir değişkeni içeren elemanlara değil, değişkenlerin mümkün olarak ölçülebilen veya sayılabilen içerik karakteristiğine atıf yapılmaktadır. Böylece istatistikte istatistiksel yığın ya ölçülebilir ya sayılabilir karekteristiktir ve sayısal olarak ortaya çıkabilmesi mümkündür.

<span class="mw-page-title-main">Çarpıklık</span>

Çarpıklık olasılık kuramı ve istatistik bilim dallarında bir reel-değerli rassal değişkenin olasılık dağılımının simetrik olamayışının ölçülmesidir.

Elverişlilik örneği, istatistik ve diğer araştırmalarda kullanılacak örnek verilerini elde etmek için kullanılan ve olasılık prensibine dayanmayan bir veri toplama yöntemidir. Bazen kapma örneklemesi veya fırsat örneklemesi adı da verilir.

İstatistik bilim dalında tabakalı örnekleme bir anakütleden özel bir şekil olasılık örnekleme yöntemi ile veri elde edilmesidir. Tabakalı örnekleme yöntemini diğer olasılık örnekleme yöntemlerden ayıran özelliği anakütlenin içindeki bütün elamanlar belli özelliklere göre kendi içlerinde birbirlerine benzeyen birkaç gruptan, tabakadan oluştuklarıdır. Tabaka elemanları birbirlerine benzerler fakat diğer tabaka elemanlarından çok bariz şekilde değişiktirler. Tabaka örneğinde örnek elemanları öyle seçilmektedir ki her bir anakütle tabakası için örnekte temsilci bulunmaktadır.

Örüntülü örnekleme istatistik bilimi içinde, örnekleme yoluyla veri toplamak için kullanılabilecek bir olasılık örneklemesi yöntemidir. Bu yöntemin ana prensibi bir anakütle çerçevesi içinde bulunan elemanlar numaralanıp sıra ile her elemana bir kod numarası verilebilirse, rastgele seçilmiş veya hesaplama ile bulunmuş bir kod aralığı olan k aralığı ile her kinci elemanın seçimidir.

Küme örneklemesi, istatistik bilimi içinde örneklem kullanılarak betimsel veya çıkarımsal sonuç istenirse, olasılıksal örnekleme kurallarına uyan bir örneklem veri toplama yöntemidir. Genel olarak bu yöntemin uygulanması anakütle içinde veri elamanları "kümeler" halinde ise uygundur. Bir küme içindeki elemanlar belirli karakter özelliklerine göre birbirine "yakınlık" göstermekte ve diğer anakütle içindeki kümelerden daha "uzak" olmaktadır. "Yakınlık" veya "uzaklık" genel olarak veri toplama para veya zaman maliyetine göre tanımlanır.

İstatistik bilim dalı içinde Friedman sıralamalı iki yönlü varyans analizi sonradan çok tanınmış bir iktisatçı olan Amerikan Milton Friedman tarafından ortaya atılan bir parametrik olmayan istatistik sınamasıdır.

Mann-Whitney U testi niceliksel ölçekli gözlemleri verilen iki örneklemin aynı dağılımdan gelip gelmediğini incelemek kullanılan bir parametrik olmayan istatistik testdir. Aynı zamanda Wilcoxon sıralama toplamı testi veya Wilcoxon-Mann-Whitney testi) olarak da bilinmektedir. Bu testi ilk defa eşit hacimli iki örneklem verileri için Wilcoxon (1945) ortaya atmıştır. Sonradan, Mann and Whitney (1947) tarafından değişik büyüklükte iki örneklem problemleri analizleri için uygulanıp geliştirilmiştir.

İstatistik bilim dalında ağırlıklı ortalama betimsel istatistik alanında, genellikle örneklem, veri dizisini özetlemek için bir merkezsel konum ölçüsüdür. En çok kullanan ağırlıklı ortalama tipi ağırlıklı aritmetik ortalamadır. Burada genel olarak bir örnekle bu kavram açıklanmaktadır. Değişik özel tipli ağırlıklar alan özel ağırlıklı aritmetik ortalamalar bulunmaktadır. Diğer ağırlıklı ortalamalar ağırlıklı geometrik ortalama ve ağırlıklı harmonik ortalamadir. Ağırlıklı ortalama kavramı ile ilişkili teorik açıklamalar son kısımda ele alınacakdır.

Güven aralığı, istatistik biliminde bir anakütle parametresi için bir çeşit aralık kestirimi olup bir çıkarımsal istatistik çözüm aracıdır. Bir anakütle parametre değerinin tek bir sayı ile kestirimi yapılacağına, bu parametre değerini kapsayabilecek iki sayıdan oluşan bir aralık bulunur. Böylece güven aralıkları bir kestirimin ne kadar güvenilir olduğunu gösterir.

Tek anakütle ortalaması için parametrik hipotez sınaması veya tek-örneklem için sınama veya μ için sınama, bir rastgele örneklem ortalaması ile bu örneklemin çekilmiş olduğunu düşündüğümüz anakütlenin μ ile belirtilen "anakütle ortalaması" hakkında bir hipotez değeri belirtilmesinin anlamlı olup olmadığını araştırmamızı sağlayan parametrik hipotez sınamasıdır.

Basit rastgele örneklem almanın ana prensibi her bir anakütle elemanının aynı olasılıkla örneğe girebilmesidir. Bu bir olasılık örneği tanımına uyar, çünkü her bir anakütle elemanı için örneklemde bulunma olasılığı bir Bernoulli dağılımı gösterir. Eğer anakütle büyüklüğü N ile ifade edilirse, her bir anakütle elemanı 1/N olasılıkla örnekde bulunur.