İçeriğe atla

Histogram

Histogram, gruplandırılmış bir veri dağılımının sütun grafiğiyle gösterimidir. Diğer bir ifadeyle, tekrarlı sayılardan oluşan verilerin, uygulanan işlemlerden sonra önce tabloya, tablodan yararlanarak grafiğe aktarılması, yani veri gruplarının grafiğinin dikdörtgen sütunlar halinde gösterilmesidir.[1]

Açıklama

İlk olarak Karl Pearson tarafından geliştirilmiştir. Sütunlar belirlenen aralıkların sınıfını belirler. Sütunların yükseklikleri her aralığa kaç değer düştüğünü belirtir. Bölmeler eşit boyutta ve bitişik olmalıdır. Sütunların çok ve dar olması histogramın güvenilirliğini artırır. Eğer sütunların sayısı az ve geniş ise elde edilecek bilgiler ile yanlış varsayımlar yapılması daha olağandır.[2]

Görüntü üzerinde oluşturulan histogramlar ise her piksel seviyesinin görüntüdeki miktarını yani frekansını gösterir.[3] Görüntü koyu tonlarda ise veya açık tonlarda ise bu görüntülerin bilgisi histogram okunarak elde edilebilir.

Histogram Eşitleme

Görüntüler için çıkarılan histogramlarda görüntüyü iyileştirmek için histogram eşitleme kullanılır. Histogramda bulunan frekans ile yapılan doğrusal olmayan bir eşitleme işlemidir. Görüntü yüksek değerli bir frekansa sahipse piksel seviyesi geniş bir piksel alanına yayılır. Görüntü düşük bir frekansa sahipse dar bir piksel alanına yayılarak histogram oluşturulur. Görüntünün histogramı bulunarak; kümülatif histogram bulunur. Değerler normalize edilip eski değerler ile birlikte elde edilen değerler birbirine karşılık düşürülür. Yeni histogram grafiği elde edilir.

Matematiksel Tanım

Matematiksel anlamda, histogram, ayrık kategorilerin her birine düşen verilerin sayısını veren bir fonksiyondur. Histogram grafiği, histogramı temsil etmenin sadece bir yoludur. Bu fonksiyonun tanımı aşağıdaki gibidir:

Kümülatif Histogram

Kümülatif histogram, belirtilen aralığa kadar tüm aralıklardaki kümülatif gözlem sayısını veren bir eşitliktir. Matematiksel olarak aşağıdaki gibi tanımlanır:

Sturges Formülü

Sturges formülü, iki terimli bir dağılımdan türetilmiştir ve yaklaşık olarak normal bir dağılım sağlar.[4] Bölme boyutlarını veri aralığına dağıtır.

Bu formülde, n <30 ise kötü performans gösterebilir. Bu sebeple bölmelerin sayısı azdır. Ayrıca verilerdeki eğilimleri iyi gösterme olasılığı düşüktür. Veriler normal olarak dağıtılmadıysa da kötü performans gösterebilir.

Rice Kuralı

Rice kuralı, Sturges kuralına alternatif olarak türetilmiştir.[5]

Karekök Seçimi

Bu kural, örnekteki veri noktalarının sayısının karekökünü alır. Excel histogramları ve diğer birçok uygulama tarafından kullanılır.[6]

Ayrıca sonucu bir sonraki tam sayıya yuvarlar.

Kaynakça

  1. ^ "Histogram (Histogram Nedir?, Histogram Hazırlama ve Yorumlama)". 5 Mart 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 2 Kasım 2015. 
  2. ^ "Histogram" (PDF). Ondokuz Mayıs Üniversitesi. 22 Mayıs 2021 tarihinde kaynağından (PDF) arşivlendi. 
  3. ^ "Görüntü İşleme Teknikleri-1" (PDF). Oğuzhan Öztaş. 21 Şubat 2016 tarihinde kaynağından (PDF) arşivlendi. 
  4. ^ Sturges, Herbert A. (1 Mart 1926). "The Choice of a Class Interval". Journal of the American Statistical Association. 21 (153): 65-66. doi:10.1080/01621459.1926.10502161. ISSN 0162-1459. 
  5. ^ "Free Statistics Book". onlinestatbook.com. 6 Temmuz 2006 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  6. ^ "EXCEL Univariate: Histogram". cameron.econ.ucdavis.edu. 28 Şubat 2009 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 

İlgili Araştırma Makaleleri

Olasılık kuramı ve istatistik bilim dallarında varyans bir rassal değişken, bir olasılık dağılımı veya örneklem için istatistiksel yayılımın, mümkün bütün değerlerin beklenen değer veya ortalamadan uzaklıklarının karelerinin ortalaması şeklinde bulunan bir ölçüdür. Ortalama bir dağılımın merkezsel konum noktasını bulmaya çalışırken, varyans değerlerin ne ölçekte veya ne derecede yaygın olduklarını tanımlamayı hedef alır. Varyans için ölçülme birimi orijinal değişkenin biriminin karesidir. Varyansın karekökü standart sapma olarak adlandırılır; bunun ölçme birimi orijinal değişkenle aynı birimde olur ve bu nedenle daha kolayca yorumlanabilir.

Regresyon analizi, iki ya da daha çok nicel değişken arasındaki ilişkiyi ölçmek için kullanılan analiz metodudur. Eğer tek bir değişken kullanılarak analiz yapılıyorsa buna tek değişkenli regresyon, birden çok değişken kullanılıyorsa çok değişkenli regresyon analizi olarak isimlendirilir. Regresyon analizi ile değişkenler arasındaki ilişkinin varlığı, eğer ilişki var ise bunun gücü hakkında bilgi edinilebilir. Regresyon terimi için öz Türkçe olarak bağlanım sözcüğü kullanılması teklif edilmiş ise de Türk ekonometriciler arasında bu kullanım yaygın değildir.

<span class="mw-page-title-main">Karekök</span>

Matematikte negatif olmayan bir gerçel sayısının temel karekök bulma işlemi şeklinde gösterilir ve karesi (bir sayının kendisiyle çarpılmasının sonucu) olan negatif olmayan bir gerçek sayıyı ifade eder.

<span class="mw-page-title-main">Normal dağılım</span> sürekli olasılık dağılım ailesi

Normal dağılım, aynı zamanda Gauss dağılımı veya Gauss tipi dağılım olarak isimlendirilen, birçok alanda pratik uygulaması olan, çok önemli bir sürekli olasılık dağılım ailesidir.

<span class="mw-page-title-main">Aritmetik ortalama</span>

Aritmetik ortalama, bir sayı dizisindeki elemanların toplamının eleman sayısına bölünmesi ile elde edilir. İstatistik bilim dalında hem betimsel istatistik alanında hem de çıkarımsal istatistik alanında en çok kullanan merkezi eğilim ölçüsü' dür.

<span class="mw-page-title-main">Gama fonksiyonu</span>

Gama fonksiyonu, matematikte faktöriyel fonksiyonunun karmaşık sayılar ve tam sayı olmayan reel sayılar için genellenmesi olan bir fonksiyondur. Г simgesiyle gösterilir.

Ortalama veya merkezsel konum ölçüleri, istatistik bilim dalında ve veri analizinde kullanılan bir veri dizisinin orta konumunu, tek bir sayı ile ifade eden betimsel istatistik ölçüsüdür. Günlük hayatta ortalama dendiğinde genellikle kast edilen aritmetik ortalama olmakla beraber bu ölçünün çok belirli bazı dezavantajları söz konusudur. Bu yüzden matematik ve istatistikte, bir anakütle veya örneklem veri dizisi değerlerini temsil eden tek bir orta değer veya beklenen değer, olarak medyan (ortanca), mod (tepedeğer), geometrik ortalama, harmonik ortalama vb adlari verilen birçok değişik merkezsel konum ölçüleri geliştirilmiş ve pratikte kullanılmaktadır.

Merkezi limit teoremi büyük bir sayıda olan bağımsız ve aynı dağılım gösteren rassal değişkenlerin aritmetik ortalamasının, yaklaşık olarak normal dağılım göstereceğini ifade eden bir teoremdir. Matematiksel bir ifadeyle, bir merkezi limit teoremi olasılık kuramı içinde bulunan bir zayıf yakınsama sonucu setidir. Bunların hepsi, birçok bağımsız aynı dağılım gösteren rassal değişkenlerin herhangi bir toplam değerinin limitte belirli bir "çekim gücü gösteren dağılıma" göre dağılım gösterme eğiliminde olduğu gerçeğini önerir.

<span class="mw-page-title-main">Çarpıklık</span>

Çarpıklık olasılık kuramı ve istatistik bilim dallarında bir reel-değerli rassal değişkenin olasılık dağılımının simetrik olamayışının ölçülmesidir.

<span class="mw-page-title-main">Gamma dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında gamma dağılımı iki parametreli bir sürekli olasılık dağılımıdır. Bu parametrelerden biri ölçek parametresi θ; diğeri ise şekil parametresi k olarak anılır. Eğer k tam sayı ise, gamma dağılımı k tane üstel dağılım gösteren rassal değişkenlerin toplamını temsil eder; rassal değişkenlerin her biri nin üstel dağılımı için parametre olur.

Olasılık kuramı ve bir dereceye kadar istatistik bilim dallarında basıklık kavramı 1905da K. Pearson tarafından ilk defa açıklanmıştır. Basıklık kavramı bir reel değerli rassal değişken için olasılık dağılımının, grafik gösteriminden tanımlanarak ortaya çıkarılan bir kavram olan, sivriliği veya basıklığı özelliğinin ölçümüdür. Basıklık kavramının ayrıntıları olasılık kuramı içinde geliştirilmiştir. Betimsel istatistik için bir veri setinin basıklık karakteri pek dikkate alınmayan bir özellik olarak görülmektedir. Buna bir neden parametrik çıkarımsal istatistik alanında basıklık hakkında hemen hemen hiçbir kestirim veya sınama bulunmamasındandır ve pratik istatistik kullanımda basıklık pek önemsiz bir karakter olarak görülmektedir. Belki de basıklık ölçüsünün elle hesaplanmasının hemen hemen imkânsızlığı buna bir neden olmuştur.

İstatistik bilim dalı içinde Friedman sıralamalı iki yönlü varyans analizi sonradan çok tanınmış bir iktisatçı olan Amerikan Milton Friedman tarafından ortaya atılan bir parametrik olmayan istatistik sınamasıdır.

Pearson ki-kare testi nicel veya nitel değişkenler arasında bağımlılık olup olmadığının, örnek sonuçlarının belirli bir teorik olasılık dağılımına uygun olup olmadığının, iki veya daha fazla örneğin aynı anakütleden gelip gelmediğinin, ikiden fazla anakütle oranının birbirine eşit olup olmadığının ve çeşitli anakütle oranlarının belirli değere eşit olup olmadığının araştırılmasında kullanılır. İstatistik biliminin çıkarımsal istatistik bölümünde ele alınan iki-değişirli parametrik olmayan test analizlerinden olan ve ki-kare dağılımı'nı esas olarak kullanan ki-kare testlerinden en çok kullanılanıdır. İngiliz istatistikçi olan Karl Pearson tarafından 1900'da ortaya çıkartılmıştır.

<span class="mw-page-title-main">Theodorus sarmalı</span> Arşimet spiralinin ayrık analog versiyonu

Geometride, Theodorus Sarmalı, uç uca yerleştirilmiş dik üçgenlerden oluşan bir spiraldir. Adını, Cyreneli Theodorus'tan almıştır.

<span class="mw-page-title-main">Toplanmış alan tablosu</span>

Toplanmış alan tablosu, bir ızgaranın dikdörtgen bir alt kümesindeki değerlerin toplamını hızlı ve verimli bir şekilde oluşturmak için bir veri yapısı ve algoritmadır. Görüntü işleme alanında, bütünleşik görüntü olarak da bilinir. 1984 yılında Frank Painter tarafından mipmap'lerle kullanılmak üzere bilgisayar grafiklerine tanıtıldı. Bilgisayarla görmede Lewis tarafından popüler hale getirildi ve ardından "bütünleşik görüntü" adı verildi. 2001'de Viola-Jones nesne algılama çerçevesinde belirgin bir şekilde kullanıldı. Tarihsel olarak, bu ilke, çok boyutlu olasılık dağılım fonksiyonları çalışmasında, yani ilgili kümülatif dağılım fonksiyonlarından 2D olasılıkların hesaplanmasında çok iyi bilinmektedir.

<span class="mw-page-title-main">Görüntü eşikleme</span>

Dijital görüntü işlemede, eşikleme, görüntüleri bölümlere ayırmada kullanılan bir yöntemdir. Görüntülere gri tonlama eklendikten sonra ikili (binary) bir görüntü elde edilir. İkili görüntüler oluşturmak için eşikleme kullanılabilir.

<span class="mw-page-title-main">Otsu methodu</span>

Bilgisayarla görme ve görüntü işlemede, otomatik görüntü eşikleme yapmak için Nobuyuki Otsu tarafından oluşturulan Otsu methodu kullanılmaktadır. En basit haliyle, algoritma pikselleri ön plan ve arka plan olmak üzere iki sınıfa ayıran tek bir yoğunluk eşiği döndürmektedir. Bu eşik, sınıf içi yoğunluk varyansını en aza indirerek veya eşdeğer olarak, sınıflar arası varyansı maksimize ederek belirlenmektedir. Otsu'nun yöntemi, Fisher's Discriminant Analysis'in tek boyutlu ayrık bir analoğudur. Jenks optimizasyon yöntemiyle ilgilidir ve yoğunluk histogramında gerçekleştirilen global olarak en uygun k-ortalamalara eşdeğerdir. Çok seviyeli eşiklemenin genişletilmesi orijinal belgede açıklanmıştır ve o zamandan beri hesaplama açısından verimli uygulamalar önerilmiştir.

Matematikte Euler sayıları, Taylor serisi açılımıyla tanımlanan bir En tam sayı dizisidir..

Sayılar teorisi'nde asal omega fonksiyonları ve , doğal sayısının asal çarpanlarının sayısını hesaplamak için kullanılır. fonksiyonu doğal sayısının birbirinden farklı asal çarpanlarının sayısını hesaplarken fonksiyonu sayının toplam asal çarpan sayısını hesaplar. Yani birbirinden farklı asal sayıları için ise ve olur.

Matematik alanında, toplam veya genel toplam olarak sonuçlanan, toplananlar ya da toplamalar diye adlandırılan bir sayı dizisinin eklenme sürecine toplam/toplama denir. Sayıların yanı sıra, fonksiyonlar, vektörler, matrisler, polinomlar ve genelde "+" işareti ile tanımlanmış işleme sahip diğer tüm matematiksel nesne türleri de toplanabilir.