İçeriğe atla

Gözetimli öğrenme

Gözetimli öğrenme ya da denetimli öğrenme (İngilizce: supervised learning), bilinen etiketler ve özellikler kullanarak bir fonksiyon öğrendiğimiz, makine öğreniminin önemli bir alt dalıdır. Bu yöntem, eğitim veri seti kullanılarak öğrenilen modelin, yeni ve bilinmeyen veri noktalarını doğru bir şekilde tahmin etmesini amaçlar.[1][2]

Bilgisayar mühendisliğinin, makine öğrenmesi alanının bir konusu olan gözetimli öğrenme, verilen girdi kümesinden istenen çıktı kümesinin elde edilmesi için bir fonksiyon öğrenilmesidir.[3]

Gözetimli öğrenmede, öğrenilmek istenen kavram ile ilgili toplanan gözlemler bir eğitim kümesi olarak öğreniciye verilir. Eğitim kümesinde her örnek için istenen çıktı değerleri de verilir. Bu bilgiler kullanılarak giriş ve çıkış arasında bir ilişki oluşturulur. Oluşturulan ilişki kullanılarak gelecekte karşılaşılacak gözlemlerinin karşılık geldiği çıktıları tahmin edilebilir.

Tarihçe ve Gelişim

Gözetimli öğrenme, 1950'lerde istatistiksel sınıflandırma ve regresyon analizinin gelişimi ile ortaya çıkmıştır. Alan, yapay sinir ağlarının ve destek vektör makinelerinin geliştirilmesi ile önemli ilerlemeler kaydetmiştir. 1990'larda büyük veri kümelerinin ve hesaplama gücünün artmasıyla, gözetimli öğrenme algoritmaları daha sofistike hale gelmiştir.[4][5]

Uygulama Alanları

Gözetimli öğrenme, çeşitli alanlarda başarılı bir şekilde uygulanmaktadır:

Tıp: Hastalık teşhisi ve tedavi önerileri.

Finans: Kredi risk analizi ve piyasa tahminleri.

Pazarlama: Müşteri segmentasyonu ve hedefli pazarlama.

Görüntü İşleme: Nesne tanıma ve yüz tanıma.[6][7][8]

Avantaj ve Dezavantajlar

Gözetimli öğrenme yöntemlerinin avantajları ve dezavantajları şunlardır:

Avantajlar:

Yüksek doğruluk: Etiketlenmiş veri setleri kullanarak yüksek doğrulukta modeller oluşturabilir.

Uygulama çeşitliliği: Birçok farklı problem türünde uygulanabilir.

Dezavantajlar:

Veri bağımlılığı: Etiketlenmiş veri gereksinimi yüksek ve maliyetlidir.

Aşırı öğrenme riski: Model, eğitim verisine aşırı uyum sağlayarak genelleme yeteneğini kaybedebilir.[9][10]

Kaynakça

  1. ^ Mitchell, T. (1997). Machine Learning. McGraw Hill. ISBN 0-07-042807-7.
  2. ^ Russell, S., & Norvig, P. (2010). Artificial Intelligence: A Modern Approach. Prentice Hall. ISBN 0-13-604259-7.
  3. ^ Bkz. Alpaydın, Ethem (2010). Introduction to Machine Learning. Londra: The MIT Press. s. 8. ISBN 978-0-262-01243-0. 2 Mart 2017 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Temmuz 2016. 
  4. ^ McCarthy, J., Minsky, M. L., Rochester, N., & Shannon, C. E. (1955). A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence. August 31, 1955.
  5. ^ Vapnik, V. (1995). The Nature of Statistical Learning Theory. Springer.
  6. ^ Esteva, A., Kuprel, B., Novoa, R. A., Ko, J., Swetter, S. M., Blau, H. M., & Thrun, S. (2017). Dermatologist-level classification of skin cancer with deep neural networks. Nature, 542(7639), 115-118.
  7. ^ Ng, A. Y., & Jordan, M. I. (2002). On Discriminative vs. Generative Classifiers: A comparison of logistic regression and naive Bayes. Advances in Neural Information Processing Systems, 14, 841-848.
  8. ^ Viola, P., & Jones, M. (2001). Rapid object detection using a boosted cascade of simple features. Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 1, 511-518.
  9. ^ Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer.
  10. ^ Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.

İlgili Araştırma Makaleleri

Regresyon analizi, iki ya da daha çok nicel değişken arasındaki ilişkiyi ölçmek için kullanılan analiz metodudur. Eğer tek bir değişken kullanılarak analiz yapılıyorsa buna tek değişkenli regresyon, birden çok değişken kullanılıyorsa çok değişkenli regresyon analizi olarak isimlendirilir. Regresyon analizi ile değişkenler arasındaki ilişkinin varlığı, eğer ilişki var ise bunun gücü hakkında bilgi edinilebilir. Regresyon terimi için öz Türkçe olarak bağlanım sözcüğü kullanılması teklif edilmiş ise de Türk ekonometriciler arasında bu kullanım yaygın değildir.

<span class="mw-page-title-main">Küme</span> matematiksel anlamda tanımsız bir kavramdır. Bu kavram "nesneler topluluğu veya yığını" olarak yorumlanabilir.

Küme, matematikte farklı nesnelerin topluluğu veya yığını olarak tanımlanmaktadır. Bu tanımdaki "nesne" soyut ya da somut bir şeydir. Fakat her ne olursa olsun iyi tanımlanmış olan bir şeyi, bir eşyayı ifade etmektedir. Örneğin, "Tüm canlılar topluluğu", "Dilimiz alfabesindeki harflerin topluluğu", "Masamın üzerindeki tüm kâğıtlar" tümcelerindeki nesnelerin anlaşılabilir, belirgin oldukları, kısaca iyi tanımlı oldukları açıkça ifade edilmektedir. Dolayısıyla bu tümcelerin her biri bir kümeyi tarif etmektedir. O halde, matematikte "İyi tanımlı nesnelerin topluluğuna küme denir." biçiminde bir tanımlama yapılmaktadır.

<span class="mw-page-title-main">Makine öğrenimi</span> algoritmaların ve istatistiksel modellerin kullanımıyla bilgisayarların yapacakları işleri kendileri çözebilmeleri

Makine öğrenimi (ML), veriden öğrenebilen ve görünmeyen verilere genelleştirebilen ve dolayısıyla açık talimatlar olmadan görevleri yerine getirebilen istatistiksel algoritmaların geliştirilmesi ve incelenmesiyle ilgilenen, yapay zekâda akademik bir disiplindir. Makine öğrenimi, bilgisayarların deneyimlerinden öğrenerek karmaşık görevleri otomatikleştirmeyi sağlayan bir yapay zeka alanıdır. Bu, veri analizi yaparak örüntüler tespit etme ve tahminlerde bulunma yeteneğine dayanır. Son zamanlarda yapay sinir ağları, performans açısından önceki birçok yaklaşımı geride bırakmayı başardı.

<span class="mw-page-title-main">Naive Bayes sınıflandırıcısı</span>

Naïve Bayes sınıflandırıcı, örüntü tanıma problemine ilk bakışta oldukça kısıtlayıcı görülen bir önerme ile kullanılabilen olasılıksal bir yaklaşımdır. Bu önerme, örüntü tanımada kullanılacak her bir tanımlayıcı öznitelik ya da parametrenin istatistik açıdan bağımsız olması gerekliliğidir. Her ne kadar bu önerme Naive Bayes sınıflandırıcının kullanım alanını kısıtlasa da istatistik bağımsızlık koşulu esnetilerek kullanıldığında da daha karmaşık yapay sinir ağları gibi metotlarla karşılaştırabilir sonuçlar vermektedir. Bir Naive Bayes sınıflandırıcı, her özniteliğin birbirinden koşulsal bağımsız olduğu ve öğrenilmek istenen kavramın tüm bu özniteliklere koşulsal bağlı olduğu bir Bayes ağı olarak da düşünülebilir.

Granger nedensellik sınaması, bir zaman serisinin başka bir zaman serisini tahmininde kullanışlı olup olmadığının bir istatistiksel hipotez sınamasıdır. Normalde, bağlanımlar, "sadece" ilintileri yansıtırlar, ancak Ekonomi Nobel Ödülünü kazanan Clive Granger, belli bir sınamalar kümesinin nedensellikle ilgili bir şeyler ortaya çıkardığını savunmuştur.

Uyarlamalı ağ tabanlı bulanık çıkarım sistemi, Takagi-Sugeno bulanık çıkarım sistemine dayalı bir tür yapay sinir ağı yöntemi. Jang tarafından 1990’ların başlarında geliştirilmiş olup doğrusal olmayan fonksiyonların modellenmesinde ve kaotik zaman serilerinin tahmininde kullanılmıştır.

<span class="mw-page-title-main">Öznitelik (makine öğrenmesi)</span>

Öznitelik, makine öğrenmesi ve örüntü tanıma alanlarında, gözlemlenen bir olgunun ölçülebilir bir niteliğidir. Anlaşılır, ayırt edici ve bağımsız özellikler seçmek etkili örüntü tanıma, sınıflandırma ve regresyon algoritmaları için kritik bir adımdır. Özellikler genellikle sayısaldır ancak sentaktik örüntü analizinde kelimeler ve çizgeler de kullanılır. 

<span class="mw-page-title-main">Tümevarımlı mantık programlama</span>

Tümevarımlı mantık programlama (TMP) bilginin mantık programlama ile ifade edildiği bir makine öğrenmesi yöntemidir. Mantıksal olgulardan oluşan artalan bilgisi ve gözlemler kümesini içeren bir veritabanı verildiğinde, ILP sistemi tüm olumlu gözlemleri gerektiren ve olumsuz gözlemlerin hiçbirini gerektirmeyen bir hipotez üretir.

<span class="mw-page-title-main">Bayes ağı</span>

Bir Bayes ağı, Bayes modeli ya da olasılıksal yönlü dönüşsüz çizge modeli bir olasılıksal çizge modelidir ve birbirleriyle koşulsal bağımlılıklara sahip bir rassal değişkenler kümesini yönlü dönüşsüz çizge(YDÇ) şeklinde ifade eder. Bayes ağları; gündelik hayatta meydana gelen bir olayı anlatmak ve o olayın gerçekleşmesine sebebiyet verebileceği bilinen birkaç olası nedenden herhangi birinin katkıda bulunan faktör olma olasılığını tahmin etmek için kullanılan ideal bir modelleme türüdür. Örneğin, bir Bayes ağı kullanılarak hastalıklar ve semptomları arasındaki olasılıksal koşul ilişkileri modellenebilir. Bu model kullanılarak, bir kişide görülen semptomlar verildiğinde bu kişinin bazı hastalıklara sahip olma olasılıkları hesaplanabilir. Buna benzer olarak neden-sonuç ilişkisi olan birçok olayın olasılığı bu modelleme ile görselleştirilebilir.

<span class="mw-page-title-main">Pekiştirmeli öğrenme</span>

Pekiştirmeli öğrenme, davranışçılıktan esinlenen, öznelerin bir ortamda en yüksek ödül miktarına ulaşabilmesi için hangi eylemleri yapması gerektiğiyle ilgilenen bir makine öğrenmesi yaklaşımıdır. Bu problem, genelliğinden ötürü oyun kuramı, kontrol kuramı, yöneylem araştırması, bilgi kuramı, benzetim tabanlı eniyileme ve istatistik gibi birçok diğer dalda da çalışılmaktadır.

<span class="mw-page-title-main">Destek vektör makinesi</span>

Destek vektör makinesi, eğitim verilerindeki herhangi bir noktadan en uzak olan iki sınıf arasında bir karar sınırı bulan vektör uzayı tabanlı makine öğrenme yöntemi olarak tanımlanabilir.

<span class="mw-page-title-main">Çapraz doğrulama (istatistik)</span> çapraz

Çarpraz doğrulama, yapılan bir istatistiksel analizin bağımsız bir veri setinde nasıl bir sonuç elde edeceğini sınayan bir model doğrulama tekniğidir. Başlıca kullanım alanı bir öngörü sisteminin pratikte hangi doğrulukla çalışacağını kestirmektir. Bir öngörü probleminde, model genellikle bir "bilinen veri" kümesiyle eğitilir ve bir "bilinmeyen veri" kümesiyle sınanır. Bu sınamanın amacı, eğitilen modelin yeni verilere genelleşme kabiliyetini ölçmek ve aşırı uyma ya da seçim yanlılığı problemlerini tespit etmektir.

Perceptron (Algılayıcı), tek katmanlı bir yapay sinir ağının temel birimidir. Eğitilebilecek tek bir yapay sinir hücresinden oluşmaktadır. Denetimli bir öğrenme algoritmasıdır. Bir perceptron giriş değerleri, ağırlıklar ve sapma, ağırlıklı toplam ve aktivasyon işlevi olmak üzere dört bölümden oluşmaktadır. Hem giriş hem de çıkış değerleri verilir ve sinir ağının öğrenmesi beklenir.

<span class="mw-page-title-main">Çoklu örnekle öğrenme</span>

Makine öğreniminde, çoklu örnek öğrenme (ÇÖÖ) bir tür denetimli öğrenmedir. Öğrenci, bireysel olarak etiketlenmiş bir dizi örnek almak yerine, her biri birçok örnek içeren bir dizi etiketli paket alır.

Yapay zeka araştırmalarında sorunların, mantığın ve araştırmanın ileri düzey "sembolik" temsillerine dayanan tüm yöntemlerin toplanması için kullanılan terimdir. Sembolik YZ, 1950'lerin ortalarından 1980'lerin sonuna kadar YZ araştırmalarının baskın paradigmasıydı. 23 Mayıs 2021 tarihinde Wayback Machine sitesinde arşivlendi. 23 Mayıs 2021 tarihinde Wayback Machine sitesinde arşivlendi.

Çekişmeli üretici ağ, Ian Goodfellow ve meslektaşları tarafından 2014 yılında tasarlanan bir makine öğrenimi framework sınıfıdır. Bir oyunda iki sinir ağı birbiriyle yarışmaktadır.

Veri analizinde, anomali tespiti, verilerin çoğunluğundan önemli ölçüde farklılaşarak şüphe uyandıran nadir öğelerin, olayların veya gözlemlerin tanımlanmasıdır. Tipik olarak anormal öğeler, banka dolandırıcılığı, yapısal bir kusur, tıbbi sorunlar veya bir metindeki hatalar gibi bir tür soruna dönüşecektir. Anormallikler ayrıca aykırı değerler, yenilikler, gürültü, sapmalar ve istisnalar olarak da adlandırılmaktadır.

<span class="mw-page-title-main">Yinelemeli sinir ağı</span> bölümler arasındaki bağlantıların yönlendirilmiş bir döngü oluşturduğu yapay sinir ağı türü

Yinelemeli sinir ağı, düğümler arası bağların zamansal bir dizi doğrultusunda yönlü çizge oluşturduğu bir yapay sinir ağı çeşididir. Yaygın olarak İngilizce kısaltması olan RNN olarak anılır. İleri beslemeli sinir ağından türetilen RNN yöntemi, bir iç durum belleği kullanarak değişik uzunluktaki dizileri işleyebilir. Bu sayede yazı tanıma ve konuşma tanıma gibi problemlere uygulanabilir. Teorik olarak Turing makinesine denk (Turing-complete) olan yinelemeli sinir ağları, herhangi uzunluktaki bir girdiyi işleyebilen herhangi bir programı çalıştırabilir.

<span class="mw-page-title-main">Otomatik makine öğrenimi</span>

Otomatik makine öğrenimi (AutoML), makine öğrenimini gerçek dünya sorunlarına uygulanmasını otomatikleştirme sürecidir.

Yapay sinir ağındaki bir nöronun aktivasyon fonksiyonu, nöronun girdilerinden gelen değerlerin toplamını kullanarak nöronun çıktısını hesaplamaya yardımcı olan matematiksel fonksiyondur. Aktivasyon fonksiyonu doğrusal olmadığı sürece, sadece birkaç nöron kullanılarak bile karmaşık problemler çözülebilir.