İçeriğe atla

Derin öğrenme

Derin öğrenme (aynı zamanda derin yapılandırılmış öğrenme, hiyerarşik öğrenme ya da derin makine öğrenmesi) bir veya daha fazla gizli katman içeren yapay sinir ağları ve benzeri makine öğrenme algoritmalarını kapsayan çalışma alanıdır.

Yani en az bir adet yapay sinir ağının (YSA) kullanıldığı ve birçok algoritma ile, bilgisayarın eldeki verilerden yeni veriler elde etmesidir.

Derin öğrenme gözetimli, yarı gözetimli veya gözetimsiz olarak gerçekleştirilebilir.[1] Derin yapay sinir ağları pekiştirmeli öğrenme yaklaşımıyla da başarılı sonuçlar vermiştir.[2] Yapay sinir ağları, biyolojik sistemlerdeki bilgi işleme ve dağıtılmış iletişim düğümlerinden esinlenilmiştir. Yapay sinir ağlarının biyolojik beyinlerden çeşitli farklılıkları vardır. Özellikle, sinir ağları statik ve sembolik olma eğilimindeyken, çoğu canlı organizmanın biyolojik beyni dinamik(plastik) ve analogtur.[3][4][5]

Tarihçe

Derin öğrenme kavramı, 1940'lardan beri geliştirilen sinir ağlarına dayanmaktadır. 1980'ler ve 1990'lar boyunca, araştırmacılar geri yayılım (backpropagation) ve destek vektör makineleri gibi daha gelişmiş tekniklerle sinir ağları üzerinde çalıştılar. 2000'lerde, büyük miktarda etiketli verinin ve daha güçlü donanımların kullanılabilir hale gelmesiyle, derin öğrenme alanında büyük ilerlemeler kaydedildi. Bu dönemde, yapay sinir ağları ve derin öğrenme, tanıma ve sınıflandırma görevlerinde insan seviyesinde performans sergilemeye başladı.[6]

Derin Öğrenme Modelleri ve Teknikleri

Derin öğrenme modelleri, farklı yapı ve işlevlere sahip çeşitli sinir ağlarından oluşur. Başlıca derin öğrenme modelleri şunlardır:[7]

  1. Yapay Sinir Ağları (ANN)
  2. Evrişimli Sinir Ağları (CNN)
  3. Tekrarlayan Sinir Ağları (RNN)
  4. Uzun Kısa Vadeli Bellek (LSTM)
  5. Generative Adversarial Networks (GAN)

Derin öğrenme algoritmaları, büyük veri kümesi üzerinde eğitilerek başarılı tahminler yapabilirler. Bu süreçte sıkça kullanılan teknikler şunlardır:

  1. Geri yayılım (Backpropagation)
  2. Aktivasyon fonksiyonları
  3. Dropout ve düzenlileştirme (Regularization)
  4. Stokastik Gradyan İnişi (SGD)
  5. Adam optimizasyonu

Uygulama Alanları

Derin öğrenme, bilgisayarlı görü ve ses tanıma, doğal dil işleme, tıbbi görüntü analizi ve oyun stratejileri gibi çeşitli alanlarda başarıyla kullanılmaktadır. Ayrıca, otomotiv, eğlence, finans ve sağlık gibi sektörlerde önemli rol oynar.[7]

Örnek kullanım alanları:[8]

  • Yüz tanıma sistemleri,
  • Ses tanıma sistemleri,
  • Araçlarda otopilot özelliği ve sürücüsüz kendi kendine giden araçlar,
  • Alarm sistemleri, (kamera kayıtlarını sürekli kontrol etmek yerine, yalnızca olağandışı hareketlerde alarm sisteminin devreye girmesi gibi teknolojiler derin öğrenme sayesinde mümkün olmaktadır.)
  • Sağlık sektöründe kanser araştırmaları, (Kanserli hücre örneklerinin tanıtıldığı derin öğrenme algoritmaları, yeni hücrelerin kanserli olup olmadığı tanısını koymakta hem daha hızlı hem de daha başarılı oluyor.)
  • Görüntü iyileştirilmeleri,
  • Tavsiye sistemleri (örneğin beğenilebilecek ürün, müzik ve film önerileri sunmada)
  • Siber tehdit analizleri

Kaynakça

  1. ^ Bengio, Yoshua; LeCun, Yann; Hinton, Geoffrey (2015). "Deep Learning". Nature. 521 (7553). ss. 436-444. Bibcode:2015Natur.521..436L. doi:10.1038/nature14539. 
  2. ^ Francois-Lavet, Vincent (2018). "An Introduction to Deep Reinforcement Learning". Foundations and Trends in Machine Learning. 11 (3–4). ss. 219-354. doi:10.1561/2200000071. 11 Temmuz 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 13 Temmuz 2019. 
  3. ^ Marblestone, Adam H.; Wayne, Greg; Kording, Konrad P. (2016). "Toward an Integration of Deep Learning and Neuroscience". Frontiers in Computational Neuroscience. 10: 94. arXiv:1606.03813. Bibcode:2016arXiv160603813M. doi:10.3389/fncom.2016.00094. PMC 5021692. PMID 27683554. S2CID 1994856.
  4. ^ Olshausen, B. A. (1996). "Emergence of simple-cell receptive field properties by learning a sparse code for natural images". Nature. 381 (6583): 607–609. Bibcode:1996Natur.381..607O. doi:10.1038/381607a0. PMID 8637596. S2CID 4358477.
  5. ^ Bengio, Yoshua; Lee, Dong-Hyun; Bornschein, Jorg; Mesnard, Thomas; Lin, Zhouhan (13 February 2015). "Towards Biologically Plausible Deep Learning". arXiv:1502.04156 [cs.LG].
  6. ^ Alom, Md Zahangir; Taha, Tarek M.; Yakopcic, Christopher; Westberg, Stefan; Sidike, Paheding; Nasrin, Mst Shamima; Van Esesn, Brian C.; Awwal, Abdul A. S.; Asari, Vijayan K. (12 Eylül 2018). "The History Began from AlexNet: A Comprehensive Survey on Deep Learning Approaches". arXiv:1803.01164 [cs]. 8 Nisan 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Nisan 2023. 
  7. ^ a b "What Is Deep Learning? | How It Works, Techniques & Applications". www.mathworks.com (İngilizce). 14 Nisan 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Nisan 2023. 
  8. ^ Beyaznet. "Derin Öğrenme (Deep Learning) Nedir?". www.beyaz.net. 28 Mayıs 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Ağustos 2023. 

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Yapay zekâ</span> insani zekaya sahip makine ve yazılım geliştiren bilgisayar bilimleri dalı

Yapay zekâ ya da kısaca YZ,, insanlar da dahil olmak üzere hayvanlar tarafından, doğal zekânın aksine makineler tarafından görüntülenen zekâ çeşididir. İlk ve ikinci kategoriler arasındaki ayrım genellikle seçilen kısaltmayla ortaya çıkar. Güçlü yapay zeka genellikle Yapay genel zekâ olarak etiketlenirken, doğal zekayı taklit etme girişimleri yapay biyolojik zekâ olarak adlandırılır. Önde gelen yapay zeka ders kitapları, alanı zeki etmenlerin çalışması olarak tanımlar: Çevresini algılayan ve hedeflerine başarıyla ulaşma şansını en üst düzeye çıkaran eylemleri gerçekleştiren herhangi bir cihaz. Halk arasında, yapay zekâ kavramı genellikle insanların insan zihni ile ilişkilendirdiği öğrenme ve problem çözme gibi bilişsel eylemleri taklit eden makineleri tanımlamak için kullanılır.

<span class="mw-page-title-main">Yapay sinir ağları</span>

Yapay sinir ağları (YSA), insan beyninin bilgi işleme tekniğinden esinlenerek geliştirilmiş bir bilgi işlem teknolojisidir. YSA ile basit biyolojik sinir sisteminin çalışma şekli taklit edilir. Yani biyolojik nöron hücrelerinin ve bu hücrelerin birbirleri ile arasında kurduğu sinaptik bağın dijital olarak modellenmesidir. Nöronlar çeşitli şekillerde birbirlerine bağlanarak ağlar oluştururlar. Bu ağlar öğrenme, hafızaya alma ve veriler arasındaki ilişkiyi ortaya çıkarma kapasitesine sahiptirler. Diğer bir ifadeyle, YSA'lar, normalde bir insanın düşünme ve gözlemlemeye yönelik doğal yeteneklerini gerektiren problemlere çözüm üretmektedir. Bir insanın, düşünme ve gözlemleme yeteneklerini gerektiren problemlere yönelik çözümler üretebilmesinin temel sebebi ise insan beyninin ve dolayısıyla insanın sahip olduğu yaşayarak veya deneyerek öğrenme yeteneğidir.

<span class="mw-page-title-main">Makine öğrenimi</span> algoritmaların ve istatistiksel modellerin kullanımıyla bilgisayarların yapacakları işleri kendileri çözebilmeleri

Makine öğrenimi (ML), veriden öğrenebilen ve görünmeyen verilere genelleştirebilen ve dolayısıyla açık talimatlar olmadan görevleri yerine getirebilen istatistiksel algoritmaların geliştirilmesi ve incelenmesiyle ilgilenen, yapay zekâda akademik bir disiplindir. Makine öğrenimi, bilgisayarların deneyimlerinden öğrenerek karmaşık görevleri otomatikleştirmeyi sağlayan bir yapay zeka alanıdır. Bu, veri analizi yaparak örüntüler tespit etme ve tahminlerde bulunma yeteneğine dayanır. Son zamanlarda yapay sinir ağları, performans açısından önceki birçok yaklaşımı geride bırakmayı başardı.

<span class="mw-page-title-main">Gözetimli öğrenme</span>

Gözetimli öğrenme ya da denetimli öğrenme, bilinen etiketler ve özellikler kullanarak bir fonksiyon öğrendiğimiz, makine öğreniminin önemli bir alt dalıdır. Bu yöntem, eğitim veri seti kullanılarak öğrenilen modelin, yeni ve bilinmeyen veri noktalarını doğru bir şekilde tahmin etmesini amaçlar.

<span class="mw-page-title-main">Google DeepMind</span>

DeepMind Technologies, Alphabet Inc.'in bir yan kuruluşu olup, 2010'da kurulmuş bir İngiliz yapay zekâ program geliştirme şirketidir. DeepMind, 2014'te Google tarafından satın alınmıştır. Şirketin merkezi Londra'dadır ve Kanada, Fransa ve Amerika Birleşik Devletleri'nde araştırma merkezleri bulunmaktadır. 2015'te, Google'ın ana şirketi olan Alphabet Inc.'in tamamına sahip olduğu bir yan kuruluş oldu.

<span class="mw-page-title-main">Öznitelik (makine öğrenmesi)</span>

Öznitelik, makine öğrenmesi ve örüntü tanıma alanlarında, gözlemlenen bir olgunun ölçülebilir bir niteliğidir. Anlaşılır, ayırt edici ve bağımsız özellikler seçmek etkili örüntü tanıma, sınıflandırma ve regresyon algoritmaları için kritik bir adımdır. Özellikler genellikle sayısaldır ancak sentaktik örüntü analizinde kelimeler ve çizgeler de kullanılır. 

<span class="mw-page-title-main">Pekiştirmeli öğrenme</span>

Pekiştirmeli öğrenme, davranışçılıktan esinlenen, öznelerin bir ortamda en yüksek ödül miktarına ulaşabilmesi için hangi eylemleri yapması gerektiğiyle ilgilenen bir makine öğrenmesi yaklaşımıdır. Bu problem, genelliğinden ötürü oyun kuramı, kontrol kuramı, yöneylem araştırması, bilgi kuramı, benzetim tabanlı eniyileme ve istatistik gibi birçok diğer dalda da çalışılmaktadır.

<span class="mw-page-title-main">Yoshua Bengio</span>

Yoshua Bengio, Kanadalı bilgisayar bilimcisi. Yapay sinir ağları ve derin öğrenme konusundaki çalışmalarıyla tanınmıştır. 2018 Turing Ödülü'nü Geoffrey Hinton ve Yann LeCun'la birlikte almaya hak kazanmıştır.

<span class="mw-page-title-main">Geoffrey Hinton</span> İngiliz-Kanadalı bilgisayar uzmanı ve psikolog

Geoffrey Everest Hinton, İngiliz-Kanadalı bilişsel ruhbilimci ve bilgisayar bilimcisi. Yapay sinir ağları konusundaki çalışmalarıyla tanınan Hinton 2013'te Google Brain projesine katılmıştır. 2018 Turing Ödülü'nü Yoshua Bengio ve Yann LeCun'la birlikte almaya hak kazanmıştır.

Evrişimsel sinir ağları, derin öğrenmenin bir alt dalıdır ve genellikle görsel bilginin analiz edilmesinde kullanılır. Yaygın kullanım alanları resim ve video tanıma, önerici sistemler resim sınıflandırma, tıbbi görüntü analizi ve doğal dil işleme olarak sıralanabilir.

<span class="mw-page-title-main">Uzun kısa süreli bellek</span>

Uzun kısa süreli bellek derin öğrenme alanında kullanılan yapay bir yinelemeli sinir ağı (RNN) mimarisidir. Standart ileri beslemeli sinir ağlarının aksine, LSTM'nin geri bildirim bağlantıları vardır. Yalnızca anlık veriyi değil, veri dizilerini de işleyebilir. Örneğin, LSTM bölümlenmemiş, bağlı el yazısı tanıma, konuşma tanıma ve ağ trafiğinde anomali veya IDS'lerde tespiti gibi görevler için geçerlidir.

Perceptron (Algılayıcı), tek katmanlı bir yapay sinir ağının temel birimidir. Eğitilebilecek tek bir yapay sinir hücresinden oluşmaktadır. Denetimli bir öğrenme algoritmasıdır. Bir perceptron giriş değerleri, ağırlıklar ve sapma, ağırlıklı toplam ve aktivasyon işlevi olmak üzere dört bölümden oluşmaktadır. Hem giriş hem de çıkış değerleri verilir ve sinir ağının öğrenmesi beklenir.

<span class="mw-page-title-main">Sağlık hizmetlerinde yapay zekâ</span>

Sağlık hizmetlerinde yapay zekâ, karmaşık tıbbî ve sağlık hizmetleri verilerinin analizinde, insan bilişini taklit etmek için makine öğrenimi algoritmalarını, yazılımlarını veya yapay zekâyı (AI) tanımlamak için kullanılan kapsamlı bir terimdir. Özellikle, AI, bilgisayar algoritmalarının sonuçları yalnızca giriş verilerine göre yaklaşık olarak tahmin etme yeteneğidir.

<span class="mw-page-title-main">Bilgisayarlı görü</span> görsellerden veri bilgisi çıkartmak

Bilgisayarlı görü, bilgisayarların dijital görüntülerden veya videolardan nasıl bir anlam kazanabileceğiyle ilgilenen disiplinler arası bilimsel bir alandır. Mühendislik yöntemleriyle, insan görsel sisteminin yapabileceği görevleri anlamaya ve otomatikleştirmeye çalışmaktadır.

Çekişmeli üretici ağ, Ian Goodfellow ve meslektaşları tarafından 2014 yılında tasarlanan bir makine öğrenimi framework sınıfıdır. Bir oyunda iki sinir ağı birbiriyle yarışmaktadır.

<span class="mw-page-title-main">Ian Goodfellow</span>

Ian J. Goodfellow makine öğrenimi alanında çalışan bir araştırmacıdır ve şu anda Apple Inc.'de Özel Projeler Grubunda makine öğrenimi yöneticisi olarak çalışmaktadır. Daha önce Google Brain'de araştırma bilimcisi olarak çalışmıştır ve derin öğrenme alanına çeşitli katkılarda bulunmuştur.

<span class="mw-page-title-main">Yinelemeli sinir ağı</span> bölümler arasındaki bağlantıların yönlendirilmiş bir döngü oluşturduğu yapay sinir ağı türü

Yinelemeli sinir ağı, düğümler arası bağların zamansal bir dizi doğrultusunda yönlü çizge oluşturduğu bir yapay sinir ağı çeşididir. Yaygın olarak İngilizce kısaltması olan RNN olarak anılır. İleri beslemeli sinir ağından türetilen RNN yöntemi, bir iç durum belleği kullanarak değişik uzunluktaki dizileri işleyebilir. Bu sayede yazı tanıma ve konuşma tanıma gibi problemlere uygulanabilir. Teorik olarak Turing makinesine denk (Turing-complete) olan yinelemeli sinir ağları, herhangi uzunluktaki bir girdiyi işleyebilen herhangi bir programı çalıştırabilir.

Nöral makine çevirisi (NMT), bir sözcük dizilim olasılığını tahmin etmek için yapay bir sinir ağı kullanan ve genellikle cümlenin tümünü tek bir entegre modelde modelleyen bir makine çevirisi yaklaşımıdır.

<span class="mw-page-title-main">Otomatik makine öğrenimi</span>

Otomatik makine öğrenimi (AutoML), makine öğrenimini gerçek dünya sorunlarına uygulanmasını otomatikleştirme sürecidir.

Yapay sinir ağındaki bir nöronun aktivasyon fonksiyonu, nöronun girdilerinden gelen değerlerin toplamını kullanarak nöronun çıktısını hesaplamaya yardımcı olan matematiksel fonksiyondur. Aktivasyon fonksiyonu doğrusal olmadığı sürece, sadece birkaç nöron kullanılarak bile karmaşık problemler çözülebilir.