İçeriğe atla

Adaptif rezonans teorisi

Adaptif rezonans teorisi (ART), Stephen Grossberg ve Gail Carpenter tarafından beynin bilgiyi nasıl işlediğini anlamak üzere geliştirilen bir teoridir. Denetimli ve denetimsiz öğrenme yöntemlerini kullanan ve örüntü tanıma ve tahmin gibi sorunları ele alan bir dizi sinir ağı modelini açıklamaktadır.

ART modelinin arkasındaki birincil sezgi, nesne tanımlama ve tanımanın genellikle "yukarıdan aşağıya" gözlemci beklentilerinin "aşağıdan yukarıya" duyusal bilgilerle etkileşiminin bir sonucu olarak ortaya çıkmasıdır. Model, 'yukarıdan aşağıya' beklentilerin, daha sonra duyular tarafından algılanan bir nesnenin gerçek özellikleri ile karşılaştırılan bir bellek şablonu veya prototipi şeklini aldığını varsayar. Bu karşılaştırma, kategori aidiyetinin bir ölçüsüne yol açar. Duyum ve beklenti arasındaki bu fark, 'uyanıklık parametresi' adı verilen belirli bir eşiği aşmadığı sürece, algılanan nesne beklenen sınıfın bir üyesi olarak kabul edilecektir. Böylece sistem, 'esneklik/kararlılık' sorununa, yani artan öğrenme olarak da adlandırılan mevcut bilgiyi bozmadan yeni bilgi edinme sorununa bir çözüm sunar.

Öğrenme modeli

Basit ART iskeleti
Basit ART iskeleti

Temel ART sistemi, denetimsiz bir öğrenme modelidir. Tipik olarak bir karşılaştırma alanı ve nöronlardan oluşan bir tanıma alanı, bir uyanıklık parametresi (tanıma eşiği) ve bir sıfırlama modülünden oluşur.

  • Karşılaştırma alanı bir girdi vektörü (tek boyutlu bir değerler dizisi) alır ve onu tanıma alanındaki en iyi eşleşmesine aktarır.
    • En iyi eşleşmesi, ağırlıkları (ağırlık vektörü) girdi vektörüyle en yakından eşleşen tek nörondur.
  • Her bir tanıma alanı nöronu, diğer tanıma alanı nöronlarının her birine negatif bir sinyal (bu nöronun giriş vektörüne eşleşme kalitesiyle orantılı olarak) verir ve böylece çıkışlarını engeller.
    • Bu şekilde tanıma alanı yanal inhibisyon sergiler ve içindeki her nöronun girdi vektörlerinin sınıflandırıldığı bir kategoriyi temsil etmesine izin verir.
  • Giriş vektörü sınıflandırıldıktan sonra, sıfırlama modülü, tanıma eşleşmesinin gücünü uyanıklık parametresiyle karşılaştırır.
    • Dikkat parametresinin üstesinden gelinirse (yani giriş vektörü önceki giriş vektörlerinde görülen normal aralık içindeyse), eğitim başlar:
      • Kazanan tanıma nöronunun ağırlıkları, giriş vektörünün özelliklerine göre ayarlanır.
    • Aksi takdirde, eşleşme seviyesi uyanıklık parametresinin altındaysa (yani giriş vektörünün eşleşmesi, o nöron için normal beklenen aralığın dışındaysa), kazanan tanıma nöronu engellenir ve bir arama prosedürü gerçekleştirilir.
      • Bu arama prosedüründe, bir tanıma eşleşmesi tarafından uyanıklık parametresinin üstesinden gelinene kadar, tanıma nöronları sıfırlama işlevi tarafından birer birer devre dışı bırakılır.
        • Özellikle, arama prosedürünün her döngüsünde en aktif tanıma nöronu seçilir ve aktivasyonu uyanıklık parametresinin altındaysa kapatılır (böylece geri kalan tanıma nöronlarını inhibisyonundan serbest bıraktığına dikkat edin).
    • Hiçbir taahhütlü tanıma nöronunun eşleşmesi ihtiyat parametresinin üstesinden gelmezse, taahhüt edilmemiş bir nöron taahhüt edilir ve ağırlıkları giriş vektörünü eşleştirmeye göre ayarlanır.
  • Uyanıklık parametresinin sistem üzerinde önemli bir etkisi vardır: daha yüksek teyakkuz oldukça ayrıntılı anılar (birçok, ince taneli kategoriler) üretirken, daha düşük teyakkuz daha genel anılar (daha az, daha genel kategoriler) ile sonuçlanır.

Eğitim

ART tabanlı sinir ağlarını eğitmenin iki temel yöntemi vardır: yavaş ve hızlı. Yavaş öğrenme yönteminde, tanıma nöronunun ağırlıklarının giriş vektörüne yönelik eğitim derecesi, diferansiyel denklemlerle sürekli değerlere hesaplanır ve bu nedenle giriş vektörünün sunulma süresinin uzunluğuna bağlıdır. Hızlı öğrenme ile yapılacak ağırlık ayarlamalarının derecesini hesaplamak için cebirsel denklemler kullanılır ve ikili değerler kullanılır. Hızlı öğrenme çeşitli görevler için etkili ve verimli olsa da, yavaş öğrenme yöntemi biyolojik olarak daha makuldür ve sürekli zamanlı ağlarla kullanılabilir (yani girdi vektörü sürekli olarak değişebilir).

Türler

ARTMAP'e genel bakış
ARTMAP'e genel bakış

ART 1,[1] yalnızca ikili girişleri kabul eden ART ağlarının en basit çeşididir. ART 2,[2] sürekli girişleri desteklemek için ağ yeteneklerini genişletir. ART 2-A, büyük ölçüde hızlandırılmış çalışma süresine sahip modern bir ART-2 formudur ve nitel sonuçların tam ART-2 uygulamasından yalnızca nadiren daha düşük olur. ART 3,[3] sistemin denklemlerine simüle edilmiş sodyum ve kalsiyum iyonu konsantrasyonlarını dahil ederek sinaptik aktivitenin ilkel nörotransmitter düzenlemesini simüle ederek ART-2'yi temel alır, bu da uyumsuzluk sıfırlamalarını tetikleyen kategorileri kısmen engellemenin fizyolojik olarak daha gerçekçi bir yolunu sağlar.

Öngörülü ART olarak da bilinen ARTMAP,[4] hafifçe değiştirilmiş iki ART-1 veya ART-2 birimini, birinci birimin giriş verilerini aldığı denetimli bir öğrenme yapısında birleştirir. İkinci ünite, doğru çıktı verilerini alır, ardından doğru sınıflandırmayı yapmak için birinci ünitedeki uyanıklık parametresinin mümkün olan minimum ayarını yapmak için kullanılır.

Bulanık ART,[5] bulanık mantığı ART'nin örüntü tanımasına uygular, böylece genelleştirilebilirliği artırır. Bulanık ART'nin isteğe bağlı (ve çok kullanışlı) bir özelliği, özelliklerin yokluğunu örüntü sınıflandırmalarına dahil etmenin bir yolu olan tamamlayıcı kodlamadır; Bu, verimsiz ve gereksiz kategori çoğalmasını önlemeye yönelik uzun bir yol kat eder. Uygulanan benzerlik ölçüleri L1 normuna dayanmaktadır. Bulanık ART'ın gürültüye karşı çok hassas olduğu bilinmektedir.

Bulanık ARTMAP,[6] yalnızca bulanık ART birimleri kullanan ARTMAP'tir ve bu da etkinlikte karşılık gelen bir artış sağlar.

Basitleştirilmiş Bulanık ARTMAP (SFAM),[7] sınıflandırma görevlerine adanmış bulanık ARTMAP'ın oldukça basitleştirilmiş bir varyantını oluşturur.

Gauss ART[8] ve Gauss ARTMAP,[8] Gauss aktivasyon fonksiyonlarını ve olasılık teorisine dayalı hesaplamaları kullanır. Bu nedenle Gauss karışım modelleriyle bazı benzerlikleri vardır. Bulanık ART ve bulanık ARTMAP ile karşılaştırıldığında, gürültüye karşı daha az duyarlıdırlar. Ancak öğrenilen temsillerin kararlılığı azalır ve bu da açık uçlu öğrenme görevlerinde kategori çoğalmasına yol açabilir.

Fusion ART ve ilgili ağlar[9] ART ve ARTMAP'i birden çok model kanalına genişletir. Birkaç öğrenme paradigmasını desteklerler.

TopoART,[10] bulanık ART'yi büyüyen sinir gazı gibi topoloji öğrenme ağlarıyla birleştirir. Ayrıca, bir gürültü azaltma mekanizması ekler. TopoART'ı daha ileri öğrenme paradigmalarına genişleten birkaç türetilmiş sinir ağı vardır.

Hypersphere ART[11] ve Hypersphere ARTMAP[12] sırasıyla bulanık ART ve bulanık ARTMAP ile yakından ilişkilidir. Ancak farklı türde bir kategori gösterimi (yani hiper küreler) kullandıkları için girdilerinin [0, 1] aralığına normalleştirilmesini gerektirmezler. L2 normuna dayalı benzerlik ölçüleri uygularlar.

LAPART[13] Yanal Olarak Hazırlanmış Uyarlamalı Rezonans Teorisi (LAPART) sinir ağları, öğrenilmiş ilişkilere dayalı tahminler yapmak için bir mekanizma oluşturmak için iki bulanık ART algoritmasını birleştirir. İki bulanık ART'nin birleştirilmesi, sistemin net bir çözüme doğru hızla yakınsamasını sağlayan benzersiz bir kararlılığa sahiptir. Ek olarak, bulanık ARTMAP'e benzer şekilde mantıksal çıkarım ve denetimli öğrenme gerçekleştirebilir.

Eleştiri

Bulanık ART ve ART 1 sonuçlarının (yani öğrenilen kategoriler) kritik olarak eğitim verilerinin işlenme sırasına bağlı olduğu not edilmiştir. Etki, daha yavaş bir öğrenme hızı kullanılarak bir dereceye kadar azaltılabilir, ancak girdi veri setinin boyutundan bağımsız olarak mevcuttur. Dolayısıyla bulanık ART ve ART 1 tahminleri, istatistiksel tutarlılık özelliğine sahip değildir.[14] Bu sorun, her iki ağda da kararlı öğrenmeyi sağlayan ilgili mekanizmaların bir yan etkisi olarak düşünülebilir.

Kategorileri kümelere özetleyen TopoART ve Hypersphere TopoART gibi daha gelişmiş ART ağları, kümelerin şekilleri ilişkili kategorilerin oluşturulma sırasına bağlı olmadığından bu sorunu çözebilir. (bakınız, şekil 3(g, h) ve şekil 4,[12])

Kaynakça

  1. ^ "Dış bağlantı" (PDF). 19 Mayıs 2006 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 27 Haziran 2021. 
  2. ^ "ART 2: Self-organization of stable category recognition codes for analog input patterns" (PDF). 4 Eylül 2006 tarihinde kaynağından (PDF) arşivlendi. 
  3. ^ "Dış bağlantı". 7 Mayıs 2004 tarihinde kaynağından arşivlendi. 
  4. ^ "ARTMAP: Supervised real-time learning and classification of nonstationary data by a self-organizing neural network" (PDF). 30 Mayıs 2005 tarihinde kaynağından (PDF) arşivlendi. 
  5. ^ "Fuzzy ART: Fast stable learning and categorization of analog patterns by an adaptive resonance system" (PDF). 30 Mart 2004 tarihinde kaynağından (PDF) arşivlendi. 
  6. ^ "Fuzzy ARTMAP: A neural network architecture for incremental supervised learning of analog multidimensional maps" (PDF). 30 Mayıs 2005 tarihinde kaynağından (PDF) arşivlendi. 
  7. ^ Mohammad-Taghi Vakil-Baghmisheh and Nikola Pavešić. (2003) A Fast Simplified Fuzzy ARTMAP Network, Neural Processing Letters, 17(3):273–316
  8. ^ a b "Gaussian ARTMAP: A Neural Network for Fast Incremental Learning of Noisy Multidimensional Maps" (PDF). 
  9. ^ "Fusion ARTMAP: an adaptive fuzzy network for multi-channel classification" (PDF). 28 Ekim 2020 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 27 Haziran 2021. 
  10. ^ "TopoART: A Topology Learning Hierarchical ART Network". 26 Ekim 2016 tarihinde kaynağından arşivlendi. 
  11. ^ "Hypersphere ART and ARTMAP for Unsupervised and Supervised Incremental Learning" (PDF). 1 Ağustos 2010 tarihinde kaynağından (PDF) arşivlendi. 
  12. ^ a b "Incremental On-line Clustering with a Topology-Learning Hierarchical ART Neural Network Using Hyperspherical Categories" (PDF). In: Poster and Industry Proceedings of the Industrial Conference on Data Mining (ICDM), 22–34. 16 Kasım 2019 tarihinde kaynağından (PDF) arşivlendi. 
  13. ^ "Lapart-python documentation". 23 Ekim 2017 tarihinde kaynağından arşivlendi. 
  14. ^ "Why Statisticians Should Not FART". 25 Ocak 2004 tarihinde kaynağından arşivlendi. 

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Yapay zekâ</span> insani zekaya sahip makine ve yazılım geliştiren bilgisayar bilimleri dalı

Yapay zekâ ya da kısaca YZ,, insanlar da dahil olmak üzere hayvanlar tarafından, doğal zekânın aksine makineler tarafından görüntülenen zekâ çeşididir. İlk ve ikinci kategoriler arasındaki ayrım genellikle seçilen kısaltmayla ortaya çıkar. Güçlü yapay zeka genellikle Yapay genel zekâ olarak etiketlenirken, doğal zekayı taklit etme girişimleri yapay biyolojik zekâ olarak adlandırılır. Önde gelen yapay zeka ders kitapları, alanı zeki etmenlerin çalışması olarak tanımlar: Çevresini algılayan ve hedeflerine başarıyla ulaşma şansını en üst düzeye çıkaran eylemleri gerçekleştiren herhangi bir cihaz. Halk arasında, yapay zekâ kavramı genellikle insanların insan zihni ile ilişkilendirdiği öğrenme ve problem çözme gibi bilişsel eylemleri taklit eden makineleri tanımlamak için kullanılır.

<span class="mw-page-title-main">Yapay sinir ağları</span>

Yapay sinir ağları (YSA), insan beyninin bilgi işleme tekniğinden esinlenerek geliştirilmiş bir bilgi işlem teknolojisidir. YSA ile basit biyolojik sinir sisteminin çalışma şekli taklit edilir. Yani biyolojik nöron hücrelerinin ve bu hücrelerin birbirleri ile arasında kurduğu sinaptik bağın dijital olarak modellenmesidir. Nöronlar çeşitli şekillerde birbirlerine bağlanarak ağlar oluştururlar. Bu ağlar öğrenme, hafızaya alma ve veriler arasındaki ilişkiyi ortaya çıkarma kapasitesine sahiptirler. Diğer bir ifadeyle, YSA'lar, normalde bir insanın düşünme ve gözlemlemeye yönelik doğal yeteneklerini gerektiren problemlere çözüm üretmektedir. Bir insanın, düşünme ve gözlemleme yeteneklerini gerektiren problemlere yönelik çözümler üretebilmesinin temel sebebi ise insan beyninin ve dolayısıyla insanın sahip olduğu yaşayarak veya deneyerek öğrenme yeteneğidir.

<span class="mw-page-title-main">İnsan beyni</span> insan sinir sisteminin ana organı

İnsan beyni, insan sinir sisteminin merkezi organıdır ve omurilikle birlikte merkezi sinir sistemini oluşturur.

<span class="mw-page-title-main">Nörobilim</span> sinir sistemini inceleyen bilim dalı

Nörobilim, sinir sistemini inceleyen disiplinlerarası bir bilim dalıdır. Nöronların ve nöral devrelerin temel özelliklerini anlamayı hedefleyen bu bilim dalı, bu amaçla fizyoloji, anatomi, moleküler biyoloji, gelişim biyolojisi, sitoloji, matematiksel modelleme ve psikolojiyi birleştirir. Öğrenme, bellek, davranış, algı ve bilincin biyolojik temelinin anlaşılması Eric Kandel tarafından biyolojik bilimlerin "nihai zorluğu" olarak tanımlanmıştır.

<span class="mw-page-title-main">Makine öğrenimi</span> algoritmaların ve istatistiksel modellerin kullanımıyla bilgisayarların yapacakları işleri kendileri çözebilmeleri

Makine öğrenimi (ML), veriden öğrenebilen ve görünmeyen verilere genelleştirebilen ve dolayısıyla açık talimatlar olmadan görevleri yerine getirebilen istatistiksel algoritmaların geliştirilmesi ve incelenmesiyle ilgilenen, yapay zekâda akademik bir disiplindir. Makine öğrenimi, bilgisayarların deneyimlerinden öğrenerek karmaşık görevleri otomatikleştirmeyi sağlayan bir yapay zeka alanıdır. Bu, veri analizi yaparak örüntüler tespit etme ve tahminlerde bulunma yeteneğine dayanır. Son zamanlarda yapay sinir ağları, performans açısından önceki birçok yaklaşımı geride bırakmayı başardı.

<span class="mw-page-title-main">Gözetimli öğrenme</span>

Gözetimli öğrenme ya da denetimli öğrenme, bilinen etiketler ve özellikler kullanarak bir fonksiyon öğrendiğimiz, makine öğreniminin önemli bir alt dalıdır. Bu yöntem, eğitim veri seti kullanılarak öğrenilen modelin, yeni ve bilinmeyen veri noktalarını doğru bir şekilde tahmin etmesini amaçlar.

Uyarlamalı ağ tabanlı bulanık çıkarım sistemi, Takagi-Sugeno bulanık çıkarım sistemine dayalı bir tür yapay sinir ağı yöntemi. Jang tarafından 1990’ların başlarında geliştirilmiş olup doğrusal olmayan fonksiyonların modellenmesinde ve kaotik zaman serilerinin tahmininde kullanılmıştır.

<span class="mw-page-title-main">Google DeepMind</span>

DeepMind Technologies, Alphabet Inc.'in bir yan kuruluşu olup, 2010'da kurulmuş bir İngiliz yapay zekâ program geliştirme şirketidir. DeepMind, 2014'te Google tarafından satın alınmıştır. Şirketin merkezi Londra'dadır ve Kanada, Fransa ve Amerika Birleşik Devletleri'nde araştırma merkezleri bulunmaktadır. 2015'te, Google'ın ana şirketi olan Alphabet Inc.'in tamamına sahip olduğu bir yan kuruluş oldu.

Evrişimsel sinir ağları, derin öğrenmenin bir alt dalıdır ve genellikle görsel bilginin analiz edilmesinde kullanılır. Yaygın kullanım alanları resim ve video tanıma, önerici sistemler resim sınıflandırma, tıbbi görüntü analizi ve doğal dil işleme olarak sıralanabilir.

<span class="mw-page-title-main">Uzun kısa süreli bellek</span>

Uzun kısa süreli bellek derin öğrenme alanında kullanılan yapay bir yinelemeli sinir ağı (RNN) mimarisidir. Standart ileri beslemeli sinir ağlarının aksine, LSTM'nin geri bildirim bağlantıları vardır. Yalnızca anlık veriyi değil, veri dizilerini de işleyebilir. Örneğin, LSTM bölümlenmemiş, bağlı el yazısı tanıma, konuşma tanıma ve ağ trafiğinde anomali veya IDS'lerde tespiti gibi görevler için geçerlidir.

Perceptron (Algılayıcı), tek katmanlı bir yapay sinir ağının temel birimidir. Eğitilebilecek tek bir yapay sinir hücresinden oluşmaktadır. Denetimli bir öğrenme algoritmasıdır. Bir perceptron giriş değerleri, ağırlıklar ve sapma, ağırlıklı toplam ve aktivasyon işlevi olmak üzere dört bölümden oluşmaktadır. Hem giriş hem de çıkış değerleri verilir ve sinir ağının öğrenmesi beklenir.

Nesne tespiti bilgisayarla görü ve görüntü işleme ile ilgili bilgisayar teknolojisi

Nesne tespiti, dijital görüntülerde ve videolarda belirli bir sınıftaki anlamsal nesnelerin örneklerini algılamakla ilgilenen, bilgisayarla görme ve görüntü işleme ile ilgili bir bilgisayar teknolojisidir. Nesne tespiti, bilgisayarla görme ve görüntü işlemeden farklı olarak algılanan nesnenin görüntü üzerinde koordinatlarının bulunmasını içerir. Bulunan koordinatlar ile nesnenin bir çerçeve ile içine alınacağı alan da tespit edilmiş olur. Nesne tespiti, gerçek zamanlı (anlık) ve gerçek zamanlı olmayan olarak ikiye ayrılır. Üzerinde iyi araştırma yapılmış alanlar yüz tespiti, yaya tespiti ve araç tespitidir. Nesne tespiti, görüntü alma ve video gözetimi dahil olmak üzere bilgisayarla görmenin birçok alanında uygulamaya sahiptir.

Çekişmeli üretici ağ, Ian Goodfellow ve meslektaşları tarafından 2014 yılında tasarlanan bir makine öğrenimi framework sınıfıdır. Bir oyunda iki sinir ağı birbiriyle yarışmaktadır.

<span class="mw-page-title-main">DeepDream</span>

DeepDream, Alexander Mordvintsev adlı Google mühendisi tarafından oluşturulmuştur. DeepDream, algoritmik pareidolia yoluyla görüntülerdeki desenleri tespit etmek ve görüntüleri geliştirmek için evrişimli sinir ağı kullanmaktadır. Böylece aşırı işlenmiş görüntüler vasıtasıyla rüya tarzında halüsinojenik görüntüler oluşturan bilgisayar programıdır.

Veri analizinde, anomali tespiti, verilerin çoğunluğundan önemli ölçüde farklılaşarak şüphe uyandıran nadir öğelerin, olayların veya gözlemlerin tanımlanmasıdır. Tipik olarak anormal öğeler, banka dolandırıcılığı, yapısal bir kusur, tıbbi sorunlar veya bir metindeki hatalar gibi bir tür soruna dönüşecektir. Anormallikler ayrıca aykırı değerler, yenilikler, gürültü, sapmalar ve istisnalar olarak da adlandırılmaktadır.

<span class="mw-page-title-main">Yinelemeli sinir ağı</span> bölümler arasındaki bağlantıların yönlendirilmiş bir döngü oluşturduğu yapay sinir ağı türü

Yinelemeli sinir ağı, düğümler arası bağların zamansal bir dizi doğrultusunda yönlü çizge oluşturduğu bir yapay sinir ağı çeşididir. Yaygın olarak İngilizce kısaltması olan RNN olarak anılır. İleri beslemeli sinir ağından türetilen RNN yöntemi, bir iç durum belleği kullanarak değişik uzunluktaki dizileri işleyebilir. Bu sayede yazı tanıma ve konuşma tanıma gibi problemlere uygulanabilir. Teorik olarak Turing makinesine denk (Turing-complete) olan yinelemeli sinir ağları, herhangi uzunluktaki bir girdiyi işleyebilen herhangi bir programı çalıştırabilir.

<span class="mw-page-title-main">Geniş dil modeli</span>

Geniş dil modeli - GDM, genel amaçlı olarak dili anlama ve üretme becerisiyle öne çıkan bir dil modeli türüdür. GDM'ler bu yetenekleri, eğitilmeleri sırasında milyarlarca parametreyi öğrenebilmek amacıyla niceliksel olarak çok fazla veri kullanarak kazanırlar. Bu sırada da, aşırı büyük boyutta hesaplama kaynakları tüketirler. GDM'ler, gelişmiş olarak yapay sinir ağlarıdır ve özgözetimli öğrenme ya da yarı gözetimli öğrenme yöntemleri kullanılarak (önceden) eğitilirler.

<span class="mw-page-title-main">Hibrit akıllı sistem</span>

Hibrit akıllı sistem, yapay zeka alt alanlarından gelen yöntem ve tekniklerin bir kombinasyonunu kullanan bir yazılım sistemini ifade eder:

<span class="mw-page-title-main">Otomatik makine öğrenimi</span>

Otomatik makine öğrenimi (AutoML), makine öğrenimini gerçek dünya sorunlarına uygulanmasını otomatikleştirme sürecidir.

Yapay sinir ağındaki bir nöronun aktivasyon fonksiyonu, nöronun girdilerinden gelen değerlerin toplamını kullanarak nöronun çıktısını hesaplamaya yardımcı olan matematiksel fonksiyondur. Aktivasyon fonksiyonu doğrusal olmadığı sürece, sadece birkaç nöron kullanılarak bile karmaşık problemler çözülebilir.