İçeriğe atla

Otomatik makine öğrenimi

Otomatik makine öğrenimi (AutoML), makine öğrenimini gerçek dünya sorunlarına uygulanmasını otomatikleştirme sürecidir.

AutoML, potansiyelinde ham bir veri kümesiyle başlangıçtan dağıtıma hazır bir makine öğrenimi modeli oluşturmaya kadar her adımı içerir. AutoML, makine öğreniminin uygulanmasıyla ilgili giderek artan zorluklara karşı önerilen yapay zeka tabanlı bir çözümdür.[1] AutoML'deki yüksek derecede otomasyon, uzman olmayan kişilerin makine öğrenimi modellerini ve tekniklerini kullanmalarına olanak sağlama amacını taşır ve onların makine öğrenimi konusunda uzman olmalarını gerektirmez. Makine öğrenimini uygulama sürecinin baştan sona otomatikleştirilmesi ayrıca daha basit çözümler üretme, bu çözümlerin daha hızlı oluşturulması ve genellikle elle tasarlanmış modellerden daha iyi performans gösteren modeller gibi avantajlar sunar.[2]

AutoML'de kullanılan yaygın teknikler arasında hiperparametre optimizasyonu, meta-öğrenme ve sinir mimarisi araması bulunmaktadır.

Standart yaklaşımla karşılaştırma

Tipik bir makine öğrenimi uygulamasında, uygulayıcılar eğitim için kullanılacak bir dizi giriş veri noktasına sahiptir. Ham veriler tüm algoritmaların uygulanabileceği biçimde olmayabilir. Veriyi makine öğrenimine uygun hale getirmek için bir uzmanın uygun veri ön işleme, özellik mühendisliği, özellik çıkarma ve özellik seçme yöntemlerini uygulaması gerekebilir. Bu adımlardan sonra uygulayıcılar, modellerinin tahmin performansını maksimize etmek için algoritma seçimi ve hiperparametre optimizasyonu gerçekleştirmelidir. Derin öğrenme kullanılacaksa sinir ağının mimarisinin de makine öğrenimi uzmanı tarafından seçilmesi gerekir.

Bu adımların her biri, makine öğrenimini kullanılma konusunda önemli engellere yol açabilecek zorluklar içerebilir. AutoML, uzman olmayanlar için bu adımları basitleştirmeyi, makine öğrenimi tekniklerini doğru ve etkili bir şekilde kullanmalarını kolaylaştırmayı amaçlamaktadır.

AutoML, veri mühendisliği, veri keşfi, model yorumlama[3] ve tahmin[4] gibi zorlu görevler de içeren veri bilimini otomatikleştirmeye yönelik daha geniş bir yaklaşım içerisinde önemli bir rol oynar.

Otomasyonun hedefleri

Otomatik makine öğrenimi, makine öğrenimi sürecinin çeşitli aşamalarını hedefleyebilir. Otomasyon için adımlar şunlardır:

  • Veri hazırlama ve alma (ham verilerden ve çeşitli formatlardan)
    • Sütun tipi tespiti; örneğin boolean, ayrık sayısal, sürekli sayısal veya metin
    • Sütun amacı tespiti; örneğin hedef/etiket, sınıflandırma alanı, sayısal özellik, kategorik metin özelliği veya serbest metin özelliği
    • Görev tespiti; örneğin ikili sınıflandırma, regresyon, kümeleme veya derecelendirme
  • Özellik mühendisliği
    • Öznitelik Seçimi
    • Özellik çıkarma
    • Meta-öğrenme ve transfer öğrenimi
    • Çarpık verilerin ve/veya eksik değerlerin tespiti ve işlenmesi
  • Model seçimi - genellikle birden fazla rakip yazılım uygulaması dahil olmak üzere hangi makine öğrenimi algoritmasının kullanılacağını seçme
  • Birleştirme - birden fazla model kullanmanın genellikle tek bir modelden daha iyi sonuçlar verdiği bir fikir birliği biçimi
  • Öğrenme algoritmasının ve özelliğinin hiperparametre optimizasyonu
  • Zaman, bellek ve karmaşıklık kısıtlamaları altında işlem hattı seçimi
  • Değerlendirme metriklerinin ve doğrulama prosedürlerinin seçimi
  • Sorun kontrolü
    • Sızıntı tespiti
    • Yanlış yapılandırma tespiti
  • Elde edilen sonuçların analizi
  • Kullanıcı arayüzleri ve görselleştirmeler oluşturma

Zorluklar ve Sınırlamalar

Otomatik makine öğrenimi etrafında ele alınan bir dizi önemli zorluk bulunmaktadır. Bu alandaki büyük bir sorun, "ev endüstrisi olarak geliştirme"[5] olarak adlandırılan bir durumu içermektedir. Bu ifade, makine öğreniminde gelişmenin uzmanların manuel kararlarına ve önyargılarına dayanmasına atıfta bulunur. Bu durum, makine öğreniminin amacıyla çelişir; çünkü amaç, sistemlerin kendi kullanımlarından ve verinin analizinden öğrenip gelişmesine izin veren sistemler oluşturmaktır. Temelde, uzmanların sistemlerin öğrenmelerine ne kadar müdahil olmaları gerektiği ile makinelerin ne kadar özgürlüğe sahip olmaları gerektiği arasındaki bir mücadeleyi yansıtmaktadır. Ancak uzmanlar ve geliştiriciler, bu makineleri kendileri öğrenmeleri için hazırlamak ve yönlendirmek konusunda yardımcı olmalıdır. Bu sistemleri oluşturmak için, makine öğrenimi algoritmaları ve sistem tasarımı bilgisine dayalı yoğun emek gerektiren bir çalışma gerekir.[6]

Ek olarak, diğer zorluklar arasında meta-öğrenme zorlukları[7] ve hesaplamalı kaynak tahsisi bulunmaktadır.

Kaynakça

  1. ^ Thornton, Chris; Hutter, Frank; Hoos, Holger H.; Leyton-Brown, Kevin (11 Ağustos 2013). "Auto-WEKA: combined selection and hyperparameter optimization of classification algorithms". Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. KDD '13. New York, NY, USA: Association for Computing Machinery: 847-855. doi:10.1145/2487575.2487629. ISBN 978-1-4503-2174-7. 
  2. ^ Olson, Randal S.; Urbanowicz, Ryan J.; Andrews, Peter C.; Lavender, Nicole A.; Kidd, La Creis; Moore, Jason H. (2016). Squillero, Giovanni; Burelli, Paolo (Ed.). "Automating Biomedical Data Science Through Tree-Based Pipeline Optimization". Applications of Evolutionary Computation. Lecture Notes in Computer Science (İngilizce). Cham: Springer International Publishing: 123-137. doi:10.1007/978-3-319-31204-0_9. ISBN 978-3-319-31204-0. 9 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Ocak 2024. 
  3. ^ De Bie, Tijl; De Raedt, Luc; Hernández-Orallo, José; Hoos, Holger H.; Smyth, Padhraic; Williams, Christopher K. I. (Mart 2022). "Automating data science". Communications of the ACM (İngilizce). 65 (3): 76-87. doi:10.1145/3495256. ISSN 0001-0782. 28 Ocak 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Ocak 2024. 
  4. ^ Yi, Rita; Song, Lingxi; Li, Bo; James, M.; Yue, Xiao-Guang (2022). "Predicting Carpark Prices Indices in Hong Kong Using AutoML". Computer Modeling in Engineering & Sciences (İngilizce). 134 (3): 2247-2282. doi:10.32604/cmes.2022.020930. ISSN 1526-1492. 14 Haziran 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Ocak 2024. 
  5. ^ Hutter, Frank; Kotthoff, Lars; Vanschoren, Joaquin, (Ed.) (2019). Automated Machine Learning: Methods, Systems, Challenges. The Springer Series on Challenges in Machine Learning (İngilizce). Cham: Springer International Publishing. doi:10.1007/978-3-030-05318-5. ISBN 978-3-030-05317-8. 
  6. ^ "Machine Learning with Python: Clustering" (İngilizce). 2018. doi:10.4135/9781526466426. 
  7. ^ "Meta Learning Challenges". metalearning.chalearn.org. 3 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Ocak 2024. 

Daha fazla okuma

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Yapay zekâ</span> insani zekaya sahip makine ve yazılım geliştiren bilgisayar bilimleri dalı

Yapay zekâ ya da kısaca YZ,, insanlar da dahil olmak üzere hayvanlar tarafından, doğal zekânın aksine makineler tarafından görüntülenen zekâ çeşididir. İlk ve ikinci kategoriler arasındaki ayrım genellikle seçilen kısaltmayla ortaya çıkar. Güçlü yapay zeka genellikle Yapay genel zekâ olarak etiketlenirken, doğal zekayı taklit etme girişimleri yapay biyolojik zekâ olarak adlandırılır. Önde gelen yapay zeka ders kitapları, alanı zeki etmenlerin çalışması olarak tanımlar: Çevresini algılayan ve hedeflerine başarıyla ulaşma şansını en üst düzeye çıkaran eylemleri gerçekleştiren herhangi bir cihaz. Halk arasında, yapay zekâ kavramı genellikle insanların insan zihni ile ilişkilendirdiği öğrenme ve problem çözme gibi bilişsel eylemleri taklit eden makineleri tanımlamak için kullanılır.

<span class="mw-page-title-main">Sayısal analiz</span>

Sayısal analiz, diğer adıyla nümerik analiz veya sayısal çözümleme, matematiksel analiz problemlerinin yaklaşık çözümlerinde kullanılan algoritmaları inceler. Bu nedenle birçok mühendislik dalı ve doğa bilimlerinde önem arz eden sayısal analiz, bilimsel hesaplama bilimi olarak da kabul edilebilir. Bilgisayarın işlem kapasitesinin artması ile gündelik hayatta ortaya çıkan birçok sistemin matematiksel modellenmesi mümkün olmuş ve sayısal analiz algoritmaları burada ön plana çıkmıştır. 21. yüzyıldan itibaren bilimsel hesaplama yöntemleri mühendislik ve doğa bilimleri ile sınırlı kalmamış ve sosyal bilimler ile işletme gibi alanları da etkilemiştir. Sayısal analizin alt başlıklarına adi diferansiyel denklemlerin yaklaşık çözümleri ve özellikle veri biliminde önem taşıyan sayısal lineer cebir ile optimizasyon örnek gösterilebilir.

<span class="mw-page-title-main">Makine öğrenimi</span> algoritmaların ve istatistiksel modellerin kullanımıyla bilgisayarların yapacakları işleri kendileri çözebilmeleri

Makine öğrenimi (ML), veriden öğrenebilen ve görünmeyen verilere genelleştirebilen ve dolayısıyla açık talimatlar olmadan görevleri yerine getirebilen istatistiksel algoritmaların geliştirilmesi ve incelenmesiyle ilgilenen, yapay zekâda akademik bir disiplindir. Makine öğrenimi, bilgisayarların deneyimlerinden öğrenerek karmaşık görevleri otomatikleştirmeyi sağlayan bir yapay zeka alanıdır. Bu, veri analizi yaparak örüntüler tespit etme ve tahminlerde bulunma yeteneğine dayanır. Son zamanlarda yapay sinir ağları, performans açısından önceki birçok yaklaşımı geride bırakmayı başardı.

<span class="mw-page-title-main">Gözetimli öğrenme</span>

Gözetimli öğrenme ya da denetimli öğrenme, bilinen etiketler ve özellikler kullanarak bir fonksiyon öğrendiğimiz, makine öğreniminin önemli bir alt dalıdır. Bu yöntem, eğitim veri seti kullanılarak öğrenilen modelin, yeni ve bilinmeyen veri noktalarını doğru bir şekilde tahmin etmesini amaçlar.

<span class="mw-page-title-main">Öznitelik çıkarımı</span>

Makine öğrenimi, örüntü tanıma ve görüntü işleme alanlarında kullanılan öznitelik çıkarımı, girdi olarak verilen ölçülmüş verileri kullanarak türetilmiş değerler (öznitelikler) oluşturur. Türetilen değerlerin bilgilendirici ve artıksız olması, öğrenme sürecini kolaylaştırıcı olması ve bazı durumlarda insan uzmanlar tarafından daha iyi anlaşılabilir (yorumlanabilir) olması amaçlanır. Öznitelik çıkarımı, boyut indirgeme konusuyla ilişkilidir.

<span class="mw-page-title-main">Pekiştirmeli öğrenme</span>

Pekiştirmeli öğrenme, davranışçılıktan esinlenen, öznelerin bir ortamda en yüksek ödül miktarına ulaşabilmesi için hangi eylemleri yapması gerektiğiyle ilgilenen bir makine öğrenmesi yaklaşımıdır. Bu problem, genelliğinden ötürü oyun kuramı, kontrol kuramı, yöneylem araştırması, bilgi kuramı, benzetim tabanlı eniyileme ve istatistik gibi birçok diğer dalda da çalışılmaktadır.

<span class="mw-page-title-main">Destek vektör makinesi</span>

Destek vektör makinesi, eğitim verilerindeki herhangi bir noktadan en uzak olan iki sınıf arasında bir karar sınırı bulan vektör uzayı tabanlı makine öğrenme yöntemi olarak tanımlanabilir.

<span class="mw-page-title-main">Derin öğrenme</span> Makine öğreniminin bir branşı

Derin öğrenme bir veya daha fazla gizli katman içeren yapay sinir ağları ve benzeri makine öğrenme algoritmalarını kapsayan çalışma alanıdır.

<span class="mw-page-title-main">Geoffrey Hinton</span> İngiliz-Kanadalı bilgisayar uzmanı ve psikolog

Geoffrey Everest Hinton, İngiliz-Kanadalı bilişsel ruhbilimci ve bilgisayar bilimcisi. Yapay sinir ağları konusundaki çalışmalarıyla tanınan Hinton 2013'te Google Brain projesine katılmıştır. 2018 Turing Ödülü'nü Yoshua Bengio ve Yann LeCun'la birlikte almaya hak kazanmıştır.

<span class="mw-page-title-main">TensorFlow</span>

TensorFlow, makine öğrenimi için ücretsiz ve açık kaynaklı bir yazılım kütüphanesidir. Bir dizi görevde kullanılabilir, ancak derin sinir ağlarının eğitimi ve çıkarımına özel olarak odaklanmaktadır.

<span class="mw-page-title-main">Veri bilimi</span> verilerden bilgi ve içgörü elde etmeye odaklanan disiplinler arası çalışma alanı

Veri bilimi, yapılandırılmış ve yapılandırılmamış verilerden bilgi ve öngörü elde etmek için bilimsel yöntemleri, süreçleri, algoritmaları ve sistemleri kullanan çok disiplinli bir alandır. Veri bilimi veri madenciliği ve büyük verilerle ilişkilidir.

<span class="mw-page-title-main">Çoklu örnekle öğrenme</span>

Makine öğreniminde, çoklu örnek öğrenme (ÇÖÖ) bir tür denetimli öğrenmedir. Öğrenci, bireysel olarak etiketlenmiş bir dizi örnek almak yerine, her biri birçok örnek içeren bir dizi etiketli paket alır.

<span class="mw-page-title-main">Bilgisayarlı görü</span> görsellerden veri bilgisi çıkartmak

Bilgisayarlı görü, bilgisayarların dijital görüntülerden veya videolardan nasıl bir anlam kazanabileceğiyle ilgilenen disiplinler arası bilimsel bir alandır. Mühendislik yöntemleriyle, insan görsel sisteminin yapabileceği görevleri anlamaya ve otomatikleştirmeye çalışmaktadır.

<span class="mw-page-title-main">Sayısal Patoloji</span>

Sayısal Patoloji ve ya Dijital patoloji, sayısallaştırılmış (dijitalleştirilmiş) patoloji örnek slaytlarından üretilen bilgilere dayalı olarak veri yönetimine odaklanan bir patoloji alt alanıdır. Bilgisayar tabanlı teknolojinin kullanılmasıyla dijital patoloji, sanal mikroskopi kullanır. Mikroskop slaytları, bir bilgisayar monitöründe görüntülenebilen, yönetilebilen, paylaşılabilen ve analiz edilebilen dijital slaytlara dönüştürülür. Sanal mikroskopinin bir diğer adı olan Bütün Slayt Görüntüleme uygulamasıyla dijital patoloji alanı büyümektedir. Ayrıca Yapay Zeka ve Makine Öğrenimindeki başarıya bağlı olarak hastalıkların tanısı ve gidişatının öngörüsü için tanısal tıpta ve araştırmalarda ucuz ve hızlı çözümler sunmaktadır.

Veri analizinde, anomali tespiti, verilerin çoğunluğundan önemli ölçüde farklılaşarak şüphe uyandıran nadir öğelerin, olayların veya gözlemlerin tanımlanmasıdır. Tipik olarak anormal öğeler, banka dolandırıcılığı, yapısal bir kusur, tıbbi sorunlar veya bir metindeki hatalar gibi bir tür soruna dönüşecektir. Anormallikler ayrıca aykırı değerler, yenilikler, gürültü, sapmalar ve istisnalar olarak da adlandırılmaktadır.

<span class="mw-page-title-main">Algokrasi</span>

Algokrasi, özellikle yapay zeka ve blok zinciri gibi teknolojiler başta olmak üzere, bilgisayar algoritmalarının yasal düzenlemelerde, kanun yapımında ve genellikle ulaşım veya tapu kaydı gibi günlük yaşamın herhangi bir yerinde kullanıldığı alternatif bir hükûmet veya sosyal düzen biçimidir. "Algoritma ile yönetim" terimi, 2013 yılında akademik literatürde “Algoritmik Yönetim'e” alternatif olarak ortaya çıkmıştır. İlgili bir terim olan "Algoritmik Düzenleme", standart belirleme ve davranışın hesaplama algoritmaları aracılığıyla izlenmesi veya değiştirilmesi olarak tanımlanır - yargının otomasyonu da bu kapsamda bulunmaktadır.

<span class="mw-page-title-main">Süreç mühendisliği</span> ham veya başlangıç maddesinin kimyasal-fiziksel ya da biyolojik işlemler kullanılarak başka bir ürüne dönüştürüldüğü tüm teknik işlemler

Süreç mühendisliği, insanların hammaddeleri ve enerjiyi endüstriyel düzeyde toplum için yararlı ürünlere dönüştürmesini sağlayan temel ilkelerin ve doğa kanunlarının anlaşılması ve uygulanmasıdır. Süreç mühendisleri, basınç, sıcaklık ve derişim gradyanları gibi doğadaki itici güçlerden ve kütlenin korunumu yasasından yararlanarak, istenilen kimyasal ürünleri büyük miktarlarda sentezlemek ve saflaştırmak için yöntemler geliştirebilirler. Süreç mühendisliği, kimyasal, fiziksel ve biyolojik süreçlerin tasarımı, işletimi, kontrolü, optimizasyonu ve yoğunlaştırılmasına odaklanır. Süreç mühendisliği, tarım, otomotiv, biyoteknik, kimya, gıda, malzeme geliştirme, madencilik, nükleer, petrokimya, ilaç ve yazılım geliştirme gibi çok çeşitli endüstrileri kapsamaktadır. Sistematik bilgisayar tabanlı yöntemlerin süreç mühendisliğine uygulanmasına "süreç sistemleri mühendisliği" adı verilir.

Michael Kearns, Amerikalı bilgisayar bilimcisi, profesör ve Pensilvanya Üniversitesinde Ulusal Merkez Başkanı, üniversitenin Ağ ve Sosyal Sistemler Mühendisliği Programı'nın (NETS) kurucu direktörü, Warren Ağ ve Veri Bilimleri Merkezi'nin kurucu direktörüdür. Ayrıca üniversitenin Wharton Okulu'nda ve Ekonomi bölümünde ikincil görevleri mevcuttur. Hesaplamalı öğrenme teorisi ve algoritmik oyun teorisinde önde gelen bir araştırmacıdır. Makine öğrenimi, yapay zekâ, hesaplamalı finans, algoritmik ticaret, hesaplamalı sosyal bilimler ve sosyal ağlar ile ilgilenmektedir. Daha önce Morgan Stanley'nin Yapay Zeka Mükemmeliyet Merkezi ekibinde Danışmanlık ve Araştırma işlevini yönetmiştir. Şu anda Amazon Web Services bünyesinde bir Amazon Uzmanıdır.

<span class="mw-page-title-main">Dijital ikiz</span>

Dijital İkiz, gerçek dünya nesnelerinin, süreçlerinin veya sistemlerinin sanal bir simülasyonunu temsil eden bir dijital modeldir. İkizler, fiziksel nesnenin özelliklerini, performansını ve davranışını taklit ederek, gerçek zamanlı olarak analiz, tahmin ve optimizasyon sağlar. Bu teknoloji, özellikle endüstriyel İnternet ve Nesnelerin İnterneti (IoT) alanlarında yaygın olarak kullanılmaktadır.

Burada, sayısal analiz veya veri analizi için kullanılmak üzere tasarlanmış önemli son kullanıcı bilgisayar uygulamaları listelenmiştir: