Aşırı öğrenme - Turkipedia

Yeşil çizgi aşırı uyan bir modeli, siyah çizgi iyi uyan bir modeli göstermektedir. Yeşil çizgi eğitim kümesine daha çok uymasına rağmen yeni karşılaşılan verilere uyum sağlamakta zorlanacaktır.

İstatistikte, aşırı uyma, üretilen bir analizin belirli bir veri kümesine aşırı oranda uyum göstermesi, dolayısıyla bu veri kümesinde yer almayan yeni verilere uyum sağlayamaması problemidir.^[1] Aşırı uyan bir modelde verinin gerektirdiğinden daha fazla parametre vardır.^[2] Bunun temel sebebi, verinin elde edilişinde ortaya çıkan sapmaları (gürültü) da kapsayacak bir analiz yapılmış olmasıdır.^[3]

Ayrıca bakınız

Kaynakça

^ Alpaydın, Ethem (2009). Introduction to Machine Learning (2 bas.). MIT press. s. 39.
^ Everitt B.S., Skrondal A. (2010), Cambridge Dictionary of Statistics, Cambridge University Press.
^ Anderson, D. R. (2002). Model Selection and Multimodel Inference (2.2soyadı=Burnham bas.). Springer-Verlag. Yazar |ad1= eksik |soyadı1= (yardım)

İlgili Araştırma Makaleleri

Veri madenciliği, büyük ölçekli veriler arasından faydalı bilgiye ulaşma, bilgiyi madenleme işidir. Büyük veri yığınları içerisinden gelecekle ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranması olarak da tanımlanabilir.

İstatistik veya sayım bilimi, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir. Belirli bir amaç için verilerin toplanması, sınıflandırılması, çözümlenmesi ve sonuçlarının yorumlanması esasına dayanır. Bu çerçevede yapılan işlemlerin tümüne sayımlama denir.

Regresyon analizi, iki ya da daha çok nicel değişken arasındaki ilişkiyi ölçmek için kullanılan analiz metodudur. Eğer tek bir değişken kullanılarak analiz yapılıyorsa buna tek değişkenli regresyon, birden çok değişken kullanılıyorsa çok değişkenli regresyon analizi olarak isimlendirilir. Regresyon analizi ile değişkenler arasındaki ilişkinin varlığı, eğer ilişki var ise bunun gücü hakkında bilgi edinilebilir. Regresyon terimi için öz Türkçe olarak bağlanım sözcüğü kullanılması teklif edilmiş ise de Türk ekonometriciler arasında bu kullanım yaygın değildir.

Doğrusal cebir ya da lineer cebir; matematiğin, vektörler (yöney), vektör uzayları, doğrusal dönüşümler, doğrusal denklem takımları ve matrisleri (dizey) inceleyen alanıdır. Vektör uzayları, modern matematiğin merkezinde yer alan bir konudur. Bundan dolayı doğrusal cebir hem soyut cebirde hem de fonksiyonel analizde sıkça kullanılır. Doğrusal cebir, analitik geometri ile de alakalı olup sosyal bilimlerde ve fen bilimlerinde yaygın bir uygulama alanına sahiptir.

Otokorelasyon ya da öz ilinti, bir sinyalin farklı zamanlardaki değerleri arasındaki korelasyonudur. Başka bir deyişle, gözlemlenen değerler arasındaki benzerliğin, zamansal gecikmenin bir fonksiyonu olarak ifadesidir. Otokorelasyon analizi tekrar eden örüntülerin tanınması, bir sinyalin kayıp temel frekansının tespit edilmesi gibi amaçlar için kullanılan bir matematiksel araçtır. Sinyal işlemede fonksiyonların ya da dizilerin analizi için sıkça kullanılır.

Betimsel istatistikte çeyrekler açıklığı sıralanmış bir veri dizisinin orta yarısını (%50'sini) kapsayan ve üçüncü dörtte birlik ve birinci dörtte birlik aralığını veya farkını gösteren bir istatistiksel yayılma ölçüsüdür. Birinci dörtte birlik sıralanmış veri dizisinin ilk %25'inden büyük ve üçüncü dörtte birlik sıralanmış veri dizisinin %25'inden daha küçük olduğu için, bu iki dörtte birlik arasında kalan veri yüzdesi %50'dir. Çeyrekler açıklığı ölçüm birimi veri ölçüm birimi ile aynıdır. İngilizcesi IQR'dir.

Karmaşık analiz ya da başka bir deyişle kompleks analiz, bir karmaşık değişkenli fonksiyonları araştıran bir matematik dalıdır. Bir değişkenli karmaşık analize ya da çok değişkenli karmaşık analizle beraber tümüne karmaşık değişkenli fonksiyonlar teorisi de denilir.

Yıldız sistemi, kütleçekim etkisiyle bağlı olarak birbirlerinin yörüngesinde dolanan az sayıdaki yıldızdan oluşan bir sistemdir. Kütleçekimi ile bağlı büyük bir yıldız grubu genellikle bir yıldız kümesi veya gökada olarak adlandırılır, fakat geniş anlamıyla bunlar aynı zamanda yıldız sistemleridir. Yıldız sistemleri; gezegenler ve benzer cisimleri içeren gezegen sistemleriyle karıştırılmamalıdır.

Makine öğrenimi (ML), veriden öğrenebilen ve görünmeyen verilere genelleştirebilen ve dolayısıyla açık talimatlar olmadan görevleri yerine getirebilen istatistiksel algoritmaların geliştirilmesi ve incelenmesiyle ilgilenen, yapay zekâda akademik bir disiplindir. Makine öğrenimi, bilgisayarların deneyimlerinden öğrenerek karmaşık görevleri otomatikleştirmeyi sağlayan bir yapay zeka alanıdır. Bu, veri analizi yaparak örüntüler tespit etme ve tahminlerde bulunma yeteneğine dayanır. Son zamanlarda yapay sinir ağları, performans açısından önceki birçok yaklaşımı geride bırakmayı başardı.

Matematiksel model, bir sistemin matematiksel kavramlar ve dil kullanılarak tanımlanmasıdır. Matematiksel model geliştirme süreci, matematiksel modelleme olarak adlandırılır. Matematiksel modeller, doğa bilimlerinde ve mühendislik disiplinlerinde bunun yanı sıra sosyal bilimlerde kullanılır. Matematiksel modelleri daha çok fizikçiler, mühendisler, istatistikçiler, operasyon araştırma analistleri ve ekonomistler kullanır. Model, bir sistemi açıklamaya, farklı bileşenlerin etkilerini incelemeye ve bir davranış hakkında öngörüde bulunmak için yardımcı olabilir.

Gözetimli öğrenme ya da denetimli öğrenme, bilinen etiketler ve özellikler kullanarak bir fonksiyon öğrendiğimiz, makine öğreniminin önemli bir alt dalıdır. Bu yöntem, eğitim veri seti kullanılarak öğrenilen modelin, yeni ve bilinmeyen veri noktalarını doğru bir şekilde tahmin etmesini amaçlar.

Oskar Ryszard Lange, Polonyalı iktisatçı ve diplomat.

<span class="mw-page-title-main">İki parçalı graf</span>

Graf teorisinde, düğümleri her kenar iki kümede de birer bitiş ucuna sahip olacak şekilde iki ayrı kümeye ayrılabilen graflara iki parçalı graf adı verilir.

ÇıkarımsaI istatistik veya çıkarımsal sayımlama, veri analizi yoluyla verinin ait olduğu dağılımın özelliklerini anlama süreçlerini kapsar. Çıkarımsal istatistik bir anakütlenin özellikleri hakkında çıkarımlar yapar: bu hipotez testleri ve anakütle paramatrelerinin tahminlerini içerir. Anakütle verisinin gözlenen veri kümesinden daha büyük olduğu varsayılır; diğer bir deyişle, gözlenen verilerin daha büyük bir anakütleden alınmış örneklem olduğu varsayılır.

Makine öğrenimi, örüntü tanıma ve görüntü işleme alanlarında kullanılan öznitelik çıkarımı, girdi olarak verilen ölçülmüş verileri kullanarak türetilmiş değerler (öznitelikler) oluşturur. Türetilen değerlerin bilgilendirici ve artıksız olması, öğrenme sürecini kolaylaştırıcı olması ve bazı durumlarda insan uzmanlar tarafından daha iyi anlaşılabilir (yorumlanabilir) olması amaçlanır. Öznitelik çıkarımı, boyut indirgeme konusuyla ilişkilidir.

<span class="mw-page-title-main">Kümeleme analizi</span>

Küme analizi veya kümeleme, bir nesne kümesini gruplama problemidir. Bu problemde, nesnelerin aynı kümede (salkımda) yer alması için diğer kümelerdeki elemanlardan ziyade herhangi bir şekilde birbirine daha benzer olması gerekmektedir. Veri madenciliğinin ana problemlerinden biri olup, istatistikî veri analizinde de yaygın olarak kullanılan bir tekniktir. Makine öğrenimi, örüntü tanıma, görüntü analizi, bilgi erişimi, biyoenformatik, veri sıkıştırma ve bilgisayar grafikleri alanlarında da kullanımı mevcuttur.

Matematiksel jeofizik, jeofizikteki matematiksel yöntemlerin geliştirilmesiyle ilgilidir. Bu nedenle, özellikle jeodinamik ve sismoloji başta olmak üzere jeofizikteki birçok alanda uygulamaya sahiptir.

Temsil teorisi soyut cebirdeki cebirsel yapıları, daha somut olan matematiksel nesnelerin dönüşümleri olarak tasvir etmeye çalışan bir matematik dalıdır. Örneğin soyut bir $\text{[math]}$ grubunu bir vektör uzayı $\text{[math]}$ 'nin eşyapı dönüşüm grubunun( $\text{[math]}$ ) içinde görmeye çalışır. Böyle temsillere doğrusal temsil denir, çünkü bu temsil aslında $\text{[math]}$ grubundan genel lineer grup $\text{[math]}$ 'ye bir morfizma yazmak demektir. Böyle bir temsil bulmaktaki amaç, $\text{[math]}$ grubunu çalışmak için lineer cebir kullanmaktır. Soyut gruplardaki çarpma işlemi, özellikle bir bilgisayar için matris çarpmasından daha zordur. Soyut bir grubun doğrusal temsillerini kullanarak, gruptaki kimi hesaplamaları bilgisayara yaptırmak daha kolay olur.

Yapı, maddi bir nesne veya sistemdeki birbiriyle ilişkili unsurların düzenlenmesi ve organizasyonu veya bu şekilde organize edilmiş nesne veya sistemdir. Maddi yapılar, binalar ve makineler gibi insan yapımı nesneleri ve biyolojik organizmalar, mineraller ve kimyasallar gibi doğal nesneleri içerir. Soyut yapılar bilgisayar bilimlerindeki veri yapılarını ve müzik formunu içerir. Yapı türleri arasında bir hiyerarşi, çoktan çoğa bağlantılar içeren bir bağlantı veya uzayda komşu olan bileşenler arasındaki bağlantıları içeren bir kafes bulunur.

Çarpraz doğrulama, yapılan bir istatistiksel analizin bağımsız bir veri setinde nasıl bir sonuç elde edeceğini sınayan bir model doğrulama tekniğidir. Başlıca kullanım alanı bir öngörü sisteminin pratikte hangi doğrulukla çalışacağını kestirmektir. Bir öngörü probleminde, model genellikle bir "bilinen veri" kümesiyle eğitilir ve bir "bilinmeyen veri" kümesiyle sınanır. Bu sınamanın amacı, eğitilen modelin yeni verilere genelleşme kabiliyetini ölçmek ve aşırı uyma ya da seçim yanlılığı problemlerini tespit etmektir.

Bu sayfa, bu Vikipedi makalesine dayanmaktadır.
Metin, CC BY-SA 4.0 lisansı altında mevcuttur; ek koşullar uygulanabilir.
Görseller, videolar ve sesler kendi lisansları altında mevcuttur.