İçeriğe atla

Geniş dil modeli

Geniş dil modeli - GDM (Large Language Model - LLM), genel amaçlı olarak dili anlama ve üretme becerisiyle öne çıkan bir dil modeli türüdür. GDM'ler bu yetenekleri, eğitilmeleri sırasında milyarlarca parametreyi öğrenebilmek amacıyla niceliksel olarak çok fazla veri kullanarak kazanırlar. Bu sırada da, aşırı büyük boyutta hesaplama kaynakları tüketirler.[1] GDM'ler, gelişmiş olarak yapay sinir ağlarıdır (temel olarak dönüştürücüler[2] ) ve özgözetimli öğrenme ya da yarı gözetimli öğrenme yöntemleri kullanılarak (önceden) eğitilirler.

GDM'ler özbağlanımlı dil modelleri olarak, bir giriş metnini alıp bir sonraki belirteci ya da sözcüğü kezlerce tahmin ederek çalışırlar.[3] 2020 yılına dek, bir modelin belirli görevleri yerine getirebilecek şekilde uyarlanmasının tek yolu ince ayar yapmaktı. Ancak günümümzde popüler olan GPT-3 gibi daha büyük boyutlu modeller, benzer sonuçlara ulaşmak için sufle mühendisliğini kullanabilecek biçimde tasarlanmaya başladı.[4] GDM'lerin, insan dili derleminde var olan sözdizimi, anlambilim ve "ontoloji" hakkında somutlaşmış bilgi edinebilmenin yanı sıra, aynı zamanda bütüncede bulunan yanlışlıkları ve önyargıları da edindikleri düşünülmektedir.[5]

Kaynakça

  1. ^ "Better Language Models and Their Implications". OpenAI. 14 Şubat 2019. 19 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 29 Ekim 2023. 
  2. ^ Merritt, Rick (25 Mart 2022). "What Is a Transformer Model?". NVIDIA Blog (İngilizce). 23 Ekim 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 29 Ekim 2023. 
  3. ^ A bot will complete this citation soon. Click here to jump the queue arXiv:[1].
  4. ^ Brown, Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish; Askell, Amanda; Agarwal (Aralık 2020). "Language Models are Few-Shot Learners" (PDF). Advances in Neural Information Processing Systems. Curran Associates, Inc. 33: 1877-1901. 25 Mayıs 2023 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 29 Ekim 2023. 
  5. ^ Manning, Christopher D. (2022). "Human Language Understanding & Reasoning". Daedalus. 151 (2): 127-138. doi:10.1162/daed_a_01905. 9 Mart 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 29 Ekim 2023. 

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Zazalar</span> Türkiyenin doğu ve güneydoğusunda yaşayan bir etnik grup

Zazalar, Hint-Avrupa dil ailesine bağlı bir dil olan Zazaca konuşup Türkiye'nin çoğunlukla Doğu Anadolu Bölgesi'nde; Bingöl, Bitlis, Elazığ, Erzincan ve Tunceli, Güneydoğu Anadolu Bölgesi'nde ise; Diyarbakır, Adıyaman, Şanlıurfa illerinin belirli bölgelerinde yaşayan İranî bir halktır. Yaklaşık 2-3 milyon nüfusa sahip olan Zazalar; Türkler, Kürtler ve Araplardan sonra sayısal olarak Türkiye'deki dördüncü en büyük etnik grubu oluşturmaktadır.

<span class="mw-page-title-main">Japonya</span> Doğu Asyada bir ada ülkesi

Japonya, Doğu Asya'da yer alan bir ada ülkesidir. Büyük Okyanus'un kuzeybatısında konumlanan ülke; Japon Denizi'nden Çin, Kuzey Kore, Güney Kore ve Rusya'nın doğusuna; kuzeyde Ohotsk Denizi'nden güneyde Doğu Çin Denizi ve Tayvan'a kadar uzanır. De facto başkenti ve en büyük şehri Tokyo'dur. Adını oluşturan kanji karakterler, "güneş" ve "köken" anlamına geldiğinden "Doğan Güneşin Ülkesi" olarak adlandırılır.

<span class="mw-page-title-main">Hollanda</span> Karayiplerde toprakları bulunan Kuzeybatı Avrupada bir ülke

Hollanda, Batı Avrupa'da ve kısmen Karayipler'de bulunan bir ülkedir. Hollanda Krallığı'nı meydana getiren dört ülkeden en büyüğüdür. Hollanda, Avrupa'da doğuda Almanya'ya, güneyde Belçika'ya ve kuzeybatıda Kuzey Denizi'ne komşu olan on iki vilayetten ve Karayipler'de Bonaire, Sint Eustatius ve Saba adaları olmak üzere üç özel belediyeden oluşur.

<span class="mw-page-title-main">İngilizce</span> Batı Cermen dili

İngilizce (

<span class="mw-page-title-main">Farsça</span> Bir batı İran dili

Farsça ya da Persçe, Hint-Avrupa dillerinin İran dilleri koluna ait bir batı İran dilidir. Başta İran olmak üzere, kuzeyde Rusya ve Azerbaycan, doğuda Afganistan ve Tacikistan, Orta Asya'da Özbekistan ve Basra Körfezi üzerinde Kuveyt ve Irak gibi ülkelerde 100 milyonun üzerinde kişi tarafından konuşulmaktadır. Antik Pers halkının konuştuğu dilden türemiştir.

<span class="mw-page-title-main">Urduca</span> Pakistanın iki resmî dilinden biri

Urduca, Hindustani dilinin Pakistan'da kullanılan standart biçimine verilen isim. Pakistan'ın iki resmî dilinden biridir. Hindistan'ın bazı bölgelerinde de resmî dilidir. Hintçe ve Urdu Hindustani adlı dilin iki ayrı standart biçimi olarak kabul edilmekle beraber Urduca özellikle Pakistan ve Hindistan'ın kuzeyinde Müslümanların daha yoğun olduğu yerlerde konuşulmakta ve Hintçeye kıyasla daha fazla Farsça aktarma sözcük içermektedir.

<span class="mw-page-title-main">Endonezce</span> Endonezyanın resmî ve en çok konuşulan dili.

Endonezce ya da Endonezya dili, Endonezya ve çevresinde yaklaşık 300 milyon kişi tarafından konuşulan Avustronezya dil ailesine bağlı bir dil. Malaycanın standartlaştırılmış bir değişkesi olan Endonezce Endonezya'nın dünyanın en kalabalık dördüncü ülkesi olmasına bağlı olarak dünyanın en çok konuşulan dillerinden biridir. Tarih boyuncaGüneydoğu Asya takımadaları üzerinde lingua franca olarak kullanılmıştır. 700'den fazla yerel dilin konuşulduğu Endonezya'nı resmî dilidir. 1976-1999 yılları arasında Endonezya hakimiyetine bağlı olarak Doğu Timor'da resmî dil olarak kullanılmış olup daha sonra İngilizce ile birlikte çalışma dili olarak kabul edilmiştir. Kasım 2023'te UNESCO'nun resmî dillerinden biri olarak kabul edilmiştir. Endonezya'nın 1945'te bağımsızlığını ilan etmesinden sonra standartlaştırılmış bir Malayca şivesi olmasına bağlı olarak Endonezce ve Malayca farklı diller olarak kabul edilmelerine rağmen neredeyse aynıdırlar.

<span class="mw-page-title-main">Peştuca</span> dil

Peştuca ya da Afganca, Afganistan’da ve Pakistan’ın batı kesiminde yaşayan Peştunların konuştuğu dil. Hint-Avrupa dillerinin Hint-İran dilleri öbeğine bağlıdır. Kırk beş harfli bir alfabesi vardır. Bazı sesler Sanskritçede de bulunur.

<span class="mw-page-title-main">Belarusça</span> Belarusun resmî dili olan doğu Slav dili

Belarusça veya Beyaz Rusça, Rusça ile beraber Belarus'un resmî dili. Hint-Avrupa dil ailesinin Slav dilleri grubunun Doğu Slav dilleri alt grubuna dahil olup toplam konuşan sayısı yaklaşık 7 milyondur. Mevcut Anayasa uyarınca Belarus Cumhuriyeti'nde Rusça ile birlikte iki resmî dilden biridir. Ek olarak, Rusya, Litvanya, Letonya, Polonya ve Ukrayna'nın bazı bölgelerinde bu ülkelerdeki Belaruslu azınlıklar tarafından konuşulmaktadır.

<span class="mw-page-title-main">Ford Model T</span>

Ford Model T, Ford Motor Şirketi tarafından 1 Ekim 1908'den 26 Mayıs 1927'ye kadar üretilen bir otomobildir. Genellikle orta sınıf Amerikalılar için otomobil yolculuğunu mümkün kılan ilk kitlesel olarak uygun fiyatlı otomobil olarak kabul edilir. Nispeten düşük fiyat kısmen Ford'un bireysel el işçiliği yerine montaj hattı üretimini içeren verimli imalatının bir sonucuydu. Seri üretimden sağlanan tasarruflar, fiyatın 1910'da 780 dolardan 1924'te 290 dolara (2023 doları cinsinden 5.156 dolara düşmesine olanak sağladı.

<span class="mw-page-title-main">Makine öğrenimi</span> algoritmaların ve istatistiksel modellerin kullanımıyla bilgisayarların yapacakları işleri kendileri çözebilmeleri

Makine öğrenimi (ML), veriden öğrenebilen ve görünmeyen verilere genelleştirebilen ve dolayısıyla açık talimatlar olmadan görevleri yerine getirebilen istatistiksel algoritmaların geliştirilmesi ve incelenmesiyle ilgilenen, yapay zekâda akademik bir disiplindir. Makine öğrenimi, bilgisayarların deneyimlerinden öğrenerek karmaşık görevleri otomatikleştirmeyi sağlayan bir yapay zeka alanıdır. Bu, veri analizi yaparak örüntüler tespit etme ve tahminlerde bulunma yeteneğine dayanır. Son zamanlarda yapay sinir ağları, performans açısından önceki birçok yaklaşımı geride bırakmayı başardı.

<span class="mw-page-title-main">BMC Levend</span>

BMC Levend, BMC tarafından 1980-2009 yılları arasında üretilen hafif ticari araç ve minibüs serisidir. Araç, BMC TM 25'in yerini almış olup başlangıçta Leyland TM 30 olarak üretilmeye başlanmış ve 1990 yılında ise Levend ismiyle piyasaya sürülmüştür.

OpenAI, ABD merkezli yapay zekâ araştırma şirketi. Şirketin genel amacı insanlığa fayda sağlayabilecek yapay zekâ hakkında araştırma yapmaktır. 2015 yılının sonlarında San Francisco'da kurulan şirket, patentlerini ve araştırmalarını halka açık hale getirerek diğer kurum ve araştırmacılarla “serbest iş birliği yapmayı” amaçlamaktadır. Elon Musk ve Sam Altman, yapay genel zekâdan kaynaklanan varoluşsal risk endişelerinden dolayı bu şirketi kurduklarını açıklamıştır. Organizasyon 2015 yılında Sam Altman, Reid Hoffman, Jessica Livingston, Elon Musk, Ilya Sutskever, Peter Thiel ve diğerleri tarafından San Francisco’da kurulmuş ve toplamda 1 milyar dolar bağışta bulunulmuşlardır. Musk 2018 yılında yönetim kurulundan istifa etmiş ancak bağışçı olarak kalmıştır. Microsoft 2019 yılında OpenAI LP’ye 1 milyar dolarlık bir yatırım sağlamış ve Ocak 2023’te ikinci birçok yıllık yatırım sağlamıştır; bu ikinci yatırımın 10 milyar dolar olduğu bildirilmektedir. ChatGPT yazılı cevap veren botun yapımı da OpenAI’a aittir.

<span class="mw-page-title-main">Google DeepMind</span>

DeepMind Technologies, Alphabet Inc.'in bir yan kuruluşu olup, 2010'da kurulmuş bir İngiliz yapay zekâ program geliştirme şirketidir. DeepMind, 2014'te Google tarafından satın alınmıştır. Şirketin merkezi Londra'dadır ve Kanada, Fransa ve Amerika Birleşik Devletleri'nde araştırma merkezleri bulunmaktadır. 2015'te, Google'ın ana şirketi olan Alphabet Inc.'in tamamına sahip olduğu bir yan kuruluş oldu.

<span class="mw-page-title-main">Aynuca</span>

Aynuca, Japonya'nın kuzeyindeki Hokkaidō adasında ve geçmişte Kuril Adaları ile Sahalin Adası'nda konuşulmuş izole bir dildir. Aynuca, Japonya'daki Aynu halkının ana dili olup, günümüzde tehlike altındaki diller arasında yer almaktadır. Bu dilin kökeni diğer dillerle net bir şekilde ilişkilendirilememiştir ve izole bir dil olarak kabul edilmektedir.

<span class="mw-page-title-main">Sinirdilbilim</span>

Sinirdilbilim, sinir dil bilimi, beyin dil bilimi ya da nörolinguistik; insan beyninde dil kavraması, üretimi ve edinilmesini denetleyen sinirsel mekanizmalara ilişkin çalışmaları kapsayan akademik alandır. Disiplinlerarası bir alan olarak sinir dil bilimi; sinir bilimi, dil bilimi, bilişsel bilim, iletişim bozuklukları ve nöropsikoloji gibi dallardan yöntemler ve teorilerden faydalanır. Birçok farklı geçmişi olan sinir dil bilimi araştırmacıları, bu alana çeşitli deneysel tekniklerin yanı sıra büyük oranda farklılık gösteren teorik bakış açıları getirmiştir. Sinir dil bilimi dalında yapılmış çalışmalar ağırlıklı olarak ruh dil bilimi (psikolinguistik) ve kuramsal dil biliminden kaynaklanan modellerin kullanımıyla şekillendirilmiş ve beynin ruh ile kuramsal dil bilimi dallarında dilin üretimi ve kavrayışı için şart olduğu önerilen işlemleri nasıl uyguladığını araştırmaya odaklanır. Sinir dil bilimcileri, beynin dil ile ilgili bilgileri işleme almak için kullandığı işlevbilimsel mekanizmaları araştırır ve afaziyoloji, beyin görüntüleme, elektrofizyoloji ve bilgisayar modellemesini kullanarak dilbilimsel ve ruhdilbilimsel teorileri değerlendirirler.

Sufle mühendisliği; yapay zekada, özellikle de doğal dil işlemede kullanılan bir kavramdır. Sufle mühendisliğinde görevin tanımı, girdiye gömülüdür. Sufle mühendisliği tipik olarak bir veya daha çok görevi sufle tabanlı bir veri kümesine dönüştürerek ve "sufle tabanlı öğrenme" veya sadece "sufle öğrenme" olarak adlandırılan yöntemle bir dil modelini eğiterek çalışır. Sufle mühendisliği, "önek-ayarlama" veya "sufle ayarlama" olarak adlandırılan yöntemle yalnızca sufle temsilinin öğrenildiği büyük bir "dondurulmuş" ön eğitimli dil modelinden çalışabilir.

<span class="mw-page-title-main">ChatGPT</span> OpenAI tarafından geliştirilen yapay zekâ sohbet robotu

ChatGPT, OpenAI tarafından geliştirilen ve diyalog konusunda uzmanlaşmış bir yapay zeka sohbet botudur. Bu chatbot, denetimli ve takviyeli öğrenme teknikleriyle ince ayar yapılmış büyük bir dil modeline dayanır. ChatGPT'nin ilk versiyonu, GPT-3 temelli idi ve daha sonra gelişmiş sürümleri olan GPT-3.5 ve 14 Mart 2023'te GPT-4 ile güncellenmiştir ve ChatGPT Plus kullanıcıları için kullanılabilir durumdadır.

<span class="mw-page-title-main">PaLM</span>

PaLM, Google AI tarafından geliştirilen 540 milyar parametreli dönüştürücü tabanlı büyük bir dil modelidir. Araştırmacılar ayrıca model ölçeğinin etkilerini test etmek için PaLM'ın daha küçük sürümlerini, 8 ve 62 milyar parametreli modellerini de yaptılar.

<span class="mw-page-title-main">Önceden eğitilmiş üretken dönüştürücü</span> büyük dil modeli çeşidi

Önceden eğitilmiş üretken dönüştürücü ya da özgün İngilizce adının kısaltmasıyla GPT, bir tür geniş dil modeli ve Üretken yapay zekâ için öne çıkan bir çerçevedir. Doğal dil işleme görevlerinde kullanılan yapay sinir ağlarından oluşur. GPT'ler dönüştürücü mimarisine dayanır, etiketlenmemiş metinlerden oluşan büyük veri setleri üzerinde önceden eğitilmiştir ve insan benzeri yeni içerikler üretebilir. 2023 itibarıyla, çoğu LLM bu özelliklere sahiptir ve bazen genel olarak GPT'ler olarak anılırlar.