İçeriğe atla

o1

o1
Geliştirici(ler)OpenAI
İlk yayınlanma12 Eylül 2024 (33 gün önce) (2024-09-12)
TürÖnceden eğitilmiş üretken dönüştürücü
Resmî sitesiopenai.com/o1/ Bunu Vikiveri'de düzenleyin

o1, OpenAI tarafından geliştirilen ve çok adımlı problemleri analiz edebilme yeteneğine sahip önceden eğitilmiş üretken dönüştürücü yapay zekâ modeli. 12 Eylül 2024 tarihinde duyurulmuştur.[1]

Tarihçe

Arka Plan

Temmuz 2024'te, Reuters OpenAI'ın "Strawberry" kod adıyla bilinen bir önceden eğitilmiş üretken dönüştürücü geliştirdiğini bildirdi.[2]

Yayın

o1, 12 Eylül 2024 tarihinde ChatGPT Plus ve Team kullanıcıları için piyasaya sürüldü.[1] GitHub o1'i Copilot hizmetinde uygulamaya başladı.[3]

Yetenekler

OpenAI'a göre, o1 yeni bir optimizasyon algoritması ve bu algoritmaya özel olarak hazırlanmış bir veri kümesi kullanılarak eğitilmiştir. Eğitim, pekiştirmeli öğrenme yöntemini kullanmıştır.[4]

o1, bir yanıt üretmeden önce ek süre harcayarak düşünmektedir, bu da onu özellikle bilim ve programlama gibi karmaşık akıl yürütme görevlerinde daha etkili hale getirmektedir.[1] Önceki modellere kıyasla, o1, nihai yanıtı vermeden önce kullanıcıdan gizli "Chain-Of-Thought" oluşturacak şekilde eğitilmiştir.[5][6] OpenAI CTO'su Mira Murati'ye göre o1'deki yanıt vermeden önce düşünme yeteneği, yeni bir yaklaşımı temsil ediyor. Bu yöntem, yanıt üretirken daha fazla hesaplama gücü kullanarak modelin çıktısını geliştiriyor; Diğer taraftan, modelin ölçeklenmesi yaklaşımı, çıktıları artırmak için modelin boyutunu, eğitim verilerini ve hesaplama gücünü artırıyor.[7] OpenAI'ın test sonuçları, yanıt vermeden önce düşünülen hesaplama miktarının logaritması ile doğruluk arasında bir korelasyon olduğunu göstermektedir.[5][6]

o1-preview, fizik, kimya ve biyoloji ile ilgili soruları yanıtlarken yaklaşık olarak bir doktora (PhD) seviyesinde performans göstermiştir. Uluslararası Matematik Olimpiyatları (IMO) seçme sınavında, o1-preview %83 oranında doğru çözüm sağlarken, GPT-4o'nun oranı %13'tür. Ayrıca, Codeforces kodlama yarışmalarında en iyi %89'luk yüzde diliminde yer almıştır.[8] o1-mini, o1-preview'den %80 oranında daha hızlı ve ucuzdur. Özellikle programlama ve STEM alanlarıyla ilgili görevler için daha uygundur, ancak o1-preview kadar geniş bir "genel dünya bilgisi"ne sahip olmamaktadır.[9]

OpenAI, o1'in akıl yürütme yeteneklerinin, verilen güvenlik kurallarına uyma konusunda daha etkili olduğunu belirtmiştir. OpenAI, bir test sırasında o1-preview'ün, bir hata nedeniyle başarısız olması gereken bir görevde bir yapılandırma hatasını kullanarak başarı sağladığını rapor etmiştir.[10][11] OpenAI ayrıca Birleşik Krallık ve ABD'deki yapay zekâ güvenlik enstitülerine erken erişim sağlamış, bu sayede araştırma, değerlendirme ve testler yapılmıştır. Araştırmacı Dan Hendrycks, o1 hakkında, "Model, biyolojik silahlarla ilgili soruları yanıtlamada çoğu zaman doktora seviyesindeki bilim insanlarını geride bırakıyor." açıklamasını vermiştir.[12]

Kaynakça

  1. ^ a b c Metz, Cade (12 Eylül 2024). "OpenAI, Matematik ve Bilim Üzerinde Akıl Yürütme Yapabilen Yeni ChatGPT'yi Tanıttı". The New York Times. Erişim tarihi: 12 Eylül 2024. 
  2. ^ Tong, Anna; Paul, Katie (12 Temmuz 2024). "Özel: OpenAI, 'Strawberry' kod adıyla yeni bir akıl yürütme teknolojisi üzerinde çalışıyor". Reuters. 13 Temmuz 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 12 Temmuz 2024. 
  3. ^ Peters, Jay (12 Eylül 2024). "GitHub, OpenAI'nin o1 önizlemesini GitHub Copilot'ta test etmeye başladı". The Verge. Erişim tarihi: 12 Eylül 2024. 
  4. ^ Robison, Kylie (12 Eylül 2024). "OpenAI releases o1, its first model with 'reasoning' abilities". The Verge (İngilizce). 13 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Eylül 2024. 
  5. ^ a b "Learning to Reason with LLMs". OpenAI. 12 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 13 Eylül 2024. 
  6. ^ a b Kahn, Jeremy. "Here are 9 things you need to know about OpenAI's o1 model". Fortune (İngilizce). Erişim tarihi: 15 Eylül 2024. 
  7. ^ Knight, Will. "OpenAI Announces a New AI Model, Code-Named Strawberry, That Solves Difficult Problems Step by Step". Wired (İngilizce). ISSN 1059-1028. 14 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Eylül 2024. 
  8. ^ Franzen, Carl (12 Eylül 2024). "Forget GPT-5! OpenAI launches new AI model family o1 claiming PhD-level performance". VentureBeat (İngilizce). 14 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Eylül 2024. 
  9. ^ "OpenAI o1-mini". OpenAI. 12 Eylül 2024. 15 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Eylül 2024. 
  10. ^ Coombes, Lloyd (13 Eylül 2024). "OpenAI's new ChatGPT o1 model 'cheated' on an impossible test — here's what happened". Tom's Guide (İngilizce). 14 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Eylül 2024. 
  11. ^ "OpenAI o1 System Card" (PDF). OpenAI. 12 Eylül 2024. ss. 16-17. 16 Eylül 2024 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 16 Eylül 2024. 
  12. ^ Boran, Marie (13 Eylül 2024). "OpenAI o1 model warning issued by scientist: "Particularly dangerous"". Newsweek (İngilizce). Erişim tarihi: 15 Eylül 2024. 

İlgili Araştırma Makaleleri

OpenAI, ABD merkezli yapay zekâ araştırma şirketi. Şirketin genel amacı insanlığa fayda sağlayabilecek yapay zekâ hakkında araştırma yapmaktır. 2015 yılının sonlarında San Francisco'da kurulan şirket, patentlerini ve araştırmalarını halka açık hale getirerek diğer kurum ve araştırmacılarla “serbest iş birliği yapmayı” amaçlamaktadır. Elon Musk ve Sam Altman, yapay genel zekâdan kaynaklanan varoluşsal risk endişelerinden dolayı bu şirketi kurduklarını açıklamıştır. Organizasyon 2015 yılında Sam Altman, Reid Hoffman, Jessica Livingston, Elon Musk, Ilya Sutskever, Peter Thiel ve diğerleri tarafından San Francisco’da kurulmuş ve toplamda 1 milyar dolar bağışta bulunulmuşlardır. Musk 2018 yılında yönetim kurulundan istifa etmiş ancak bağışçı olarak kalmıştır. Microsoft 2019 yılında OpenAI LP’ye 1 milyar dolarlık bir yatırım sağlamış ve Ocak 2023’te ikinci birçok yıllık yatırım sağlamıştır; bu ikinci yatırımın 10 milyar dolar olduğu bildirilmektedir. ChatGPT yazılı cevap veren botun yapımı da OpenAI’a aittir.

Chatbot, kullanıcı ile genellikle metin, bazı durumlarda ise konuşma yoluyla diyalog kurarak bilgi veren veya bir işlemi gerçekleştiren bir yazılımdır.

Generative Pre-trained Transformer 3 kısaca GPT-3, insanların yazdığı metinlere benzer içerik üretmek için derin öğrenmeyi kullanan özbağlanımlı dil modelidir. GPT-n serisindeki üçüncü nesil dil tahmin modeli olan GPT-3, San Francisco merkezli yapay zeka araştırma laboratuvarı OpenAI tarafından geliştirilmiştir. GPT-3'ün tam sürümü, veri işleyecek 175 milyar parametreye sahiptir. Bu rakam GPT-2'nin öğrenme kapasitesinin 2 katıdır. 14 Mayıs 2020'de tanıtılan ve Temmuz 2020 itibarıyla beta aşamasında olan GPT-3, önceden öğretilmiş dil örnekleriyle doğal dil işleme (NLP) sistemini kullanmaktadır. GPT-3'ün piyasaya sürülmesinden önce, en büyük dil modeli Microsoft'un Şubat 2020'de tanıttığı ve GPT-3'ün %10'undan daha az kapasiteye sahip olan Turing NLG idi.

<span class="mw-page-title-main">ChatGPT</span> OpenAI tarafından geliştirilen yapay zekâ sohbet robotu

ChatGPT, OpenAI tarafından geliştirilen ve diyalog konusunda uzmanlaşmış bir yapay zeka sohbet botudur. Bu chatbot, denetimli ve takviyeli öğrenme teknikleriyle ince ayar yapılmış büyük bir dil modeline dayanır. ChatGPT'nin ilk versiyonu, GPT-3 temelli idi ve daha sonra gelişmiş sürümleri olan GPT-3.5 ve 14 Mart 2023'te GPT-4 ile güncellenmiştir ve ChatGPT Plus kullanıcıları için kullanılabilir durumdadır.

GPT-4, OpenAI tarafından oluşturulan çok modlu büyük bir dil modelidir. GPT serisinin dördüncüsüdür. 14 Mart 2023’te yayınlanmıştır ve API aracılığıyla ve ChatGPT Plus kullanıcıları için kullanılabilir olacaktır. Microsoft, GPT kullanan Bing sürümlerinin resmi yayınlanmadan önce aslında GPT-4 kullandığını doğruladı.

GitHub Copilot, kullanıcıların kod yazma sürecinde yardımcı olan bulut tabanlı bir yapay zeka aracıdır. GitHub ve OpenAI tarafından geliştirilen araç, Visual Studio Code, Visual Studio, Neovim ve diğer entegre geliştirme ortamlarının (IDE'ler) kullanıcılarına destek vermek için tasarlanmıştır. GitHub Copilot, teknik önizleme için 29 Haziran 2021'de duyurulmuş ve daha sonra JetBrains pazarında bir eklenti olarak yayınlanmıştır. GitHub, Copilot'un kullanıcıların belgeleri okumak için harcadıkları süreyi azaltarak programcıların bilmedikleri kodlama çerçevelerinde ve dillerinde gezinmelerine olanak tanıdığını belirtmektedir.

<span class="mw-page-title-main">Gemini</span> yapay zeka sohbet botu

Gemini ya da eski adıyla Bard, Google AI tarafından geliştirilen ve 21 Mart 2023'te yayınlanan bir sohbet robotudur. Google'ın LaMDA dil ailesini kullanan Gemini; şu anda 200'den fazla ülkede yayın yapmakta, 40'tan fazla dilde kullanılabilmektedir.

<span class="mw-page-title-main">PaLM</span>

PaLM, Google AI tarafından geliştirilen 540 milyar parametreli dönüştürücü tabanlı büyük bir dil modelidir. Araştırmacılar ayrıca model ölçeğinin etkilerini test etmek için PaLM'ın daha küçük sürümlerini, 8 ve 62 milyar parametreli modellerini de yaptılar.

Attention Is All You Need, Google tarafından 2017 yılında yayımlanan bir bilimsel makaledir. Sekiz bilim insanı tarafından kaleme alınan makale, ChatGPT, Midjourney, Stable Diffusion, GitHub Copilot gibi üretken yapay zeka uygulamalarının doğmasına vesile olduğu için modern yapay zekanın kurucu belgesi olarak kabul edilmektedir.

Gemini dil modeli, Google DeepMind tarafından geliştirilmiş olan ve LaMDA ve PaLM 2'nin ardılı olarak hizmet veren çok modlu büyük dil modelleri ailesinin adıdır. Gemini Ultra, Gemini Pro ve Gemini Nano'dan oluşan bu ürün, OpenAI'nin GPT-4'üne rakip olarak konumlandırılarak 6 Aralık 2023'te duyurulmuştur. Aynı adı taşıyan üretken yapay zeka sohbet robotunun ardındaki esas gücü oluşturmaktadır.

<span class="mw-page-title-main">Önceden eğitilmiş üretken dönüştürücü</span> büyük dil modeli çeşidi

Önceden eğitilmiş üretken dönüştürücü ya da özgün İngilizce adının kısaltmasıyla GPT, bir tür geniş dil modeli ve Üretken yapay zekâ için öne çıkan bir çerçevedir. Doğal dil işleme görevlerinde kullanılan yapay sinir ağlarından oluşur. GPT'ler dönüştürücü mimarisine dayanır, etiketlenmemiş metinlerden oluşan büyük veri setleri üzerinde önceden eğitilmiştir ve insan benzeri yeni içerikler üretebilir. 2023 itibarıyla, çoğu LLM bu özelliklere sahiptir ve bazen genel olarak GPT'ler olarak anılırlar.

Microsoft Copilot, Microsoft tarafından geliştirilen ve 7 Şubat 2023'te piyasaya sürülen bir sohbet robotudur. Geniş bir dil yelpazesini esas alarak kaynak gösterme, şiir ve şarkı yazma işlemlerini yapabilir.

Claude, Anthropic tarafından geliştirilen geniş kapsamlı dil modelleri ailesidir. İlk model Mart 2023'te piyasaya sürüldü. Mart 2024'te çıkan Claude 3 ise görselleri de analiz edebiliyor.

Ermira "Mira" Murati, Arnavut mühendis, araştırmacı ve teknoloji yöneticisidir. 2018 yılından bu yana OpenAI'ın Baş Teknoloji Yöneticisi (CTO) olarak görev yapmaktadır.

GPT-4o, OpenAI tarafından oluşturulan çok dilli, çok modlu, önceden eğitilmiş üretken dönüştürücüdür. OpenAI CTO'su Mira Murati önderliğinde 13 Mayıs 2024 tarihinde gerçekleştirilen canlı yayında duyurulmuş ve aynı gün yayınlanmıştır. GPT-4o ücretsiz olmakla birlikte, ChatGPT Plus aboneleri için 5 kat daha fazla kullanım limitine sahiptir. Metin, görüntü ve ses işleyebilmekte ve üretebilmektedir. API'si önceki GPT-4 Turbo'ya kıyasla iki kat daha hızlı ve yarı fiyatınadır.

<span class="mw-page-title-main">Apple Intelligence</span> Appleın geliştirdiği yapay zeka platformu

Apple Intelligence, Apple Inc. tarafından geliştirilen bir yapay zeka platformudur. Cihaz içi ve sunucu işleme kombinasyonuna dayanan bu özellik, 10 Haziran 2024'te WWDC 2024'te Apple Intelligence ile birlikte duyurulan Apple'ın iOS 18, iPadOS 18 ve macOS Sequoia işletim sistemlerinin bir özelliği olarak duyuruldu. Apple Intelligence, ChatGPT ile entegrasyon içerir ve desteklenen cihazlara sahip tüm kullanıcılar için ücretsiz olacaktır. 2024'ün sonlarında Amerika Birleşik Devletleri'nde geliştirici beta sürümüne girmesi planlanıyor ve 2025'te tamamen piyasaya sürülmesi planlanıyor.

Anthropic PBC, 2021 yılında kurulmuş ABD merkezli bir yapay zeka startup şirketi. Şirket, yapay zeka güvenliği ve güvenilirliği üzerine araştırmalar yapmakta ve bu araştırmaları genel kullanım için güvenli ve sağlam modeller geliştirmek için kullanmaktadır. Anthropic, OpenAI'ın ChatGPT ve Google'ın Gemini modellerine rakip olarak Claude adlı bir dizi geniş dil modelleri (LLM) geliştirmiştir.

<span class="mw-page-title-main">Greg Brockman</span> araştırmacı

Greg Brockman, OpenAI kurucu ortağı Amerikalı girişimci, yatırımcı ve yazılım geliştirici. Şu anda OpenAI'ın başkanlık görevini yürütmektedir. Kariyerine 2010 yılında Stripe'da başlamış ve MIT'den ayrıldıktan sonra bu şirkette çalışmaya başlamıştır. 2013 yılında Stripe'ın CTO'su olmuştur. 2015 yılında Stripe'tan ayrılarak OpenAI'ı kurmuş ve burada da CTO rolünü üstlenmiştir.

<span class="mw-page-title-main">SearchGPT</span>

SearchGPT, OpenAI tarafından geliştirilen bir prototip arama motoru. 26 Temmuz 2024'te piyasaya sürülen bu prototip, geleneksel arama motoru özelliklerini üretken yapay zekâ yetenekleriyle birleştirmektedir. Bu arama özelliği, OpenAI'yi büyük arama motorlarına, özellikle de Google ve Bing gibi büyük rakiplerin doğrudan karşısına koymaktadır; Bing, OpenAI'nin en büyük yatırımcısı olan Microsoft'un bir ürünüdür. SearchGPT ilk olarak 10.000 test kullanıcısına sınırlı bir sürüm olarak tanıtılmıştır. OpenAI, nihai hedef olarak arama özelliklerini ChatGPT'ye entegre etmeyi planlamaktadır.

Wojciech Zaremba, Polonyalı bilgisayar bilimci ve OpenAI'ın kurucu ortağı. OpenAI'da Codex araştırma ve dil takımlarını yönetmektedir. Bu takım, bilgisayar kodu yazabilen yapay zeka üzerinde aktif olarak çalışmaktadır. Ayrıca, GPT serisi dil modelleri üzerinde de çalışmaktadır.