İçeriğe atla

Claude (dil modeli)

Claude
Geliştirici(ler)Anthropic
İlk yayınlanmaMart 2023 (19 ay önce) (2023-03)
Tür
LisansTescilli
Resmî sitesiclaude.ai

Claude, Anthropic tarafından geliştirilen geniş kapsamlı dil modelleri ailesidir.[1] İlk model Mart 2023'te piyasaya sürüldü. Mart 2024'te çıkan Claude 3 ise görselleri de analiz edebiliyor.[2]

Eğitim

Claude modelleri, büyük miktarda metin içindeki sonraki kelimeyi tahmin etmek için önceden eğitilmiş üretken dönüştürücülerdir. Claude modelleri daha sonra, onları yararlı, dürüst ve zararsız hale getirmek amacıyla Anayasal Yapay Zeka ile ince ayardan geçirilmiştir.[3][4]

Anayasal Yapay Zeka

Anthropic tarafından geliştirilen Anayasal Yapay Zekâ, Claude gibi dil modelleri de dahil olmak üzere yapay zeka sistemlerini kapsamlı insan geri bildirimine ihtiyaç duymadan zararsız ve faydalı hale getirmek için bir yaklaşımdır. "Constitutional AI: Harmlessness from AI Feedback" başlıklı makalede detaylandırılan yöntem, denetimli öğrenme ve takviyeli öğrenme olmak üzere iki aşamayı içerir.[4]

Gözetimli öğrenme aşamasında, model, promplara yanıt oluşturur, bunları rehber ilkeler kümesi (bir "anayasa") temelinde kendi kendini eleştirir ve yanıtları günceller. Sonra model, bu güncellenmiş yanıtlara göre ince ayarlanır.

Yapay zeka geri bildirimi ile pekiştirmeli öğrenme (RLAIF) aşamasında, yanıtlar oluşturulur ve anayasaya uyumlulukları açısından karşılaştırılır. Bu yapay zeka geri bildirimi veri seti, yanıtları anayasaya ne kadar uyduğuna göre değerlendiren bir tercih modeli eğitmek için kullanılır. Daha sonra Claude, bu tercih modeline göre hizalanacak şekilde ince ayara alınır. Bu teknik, insan geri bildiriminden pekiştirmeli öğrenme (RLHF) ile benzerlik gösterir, ancak tercih modelini eğitmek için kullanılan karşılaştırmalar yapay zeka kaynaklıdır ve anayasaya dayanır.[4][5]

Bu yaklaşım, yardımcı ve zararsız yapay zeka asistanlarının eğitilmesini sağlar ve zararlı taleplere karşı itirazlarını açıklayabilir, böylece şeffaflığı artırır ve insan denetiminin gereksinimini azaltır.[6][7]

Claude için oluşturulan "anayasa" 75 maddeden oluşmakta olup, BM İnsan Hakları Evrensel Bildirgesi'nden bölümler de içermektedir.[3][6]

Modeller

Claude

Claude, Anthropic tarafından Mart 2023'te piyasaya sürülen ilk büyük dil modelidir.[8] Claude çeşitli görevlerde yetenekli olduğunu kanıtlasa da kodlama, matematik ve muhakeme yeteneklerinde bazı kısıtlamalara sahipti.[9] Anthropic, Notion (üreticilik yazılımı) ve Quora (Poe sohbet robotunu geliştirmeye yardımcı olmak için) gibi şirketlerle ortaklık kurdu.[9]

Claude Instant

Claude, iki sürüm olarak piyasaya sürüldü: Claude ve Claude Instant. Claude Instant, daha hızlı, daha ucuz ve daha hafif bir sürümdür. Claude Instant'ın giriş bağlam uzunluğu 100.000 token (yaklaşık 75.000 kelimeye karşılık gelir).[10]

Claude 2

Claude'un sonraki büyük güncellemesi olan Claude 2, 11 Temmuz 2023'te yayınlandı ve genel halka açık hale geldi. Buna karşın, Claude 1 yalnızca Anthropic tarafından onaylanan seçilmiş kullanıcılara sunuluyordu.[11]

Claude 2, bağlam penceresini 9,000 token'dan 100,000 token'a genişletti.[8] Ayrıca, Claude 2'ye PDF ve diğer dokümanları yükleme özelliği eklendi. Böylece kullanıcılar, Claude'un bu belgeleri okuyup özetlemesini ve görevlerde yardımcı olmasını sağlayabilir hale geldi.

Claude 2.1

Uzmanların belirttiğine göre, Claude 2.1 sürümü önceki sürümlere kıyasla daha az yanlış ifade üretme eğilimindedir.[12] Ayrıca, işlenebilen belge uzunluğu da önemli ölçüde artırılmış ve yaklaşık 500 sayfalık yazılı materyale denk gelen 200.000 token'lık bir pencereye ulaşmıştır.[1]

Claude 3

Claude 3, 14 Mart 2024 tarihinde piyasaya sürülmüş ve basın açıklamasında geniş bir yelpazedeki bilişsel görevlerde yeni sektör standartları oluşturduğu iddia edilmiştir. Claude 3 ailesi, yetenek sırasına göre Haiku, Sonnet ve Opus olmak üzere üç ileri teknoloji modeli içermektedir. Varsayılan sürüm olan Opus'un 200.000 token'lık bir bağlam penceresi bulunmakta, ancak bu belirli kullanım durumları için 1 milyon token'a genişletilmektedir.[13][14]

Claude 3, yapay olarak test edildiğini fark etme yeteneği de dahil olmak üzere meta-bilişsel akıl yürütme gerçekleştiriyor gibi görünmektedir.[15]

Erişim

Sınırlı erişim ücretsizdir, ancak hem e-posta adresi hem de cep telefonu numarası gereklidir.

1 Mayıs 2024'te Anthropic, Claude'un ilk kurumsal paketi olan Claude Team planını ve bir Claude iOS uygulamasını duyurdu.[16]

Kaynakça

  1. ^ a b Davis, Wes (21 Kasım 2023). "OpenAI rival Anthropic makes its Claude chatbot even more useful". The Verge (İngilizce). 23 Ocak 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Ocak 2024. 
  2. ^ Whitney, Lance (4 Mart 2024). "Anthropic's Claude 3 chatbot claims to outperform ChatGPT, Gemini". ZDNET (İngilizce). 5 Mart 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 5 Mart 2024. 
  3. ^ a b "What to Know About Claude 2, Anthropic's Rival to ChatGPT". TIME (İngilizce). 18 Temmuz 2023. 11 Ocak 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Ocak 2024. 
  4. ^ a b c "Claude's Constitution". Anthropic (İngilizce). 9 Mayıs 2023. 26 Mart 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 26 Mart 2024. 
  5. ^ Eliot, Lance (25 Mayıs 2023). "Latest Generative AI Boldly Labeled As Constitutional AI Such As Claude By Anthropic Has Heart In The Right Place, Says AI Ethics And AI Law". Forbes (İngilizce). 18 Nisan 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 27 Mart 2024. 
  6. ^ a b Kadavath, Saurav; Kundu, Sandipan; Askell, Amanda; Kernion, Jackson; Jones, Andy; Chen, Anna; Goldie, Anna; Mirhoseini, Azalia (15 Aralık 2022), Constitutional AI: Harmlessness from AI Feedback, arXiv:2212.08073 $2  Birden fazla yazar-name-list parameters kullanıldı (yardım); Yazar |ad1= eksik |soyadı1= (yardım)
  7. ^ Mok, Aaron. "A ChatGPT rival just published a new constitution to level up its AI guardrails, and prevent toxic and racist responses". Business Insider (İngilizce). 23 Ocak 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Ocak 2024. 
  8. ^ a b Drapkin, Aaron (27 Ekim 2023). "What Is Claude AI and Anthropic? ChatGPT's Rival Explained". Tech.co (İngilizce). 28 Ekim 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Ocak 2024. 
  9. ^ a b "Introducing Claude". Anthropic. 14 Mart 2023. 16 Mayıs 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Mayıs 2024. 
  10. ^ Yao, Deborah (11 Ağustos 2023). "Anthropic's Claude Instant: A Smaller, Faster and Cheaper Language Model". AI Business. 3 Haziran 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Mayıs 2024. 
  11. ^ Matthews, Dylan (17 Temmuz 2023). "The $1 billion gamble to ensure AI doesn't destroy humanity". Vox (İngilizce). 3 Ekim 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Ocak 2024. 
  12. ^ "Anthropic Announces Claude 2.1 LLM with Wider Context Window and Support for AI Tools". InfoQ (İngilizce). 23 Ocak 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Ocak 2024. 
  13. ^ "Introducing the next generation of Claude". Anthropic (İngilizce). 4 Mart 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 4 Mart 2024. 
  14. ^ Whitney, Lance (4 Mart 2024). "Anthropic's Claude 3 chatbot claims to outperform ChatGPT, Gemini". ZDNET (İngilizce). 5 Mart 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 5 Mart 2024. 
  15. ^ Edwards, Benj (5 Mart 2024). "Anthropic's Claude 3 causes stir by seeming to realize when it was being tested". Ars Technica (İngilizce). 8 Mart 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 9 Mart 2024. 
  16. ^ Field, Hayden (1 Mayıs 2024). "Amazon-backed Anthropic launches iPhone app and business tier to compete with OpenAI's ChatGPT". CNBC. 2 Mayıs 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 3 Mayıs 2024. 

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Yapay zekâ</span> insani zekaya sahip makine ve yazılım geliştiren bilgisayar bilimleri dalı

Yapay zekâ ya da kısaca YZ,, insanlar da dahil olmak üzere hayvanlar tarafından, doğal zekânın aksine makineler tarafından görüntülenen zekâ çeşididir. İlk ve ikinci kategoriler arasındaki ayrım genellikle seçilen kısaltmayla ortaya çıkar. Güçlü yapay zeka genellikle Yapay genel zekâ olarak etiketlenirken, doğal zekayı taklit etme girişimleri yapay biyolojik zekâ olarak adlandırılır. Önde gelen yapay zeka ders kitapları, alanı zeki etmenlerin çalışması olarak tanımlar: Çevresini algılayan ve hedeflerine başarıyla ulaşma şansını en üst düzeye çıkaran eylemleri gerçekleştiren herhangi bir cihaz. Halk arasında, yapay zekâ kavramı genellikle insanların insan zihni ile ilişkilendirdiği öğrenme ve problem çözme gibi bilişsel eylemleri taklit eden makineleri tanımlamak için kullanılır.

OpenAI, ABD merkezli yapay zekâ araştırma şirketi. Şirketin genel amacı insanlığa fayda sağlayabilecek yapay zekâ hakkında araştırma yapmaktır. 2015 yılının sonlarında San Francisco'da kurulan şirket, patentlerini ve araştırmalarını halka açık hale getirerek diğer kurum ve araştırmacılarla “serbest iş birliği yapmayı” amaçlamaktadır. Elon Musk ve Sam Altman, yapay genel zekâdan kaynaklanan varoluşsal risk endişelerinden dolayı bu şirketi kurduklarını açıklamıştır. Organizasyon 2015 yılında Sam Altman, Reid Hoffman, Jessica Livingston, Elon Musk, Ilya Sutskever, Peter Thiel ve diğerleri tarafından San Francisco’da kurulmuş ve toplamda 1 milyar dolar bağışta bulunulmuşlardır. Musk 2018 yılında yönetim kurulundan istifa etmiş ancak bağışçı olarak kalmıştır. Microsoft 2019 yılında OpenAI LP’ye 1 milyar dolarlık bir yatırım sağlamış ve Ocak 2023’te ikinci birçok yıllık yatırım sağlamıştır; bu ikinci yatırımın 10 milyar dolar olduğu bildirilmektedir. ChatGPT yazılı cevap veren botun yapımı da OpenAI’a aittir.

Chatbot, kullanıcı ile genellikle metin, bazı durumlarda ise konuşma yoluyla diyalog kurarak bilgi veren veya bir işlemi gerçekleştiren bir yazılımdır.

Generative Pre-trained Transformer 3 kısaca GPT-3, insanların yazdığı metinlere benzer içerik üretmek için derin öğrenmeyi kullanan özbağlanımlı dil modelidir. GPT-n serisindeki üçüncü nesil dil tahmin modeli olan GPT-3, San Francisco merkezli yapay zeka araştırma laboratuvarı OpenAI tarafından geliştirilmiştir. GPT-3'ün tam sürümü, veri işleyecek 175 milyar parametreye sahiptir. Bu rakam GPT-2'nin öğrenme kapasitesinin 2 katıdır. 14 Mayıs 2020'de tanıtılan ve Temmuz 2020 itibarıyla beta aşamasında olan GPT-3, önceden öğretilmiş dil örnekleriyle doğal dil işleme (NLP) sistemini kullanmaktadır. GPT-3'ün piyasaya sürülmesinden önce, en büyük dil modeli Microsoft'un Şubat 2020'de tanıttığı ve GPT-3'ün %10'undan daha az kapasiteye sahip olan Turing NLG idi.

<span class="mw-page-title-main">ChatGPT</span> OpenAI tarafından geliştirilen yapay zekâ sohbet robotu

ChatGPT, OpenAI tarafından geliştirilen ve diyalog konusunda uzmanlaşmış bir yapay zeka sohbet botudur. Bu chatbot, denetimli ve takviyeli öğrenme teknikleriyle ince ayar yapılmış büyük bir dil modeline dayanır. ChatGPT'nin ilk versiyonu, GPT-3 temelli idi ve daha sonra gelişmiş sürümleri olan GPT-3.5 ve 14 Mart 2023'te GPT-4 ile güncellenmiştir ve ChatGPT Plus kullanıcıları için kullanılabilir durumdadır.

GPT-4, OpenAI tarafından oluşturulan çok modlu büyük bir dil modelidir. GPT serisinin dördüncüsüdür. 14 Mart 2023’te yayınlanmıştır ve API aracılığıyla ve ChatGPT Plus kullanıcıları için kullanılabilir olacaktır. Microsoft, GPT kullanan Bing sürümlerinin resmi yayınlanmadan önce aslında GPT-4 kullandığını doğruladı.

<span class="mw-page-title-main">Gemini</span> yapay zeka sohbet botu

Gemini ya da eski adıyla Bard, Google AI tarafından geliştirilen ve 21 Mart 2023'te yayınlanan bir sohbet robotudur. Google'ın LaMDA dil ailesini kullanan Gemini; şu anda 200'den fazla ülkede yayın yapmakta, 40'tan fazla dilde kullanılabilmektedir.

<span class="mw-page-title-main">Üretken yapay zekâ</span>

Üretken yapay zekâ, bilgisayar sistemlerinin metin, görüntü, ses gibi farklı veri türlerini işleyerek orijinal içerik oluşturmasına yarayan bir yapay zekâ teknolojisi dalıdır.

<span class="mw-page-title-main">Grok</span> xAI tarafından geliştirilen Chatbot programı

Grok, xAI tarafından geliştirilen ve büyük dil modellerine (LLM'ler) dayanan, konuşmaya dayalı, üretken bir yapay zeka sohbet robotudur. OpenAI'nin ChatGPT'sinin yükselişine doğrudan yanıt olarak Elon Musk tarafından bir girişim olarak geliştirilmiştir. Chatbot'un "mizah anlayışına sahip" olduğu ve Twitter'a (X) doğrudan erişim sağladığı belirtilmiştir.

<span class="mw-page-title-main">Yapay zeka patlaması</span>

Yapay Zeka Patlaması, veya Yapay Zeka Baharı, yapay zeka alanında çok hızlı bir şekilde devam eden ilerleme dönemidir. Öne çıkan örnekler arasında Google DeepMind ve OpenAI gibi laboratuvarlar tarafından yürütülen üretken yapay zekalar yer almaktadır.

Açık kaynaklı yapay zeka, açık kaynak yaklaşımının yapay zeka geliştirme alanında uygulanmasıdır.

Gemini dil modeli, Google DeepMind tarafından geliştirilmiş olan ve LaMDA ve PaLM 2'nin ardılı olarak hizmet veren çok modlu büyük dil modelleri ailesinin adıdır. Gemini Ultra, Gemini Pro ve Gemini Nano'dan oluşan bu ürün, OpenAI'nin GPT-4'üne rakip olarak konumlandırılarak 6 Aralık 2023'te duyurulmuştur. Aynı adı taşıyan üretken yapay zeka sohbet robotunun ardındaki esas gücü oluşturmaktadır.

<span class="mw-page-title-main">Önceden eğitilmiş üretken dönüştürücü</span> büyük dil modeli çeşidi

Önceden eğitilmiş üretken dönüştürücü ya da özgün İngilizce adının kısaltmasıyla GPT, bir tür geniş dil modeli ve Üretken yapay zekâ için öne çıkan bir çerçevedir. Doğal dil işleme görevlerinde kullanılan yapay sinir ağlarından oluşur. GPT'ler dönüştürücü mimarisine dayanır, etiketlenmemiş metinlerden oluşan büyük veri setleri üzerinde önceden eğitilmiştir ve insan benzeri yeni içerikler üretebilir. 2023 itibarıyla, çoğu LLM bu özelliklere sahiptir ve bazen genel olarak GPT'ler olarak anılırlar.

Microsoft Copilot, Microsoft tarafından geliştirilen ve 7 Şubat 2023'te piyasaya sürülen bir sohbet robotudur. Geniş bir dil yelpazesini esas alarak kaynak gösterme, şiir ve şarkı yazma işlemlerini yapabilir.

Ermira "Mira" Murati, Arnavut mühendis, araştırmacı ve teknoloji yöneticisidir. 2018 yılından bu yana OpenAI'ın Baş Teknoloji Yöneticisi (CTO) olarak görev yapmaktadır.

GPT-4o, OpenAI tarafından oluşturulan çok dilli, çok modlu, önceden eğitilmiş üretken dönüştürücüdür. OpenAI CTO'su Mira Murati önderliğinde 13 Mayıs 2024 tarihinde gerçekleştirilen canlı yayında duyurulmuş ve aynı gün yayınlanmıştır. GPT-4o ücretsiz olmakla birlikte, ChatGPT Plus aboneleri için 5 kat daha fazla kullanım limitine sahiptir. Metin, görüntü ve ses işleyebilmekte ve üretebilmektedir. API'si önceki GPT-4 Turbo'ya kıyasla iki kat daha hızlı ve yarı fiyatınadır.

Anthropic PBC, 2021 yılında kurulmuş ABD merkezli bir yapay zeka startup şirketi. Şirket, yapay zeka güvenliği ve güvenilirliği üzerine araştırmalar yapmakta ve bu araştırmaları genel kullanım için güvenli ve sağlam modeller geliştirmek için kullanmaktadır. Anthropic, OpenAI'ın ChatGPT ve Google'ın Gemini modellerine rakip olarak Claude adlı bir dizi geniş dil modelleri (LLM) geliştirmiştir.

<span class="mw-page-title-main">Greg Brockman</span> araştırmacı

Greg Brockman, OpenAI kurucu ortağı Amerikalı girişimci, yatırımcı ve yazılım geliştirici. Şu anda OpenAI'ın başkanlık görevini yürütmektedir. Kariyerine 2010 yılında Stripe'da başlamış ve MIT'den ayrıldıktan sonra bu şirkette çalışmaya başlamıştır. 2013 yılında Stripe'ın CTO'su olmuştur. 2015 yılında Stripe'tan ayrılarak OpenAI'ı kurmuş ve burada da CTO rolünü üstlenmiştir.

<span class="mw-page-title-main">SearchGPT</span>

SearchGPT, OpenAI tarafından geliştirilen bir prototip arama motoru. 26 Temmuz 2024'te piyasaya sürülen bu prototip, geleneksel arama motoru özelliklerini üretken yapay zekâ yetenekleriyle birleştirmektedir. Bu arama özelliği, OpenAI'yi büyük arama motorlarına, özellikle de Google ve Bing gibi büyük rakiplerin doğrudan karşısına koymaktadır; Bing, OpenAI'nin en büyük yatırımcısı olan Microsoft'un bir ürünüdür. SearchGPT ilk olarak 10.000 test kullanıcısına sınırlı bir sürüm olarak tanıtılmıştır. OpenAI, nihai hedef olarak arama özelliklerini ChatGPT'ye entegre etmeyi planlamaktadır.

o1, OpenAI tarafından geliştirilen ve çok adımlı problemleri analiz edebilme yeteneğine sahip önceden eğitilmiş üretken dönüştürücü yapay zekâ modeli. 12 Eylül 2024 tarihinde duyurulmuştur.