İçeriğe atla

Gemini (dil modeli)

Gemini dil modeli, Google DeepMind tarafından geliştirilmiş olan ve LaMDA ve PaLM 2'nin ardılı olarak hizmet veren çok modlu büyük dil modelleri ailesinin adıdır. Gemini Ultra, Gemini Pro ve Gemini Nano'dan oluşan bu ürün, OpenAI'nin GPT-4'üne rakip olarak konumlandırılarak 6 Aralık 2023'te duyurulmuştur. Aynı adı taşıyan üretken yapay zeka sohbet robotunun ardındaki esas gücü oluşturmaktadır.

Google Gemini
Geliştirici(ler)Google DeepMind
İlk yayınlanma6 Aralık 2023
Erişilebilirlik46 dil[1]
239 ülke[1]
TürDil modeli
LisansÖzel mülk yazılım
Resmî sitesihttps://deepmind.google

Tarihçe

Geliştirme Süreci

Google, 10 Mayıs 2023'teki Google I/O açılış konuşmasında, yan kuruluşu Google DeepMind tarafından geliştirilen büyük bir dil modeli (LLM) olan Gemini'yi duyurdu. Etkinlikte de tanıtılan PaLM 2'nin daha güçlü bir halefi olarak konumlandırıldı.[2]

Google CEO'su Sundar Pichai, Gemini'nin hâlâ erken gelişim aşamalarında olduğunu açıklamıştı. Diğer LLM'lerden farklı olarak Gemini'nin, yalnızca bir metin külliyatı üzerinde eğitilmemesi ve çok modlu olacak şekilde tasarlanması nedeniyle benzersiz olduğu söyleniyordu; bu, metin, resimler, ses, video ve bilgisayar kodları da dahil olmak üzere birden fazla veri türünü aynı anda işleyebileceği anlamına geliyordu.[3]

Google DeepMind olarak birleştirilen Google'ın iki kolu olan DeepMind ve Google Brain arasındaki işbirliğiyle geliştirildi[4][5] DeepMind CEO'su Demis Hassabis, Wired ile yaptığı bir röportajda, Gemini'nin gelişmiş yeteneklerinin övgüsünü yaptı; bu yeteneklerin, algoritmanın, Google'ın LaMDA ve Bard ile birlikte artan popülaritesine agresif bir şekilde meydan okuyan OpenAI'nin GPT-4 üzerinde çalışan ChatGPT'sini geride bırakmasına olanak sağlayacağına inandığını söyledi.[4][6]

Hassabis, 2016 yılında Go şampiyonu Lee Sedol'u yenerek dünya çapında ilgi gören DeepMind'ın AlphaGo programının güçlü yönlerini vurguladı ve Gemini'nin AlphaGo ve diğer Google – DeepMind LLM'lerin gücünü birleştireceğini açıkladı.[7]

Ağustos 2023'te The Information'ın yaptığı açıklamada Google, çoğu LLM'de bulunan konuşma metni yeteneklerini birleştirerek OpenAI ve diğer rakiplerini geçmeyi umuyordu. Yapay zeka destekli görüntü oluşturma özelliği, bağlamsal görüntüler oluşturmasına ve daha geniş bir kullanım senaryosuna uyarlanmasına olanak tanıyor.[8] Bard gibi[9] Google'ın kurucu ortağı Sergey Brin ise, Google Brain ve DeepMind'dan yüzlerce diğer eski mühendislerle birlikte Gemini'nin geliştirilmesine yardımcı olmak üzere emeklilikten çağrılıp Gemini'ye katkıda bulunan kişiler olarak anılmıştır.[10] Gemini, YouTube videolarının transkriptleri konusunda eğitim aldığından, adil kullanım materyalleri filtrelemek için deneyimli avukatlar çağrıldı.[8]

Lansman

6 Aralık 2023'te Pichai ve Hassabis, sanal bir basın toplantısında "Gemini 1.0"ı duyurdu. Üç modelden oluşuyordu: Gemini Ultra, "Son derece karmaşık görevler" için Gemini Pro, "çok çeşitli görevler" için ve Gemini nano ise “cihaz içi temel görevler" için kullanıcılara üç model sunuluyordu.[11] Lansman sırasında Gemini Pro ve Nano sırasıyla Pixel 8 akıllı telefonlara entegre edilecek, Gemini Ultra ise "Bard Advanced"ı güçlendirip geliştiriilerek sadece yazılım geliştiricileri için kullanımına sunulacak.[12]

Google'ın insan davranışlarını taklit etmek üzere tasarlanmış "en büyük ve en yetenekli yapay zeka modeli" olarak lanse edilen[13] Gemini'nin "kapsamlı güvenlik ihtiyacı" nedeniyle gelecek yıla kadar yaygın olarak kullanıma sunulmayacağını söyledi.[14]

Gemini, Google'ın Tensör İşleme Birimleri (TPU) üzerinde çalıştırılır ve bu birim tarafından desteklenir ve adı, NASA'nın Gemini Projesi'nin yanı sıra DeepMind-Google Brain birleşmesine de bir göndermedir[15] Gemini Ultra'nın çeşitli endüstri karşılaştırmada ise GPT-4, Anthropic'in Claude 2'si, Inflection AI'nin Inflection-2'sinden, Meta'nın LLaMA 2'sinden ve xAI'nin Grok 1'inden daha iyi performans gösterdiği söyleniyor.[16] Gemini Pro ise diğerlerinden daha iyi bir performans gösterdiği saptandı. Gemini Ultra aynı zamanda insan uzmanlardan daha iyi performans gösteren ilk dil modeliydi ve 57 konuluk Massive Multitask Language Understanding (MMLU) testinde 100 üzerinden 90 puan aldı.[17]

Gemini Pro, 13 Aralık'ta AI Studio ve Vertex AI aracılığıyla Google Cloud müşterilerinin kullanımına sunulacak, Gemini Nano ise Android geliştiricilerinin kullanımına sunulacak.[18]

Hassabis ayrıca DeepMind'ın Gemini'nin "dünyayla fiziksel etkileşime geçmek için robotikle nasıl birleştirilebileceğini" araştırdığını açıkladı.[19]

Google, ABD tarafından imzalanan idari emir uyarınca Gemini Ultra'nın test sonuçlarını ABD federal hükûmetiyle paylaşacağını belirtti. Başkan Joe Biden Ekim ayında. Benzer şekilde şirket, Kasım ayında Bletchley Park'ta düzenlenen Yapay Zeka Güvenlik Zirvesi'nde ortaya konan ilkelere uymak için Birleşik Krallık hükûmetiyle görüşmelerde bulunuyor.[3]

Güncellemeler

Google, Ocak 2024'te Gemini Nano ve Gemini Pro'yu Galaxy S24 akıllı telefon serisine entegre etmek için Samsung ile anlaşmıştı.[20]

Önceki ay Google, 1.0 Ultra'dan daha güçlü ve yetenekli bir model olarak konumlanan "Gemini 1.5"i sınırlı versiyon ile piyasaya sürdü.. Aynı ay Google, Gemini'nin lite versiyonu diye tabir edilen ücretsiz ve açık kaynaklı Gemma'yı piyasaya sürdü.[21]

Ayrıca bakınız

Kaynakça

  1. ^ a b "Where you can use Bard". Google Support. 12 Mayıs 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 13 Temmuz 2023. 
  2. ^ "Every major AI feature announced at Google I/O 2023". ZDNET (İngilizce). 10 Mayıs 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  3. ^ a b Milmo, Dan; editor, Dan Milmo Global technology (6 Aralık 2023). "Google says new AI model Gemini outperforms ChatGPT in most tests". The Guardian (İngilizce). ISSN 0261-3077. 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  4. ^ a b Levy, Steven. "Sundar Pichai on Google's AI, Microsoft's AI, OpenAI, and … Did We Mention AI?". Wired (İngilizce). ISSN 1059-1028. 11 Eylül 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  5. ^ "About Google DeepMind". Google DeepMind (İngilizce). 17 Nisan 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  6. ^ "Google's Bard builds on controversial LaMDA bot that engineer called 'sentient'". ZDNET (İngilizce). 5 Eylül 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  7. ^ Knight, Will. "Google DeepMind CEO Demis Hassabis Says Its Next Algorithm Will Eclipse ChatGPT". Wired (İngilizce). ISSN 1059-1028. 26 Haziran 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  8. ^ a b "The forced marriage at the heart of Google's AI race". The Information. 15 Ağustos 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  9. ^ "Google ChatGPT artifical intelligence". Nytimes. 20 Ocak 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Ocak 2023. 
  10. ^ Seetharaman, Miles Kruppa and Deepa. "WSJ News Exclusive | Sergey Brin Is Back in the Trenches at Google". WSJ (İngilizce). 21 Temmuz 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  11. ^ Kruppa, Miles. "Google Announces AI System Gemini After Turmoil at Rival OpenAI". WSJ (İngilizce). 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  12. ^ Edwards, Benj (6 Aralık 2023). "Google launches Gemini—a powerful AI model it says can surpass GPT-4". Ars Technica (İngilizce). 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  13. ^ Thorbecke, Brian Fung, Catherine (6 Aralık 2023). "Google launches Gemini, its most-advanced AI model yet, as it races to compete with ChatGPT | CNN Business". CNN (İngilizce). 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  14. ^ "Google launches Gemini, upping the stakes in the global AI race - CBS San Francisco". www.cbsnews.com (İngilizce). 6 Aralık 2023. 7 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  15. ^ Pierce, David (6 Aralık 2023). "Google launches Gemini, the AI model it hopes will take down GPT-4". The Verge (İngilizce). 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  16. ^ "Google DeepMind Unveils Its Most Powerful AI Offering Yet". TIME (İngilizce). 6 Aralık 2023. 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  17. ^ Knight, Will. "Google Just Launched Gemini, Its Long-Awaited Answer to ChatGPT". Wired (İngilizce). ISSN 1059-1028. 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  18. ^ "Google Opens Access to Gemini, Racing to Catch Up to OpenAI". Bloomberg.com (İngilizce). 6 Aralık 2023. 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  19. ^ Knight, Will. "Google DeepMind's Demis Hassabis Says Gemini Is a New Breed of AI". Wired (İngilizce). ISSN 1059-1028. 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  20. ^ Chokkattu, Julian. "Samsung's Galaxy S24 Phones Call on Google's AI to Spruce Up Their Smarts". Wired (İngilizce). ISSN 1059-1028. 29 Şubat 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  21. ^ "Google Delves Deeper Into Open Source with Launch of Gemma AI Model". Bloomberg.com (İngilizce). 21 Şubat 2024. 21 Şubat 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 

İlgili Araştırma Makaleleri

OpenAI, ABD merkezli yapay zekâ araştırma şirketi. Şirketin genel amacı insanlığa fayda sağlayabilecek yapay zekâ hakkında araştırma yapmaktır. 2015 yılının sonlarında San Francisco'da kurulan şirket, patentlerini ve araştırmalarını halka açık hale getirerek diğer kurum ve araştırmacılarla “serbest iş birliği yapmayı” amaçlamaktadır. Elon Musk ve Sam Altman, yapay genel zekâdan kaynaklanan varoluşsal risk endişelerinden dolayı bu şirketi kurduklarını açıklamıştır. Organizasyon 2015 yılında Sam Altman, Reid Hoffman, Jessica Livingston, Elon Musk, Ilya Sutskever, Peter Thiel ve diğerleri tarafından San Francisco’da kurulmuş ve toplamda 1 milyar dolar bağışta bulunulmuşlardır. Musk 2018 yılında yönetim kurulundan istifa etmiş ancak bağışçı olarak kalmıştır. Microsoft 2019 yılında OpenAI LP’ye 1 milyar dolarlık bir yatırım sağlamış ve Ocak 2023’te ikinci birçok yıllık yatırım sağlamıştır; bu ikinci yatırımın 10 milyar dolar olduğu bildirilmektedir. ChatGPT yazılı cevap veren botun yapımı da OpenAI’a aittir.

<span class="mw-page-title-main">Google DeepMind</span>

DeepMind Technologies, Alphabet Inc.'in bir yan kuruluşu olup, 2010'da kurulmuş bir İngiliz yapay zekâ program geliştirme şirketidir. DeepMind, 2014'te Google tarafından satın alınmıştır. Şirketin merkezi Londra'dadır ve Kanada, Fransa ve Amerika Birleşik Devletleri'nde araştırma merkezleri bulunmaktadır. 2015'te, Google'ın ana şirketi olan Alphabet Inc.'in tamamına sahip olduğu bir yan kuruluş oldu.

<span class="mw-page-title-main">ChatGPT</span> OpenAI tarafından geliştirilen yapay zekâ sohbet robotu

ChatGPT, OpenAI tarafından geliştirilen ve diyalog konusunda uzmanlaşmış bir yapay zeka sohbet botudur. Bu chatbot, denetimli ve takviyeli öğrenme teknikleriyle ince ayar yapılmış büyük bir dil modeline dayanır. ChatGPT'nin ilk versiyonu, GPT-3 temelli idi ve daha sonra gelişmiş sürümleri olan GPT-3.5 ve 14 Mart 2023'te GPT-4 ile güncellenmiştir ve ChatGPT Plus kullanıcıları için kullanılabilir durumdadır.

GPT-4, OpenAI tarafından oluşturulan çok modlu büyük bir dil modelidir. GPT serisinin dördüncüsüdür. 14 Mart 2023’te yayınlanmıştır ve API aracılığıyla ve ChatGPT Plus kullanıcıları için kullanılabilir olacaktır. Microsoft, GPT kullanan Bing sürümlerinin resmi yayınlanmadan önce aslında GPT-4 kullandığını doğruladı.

<span class="mw-page-title-main">Gemini</span> yapay zeka sohbet botu

Gemini ya da eski adıyla Bard, Google AI tarafından geliştirilen ve 21 Mart 2023'te yayınlanan bir sohbet robotudur. Google'ın LaMDA dil ailesini kullanan Gemini; şu anda 200'den fazla ülkede yayın yapmakta, 40'tan fazla dilde kullanılabilmektedir.

<span class="mw-page-title-main">Üretken yapay zekâ</span>

Üretken yapay zekâ, bilgisayar sistemlerinin metin, görüntü, ses gibi farklı veri türlerini işleyerek orijinal içerik oluşturmasına yarayan bir yapay zekâ teknolojisi dalıdır.

<span class="mw-page-title-main">Grok</span> xAI tarafından geliştirilen Chatbot programı

Grok, xAI tarafından geliştirilen ve büyük dil modellerine (LLM'ler) dayanan, konuşmaya dayalı, üretken bir yapay zeka sohbet robotudur. OpenAI'nin ChatGPT'sinin yükselişine doğrudan yanıt olarak Elon Musk tarafından bir girişim olarak geliştirilmiştir. Chatbot'un "mizah anlayışına sahip" olduğu ve Twitter'a (X) doğrudan erişim sağladığı belirtilmiştir.

<span class="mw-page-title-main">Yapay zeka patlaması</span>

Yapay Zeka Patlaması, veya Yapay Zeka Baharı, yapay zeka alanında çok hızlı bir şekilde devam eden ilerleme dönemidir. Öne çıkan örnekler arasında Google DeepMind ve OpenAI gibi laboratuvarlar tarafından yürütülen üretken yapay zekalar yer almaktadır.

Açık kaynaklı yapay zeka, açık kaynak yaklaşımının yapay zeka geliştirme alanında uygulanmasıdır.

<span class="mw-page-title-main">Önceden eğitilmiş üretken dönüştürücü</span> büyük dil modeli çeşidi

Önceden eğitilmiş üretken dönüştürücü ya da özgün İngilizce adının kısaltmasıyla GPT, bir tür geniş dil modeli ve Üretken yapay zekâ için öne çıkan bir çerçevedir. Doğal dil işleme görevlerinde kullanılan yapay sinir ağlarından oluşur. GPT'ler dönüştürücü mimarisine dayanır, etiketlenmemiş metinlerden oluşan büyük veri setleri üzerinde önceden eğitilmiştir ve insan benzeri yeni içerikler üretebilir. 2023 itibarıyla, çoğu LLM bu özelliklere sahiptir ve bazen genel olarak GPT'ler olarak anılırlar.

Microsoft Copilot, Microsoft tarafından geliştirilen ve 7 Şubat 2023'te piyasaya sürülen bir sohbet robotudur. Geniş bir dil yelpazesini esas alarak kaynak gösterme, şiir ve şarkı yazma işlemlerini yapabilir.

Claude, Anthropic tarafından geliştirilen geniş kapsamlı dil modelleri ailesidir. İlk model Mart 2023'te piyasaya sürüldü. Mart 2024'te çıkan Claude 3 ise görselleri de analiz edebiliyor.

Ermira "Mira" Murati, Arnavut mühendis, araştırmacı ve teknoloji yöneticisidir. 2018 yılından bu yana OpenAI'ın Baş Teknoloji Yöneticisi (CTO) olarak görev yapmaktadır.

GPT-4o, OpenAI tarafından oluşturulan çok dilli, çok modlu, önceden eğitilmiş üretken dönüştürücüdür. OpenAI CTO'su Mira Murati önderliğinde 13 Mayıs 2024 tarihinde gerçekleştirilen canlı yayında duyurulmuş ve aynı gün yayınlanmıştır. GPT-4o ücretsiz olmakla birlikte, ChatGPT Plus aboneleri için 5 kat daha fazla kullanım limitine sahiptir. Metin, görüntü ve ses işleyebilmekte ve üretebilmektedir. API'si önceki GPT-4 Turbo'ya kıyasla iki kat daha hızlı ve yarı fiyatınadır.

Anthropic PBC, 2021 yılında kurulmuş ABD merkezli bir yapay zeka startup şirketi. Şirket, yapay zeka güvenliği ve güvenilirliği üzerine araştırmalar yapmakta ve bu araştırmaları genel kullanım için güvenli ve sağlam modeller geliştirmek için kullanmaktadır. Anthropic, OpenAI'ın ChatGPT ve Google'ın Gemini modellerine rakip olarak Claude adlı bir dizi geniş dil modelleri (LLM) geliştirmiştir.

<span class="mw-page-title-main">Demis Hassabis</span>

Demis Hassabis,, Britanyalı bilgisayar bilimcisi, yapay zekâ araştırmacısı ve girişimcisi. Google DeepMind ve Isomorphic Labs kurucu ortağı ve CEO'su olup aynı zamanda Birleşik Krallık Hükûmeti'nin yapay zekâ danışmanı olarak görev yapmaktadır. Kariyerinin başlarında video oyunu yapay zekâ programcısı ve tasarımcısıydı ve uzman bir masa oyunları oyuncusuydu.

<span class="mw-page-title-main">Greg Brockman</span> araştırmacı

Greg Brockman, OpenAI kurucu ortağı Amerikalı girişimci, yatırımcı ve yazılım geliştirici. Şu anda OpenAI'ın başkanlık görevini yürütmektedir. Kariyerine 2010 yılında Stripe'da başlamış ve MIT'den ayrıldıktan sonra bu şirkette çalışmaya başlamıştır. 2013 yılında Stripe'ın CTO'su olmuştur. 2015 yılında Stripe'tan ayrılarak OpenAI'ı kurmuş ve burada da CTO rolünü üstlenmiştir.

<span class="mw-page-title-main">SearchGPT</span>

SearchGPT, OpenAI tarafından geliştirilen bir prototip arama motoru. 26 Temmuz 2024'te piyasaya sürülen bu prototip, geleneksel arama motoru özelliklerini üretken yapay zekâ yetenekleriyle birleştirmektedir. Bu arama özelliği, OpenAI'yi büyük arama motorlarına, özellikle de Google ve Bing gibi büyük rakiplerin doğrudan karşısına koymaktadır; Bing, OpenAI'nin en büyük yatırımcısı olan Microsoft'un bir ürünüdür. SearchGPT ilk olarak 10.000 test kullanıcısına sınırlı bir sürüm olarak tanıtılmıştır. OpenAI, nihai hedef olarak arama özelliklerini ChatGPT'ye entegre etmeyi planlamaktadır.

Ilya Sutskever, Kanadalı makine öğrenimi araştırmacısı ve bilgisayar bilimci.

o1, OpenAI tarafından geliştirilen ve çok adımlı problemleri analiz edebilme yeteneğine sahip önceden eğitilmiş üretken dönüştürücü yapay zekâ modeli. 12 Eylül 2024 tarihinde duyurulmuştur.