İçeriğe atla

Hugging Face

Hugging Face, Inc.
TipÖzel
EndüstriYapay zeka, makine öğrenimi, yazılım geliştirme
Kuruluş2016 (8 yıl önce) (2016)
Genel merkeziManhattan, New York City
Hizmet alanlarıDünya çapında
Önemli kişiler
  • Clément Delangue (CEO)
  • Julien Chaumond (CTO)
  • Thomas Wolf (CSO)
ÜrünModeller, veri kümeleri, alanlar
Çalışan sayısı170
Web sitesihuggingface.co

Hugging Face, Inc., bir Fransız-Amerikan şirketi.[1]. New York City merkezli olan şirket, makine öğrenimi kullanarak uygulamalar geliştirmek için hesaplama araçları sağlayan bir platform geliştirmektedir. Şirket, özellikle doğal dil işleme uygulamaları için geliştirilen transformer kütüphaneleri ile ve kullanıcıların makine öğrenimi modellerini, veri setlerini paylaşabildikleri ve çalışmalarını sergileyebildikleri platformuyla bilinmektedir.

Tarihçe

Şirket, 2016 yılında Fransız girişimciler Clément Delangue, Julien Chaumond ve Thomas Wolf tarafından New York City'de, başlangıçta gençlere yönelik bir chatbot uygulaması geliştiren bir şirket olarak kuruldu[2]. Şirket, adını "hugging face" emoji'sinden almıştır[2]. Chatbotun arkasındaki modeli açık kaynaklı hale getirdikten sonra, şirket dönüşüm geçirerek makine öğrenimi platformuna odaklanmıştır.

Mart 2021'de Hugging Face, bir Seri B finansman turunda 40 milyon dolar topladı.[3]

28 Nisan 2021'de şirket, birkaç araştırma grubu ile işbirliği yaparak açık bir geniş dil modeli yayınlamak amacıyla BigScience Araştırma Atölyesi'ni başlattı.[4] 2022'de atölye, 176 milyar parametreli çokdilli büyük bir dil modeli olan BLOOM'un duyurusuyla sona erdi.[5][6]

Aralık 2022'de şirket, Python dilinde makine öğrenimi uygulamaları geliştirmek için oluşturulmuş açık kaynaklı bir kütüphane olan Gradio'yu satın aldı.[7]

5 Mayıs 2022'de, şirket Coatue ve Sequoia tarafından yönetilen Seri C finansman turunu duyurdu.[8] Şirket, 2 milyar dolar değerleme kazandı.

3 Ağustos 2022'de, şirket halka açık Hugging Face Hub'ın kurumsal versiyonu olan ve SaaS veya on-premises dağıtımını destekleyen Private Hub'ı duyurdu.[9]

Şubat 2023'te, şirket Amazon Web Services (AWS) ile ortaklık kurduğunu duyurdu. Bu ortaklık, Hugging Face ürünlerinin AWS müşterilerine, özel uygulamalarını oluşturmak için yapı taşları olarak kullanılmasına olanak tanıyacak. Şirket ayrıca, BLOOM'un bir sonraki neslinin AWS tarafından geliştirilen özel bir makine öğrenimi çipi olan Trainium üzerinde çalışacağını belirtti.[10][11][12]

Ağustos 2023'te, şirket 235 milyon dolar tutarında bir Seri D finansmanı topladığını ve değerlemesinin 4,5 milyar dolara ulaştığını duyurdu. Finansman, Salesforce tarafından yönetildi ve önemli katkılar Google, Amazon, Nvidia, AMD, Intel, IBM ve Qualcomm gibi teknoloji devlerinden geldi.[13]

Haziran 2024'te, şirket Meta ve Scaleway ile birlikte Avrupa startup'ları için yeni bir Yapay zekâ hızlandırıcı programı başlattığını duyurdu. Bu girişim, startup'ların açık temel modelleri ürünlerine entegre etmelerine yardımcı olmayı ve AB Yapay zekâ ekosistemini hızlandırmayı hedefliyor. Paris'teki STATION F'te yer alacak program, Eylül 2024'ten Şubat 2025'e kadar sürecek. Seçilen startup'lar mentorluk alacak, Yapay zekâ modellerine ve araçlarına erişim sağlayacak ve Scaleway'in hesaplama gücünden yararlanacak.[14]

Hizmetler ve Teknolojiler

Transformers Kütüphanesi

Transformers kütüphanesi, metin, görüntü ve ses görevleri için açık kaynak kodlu transformer modellerinin uygulamalarını içeren bir Python paketidir. PyTorch, TensorFlow ve JAX derin öğrenme kütüphaneleri ile uyumludur ve BERT ve GPT-2 gibi önemli modellerin uygulamalarını içerir.[15] Kütüphanenin ilk adı "pytorch-pretrained-bert"[16] olarak verilmiş, ardından "pytorch-transformers" olarak değiştirilmiş ve nihayetinde "transformers" olarak adlandırılmıştır.

Bir JavaScript versiyonu (transformers.js[17]) de geliştirilmiştir ve bu versiyon, modelleri doğrudan tarayıcıda çalıştırmayı sağlar.

Hugging Face Hub

Hugging Face Hub, aşağıdakileri barındıran merkezi bir web hizmeti platformudur:[18]

Git tabanlı kod havuzları, projeler için tartışmalar ve çekme istekleri dahil; modeller, ayrıca Git tabanlı sürüm kontrolü ile; veri kümeleri, genellikle metin, görüntü ve ses içerir; web uygulamaları ("spaces" ve "widgets"), makine öğrenimi uygulamalarının küçük ölçekli gösterimleri için tasarlanmıştır. Farklı modalitelerde yaygın görevleri destekleyen birçok önceden eğitilmiş model bulunmaktadır, örneğin:

  • Doğal Dil İşleme: metin sınıflandırma, adlandırılmış varlık tanıma, soru yanıtlama, dil modelleme, özetleme, çeviri, çoktan seçmeli ve metin üretimi.
  • Bilgisayarlı Görü: görüntü sınıflandırma, nesne tanıma ve segmentasyon.
  • Ses: otomatik konuşma tanıma ve ses sınıflandırma.

Diğer Kütüphaneler

Transformers ve Hugging Face Hub'a ek olarak, Hugging Face ekosistemi, diğer görevler için çeşitli kütüphaneler içerir; örneğin veri kümesi işleme ("Datasets"), model değerlendirme ("Evaluate") ve makine öğrenimi gösterimleri ("Gradio").[19]

Ayrıca Bakınız

Kaynaklar

  1. ^ "Terms of Service – Hugging Face". huggingface.co. 5 Haziran 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 24 Mayıs 2024. 
  2. ^ a b "Hugging Face wants to become your artificial BFF". TechCrunch (İngilizce). 9 Mart 2017. 25 Eylül 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Eylül 2023. 
  3. ^ "Hugging Face, doğal dil işleme kütüphanesi için 40 milyon dolar topladı". 11 Mart 2021. 28 Temmuz 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 5 Ağustos 2022. 
  4. ^ "BigScience içinde güçlü bir açık dil modeli inşa etme arayışı". 10 Ocak 2022. 1 Temmuz 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 5 Ağustos 2022. 
  5. ^ "BLOOM". bigscience.huggingface.co. 14 Kasım 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Ağustos 2022. 
  6. ^ "AI'nin demokratikleştirilmesine yönelik radikal bir yeni proje içinde". MIT Technology Review (İngilizce). 4 Aralık 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 25 Ağustos 2023. 
  7. ^ Nataraj, Poornima (23 Aralık 2021). "Hugging Face, Python için özelleştirilebilir UI bileşenleri kütüphanesi Gradio'yu Satın Aldı". Analytics India Magazine (İngilizce). 23 Aralık 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 26 Ocak 2024. 
  8. ^ Cai, Kenrick. "The $2 Billion Emoji: Hugging Face Wants To Be Launchpad For A Machine Learning Revolution". Forbes (İngilizce). 3 Kasım 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Ağustos 2022. 
  9. ^ "Introducing the Private Hub: A New Way to Build With Machine Learning". huggingface.co. 14 Kasım 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Ağustos 2022. 
  10. ^ Bass, Dina (21 Şubat 2023). "Amazon's Cloud Unit Partners With Startup Hugging Face as AI Deals Heat Up". Bloomberg News. 22 Mayıs 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 22 Şubat 2023. 
  11. ^ Nellis, Stephen (21 Şubat 2023). "Amazon Web Services pairs with Hugging Face to target AI developers". Reuters. 30 Mayıs 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 22 Şubat 2023. 
  12. ^ "AWS and Hugging Face collaborate to make generative AI more accessible and cost efficient | AWS Machine Learning Blog". aws.amazon.com (İngilizce). 21 Şubat 2023. 25 Ağustos 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 25 Ağustos 2023. 
  13. ^ Leswing, Kif (24 Ağustos 2023). "Google, Amazon, Nvidia and other tech giants invest in AI startup Hugging Face, sending its valuation to $4.5 billion". CNBC (İngilizce). 24 Ağustos 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 24 Ağustos 2023. 
  14. ^ "META Collaboration Launches AI Accelerator for European Startups". Yahoo Finance (İngilizce). 25 Haziran 2024. 11 Temmuz 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Temmuz 2024. 
  15. ^ "🤗 Transformers". huggingface.co. 27 Eylül 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Ağustos 2022. 
  16. ^ "First release". GitHub. 17 Kasım 2018. 30 Nisan 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Mart 2023. 
  17. ^ "xenova/transformers.js". GitHub. 7 Mart 2023 tarihinde kaynağından arşivlendi. 
  18. ^ "Hugging Face Hub documentation". huggingface.co. 20 Eylül 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Ağustos 2022. 
  19. ^ "Hugging Face - Documentation". huggingface.co. 30 Eylül 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 18 Şubat 2023. 

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Makine öğrenimi</span> algoritmaların ve istatistiksel modellerin kullanımıyla bilgisayarların yapacakları işleri kendileri çözebilmeleri

Makine öğrenimi (ML), veriden öğrenebilen ve görünmeyen verilere genelleştirebilen ve dolayısıyla açık talimatlar olmadan görevleri yerine getirebilen istatistiksel algoritmaların geliştirilmesi ve incelenmesiyle ilgilenen, yapay zekâda akademik bir disiplindir. Makine öğrenimi, bilgisayarların deneyimlerinden öğrenerek karmaşık görevleri otomatikleştirmeyi sağlayan bir yapay zeka alanıdır. Bu, veri analizi yaparak örüntüler tespit etme ve tahminlerde bulunma yeteneğine dayanır. Son zamanlarda yapay sinir ağları, performans açısından önceki birçok yaklaşımı geride bırakmayı başardı.

<span class="mw-page-title-main">GitHub</span> sürüm kontrol sistemi olarak Git kullanan yazılım geliştirme projeleri için ağ tabanlı bir depolama servisi

GitHub, sürüm kontrol sistemi olarak Git kullanan yazılım geliştirme projeleri için web tabanlı bir depolama servisidir. 8 Şubat 2008 tarihinde Tom Preston-Werner, Chris Wanstrath, P. J. Hyett, Scott Chacon tarafından kuruldu. GitHub özel depolar için ücretli üyelik seçenekleri sunarken, açık kaynaklı projeler için ücretsizdir. Mayıs 2011 itibarıyla GitHub açık kaynaklı projeler tarafından tercih edilen en popüler depolama servisidir.

Kitle fonlaması, çok sayıda bireyin küçük miktarda bağışlarına dayanan yeni nesil bir yatırım ve fonlama sistemidir. Bu sistemde, bireyler kitle fonlama platformu internet sitesi üzerinden bağış yapar, küçük bir hisse satın alır ya da üretilecek ilk ürünler karşılığı ödeme yapar.

OpenAI, ABD merkezli yapay zekâ araştırma şirketi. Şirketin genel amacı insanlığa fayda sağlayabilecek yapay zekâ hakkında araştırma yapmaktır. 2015 yılının sonlarında San Francisco'da kurulan şirket, patentlerini ve araştırmalarını halka açık hale getirerek diğer kurum ve araştırmacılarla “serbest iş birliği yapmayı” amaçlamaktadır. Elon Musk ve Sam Altman, yapay genel zekâdan kaynaklanan varoluşsal risk endişelerinden dolayı bu şirketi kurduklarını açıklamıştır. Organizasyon 2015 yılında Sam Altman, Reid Hoffman, Jessica Livingston, Elon Musk, Ilya Sutskever, Peter Thiel ve diğerleri tarafından San Francisco’da kurulmuş ve toplamda 1 milyar dolar bağışta bulunulmuşlardır. Musk 2018 yılında yönetim kurulundan istifa etmiş ancak bağışçı olarak kalmıştır. Microsoft 2019 yılında OpenAI LP’ye 1 milyar dolarlık bir yatırım sağlamış ve Ocak 2023’te ikinci birçok yıllık yatırım sağlamıştır; bu ikinci yatırımın 10 milyar dolar olduğu bildirilmektedir. ChatGPT yazılı cevap veren botun yapımı da OpenAI’a aittir.

PyTorch, Torch kütüphanesine dayanan açık kaynaklı bir makine öğrenme kütüphanesidir, bilgisayarla görme ve doğal dil işleme gibi uygulamalar için kullanılır. Öncelikle Facebook'un AI Araştırma laboratuvarı (FAIR) tarafından geliştirilmiştir. Değiştirilmiş BSD lisansı ile piyasaya sürülen ücretsiz ve açık kaynaklı bir yazılımdır. Python arabirimi daha öne çıkan ve geliştirmenin birincil odağı olmasına rağmen, PyTorch'un bir C ++ arabirimi de vardır.

<span class="mw-page-title-main">TensorFlow</span>

TensorFlow, makine öğrenimi için ücretsiz ve açık kaynaklı bir yazılım kütüphanesidir. Bir dizi görevde kullanılabilir, ancak derin sinir ağlarının eğitimi ve çıkarımına özel olarak odaklanmaktadır.

Generative Pre-trained Transformer 3 kısaca GPT-3, insanların yazdığı metinlere benzer içerik üretmek için derin öğrenmeyi kullanan özbağlanımlı dil modelidir. GPT-n serisindeki üçüncü nesil dil tahmin modeli olan GPT-3, San Francisco merkezli yapay zeka araştırma laboratuvarı OpenAI tarafından geliştirilmiştir. GPT-3'ün tam sürümü, veri işleyecek 175 milyar parametreye sahiptir. Bu rakam GPT-2'nin öğrenme kapasitesinin 2 katıdır. 14 Mayıs 2020'de tanıtılan ve Temmuz 2020 itibarıyla beta aşamasında olan GPT-3, önceden öğretilmiş dil örnekleriyle doğal dil işleme (NLP) sistemini kullanmaktadır. GPT-3'ün piyasaya sürülmesinden önce, en büyük dil modeli Microsoft'un Şubat 2020'de tanıttığı ve GPT-3'ün %10'undan daha az kapasiteye sahip olan Turing NLG idi.

<span class="mw-page-title-main">Cloud9 IDE</span>

Cloud9 IDE, sürüm 2.0'dan sürüm 3.0'a kadar açık kaynak olarak yayınlanan bir Çevrimiçi IDE'dir. C, C++, PHP, Ruby, Perl, Python, Node.js ile JavaScript ve Go gibi birçok programlama dilini destekler.

Semantic Scholar, Allen Yapay Zeka Enstitüsü'nde geliştirilen ve Kasım 2015'te halka açık olarak yayınlanan bilimsel literatür için yapay zekâ destekli bir araştırma aracıdır. Bilimsel makaleler için özetler sağlamak üzere doğal dil işlemedeki gelişmeleri kullanır. Semantic Scholar ekibi, yapay zekanın doğal dil işleme, makine öğrenimi, İnsan-bilgisayar etkileşimi ve bilgi çekme alanlarında kullanımını aktif olarak araştırmaktadır.

GitHub Copilot, kullanıcıların kod yazma sürecinde yardımcı olan bulut tabanlı bir yapay zeka aracıdır. GitHub ve OpenAI tarafından geliştirilen araç, Visual Studio Code, Visual Studio, Neovim ve diğer entegre geliştirme ortamlarının (IDE'ler) kullanıcılarına destek vermek için tasarlanmıştır. GitHub Copilot, teknik önizleme için 29 Haziran 2021'de duyurulmuş ve daha sonra JetBrains pazarında bir eklenti olarak yayınlanmıştır. GitHub, Copilot'un kullanıcıların belgeleri okumak için harcadıkları süreyi azaltarak programcıların bilmedikleri kodlama çerçevelerinde ve dillerinde gezinmelerine olanak tanıdığını belirtmektedir.

<span class="mw-page-title-main">Mustafa Süleyman</span> Britanyalı girişimci ve aktivist

Mustafa Süleyman CBE, Google tarafından satın alınan ve şu anda Alphabet'in sahibi olduğu bir yapay zeka şirketi olan DeepMind'ın kurucu ortağı ve eski uygulamalı yapay zeka başkanıdır. Şu anki girişimi Inflection AI'dir.

Cloudera, Inc., kurumsal veri yönetimi ve analitik platformu hizmeti sunan bir Amerikan yazılım şirketidir. Platform; AWS, Azure ve GCP'nin yanı sıra özel bir bulutta da çalışabilir. Kullanıcıların; bulut tabanlı yazılım veya donanım kullanarak data depolamasını ve analiz etmesini sağlar. Cloudera; veri dağıtımı, veri mühendisliği, veri ambarı, işlem verileri, veri akışı, veri bilimi ve makine öğrenimi için bulut tabanlı analitik araçları sunar.

Mistral AI, Fransa merkezli yapay zeka araştırma şirketi. Şirket, Nisan 2023 tarihinde Meta ve Google'da önceki görevlerinden ayrılan araştırmacılar Artur Mensch, Timothée Lacroix ve Guillaume Lample tarafından kurulmuştur. Ekim 2023'te yaklaşık 415 milyon dolar toplayan şirket aralık 2023'te, 2 milyar doların üzerinde bir değerlenme elde etmiştir.

Açık kaynaklı yapay zeka, açık kaynak yaklaşımının yapay zeka geliştirme alanında uygulanmasıdır.

LangChain, geniş dil modelleri (LLM) kullanarak uygulamaların oluşturulmasını basitleştirmek için tasarlanmış bir yazılım iskeletidir.

<span class="mw-page-title-main">Önceden eğitilmiş üretken dönüştürücü</span> büyük dil modeli çeşidi

Önceden eğitilmiş üretken dönüştürücü ya da özgün İngilizce adının kısaltmasıyla GPT, bir tür geniş dil modeli ve Üretken yapay zekâ için öne çıkan bir çerçevedir. Doğal dil işleme görevlerinde kullanılan yapay sinir ağlarından oluşur. GPT'ler dönüştürücü mimarisine dayanır, etiketlenmemiş metinlerden oluşan büyük veri setleri üzerinde önceden eğitilmiştir ve insan benzeri yeni içerikler üretebilir. 2023 itibarıyla, çoğu LLM bu özelliklere sahiptir ve bazen genel olarak GPT'ler olarak anılırlar.

Anthropic PBC, 2021 yılında kurulmuş ABD merkezli bir yapay zeka startup şirketi. Şirket, yapay zeka güvenliği ve güvenilirliği üzerine araştırmalar yapmakta ve bu araştırmaları genel kullanım için güvenli ve sağlam modeller geliştirmek için kullanmaktadır. Anthropic, OpenAI'ın ChatGPT ve Google'ın Gemini modellerine rakip olarak Claude adlı bir dizi geniş dil modelleri (LLM) geliştirmiştir.

Figure AI, Inc., ABD merkezli bir robotik şirketi. Şirket, yapay zeka destekli insansı robotların geliştirilmesi konusunda çalışmalar yapmaktadır. Şirket, 2022 yılında, Archer Aviation ve Vettery'nin kurucusu Brett Adcock tarafından kurulmuştur. Figure AI'ın ekibi, robotik, yapay zeka, algılama, algı ve navigasyon gibi alanlarda uzmanlardan oluşmaktadır ve Boston Dynamics ve Tesla gibi önde gelen şirketlerden deneyimli kişileri bir arada tutmaktadır.

<span class="mw-page-title-main">Greg Brockman</span> araştırmacı

Greg Brockman, OpenAI kurucu ortağı Amerikalı girişimci, yatırımcı ve yazılım geliştirici. Şu anda OpenAI'ın başkanlık görevini yürütmektedir. Kariyerine 2010 yılında Stripe'da başlamış ve MIT'den ayrıldıktan sonra bu şirkette çalışmaya başlamıştır. 2013 yılında Stripe'ın CTO'su olmuştur. 2015 yılında Stripe'tan ayrılarak OpenAI'ı kurmuş ve burada da CTO rolünü üstlenmiştir.

Runway AI, Inc., New York City merkezli bir Amerikan şirketi. Üretken yapay zekâ alanında araştırma ve geliştirme üzerine kurulmuştur. Şirket, esas olarak video, görüntü ve çeşitli multimedya içerikleri üretmeye yönelik ürünler ve modeller geliştirmektedir. En dikkat çekici projeleri arasında metinden videoya üretken yapay zekâ modelleri olan Gen-1, Gen-2 ve Gen-3 Alpha yer almaktadır.