İçeriğe atla

Stable Diffusion

Stable Diffusion
Geliştirici(ler)CompVis grup LMU MMünih; Runway; Stability AI
İlk yayınlanma22 Ağustos, 2022
Güncel sürüm2.1 (model)[1] / 7 Aralık, 2022
Programlama diliPython
TürYazıdan Resme model
Resmî sitesistability.ai
Kod deposugithub.com/Stability-AI/stablediffusion

Stable Diffusion, 2022'de piyasaya sürülen bir derin öğrenme altyapılı bir metinden görüntüye (text-to-image) modelidir. Öncelikle metin açıklamalarına bağlı olarak ayrıntılı görüntüler oluşturmak için kullanılır, ancak görüntünün içeriğini değiştirmek ya da dışına genişletmek gibi diğer görevlerde de uygulanabilir.

Stable Diffusion, LMU Münih'teki CompVis grubu tarafından geliştirilen bir difüzyon modelidir. Model, EleutherAI ve LAION'un desteğiyle Stability AI, CompVis LMU ve Runway işbirliğiyle piyasaya sürüldü.[2] Ekim 2022'de Stability AI, Lightspeed Venture Partners ve Coatue Management liderliğindeki bir turda 101 milyon ABD doları yatırım aldı.[3]

Kullanım

Stable Diffusion, oluşturulan görüntüler üzerinde hiçbir hak iddia etmez ve kullanıcılara, görüntü içeriğinin yasa dışı olmaması koşuluyla, modelden oluşturulan tüm görüntülerin kullanım haklarını özgürce verir. Stable Diffusion ve diğer üretken modeller, sahibinin izni olmadan telif hakkıyla korunan görüntülerden eğitildiğinden, kullanıcılara görüntü kullanımı konusunda sağlanan özgürlük, mülkiyet etiği konusunda tartışmalıdır.

Kaynakça

  1. ^ "Stable Diffusion v2.1 and DreamStudio Updates 7-Dec 22". stability.ai. 7 Aralık 2022 tarihinde kaynağından arşivlendi. 
  2. ^ "Revolutionizing image generation by AI: Turning text into images". LMU Munich. 17 Eylül 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Eylül 2022. 
  3. ^ "Stability AI, the startup behind Stable Diffusion, raises $101M". Techcrunch (İngilizce). 17 Ekim 2022. 17 Ekim 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Ekim 2022.  Yazar |ad1= eksik |soyadı1= (yardım)

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Flickr</span>

Flickr, Şubat 2004'te Ludi corp tarafından kurulan ve 20 Mart 2005 tarihinde Yahoo tarafından 35 milyon dolara satın alınan bir internet sitesidir. Fotoğraf, video barındırma hizmeti ve paylaşma imkanı sunmaktadır.

<span class="mw-page-title-main">Google Drive</span> Dosya depolama ve senkronizasyon hizmeti

Google Drive, Google tarafından oluşturulmuş ve yönetilen bir dosya depolama ve senkronizasyon hizmetidir. Bu hizmet; kullanıcıların bulutta doküman depolayabilmelerini, dosya paylaşabilmelerini ve iş birliği yaptıkları kişilerle dokümanları düzenleyebilmelerini sağlar. Google Drive; dokümanların, elektronik tabloların, sunumların, çizimlerin, formların ve daha fazlasını iş birliği halinde düzenlenebilmesini sağlayan; Google Dokümanlar, E-Tablolar ve Slaytlar'dan oluşan bir ofis paketidir. Google Drive'da genele açık olarak paylaşılan dosyalar İnternet arama motorları tarafından aranabilir. Hizmete, diğer Google ürünleri gibi @gmail.com e-posta adreslerini kullanan bir Google Account hesabı ile kaydolmak mümkündür.

<span class="mw-page-title-main">Spaces (uygulama)</span>

Spaces Google tarafından geliştirilen grup tartışmaları ve mesajlaşma için özel bir çapraz-platform uygulamasıdır. Uygulama bir içerik paylaşım platformu olarak tasarlanmıştır. Kullanıcılar, bir "alan" yaratarak, tartışmaya kendi arkadaşlarını davet ederek ve videoları, görüntü, metin ve diğer medyayı paylaşabilirler. Böyle bir web tarayıcısı Google Chrome, arama motoru Google Arama ve video paylaşım platformu YouTube gibi Google hizmetleri uygulamaya yerleşik olarak kullanıcılara onlardan içeriği kaynak sağlamakta. Uygulamanın kullanımı 17 Nisan 2017'de sona ermiştir.

<span class="mw-page-title-main">Google Keep</span> not alma uygulaması

Google Keep Google tarafından geliştirilen bir not alma uygulamasıdır. 20 Mart 2013 tarihinde durdurulmuş Google Notebook'un yerine ilan edildi. Google Keep Android ve iOS mobil işletim sistemleri için bir mobil uygulama ile bir web uygulaması olarak kullanılabilir. Hizmete diğer Google ürünleri gibi, @gmail.com e-posta adreslerini kullanan bir Google Account hesabı ile kaydolmak mümkündür. Eylül 2015 itibarıyla, Google Play'de 50 milyondan fazla kez indirildi.

<span class="mw-page-title-main">Mac OS X Panther</span>

Mac OS X Panther, Apple tarafından üretilmiş ve piyasaya çıkarılmış dördüncü nesil bir Mac OS X işletim sistemidir. Sürüme bu kez büyük kedilerin bir türü olan Panthera ismi verildi. Apple 24 Ekim 2003 tarihinde Panther'i yayınladı. Sürümün güncellenmesi Apple Software Update yöntemi ile gerçekleşti. Safari web tarayıcısı da ilk kez bu sürümden başlayarak kullanılmaya başlandı.

<span class="mw-page-title-main">Bing Haritalar</span> Microsoft tarafından sunulan internet haritalama sistemi

Bing Haritalar Microsoft Bing paketinin bir parçası olarak bir web harita hizmeti arama motorudur. Bing Haritalar Platformu tarafından desteklenmektedir.

<span class="mw-page-title-main">Yığınlar (Mac OS)</span>

Yığınlar (ingilizce:Stacks) Apple'nin Mac OS X Leopard işletim sisteminde ilk bulunan bir özelliktir. Adından da anlaşılacağı gibi, dosyaları Dock'taki küçük bir organize klasöre "yığın" yaparlar. WWDC07 Keynote Presentation'da Steve Jobs, Leopard'da kullanıcının indirilen içeriğin yer alacağı İndirilenler varsayılan bir yığını verileceğini belirtti.

<span class="mw-page-title-main">Apple Pages</span> Kelime işlemci uygulaması

Apple Pages Apple Inc. tarafından geliştirilen kelime işlemci uygulamasıdır. Apple Keynote ve Apple Numbers ile birlikte iWork yazılım paketinin bir parçasıdır. Pages Microsoft şirketinin Microsoft Office paketine dahil olan Microsoft Word uygulaması ile eşdeğerdir. Pages'in ilk sürümü 11 Ocak 2005'te ilan edildi ve bir ay sonra serbest bırakıldı. En yeni Macintosh sürümü olan Pages 5 sürümü, 22 Ekim 2013 tarihinde piyasaya çıktı. Önceki sürüm olan sürüm 4 ise, 6 Ocak 2009'da iWork '09'un bir bileşeni olarak çıktı. Apple, 27 Ocak 2010'da dokunmatik bir arayüzle iPad için Pages'in yeni bir sürümünü duyurdu. 31 Mayıs 2011'de Apple, iPad, iPhone ve iPod Touch cihazlarında uygulamanın çalışmasına izin veren evrensel ikili dosyalar getiren Pages'in 1.4 iOS sürümünü güncelledi. 12 Ekim 2011'de Apple, iCloud'a "Bulutlardaki Belgeler" özelliğini ekleyerek iOS uygulamasını 1.5 sürümüne yükseltti. iOS Pages, 7 Mart 2012'de 1.6 sürümüne güncellendi ve yalnızca iOS 5.1 veya daha üst bir sürümü üzerinde çalıştı. OS X için Pages, aynı gün yayınlanan iOS için Pages 1.7'yi desteklemek için 4 Aralık 2012'de 4.3 sürümüne güncellendi.

<span class="mw-page-title-main">Apple Haritalar</span> Harita Servisi

Apple Haritalar Apple Inc. tarafından geliştirilen bir web haritalama servisidir. Bu, iOS, macOS ve watchOS'un varsayılan harita sistemidir. Otomobil, yaya ve toplu taşıma navigasyonu için yol tarifi ve tahmini varış saatlerini sağlar. Apple Haritalar ayrıca, kullanıcının binaların ve yapıların modellerinden oluşan 3D bir manzara içinde yoğun nüfuslu şehir merkezlerini keşfetmesini sağlayan benzersiz Flyovers modunu da içeriyor.

Derin öğrenme destekli süper-örnekleme (DLSS), derin öğrenmeyi kullanarak orijinal düşük çözünürlüklü görüntünün daha yüksek çözünürlüklü görüntüsüne benzeyen bir görüntü oluşturmak için Nvidia tarafından geliştirilen bir teknolojidir. Bunu uygulayabilmek için yapay sinir ağları, video oyunlarının ultra-yüksek çözünürlüklü "ideal" görüntüleri ve aynı oyunların düşük çözünürlüklü görüntüleri kullanılarak süper bilgisayarlarda Nvidia tarafından eğitilmektedir. Nvidia'ya göre bu teknoloji sayesinde, video kartları çok fazla çalışma gerektirmeden orijinal görüntüden çok daha yüksek çözünürlükte görüntüler üretebilmektedir.

<span class="mw-page-title-main">DALL-E</span> Yapay zeka programı

DALL-E, 5 Ocak 2021'de OpenAI tarafından piyasa sürülen, metinsel tanımlardan görüntü oluşturan bir yapay zeka programıdır.

<span class="mw-page-title-main">Midjourney</span>

Midjourney, metinsel açıklamalardan görüntüler oluşturan yapay zeka programının adıdır. Araç, günümüzde beta aşamasındadır. Program, İngiliz dergisi The Economist tarafından Haziran 2022'deki bir sayının ön kapağını oluşturmak için kullanıldı.

<span class="mw-page-title-main">Metinden resme model</span>

Metinden görüntüye model, girdi olarak bir metin açıklamasını alan ve bu tanıma uyan bir görüntü üreten bir makine öğrenim modelidir. Bu tür modeller, derin sinir ağlarındaki geliştirmelerin bir sonucu olarak 2010'ların ortalarında geliştirilmeye başlandı. 2022'de OpenAI'dan DALL-E 2, Google Brain'den Imagen ve StabilityAI'den Stable Diffusion gibi metinden resme modellerin çıktıları, gerçek fotoğrafların ve insan çizimlerinin kalitesine yaklaşmaya başladı.

GPT-4, OpenAI tarafından oluşturulan çok modlu büyük bir dil modelidir. GPT serisinin dördüncüsüdür. 14 Mart 2023’te yayınlanmıştır ve API aracılığıyla ve ChatGPT Plus kullanıcıları için kullanılabilir olacaktır. Microsoft, GPT kullanan Bing sürümlerinin resmi yayınlanmadan önce aslında GPT-4 kullandığını doğruladı.

GitHub Copilot, kullanıcıların kod yazma sürecinde yardımcı olan bulut tabanlı bir yapay zeka aracıdır. GitHub ve OpenAI tarafından geliştirilen araç, Visual Studio Code, Visual Studio, Neovim ve diğer entegre geliştirme ortamlarının (IDE'ler) kullanıcılarına destek vermek için tasarlanmıştır. GitHub Copilot, teknik önizleme için 29 Haziran 2021'de duyurulmuş ve daha sonra JetBrains pazarında bir eklenti olarak yayınlanmıştır. GitHub, Copilot'un kullanıcıların belgeleri okumak için harcadıkları süreyi azaltarak programcıların bilmedikleri kodlama çerçevelerinde ve dillerinde gezinmelerine olanak tanıdığını belirtmektedir.

<span class="mw-page-title-main">Yapay zeka patlaması</span>

Yapay Zeka Patlaması, veya Yapay Zeka Baharı, yapay zeka alanında çok hızlı bir şekilde devam eden ilerleme dönemidir. Öne çıkan örnekler arasında Google DeepMind ve OpenAI gibi laboratuvarlar tarafından yürütülen üretken yapay zekalar yer almaktadır.

Görüntü alma sistemi, geniş bir dijital görüntü veritabanından görüntülere göz atmak, aramak ve almak için kullanılan bir bilgisayar sistemidir. Görüntü almanın en geleneksel ve yaygın yöntemleri, görüntülere resim yazısı, anahtar sözcükler, başlık veya açıklamalar gibi meta veriler eklemeye yönelik bazı yöntemleri kullanır, böylece erişim açıklama sözcükleri üzerinden gerçekleştirilebilir. Görüntüye manuel açıklama eklemek zaman alıcı, zahmetli ve pahalıdır; Bu sorunu çözmek için otomatik görüntü açıklaması üzerine çok sayıda araştırma yapılmıştır. Ek olarak, sosyal web uygulamalarının ve anlamsal webin artması, birçok web tabanlı görsel açıklama aracının geliştirilmesine ilham kaynağı olmuştur.

Ideogram, 2022 yılında kurulmuş freemium üretken yapay zekâ web sitesi. Ideogram, kullanıcının verdiği talimata dayalı olarak bir metinden resme model yazılımı kullanmaktadır. Ideogram, benzer bir yapay zekâ aracı olan Midjourney ile büyük bir rakip olarak görülmektedir.

<span class="mw-page-title-main">Adobe Firefly</span>

Adobe Firefly, Adobe Creative Cloud'un bir parçası olarak sunulan üretken bir makine öğrenimi modeli. Şu anda açık beta aşamasında test edilmektedir.

Runway AI, Inc., New York City merkezli bir Amerikan şirketi. Üretken yapay zekâ alanında araştırma ve geliştirme üzerine kurulmuştur. Şirket, esas olarak video, görüntü ve çeşitli multimedya içerikleri üretmeye yönelik ürünler ve modeller geliştirmektedir. En dikkat çekici projeleri arasında metinden videoya üretken yapay zekâ modelleri olan Gen-1, Gen-2 ve Gen-3 Alpha yer almaktadır.