İçeriğe atla

Common Voice

Common Voice
Geliştirici(ler)Mozilla Vakfı
İlk yayınlanma2017 Haziran 19 (7 yıl önce) (19-06-2017)
ErişilebilirlikÇokdilli (Dillerin listesi)
LisansCreative Commons CC0
Resmî sitesicommonvoice.mozilla.org
Kod deposuhttps://github.com/mozilla/voice-web
Common Voice'nin maskotu
Common Voice'nin maskotu

Common Voice, ses ve konuşma tanıma yazılımları için ücretsiz bir veritabanı oluşturmak üzere Mozilla tarafından başlatılan bir kitle kaynak projesidir.[1] Proje, mikrofonla örnek cümleler kaydeden ve diğer kullanıcıların kayıtlarını inceleyen gönüllüler tarafından desteklenmektedir. Transkripsiyonlu cümleler, kamu malı CC0 lisansı altında bulunan bir ses veritabanında toplanır. Bu lisans, geliştiricilerin veritabanını herhangi bir kısıtlama veya maliyet olmadan sesten metne özelliğini kullanan uygulamalar için kullanabilmelerini sağlar.

Common Voice; Amazon Echo, Siri veya Google Asistan gibi büyük şirketlerin dil asistanlarına bir cevap olarak ortaya çıktı.

Ses veritabanı

İngilizce Common Voice veritabanı, LibriSpeech'ten sonra serbestçe erişilebilen ikinci en büyük ses veritabanıdır. İlk veriler 29 Kasım 2017'de yayımlandığında dünya çapında 20.000'den fazla kullanıcı, toplam 500 saat süren 400.000 onaylanmış cümle kaydetti.[2]

Şubat 2019'da ilk dil grubu kullanıma sunuldu. Bu grup toplam 18 dil içeriyordu: İngilizce, Fransızca, Almanca ve Mandarin Çincesi, aynı zamanda Galce ve Berberice gibi daha az yaygın diller. Toplamda 42.000'den fazla katılımcıdan yaklaşık 1.400 saatlik ses kaydı verisi dahil edildi.[3]

Kaynakça

  1. ^ "Mozilla, En Büyük Ses Veritabanı Common Voice'u Kullanıma Açtı". webtekno.com. 20 Ocak 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 26 Ocak 2022. 
  2. ^ "Announcing the Initial Release of Mozilla's Open Source Speech Recognition Model and Voice Dataset". blog mozilla.org. 29 Kasım 2017. 29 Kasım 2017 tarihinde kaynağından arşivlendi. Erişim tarihi: 31 Mart 2020. 
  3. ^ "Mozilla updates Common Voice dataset with 1,400 hours of speech across 18 languages". VentureBeat. 28 Şubat 2019. 4 Mart 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 31 Mart 2020. 

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Mozilla Firefox</span> yazılım

Mozilla Firefox, Mozilla Vakfı ve onun alt kuruluşu Mozilla Corporation tarafından geliştirilen, özgür ve açık kaynak kodlu bir web tarayıcısıdır. Firefox; Windows, macOS, Linux, Android ve iOS işletim sistemlerinde kullanabilir. Yazılımın Windows, macOS, Linux, Android sürümlerinde web sayfalarının oluşturulması için Gecko motoru kullanılır. Mozilla tarafından geliştirilen Gecko, mevcut ve planlanmış web standartlarıyla uyumludur. 2015'te çıkan iOS için Firefox uygulamasında ise Apple'ın getirdiği kısıtlamalar nedeniyle iOS'in bütünleşik WebKit motoru kullanılır.

<span class="mw-page-title-main">Türkçe</span> Türk halkının Oğuz Türkçesi dili

Türkçe ya da Türk dili, Güneydoğu Avrupa ve Batı Asya'da konuşulan, Türk dilleri dil ailesine ait sondan eklemeli bir dildir. Türk dilleri ailesinin Oğuz dilleri grubundan bir Batı Oğuz dili olan Osmanlı Türkçesinin devamını oluşturur. Dil, başta Türkiye olmak üzere Balkanlar, Ege Adaları, Kıbrıs ve Orta Doğu'yu kapsayan eski Osmanlı İmparatorluğu coğrafyasında konuşulur. Ethnologue'a göre Türkçe, yaklaşık 90 milyon konuşanı ile dünyada en çok konuşulan 18. dildir. Türkçe, Türkiye, Kuzey Kıbrıs ve Kıbrıs Cumhuriyeti'nde ulusal resmî dil statüsüne sahiptir.

<span class="mw-page-title-main">Mozilla Thunderbird</span> e-posta ve haber istemcisi

Mozilla Thunderbird, Mozilla Vakfı tarafından geliştirilen, farklı platformlarda çalışabilen, özgür ve açık kaynak kodlu bir e-posta, haber grubu, RSS ve sohbet istemcisidir. Thunderbird projesinin stratejisi Mozilla Firefox web tarayıcısını temel alır. Thunderbird, Ubuntu gibi birçok masaüstü Linux dağıtımında varsayılan e-posta istemcisi olarak gelir.

<span class="mw-page-title-main">Vikitür</span>

Vikitür viki tabanlı bir Wikimedia Vakfı tarafından desteklenen çevrimiçi bir projedir. Amacı, tüm türler için kapsamlı bir ücretsiz içerik kataloğu oluşturmaktır; proje genel halka değil bilim adamlarına yöneliktir. Jimmy Wales editörlerin derecelerine faks göndermeleri gerekmediğini, ancak gönderimlerin teknik bir izleyici ile toplanması gerektiğini belirtti. Vikitür GNU Özgür Belgeleme Lisansı ve CC BY-SA 3.0 altında bulunabilir.

<span class="mw-page-title-main">Vikipedi</span> Ücretsiz ve reklamsız internet ansiklopedisi

Vikipedi, kullanıcıları tarafından ortaklaşa olarak birçok dilde hazırlanan; özgür, bağımsız, ücretsiz, reklamsız ve kâr amacı gütmeyen bir internet ansiklopedisidir. MediaWiki yazılımı kullanılarak hazırlanmaktadır. Sürekli eklemeler ve değişiklikler yapıldığı için hiçbir zaman tamamlanmayacağı varsayılmaktadır.

<span class="mw-page-title-main">Google Çeviri</span> Çeviri aracı

Google Çeviri, İnternet sayfalarını, metinleri veya yüklemiş olduğunuz belgeleri ücretsiz çeviren bir araçtır. Google tarafından sağlanır. İlk olarak 28 Nisan 2006 tarihinde, Arapça ile İngilizce arası çeviri yaparak hizmete girmiştir. Bir web arayüzü, Android ve iOS için mobil uygulamalar, geliştiricilere tarayıcı eklentisi ve yazılım uygulamaları oluşturmada yardımcı olan bir API sunar. Google Translate, çeşitli seviyelerde 100'den fazla dili destekliyor ve Mayıs 2013 itibarıyla günlük 200 milyondan fazla kişiye hizmet veriyor.

<span class="mw-page-title-main">Türkçe Vikipedi</span> Vikipedinin Türkçe sürümü

Türkçe Vikipedi, Vikipedi'nin 5 Aralık 2002'de başlatılan Türkçe sürümüdür. Madde sayısına göre 25. en büyük Vikipedi sürümüdür. 15 Ekim 2024 günü saat 05.30 itibarıyla (UTC) 622.852 maddeye ulaşmıştır.

<span class="mw-page-title-main">LibreOffice Base</span>

LibreOffice Base, özgür ve ücretsiz LibreOffice yazılım ailesinin veritabanı yönetim aracı. LibreOffice Base kullanılarak tablo, form, sorgu ve raporlar oluşturup düzenlenebilir. Kullanıcı bu işlemleri ister kendi veritabanında, isterse Base ile birlikte gelen Firebird, HSQLDB veritabanı motorlarıyla yapabilir.

<span class="mw-page-title-main">WhatsApp</span> platformlar arası anlık iletişim uygulaması

WhatsApp Messenger, akıllı telefonlar için geliştirilen, platformlar arası çalışma özelliğine sahip bir anlık mesajlaşma ve arama veya haberleşme uygulamasıdır. Android, BlackBerry, iPhone, Windows Phone ve Nokia telefonlarıyla uyumlu olan uygulama, 2G, 3G, 4G ya da Wi-Fi İnternet bağlantısı aracılığıyla kullanıcıların birbirlerine fotoğraf, video, ücretsiz arama, sesli ve yazılı mesaj ve belge göndermesini sağlar. Aynı adı taşıyan şirket, eski Yahoo! çalışanları olan Biran Acton ve Jan Koum tarafından ABD'de, Kaliforniya eyaletindeki Santa Clara kentinde kurulmuştur.

<span class="mw-page-title-main">Telegram (yazılım)</span> Çevrim içi mesajlaşma platformu

Telegram, çoklu platform desteği sunan, güvenli anlık mesajlaşma servisidir. Rus programcısı Pavel Durov tarafından yaratılmıştır. Telegram istemcileri hem mobil hem de masaüstü sistemleri için mevcuttur. Ağustos 2013'te yayın hayatına başlamıştır. Kullanıcılar birbirleri arasında metin mesajı, fotoğraf, video, ses kaydı, sticker ve 2 GB'a kadar dosya paylaşımı yapabilmektedirler. Geliştiricileri ayrıca Kasım 2016'da Telegraph isminde, kullanıcıların çeşitli formattaki içerikler oluşturmalarını ve hikâye yazmalarını sağlayan bir uygulama hazırlamıştır.

<span class="mw-page-title-main">Google Metin Okuma</span>

Google Metin-Konuşma Motoru, Android işletim sistemi için Google tarafından geliştirilmiş bir ekran okuyucu uygulamasıdır. Uygulamaları, ekrandaki metni yüksek sesle okumaya (konuşmaya) güç verir. Şu anda desteklenen diller Bengalce (Bangladeş), Kantonca, Çince (Çin), Çince (Tayvan) Danca, Hollandaca, İngilizce (Avustralya), İngilizce (Hindistan), İngilizce, İngilizce (ABD), Fince, Fransızca, Almanca, Hintçe, Macarca, Endonezyaca, İtalyanca, Japonca, Korece, Norveççe, Lehçe, Portekizce (Brezilya), Rusça, İspanyolca (Meksika), İspanyolca (İspanya), İspanyolca (ABD), İsveççe, Taylandça, Türkçe ve Vietnamcadır.

Shazam Macintosh, kişisel bilgisayarlar, akıllı telefonlar ve tabletler için mobil bir uygulamadır. Cihazdaki mikrofonu oynayan ve kullanan kısa bir örneğe dayalı olarak müzik, film, reklam ve televizyon şovlarını tanımlayabilir. Shazam Entertainment Limited, 1999 yılında Chris Barton, Philip Inghelbrecht, Avery Wang ve Dhiraj Mukherjee tarafından kuruldu. 12 Aralık 2017 itibarıyla hizmet Apple şirketi tarafından 400 milyon dolara satın alındı. Yazılım, macOS, iOS, watchOS ve tvOS için, ayrıca başka platformlar için de kullanılabilir.

<span class="mw-page-title-main">VoiceOver</span>

VoiceOver Apple şirketi tarafından sunulan macOS, iOS, tvOS, watchOS ve iPod işletim sistemlerinde yerleşik bir ekran okuyucudur. VoiceOver'ı kullanarak, kullanıcı konuşma yapılan açıklamalara ve Mac durumunda klavyeye dayanarak Macintosh'larına veya iOS cihazlarına erişebilir. Bu özellik, kör ve görme engelli kullanıcılar için erişilebilirliği artırmak ve disleksi olan kullanıcılar için tasarlanmıştır.

<span class="mw-page-title-main">Amerika'nın Sesi</span> ABDye ait uluslararası yayıncı

Amerika'nın Sesi, Amerika Birleşik Devletleri federal hükûmeti tarafından finanse edilen uluslararası bir yayın kuruluşudur. 1 Şubat 1942 tarihinde kurulmuş olup ABD'nin en büyük uluslararası yayıncısı olan VOA, dünya çapında bağlı istasyonlara dağıtılan 40'tan fazla dilde dijital, TV ve radyo içeriği üretmektedir. Merkezi Washington, DC'dedir ve ABD hükûmetinin bağımsız bir ajansı olan Governors Broadcasting Board (BBG) tarafından denetlenmektedir.

Bir bilgi tabanı (KB), bir bilgisayar sistemi tarafından kullanılan karmaşık yapılandırılmış ve yapılandırılmamış bilgileri depolamak için kullanılan bir veri kayıt ortamı teknolojisidir. Terimin ilk kullanımı, ilk bilgi-tabanlı sistem olan uzman sistemler ile bağlantılıydı.

Tropicos, bitkilerle ilgili taksonomik bilgileri içeren, esas olarak Orta ve Güney Amerikayı da kapsayan neotropikal biyocoğrafik bölgesinde oluşan çevrimiçi bir botanik veritabanıdır. Missouri Botanik Bahçesi tarafından korunur ve 25 yıl önce kurulmuştur. Veri tabanı, 4,2 milyondan fazla herbaryum örneği hakkında görüntü ve taksonomik ve bibliyografik veriler içermektedir. Ayrıca, 49.000'den fazla bilimsel yayın hakkında veri içermektedir. Veritabanı İngilizce, Fransızca ve İspanyolca olarak sorgulanabilir. Veritabanındaki en eski kayıtlar 1703' yılına döner.

<span class="mw-page-title-main">İNaturalist</span>

iNaturalist, bir biyoloji çeşitliliği gözlemini haritalama ve paylaşma konsepti üzerine inşa edilmiş doğa bilimcileri, vatandaş bilim adamları ve biyologların çevrimiçi sosyal ağıdır. iNaturalist'e web sitesi üzerinden veya mobil uygulamalarından erişilebilir. İNaturalist ile kaydedilen gözlemler bilimsel araştırma projelerine, koruma kuruluşlarına, diğer kuruluşlara ve halka değerli veriler sunmaktadır. Proje "doğal tarih mobil uygulamaları için standart taşıyıcı" olarak adlandırıldı.

<span class="mw-page-title-main">Ses analizi</span>

Ses analizi ya da Konuşma analizi, iletişimi ve gelecekteki etkileşimi iyileştirmek için müşteri bilgilerini toplamak üzere kaydedilen çağrıları analiz etme sürecidir. Süreç, öncelikle müşteri iletişim merkezleri tarafından bir işletmeyle müşteri etkileşimlerinde ihtiyaçları çıkarmak için kullanılır.

<span class="mw-page-title-main">Mozilla VPN</span> VPN yazılımı

Mozilla VPN Mozilla tarafından geliştirilen açık kaynak kodlu bir sanal özel ağ yazılımıdır. Beta sürümü Firefox Private Network adıyla 10 Eylül 2019'da yayımlanan yazılımın 1.0 sürümü 15 Temmuz 2020'de dağıtılmaya başlamıştır.

<span class="mw-page-title-main">Lingua Libre</span>

Lingua Libre, Wikimedia France tarafından oluşturulmuş bir çevrimiçi iş birliği projesi ve aracıdır. Özgür lisans altında iş birliğine dayalı, çok dilli, görsel-işitsel bir konuşma külliyatı oluşturmayı amaçlamaktadır.