İçeriğe atla

Lingua Libre

Lingua Libre
SahipWikimedia France
OluşturanWikimedia France
URLlingualibre.org
Ticari?Hayır
Site türüDil kayıt aracı, Çevrimiçi dil ortamı kitaplığı
Kullanılabilir dil(ler)Çokdilli
Başlama tarihiAğustos 2016 (8 yıl önce) (2016-08)
Geçerli durumAktif

Lingua Libre, Wikimedia France tarafından oluşturulmuş bir çevrimiçi iş birliği projesi ve aracıdır. Özgür lisans altında iş birliğine dayalı, çok dilli, görsel-işitsel bir konuşma külliyatı oluşturmayı amaçlamaktadır.

Tanım

Lingua Libre, sözlü (ses kaydı) veya imzalı (video kaydı) herhangi bir dildeki kelimeleri ve kaydetmeyi sağlar.

2017'de Montreal'de Atikamekçe konuşan biriyle yapılan bir kayıt.

Sözcükler konuşmacıya yerinde, önceden oluşturulmuş bir liste şeklinde veya mevcut bir Wikimedia kategorisi olarak sunulur. Konuşmacı ekranda görüntülenen kelimeyi okur ve yazılım, okunan kelimeden sonra bir sessizlik algıladığında bir sonraki kelimeye geçer.[1] Açık kaynaklı yazılım Shtooka [fr]'dan ödünç alınan bu ses kaydedici, yaratıcısı Nicolas Vion'un yardımıyla saatte birkaç yüz kelimeyi kaydetmeyi mümkün kılar. Kayıtlar daha sonra web istemcisinden otomatik olarak Wikimedia Commons medya kitaplığına yüklenir.

2021 baharında Lingua Libre, Strazburg'daki bir yangın nedeniyle çevrimdışıydı.[2] Ancak hiçbir ses kaydı kaybolmadı.[3]

Kayıtların kullanımı

Kayıtlara Lingua Libre veya Wikimedia Commons üzerinden erişilebilir. Esas olarak diğer Wikimedia projelerinde, örneğin Vikisözlük girişlerini veya Vikipedi maddelerindeki özel isimleri göstermek için kullanılabilirler.[1]

Kayıtların bir dil öğretimi bağlamında yeniden kullanılması öngörülmektedir. Dil öğrenenler, telaffuzları ücretsiz olarak indirebilir ve popüler bir sözlük yazılımı olan GoldenDict'te kullanabilir.[4] Böylece ses kayıtları GoldenDict üzerinde internet bağlantısına ihtiyaç duymadan “Telaffuz Sözlüğü” olarak kullanılabilmektedir.

Kayıtlar ayrıca doğal dil işleme projelerinde, örneğin Mozilla'nın DeepSpeech konuşma tanıma motorlarını çalıştırmak için yeniden kullanılır.[5]

Ayrıca bakınız

Kaynakça

  1. ^ a b Sabine Buchwald (4 Ağustos 2019). "Wie Wikipedia Bairisch lernt". Süddeutsche Zeitung (Almanca). 12 Ağustos 2019 tarihinde kaynağından arşivlendi.  Kaynak hatası: Geçersiz <ref> etiketi: "sueddeutsche" adı farklı içerikte birden fazla tanımlanmış (Bkz: )
  2. ^ "France : un incendie se déclare au datacenter OVHcloud de Strasbourg". French Wikinews (Fransızca). 11 Mart 2021. 13 Nisan 2021 tarihinde kaynağından arşivlendi. 
  3. ^ "Lingua Libre 2.3 - Phoenix Edition ǃ". Meta Wikimedia. 19 Mart 2021. 7 Mayıs 2021 tarihinde kaynağından arşivlendi. 
  4. ^ "GoldenDict: Dictionary with Wikipedia integration". gHacks Tech News. 10 Temmuz 2017. 9 Ekim 2019 tarihinde kaynağından arşivlendi. 
  5. ^ "Modèle français 0.4 pour DeepSpeech v0.6". Mozilla Discourse. 10 Mart 2020. 10 Ağustos 2020 tarihinde kaynağından arşivlendi. 

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Türkçe</span> Türk halkının Oğuz Türkçesi dili

Türkçe ya da Türk dili, Güneydoğu Avrupa ve Batı Asya'da konuşulan, Türk dilleri dil ailesine ait sondan eklemeli bir dildir. Türk dilleri ailesinin Oğuz dilleri grubundan bir Batı Oğuz dili olan Osmanlı Türkçesinin devamını oluşturur. Dil, başta Türkiye olmak üzere Balkanlar, Ege Adaları, Kıbrıs ve Orta Doğu'yu kapsayan eski Osmanlı İmparatorluğu coğrafyasında konuşulur. Ethnologue'a göre Türkçe, yaklaşık 90 milyon konuşanı ile dünyada en çok konuşulan 18. dildir. Türkçe, Türkiye, Kuzey Kıbrıs ve Kıbrıs Cumhuriyeti'nde ulusal resmî dil statüsüne sahiptir.

<span class="mw-page-title-main">Azerice</span> Azerbaycanın resmî dili olan Türk dili

Azerice, Azerbaycanca veya Azerbaycan Türkçesi, Türk dilleri dil ailesinin Oğuz grubu içerisinde yer alan ve bir Türk halkı olan Azerilerin ana dilini oluşturan dil. En çok konuşucusu İran Azerbaycanı'nda bulunan dil, Azerbaycan Cumhuriyeti'nin resmî dilidir. Rusya'ya bağlı özerk bir cumhuriyet olan Dağıstan'ın ise resmî dilleri arasında yer alır.

<span class="mw-page-title-main">Dilbilim</span> insan dilinin araştırılması

Dilbilim, dil bilimi, lengüistik ya da lisaniyat; dilleri dilbilgisi, söz dizimi (sentaks), ses bilgisi (fonetik), ses bilimi (fonoloji), biçimbilim (morfoloji) ve edimbilim (pragmatik) gibi çeşitli yönlerden yapısal, anlamsal ve bildirişimin çıkış bağlamını temel alarak sözlerin gönderimlerini ve iletişimde dilin yaptırım gücünü inceleyen bilim dalıdır.

Etimoloji veya kökenbilim, sözcüklerin köklerini, hangi dile ait olduklarını, ne zaman ortaya çıktıklarını, ilk olarak hangi kaynakta kayıt altına alındıklarını, ses ve anlam bakımından geçirdikleri dönüşümleri inceleyen bilim dalıdır.

<span class="mw-page-title-main">Arap harfleri</span> Arap alfabesini temel alan yazı sistemi

Arap harfleri, 7. yüzyılın üçüncü çeyreğinden itibaren Emevi ve Abbasi imparatorlukları aracılığıyla Orta Doğu merkezli geniş bir alana yayılma olanağı bulmuş İslam dininin benimsendiği coğrafyalarda kabul gören, kökeni Arap alfabesine dayalı, ünsüz alfabesi türünde bir yazı sistemidir. Dünyada Latin alfabesinden sonra en çok kullanılan yazı sistemidir.

<span class="mw-page-title-main">Fince</span> Sondan eklemeli Finlandiyanın resmi dili

Fince (

<span class="mw-page-title-main">Rusça</span> Doğu Slav dili

Rusça, Hint-Avrupa dil ailesinin Slav dilleri koluna bağlı bir dil. Rusça, Belarus ve Ukrayna dilleri ile yaşayan üç Doğu Slav dilinden biridir. Yaklaşık 260 milyon konuşanı olan Rusça dünyanın en çok konuşulan dillerinden biri olup Rusya, Belarus, Kazakistan, Kırgızistan, Moldova (Gagavuzya) ile kısmî olarak tanınan Abhazya, Güney Osetya, Transdinyester'de resmî dil statüsündedir. Aynı zamanda Birleşmiş Milletler'in altı resmî dilinden biri ve Uluslararası Uzay İstasyonu'nun İngilizce ile birlikte kullanılan iki dilinden biridir. Orta Asya, Kafkasya, Ukrayna ve kısmen Baltık devletlerinde lingua franca olarak kullanılmaktadır.

Dd (de) harfi, Türk alfabesinin 5., Latin alfabesinin 4. harfidir. Sami dillerindeki deltadan geldiği kabul edilir.

<span class="mw-page-title-main">Uluslararası Fonetik Alfabe</span> sesleri gösteren standart alfabe

Uluslararası Ses Abecesi veya Uluslararası Fonetik Alfabe, seslerin kâğıt üzerinde gösterilebilmesi için oluşturulmuş standart alfabedir. Tüm dillerdeki konuşma seslerini bir örnek biçimde kodlayabilmek için oluşturulmuş işaretler ve simgeler sistemidir. Bu sistemden en çok dilbilimde ve sözlüklerin hazırlanmasında yararlanılır.

<span class="mw-page-title-main">Lazca</span> Laz halkı tarafından kullanılan dil

Lazca Türkiye'nin Doğu Karadeniz kıyı şeridinde Rize ilinin Pazar ilçesinde bulunan Melyat Deresi'nden itibaren ve Gürcistan'ın Türkiye ile paylaştığı Sarp köyüne uzanan bölgede yaşayan Laz halkı tarafından konuşulan ve eski Kolhis dilinin devamı olduğu düşünülen Zanik bir Güney Kafkas dilidir.

<span class="mw-page-title-main">Yazı</span> bir dilin metinsel olarak ifade edilmesi

Yazı, belirli işaretler kullanılarak kişiler arasında görsel tabanlı iletişim kurulmasını sağlayan bir araçtır. Yazı sistemi, dilbilgisi ve anlambilimde olduğu gibi konuşma ile aynı yapılara dayanan, ancak her kültüre özgü yazım sistemine bağlı ek kısıtlamalara ve kurallara sahip bir teknoloji biçimidir. Yazma faaliyetinin sonucu çıkan ürün metin, bu metnin yorumlayıcısı veya gözlemleyicisi ise okur veya okuyucu olarak adlandırılır.

Tt, Türk alfabesinin 24. harfidir. Türkçe okunuşu Te’dir. Bazı dillerde dil ucunun ön dişlerin hafifçe ucuna çıkarılması ile oluşturulan bir sestir.

Transkripsiyon, çevriyazı ya da çeviri yazı konuşmadaki sesleri, onları sonradan tekrar üretebilmek için özel yazılı sembollerle kaydetmektir. Dil bilimciler fonetik transkripsiyon için Uluslararası Fonetik Alfabe'yi kullanırlar. Bunun ASCII karşılığı SAMPA'dır. Örneğin bazı Anadolu ağızlarında "değil", "Gelecek misin?", "Gelemem." sözlerinin söylenişlerine göre "da´l", "del"; "gelcemin?", "gelecaññi?" şekillerinde yazılması gibi.

Konuşma sentezleyici, İnsan seslerinin bilgisayar yapay zekası tarafından üretimidir. Genellikle Metin okuma sistemlerinde kullanılan Konuşma sentezleyicisi bu sistemlerde bir dilin tüm ses bilgisi ve benzeri kurallarına göre çevri yapacak şekilde programlanırlar. Bu sentezleyicinin metni doğru telaffuz etmesini sağlar.

<span class="mw-page-title-main">LibreOffice</span> açık kaynaklı ve ücretsiz bir ofis yazılımı seti

LibreOffice, The Document Foundation tarafından geliştirilen açık kaynaklı ve ücretsiz bir ofis yazılımı seti. 2010 yılında, StarOffice'in açık kaynaklı bir türevi olan OpenOffice.org'dan çatallanmıştır. LibreOffice paketi; kelime işlemci, elektronik tablo, slayt gösterisi, çizim, veritabanı ve matematiksel formüller oluşturma programlarını içerir. 100'den fazla sayıda dilde kullanılabilir. LibreOffice bir özgür yazılım olup adındaki Libre sözcüğü İspanyolca ve Fransızcada "özgür" anlamına gelir.

, İrlanda alfabesinde yer alan bir harftir.

<span class="mw-page-title-main">Apple Sözlük</span> MacOSdaki bir sözlük uygulaması

Apple Sözlük Apple Inc. tarafından yapılan, MacOS sisteminde olan sözlük uygulamasıdır. Uygulama, çeşitli sözlükler, Wikipedia makaleleri ve Apple ile ilgili terimlerin bir sözlükden tanımlar ve eş anlamlılar sağlar.

Fonetik transkripsiyon, semboller kullanılarak konuşma seslerinin her birinin bir karakterle gösterilmesidir. Fonetik transkripsiyonun en yaygın hali, bir fonetik alfabe kullanılarak yapılan çeşididir, bunun en bilineni Uluslararası Fonetik Alfabe’dir (IPA).

<span class="mw-page-title-main">Common Voice</span> Mozillanın geliştirdiği ses veri kümesi

Common Voice, ses ve konuşma tanıma yazılımları için ücretsiz bir veritabanı oluşturmak üzere Mozilla tarafından başlatılan bir kitle kaynak projesidir. Proje, mikrofonla örnek cümleler kaydeden ve diğer kullanıcıların kayıtlarını inceleyen gönüllüler tarafından desteklenmektedir. Transkripsiyonlu cümleler, kamu malı CC0 lisansı altında bulunan bir ses veritabanında toplanır. Bu lisans, geliştiricilerin veritabanını herhangi bir kısıtlama veya maliyet olmadan sesten metne özelliğini kullanan uygulamalar için kullanabilmelerini sağlar.

<span class="mw-page-title-main">Ses analizi</span>

Ses analizi ya da Konuşma analizi, iletişimi ve gelecekteki etkileşimi iyileştirmek için müşteri bilgilerini toplamak üzere kaydedilen çağrıları analiz etme sürecidir. Süreç, öncelikle müşteri iletişim merkezleri tarafından bir işletmeyle müşteri etkileşimlerinde ihtiyaçları çıkarmak için kullanılır.