İçeriğe atla

Örnek tabanlı makine çevirisi

Örnek tabanlı makine çevirisi (EBMT) genellikle çalışma sırasında ana bilgi tabanı paralel metinler olan iki dilli bir külliyatın kullanımı ile karakterize edilen bir makine çevirisi yöntemdir. Bu, aslında bir "benzetme ile çeviri" ve makine öğreniminde vaka - tabanlı muhakeme yaklaşımının bir uygulaması olarak görülebilir.

Örnek tabanlı makine çevirisi temelinde kıyas yoluyla çeviri fikri vardır. İnsan çevirisi sürecine uygulandığında, çevirinin kıyas yoluyla gerçekleştiği fikri insanların derin dilsel analiz yaparak cümleleri çevirdiği fikrinin reddidir. Bu yaklaşıma göre insanlar öncelikle cümleyi bazı ifadelere ayrıştırarak, daha sonra bu ifadeleri çevirerek ve nihayet düzgün bir uzun cümle içinde bu parçaları birleştirerek çeviri yapar. Deyimsel çeviriler önceki çevirilere kıyasen çevrilir. Kıyas yoluyla çeviri ilkesi böyle bir sistemi eğitmek için kullanılan örnek çeviriler yoluyla örnek tabanlı makine çevirisine dönüştürülmüştür.

İki dilli derlem örneği
İngilizceTürkçe
How much is that red umbrella?kırmızı şemsiye kaç para?
How much is that small camera?küçük kamera kaç para?.

Örnek-tabanlı makine çeviri sistemleri tabloda gösterilen örnekte olduğu gibi cümle çiftleri içeren iki dilli paralel derlemle eğtilir. Cümle çiftleri birbirinin çevirisi olan cümleler içerir. Yukarıdaki örnek, sadece bir elemanı değişen minimal çiftleri göstermektedir. Bu cümleler basit alt anlamsal birimlerin çevirilerini öğrenilmesini kolaylaştırır. Örneğin, bir örnek tabanlı makine çeviri sistemi tercümenin şu üç birimini öğrenir:

1. X kaç para? ifadesi How much is that X ? 'e karşılık gelir.
2. Kırmızı şemsiye, red umbrellaya karşılık gelir.
3. Küçük kamera, small cameraya karşılık gelir.

Diğer bir otomatik çeviri yaklaşımı olan İstatistiksel makine çevirisi de iki dilli derlemlerden yararlanır.

Örnek tabanlı çeviri yaklaşımı ilk olarak Makoto Nagao tarafından 1984'te önerilmiştir.[1] Nagao, bu yaklaşımın özellikle İngilizce- Japonca gibi birbirinden tamamen farklı olan dil çiftlerinin çevirisinde uygun olduğunu göstermiştir. Bu durumda, bir cümle diğer bir dilde doğru yapıya sahip birkaç iyi yapıdaki cümleye çevrilebilir. Dolayısıyla kural tabanlı makine çevirisinin derin dilbilimsel analizine ihtiyaç duyulmaz.

Kaynakça

  1. ^ Makoto Nagao (1984). "A framework of a mechanical translation between Japanese and English by analogy principle". A. Elithorn and R. Banerji (Ed.). Artificial and Human Intelligence (PDF). Elsevier Science Publishers. 6 Şubat 2012 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 21 Aralık 2013. 

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Grekçe</span> Yunancanın İlk Çağda konuşulan hali

Grekçe veya Antik Yunan dili, Antik Yunanistan'da ve Doğu Akdeniz havzasında MÖ 9. yüzyıldan MS 6. yüzyıla kadar konuşulmuş olan ölü bir dildir. Arkaik, Klasik ve Helenistik dönemleri vardır. Antik Yunanca olarak da bilinir.

<span class="mw-page-title-main">Yapay zekâ</span> insani zekaya sahip makine ve yazılım geliştiren bilgisayar bilimleri dalı

Yapay zekâ ya da kısaca YZ,, insanlar da dahil olmak üzere hayvanlar tarafından, doğal zekânın aksine makineler tarafından görüntülenen zekâ çeşididir. İlk ve ikinci kategoriler arasındaki ayrım genellikle seçilen kısaltmayla ortaya çıkar. Güçlü yapay zeka genellikle Yapay genel zekâ olarak etiketlenirken, doğal zekayı taklit etme girişimleri yapay biyolojik zekâ olarak adlandırılır. Önde gelen yapay zeka ders kitapları, alanı zeki etmenlerin çalışması olarak tanımlar: Çevresini algılayan ve hedeflerine başarıyla ulaşma şansını en üst düzeye çıkaran eylemleri gerçekleştiren herhangi bir cihaz. Halk arasında, yapay zekâ kavramı genellikle insanların insan zihni ile ilişkilendirdiği öğrenme ve problem çözme gibi bilişsel eylemleri taklit eden makineleri tanımlamak için kullanılır.

<span class="mw-page-title-main">Doğal dil işleme</span> bilgisayar bilimi ve dil bilimi alanı

Doğal Dil İşleme, yaygın olarak NLP olarak bilinen yapay zekâ ve dilbilim alt kategorisidir. Türkçe, İngilizce, Almanca, Fransızca gibi doğal dillerin işlenmesi ve kullanılması amacı ile araştırma yapan bilim dalıdır.

Çeviri ya da tercüme, bir dildeki bir metnin başka bir dile aktarılması işlemini ve bu süreç sonucunda elde edilen ürünü anlatmak amacıyla kullanılır.

Bağlaçlar veya rabıt (bağlama) edatları; kelimeleri, kelime gruplarını veya cümleleri biçim veya anlam yönüyle birbirine bağlayan kelimeler: ve, veya, ile, ama, de (da), ancak, çünkü, eğer, hâlbuki, hem … hem …, hiç değilse, ise, ki, lâkin, meğer, nasıl ki, ne … ne …, öyle, öyle ki, sanki, şu var ki, üstelik, yahut, yalnız, yani, yoksa, zira vs. Bağlaçlar, ifadeleri ilgi ve önem sırasına koyarak düzenlememize yardımcı olur.

<span class="mw-page-title-main">Dil felsefesi</span>

Dil felsefesi, analitik felsefede dilin doğası ve dili; dil kullanıcıları ve dünya arasındaki ilişkileri araştırır. Dil ile felsefe arasındaki ilişki temelde filozofların dili kullanarak felsefe yapmalarından kaynaklanmaktadır. Özelde ise bu araştırmalar anlamın doğası, kasıtlılık, referans, cümlelerin yapısı, kavramlar, öğrenme ve düşünce içerir; dil felsefesi başlığı altında dilin özü, anlamı, kökeni ve yapısı felsefî açıdan sorgulanmaktadır.

Birebir çeviri (tercüme), literal çeviri veya motamot çeviri, çevirisi yapılan sözcüğün, deyimin veya cümlenin her bir unsurunun mevcut bağlamından koparılıp her birinin ayrı ayrı değerlendirildiği çeviri usulüne verilen addır. Bu çeviri usulünde, hedef dilin ifade kalıplarına, dilbilgisi ve imlâ kurallarına çevirmen asgari düzeyde riayet eder ve kaynak dildeki ifade şeklini değiştirmeden yansıtır.

<span class="mw-page-title-main">Google Çeviri</span> Çeviri aracı

Google Çeviri, İnternet sayfalarını, metinleri veya yüklemiş olduğunuz belgeleri ücretsiz çeviren bir araçtır. Google tarafından sağlanır. İlk olarak 28 Nisan 2006 tarihinde, Arapça ile İngilizce arası çeviri yaparak hizmete girmiştir. Bir web arayüzü, Android ve iOS için mobil uygulamalar, geliştiricilere tarayıcı eklentisi ve yazılım uygulamaları oluşturmada yardımcı olan bir API sunar. Google Translate, çeşitli seviyelerde 100'den fazla dili destekliyor ve Mayıs 2013 itibarıyla günlük 200 milyondan fazla kişiye hizmet veriyor.

Sözdizim, söz dizimi ya da Fransızcadan ödünçleme biçimiyle sentaks, doğal dillerdeki cümle kurma ilke ve kurallarını inceleyen ve bu dildeki cümlelerin esnekliğini inceleyen dilbilim dalıdır.
Eski Yunanca "birlikte düzenleme, dizme" anlamına gelen sentaks terimi dilbilimde, doğal dillerde nasıl cümle oluşturulacağına dair bir kurallar ve prensipler çalışmasıdır. Bir bilim dalına ait olmasına ek olarak “Modern İrlandacanın Sözdizimi"nde olduğu gibi, sözdizim terimi herhangi bireysel bir dilin cümle yapısına hâkim olan kurallara ve prensiplere de doğrudan ilgili olarak da kullanılır. Sözdizim, dilin yatay, yani satır şeklinde dizilen bir sistem olduğunu gösterir. Bu diziliş, sesten, morfemlere, morfemlerden daha büyük öbeklere dilin her seviyesinde mevcuttur. Sözdizimin yalnız cümle seviyesini gösteren bir terim olarak kullanılması doğru ama eksik bir kullanımdır.

Çeviribilim ya da Çeviri bilimi, yazılı ve sözlü çevirinin kuram, betimleme ve uygulamasını konu alan beşeri bilim dalıdır. Sahalar arası bir çalışma alanı olarak çeviribilim, çeviriye destek olan çeşitli sahalardan katkı alır. Bunların arasında metin dilbilim, toplumbilim, tarih, karşılaştırmalı edebiyat, felsefe, filoloji, göstergebilim, edebiyat gibi bilim dalları bulunur. Batı dillerinde “translation studies” (İngilizce), “Translationswissenschaft” (Almanca) ve “traductologie” (Fransızca) gibi adlarla anılır.

Bilgisayar destekli çeviri çeviri sırasında çevirmenleri destekleyen bilgisayar yazılımlarıyla yapılan bir tür çeviridir. BDÇ, çeviri işleminin herhangi bir insan yardımı olmaksızın ya da çeviri öncesinde ya da sonrasında çok az bir insan desteğiyle gerçekleşen makineli çeviri, makine çevirisi ya da bilgisayarlı çeviri ile karıştırılmamalıdır.

İstatistiksel makine çevirisi, iki dilli metin derlemlerinin incelenmesinden elde edilen parametrelerin kullanıldığı istatistiksel modelleri içeren bir makine çevirisi yaklaşımıdır. İstatiksel çeviri yöntemi, makine çevirisi disiplini içerisinde kural tabanlı makine çevirisi ve örnek tabanlı makine çevirisi yaklaşımlarına göre farklılık gösterir.

<span class="mw-page-title-main">Tatoeba</span>

Tatoeba.org, yabancı dil öğrenenlere yönelik oluşturulmuş, herkesin katkıda bulunabildiği, ücretsiz, örnek cümlelerin yer aldığı bir veri tabanıdır. İsminin kökeni Türkçede "örneğin" anlamına gelen Japonca "tatoeba" (例えば tatoeba) terimidir. Sadece kelimeye odaklanan diğer çevrimiçi sözlüklerin aksine Tatoeba, komple cümle çevirilerine odaklanır. Ayrıca, veri tabanının ve arayüzünün yapısı "bir taneden birçoğuna" sistemi üzerine kurulmuştur. Bir cümlenin sadece bir dildeki çevirisini görmek yerine bir dilden öbür bir dile adım adım bağlantılar zinciri oluşturarak dolaylı bir şekilde diğer dillerden çevrilmiş cümleler de ana cümlenin altında kolayca görüntülenebilir.

<span class="mw-page-title-main">Makine çevirisi</span>

MT kısaltmasıyla da anılan makine çevirisi, metin veya konuşmayı bir dilden diğerine çevirmek için yazılım kullanımını araştıran bilgisayarlı dilbilimin bir alt alanıdır.

<span class="mw-page-title-main">Microsoft Tercüman</span> çok dilli bir makine çeviri bulut hizmeti

Microsoft Tercüman, Microsoft tarafından sağlanan çok dilli bir makine çeviri bulut hizmetidir. Microsoft Translator API-si, birden fazla tüketici, geliştirici ve kurumsal ürüne entegre edilmiştir; Bing, Microsoft Office, SharePoint, Skype for Business, Yammer, Skype Translator, Visual Studio, Internet Explorer, Windows Phone, iPhone ve Apple Watch ve Android telefonu ve Android Wear için Microsoft Tercüman uygulamaları.

<span class="mw-page-title-main">Google Nöral Makine Çevirisi</span> Google tarafından Google Çevirinin akıcılığını ve duyarlılığını artırmak için geliştirilen sistem

Google Nöral Makine Çevirisi (GNMT), Google tarafından geliştirilen ve Google Çeviri’nin akıcılığını ve doğruluğunu artırmak için yapay bir sinir ağı kullanan, Kasım 2016’da tanıtılan bir yapay sinir ağları (NMT) sistemidir.

BLEU(İngilizce: bilingual evaluation understudy) bir makine çevirisi sistemi tarafından oluşturulan çevirilerin kalitesini ölçmeye yarayan bir algoritmadır. Burada "kalite", makinenin çevirisinin profesyonel bir insan çevirisine olabildiğince yakın sonuçlar oluşturabilmesi anlamına gelir. BLEU 2002'de yayınlanmış olup, günümüzde de yaygın otomatik metriklerden biridir.

Çeviri belleği (ÇB) veya Çeviri hafızası (ÇB), insan çevirmenlere yardımcı olmak için daha önce çevrilmiş cümleler, paragraflar veya cümle benzeri birimler olabilen "segmentleri" depolayan bir veritabanıdır. Çeviri belleği, kaynak metni ve karşılık gelen çevirisini “çeviri birimleri” adı verilen dil çiftlerinde saklar. Bireysel kelimeler terminoloji temelleri tarafından ele alınır ve ÇB'nin alanı içinde değildir.

Nöral makine çevirisi (NMT), bir sözcük dizilim olasılığını tahmin etmek için yapay bir sinir ağı kullanan ve genellikle cümlenin tümünü tek bir entegre modelde modelleyen bir makine çevirisi yaklaşımıdır.

Otomatik özetleme, yapay zekâ ve doğal dil işleme tekniklerini kullanarak metinlerin ana fikirlerini ve önemli bilgilerini otomatik olarak çıkarma ve kısaltma işlemidir. Bu işlem, insan müdahalesi olmadan metnin özünü yakalayan kısa ve öz bir özet oluşturmayı amaçlar.