İçeriğe atla

Makine çevirisi

İspanyolca metni İngilizceye çeviren bir cep telefonu uygulaması

MT[1] kısaltmasıyla da anılan makine çevirisi, metin veya konuşmayı bir dilden diğerine çevirmek için yazılım kullanımını araştıran bilgisayarlı dilbilimin bir alt alanıdır.

MT bir dildeki sözcüklerin başka bir dildeki sözcüklerle mekanik olarak yer değiştirmesini gerçekleştirir, ancak bu tek başına nadiren iyi bir çeviri üretir; çünkü hedef dildeki tümceler ve bunların (en yakın) karşılıklarının tanınması gerekir. Bir dildeki tüm kelimelerin başka bir dilde karşılığı yok ve birçok kelimenin birden fazla anlamı vardır.

Bu problemi istatistiksel ve nöral tekniklerle çözmek, daha iyi çevirilerle, dilsel tipolojideki farklılıkları ele almaya, deyimlerin çevirisine ve anomalilerin izolasyonuna yol açan hızla büyüyen bir alandır.[2]

Mevcut makine çevirisi yazılımı genellikle etki alanına veya mesleğe göre özelleştirmeye izin verir (hava durumu raporları gibi), izin verilen değiştirmelerin kapsamını sınırlayarak çıktıyı iyileştirir. Bu teknik, özellikle resmi veya kalıplaşmış dilin kullanıldığı alanlarda etkilidir. Buradan hükûmet belgeleri ve yasal belgelerin makine çevirisinde, konuşma veya daha az standartlaşmış metin çevirisine göre daha kullanılabilir çıktı ürettiği sonucu çıkar.

İyi bir çıktı kalitesi, insan müdahalesiyle de elde edilebilir: örneğin, bazı sistemler, eğer kullanıcı metindeki hangi kelimelerin özel adlar olduğunu açık bir şekilde belirlediyse, daha doğru çeviri yapabilir. Bu tekniklerin yardımıyla MT'nin insan çevirmenlere yardımcı olacak bir araç olarak sınırlı durumlarda kullanılabilecek çıktılar üretebilir (örneğin, hava durumu raporları).

Makine çevirisinin ilerleme ve potansiyeli tarihi boyunca tartışıldı. 1950'lerden bu yana, başta Yehoshua Bar-Hillel olmak üzere birçok akademisyen[3] yüksek kalitede tam otomatik makine çevirisi elde etme olasılığını sorguladı.[4]

Tarih

Kökenler

Makine çevirisinin kökenleri, olasılık ve istatistik dahil olmak üzere sistemik dil çevirisi için teknikler geliştiren dokuzuncu yüzyılda Arap bir kriptograf olan Al-Kindi'nin çalışmasına kadar izlenebilir.[5] Makine çevirisi fikri daha sonra 17. yüzyılda ortaya çıktı. 1629'da René Descartes, farklı dillerdeki eşdeğer fikirlerin aynı sembolü paylaştığı evrensel bir dil önerdi.[6]

Doğal dillerin çevirisinde bilgisayarların kullanılması fikri, 1947 gibi erken bir tarihte İngiltere'deki AD Booth[7] ve aynı yıl Rockefeller Foundation'dan Warren Weaver tarafından önerildi. " Warren Weaver tarafından 1949'da yazılan memorandum, makine çevirisinin ilk günlerinde belki de en etkili tek yayındı."[8][9] Bunu diğerleri izledi. 1954'te Birkbeck College'da APEXC makinesinde İngilizcenin Fransızcaya ilkel bir çevirisinin bir gösterimi yapıldı. O zamanlar konuyla ilgili popüler dergilerde makaleler yayınlandı (örneğin, Wireless World'ün Eylül 1955 sayısında Cleave ve Zacharov tarafından yazılan bir makale). O dönemde Birkbeck Koleji'nde de öncülük edilen benzer bir uygulama, Braille metinlerini bilgisayarda okuyor ve oluşturuyordu.

1950'ler

Yehoshua Bar-Hillel, araştırmalarına MIT'de başladı (1951). Profesör Michael Zarechnak liderliğindeki bir Georgetown Üniversitesi MT araştırma ekibi (1951), 1954'te Georgetown-IBM deney sisteminin halka açık bir gösterimini yaptı. Japonya[10][11] ve Rusya'da (1955) MT araştırma programları ortaya çıktı ve ilk MT konferansı Londra'da yapıldı (1956).[12][13]

David G. Hays "1957'de bilgisayar destekli dil işleme hakkında yazdı" ve "1955'ten 1968'e kadar Rand'da hesaplamalı dilbilim proje lideriydi."[14]

1960–1975

ABD'de Makine Çevirisi ve bilgisayarlı Dilbilim Derneği (1962) ve Ulusal Bilimler Akademisince Otomatik Dil İşleme Danışma Komitesi'nin (ALPAC) kurulmasıyla (1964) araştırmacılar bu alana katılmaya devam ettiler. Ancak ilerleme gerçekte çok daha yavaştı ve araştırmaların beklentileri karşılamadığını gösteren ALPAC raporundan (1966) sonra, fon büyük ölçüde azaldı.[15] Savunma Araştırma ve Mühendislik Direktörü'nün (DDR&E) 1972 tarihli bir raporuna göre, MT'nin büyük ölçekli uygulanabilirliği, Logos MT sisteminin bu çatışma sırasında askeri kılavuzları Vietnamcaya çevirmedeki başarısıyla yeniden tesis edildi.

Fransız Tekstil Enstitüsü özetleri Fransızca yanında İngilizce, Almanca ve İspanyolcaya çevirmek için MT'yi kullandı (1970); Brigham Young Üniversitesi, Mormonik metinleri otomatik yolla çevirmek için bir proje başlattı (1971).

1975 ve sonrası

1960'larda "ABD hükümetinin sözleşmeleri kapsamında alana öncülük eden" SYSTRAN, Xerox tarafından teknik kılavuzları çevirmek için kullanıldı (1978).[1] Hesaplama gücü arttıkça ve daha ucuz hale geldikçe, makine çevirisi için istatistiksel modellere 1980'lerin sonlarından başlayarak daha fazla ilgi gösterildi.[16] SYSTRAN'ın ilk uygulama sistemi, 1988 yılında Fransız Posta Servisi'nin Minitel adlı çevrimiçi hizmeti tarafından uygulandı.[17] MT ile aynı olmasa da, Çeviri Belleği teknolojisini ilk geliştiren ve pazarlayan Trados (1984) dahil olmak üzere çeşitli bilgisayar tabanlı çeviri şirketleri de piyasaya sürüldü. Rusça / İngilizce / Almanca-Ukraynaca için ilk ticari MT sistemi Kharkov Devlet Üniversitesi'nde geliştirildi (1991).

1998'de, "29.95 $ gibi bir fiyata" bilgisayarda çalıştırmak üzere "İngilizce ile seçtiğiniz büyük bir Avrupa dili arasında tek yönde çeviri yapmak için program satın alınabilirdi".[1]

Web üzerinde MT, SYSTRAN'ın küçük metinlerin ücretsiz çevirisini sunmasıyla başladı (1996) ve ardından bunu günde 500.000 istek toplayan AltaVista Babelfish[1] aracılığıyla sağladı (1997).[18] Web'deki ikinci ücretsiz çeviri hizmeti, Lernout & Hauspie'nin GlobaLink'iydi.[1] Atlantic Magazine 1998'de "Systran'dan Babelfish ve GlobaLink'ten Comprende"nin "Yetkin bir performansla" "Buna güvenme"yi ele aldığını yazdı.[19]

Google'da Çeviri Geliştirme bölümünün gelecekte başkanı olan Franz Josef Och, 2003 te DARPA'nın hızlı MT yarışmasını kazandı.[20] Bu süre zarfındaki diğer yenilikler arasında açık kaynaklı istatistiksel MT motoru MOSES (2007), Japonya'da cep telefonları için bir metin/SMS çeviri hizmeti (2008) ve İngilizce, Japonca ve Çince için konuşmadan konuşmaya çeviri işlevine sahip bir cep telefonu yer aldı (2009). 2012'de Google, Google Çeviri'nin kabaca bir günde 1 milyon kitabı dolduracak kadar metin çevirdiğini duyurdu.

Çeviri süreci

İnsan çevirisi süreci şu şekilde tanımlanabilir:

  1. Kaynak metnin anlamının çözülmesi; Ve
  2. Bu anlamı hedef dilde yeniden kodlamak.

Basit görünen prosedürün arkasında karmaşık bir bilişsel operasyon yatmaktadır. Kaynak metnin tam anlamını çözmek için, onun grameri, semantiği, sözdizimi, deyimleri vb. yanı sıra konuşmacının kültürü hakkında da derinlemesine bilgi gerektirir. Çevirmen, hedef dildeki kodlama için de aynı derinlikte bilgiye ihtiyaç duyar.

Makine çevirisindeki zorluk burada yatmaktadır: Bir metni bir kişinin anladığı gibi "anlayacak" ve hedef dilde sanki bir kişi tarafından yazılmış izlenimi veren yeni bir metin nasıl programlanır. Bir 'bilgi tabanı' tarafından desteklenmediği sürece MT, orijinal metnin kusurlu da olsa yalnızca genel bir "özünü" ("ana fikir") alabilir. Bu, toplam doğruluğun vazgeçilmez olduğu durumlar dışında birçok amaç için yeterlidir.

Yaklaşımlar

Bernard Vauquois'nın aracı temsilin karşılaştırmalı derinliklerini gösteren piramidi, zirvede diller arası makine çevirisi, ardından aktarım tabanlı ve ardından doğrudan çeviri

Makine çevirisinde dil bilgisi kurallarına dayalı bir yöntem kullanıldığında hedef dilin en uygun kelimeleri kaynak dildeki kelimelerin yerini alacaktır.

Makine çevirisinin başarısı için öncelikle doğal dili anlama sorununun çözülmesi gerektiği sıklıkla tartışılır.[21]

Genel olarak, "kural tabanlı yöntemler" bir metni ayrıştırır; genellikle hedef dildeki metnin üretildiği aracı, sembolik bir temsil oluşturur. Aracı temsilin doğasına göre, diller arası makine çevirisi veya aktarıma dayalı makine çevirisi olarak bir yaklaşım tanımlanmaktadır. Bu yöntemler, morfolojik, sözdizimsel ve semantik bilgileri ve büyük kural kümelerini içeren kapsamlı sözlükler gerektirir.

Yeterince veri yüklendiğinde, makine çevirisi programları genellikle yeterince iyi çalışır. Zorluk, belirli bir yöntemi desteklemek için doğru türden yeterli veriyi elde etmektir. Örneğin, istatistiksel yöntemlerin çalışması için gereken çok dilli büyük veri külliyatı, dilbilgisine dayalı yöntemler için gerekli değil, ancak yöntemin dikkatli bir şekilde tasarlaması için yetenekli bir dilbilimciye ihtiyaç vardır.

Yakından ilişkili diller arasında çeviri yapmak için kural tabanlı makine çevirisi kullanılabilir.

Kural tabanlı

Kural tabanlı makine çevirisi (RBMT) aktarım tabanlı, diller arası ve sözlük tabanlı makine çevirisi paradigmalarını içerir. Bu tür çoğunlukla sözlük ve gramer programlarının oluşturulmasında kullanılır. Diğer yöntemlerden farklı olarak RBMT, her iki dilin morfolojik ve sözdizim kuralları ve anlamsal analizi hakkında daha fazla bilgi içerir. Temel yaklaşım, giriş cümlesinin yapısını, kaynak dil için bir ayrıştırıcı ve bir çözümleyici, hedef dil için bir üreteç ve gerçek çeviri için bir aktarım sözlüğü kullanarak çıktı cümlesinin yapısıyla ilişkilendirmeyi içerir. RBMT'nin en büyük dezavantajı, her şeyin açık hale getirilmesi gerektiğidir: RBMT'nin en büyük çöküşü, her şeyin açık hale getirilmesi gerektiğidir: imla varyasyonu ve hatalı girdi, bununla başa çıkmak için kaynak dil analizörünün bir parçası haline getirilmeli ve tüm belirsizlik örnekleri için sözcüksel seçim kuralları yazılmalıdır. Kendi içinde yeni alanlara uyum sağlamak o kadar da zor değildir, çünkü çekirdek dilbilgisi alanlar arasında aynıdır ve etki alanına özgü ayarlama sözcüksel seçim ayarlamasıyla sınırlıdır.Çekirdek dilbilgisi tüm alanlarda aynı olduğundan ve alana özgü ayarlama sözcüksel seçim ayarlamasıyla sınırlı olduğundan, yeni alanlara uyum sağlamak kendi başına o kadar da zor değildir.

Aktarım tabanlı makine çevirisi

Aktarım tabanlı makine çevirisi orijinal cümlenin anlamını simüle eden bir ara temsilden çeviri oluşturur. Diller arası makine çevirisin'den farklı olarak çeviride yer alan dil çiftine kısmen bağlıdır.

Diller arası

Diller arası makine çevirisi, kural tabanlı makine çevirisi yaklaşımlarının bir örneğidir. Bu yaklaşımda tercüme edilecek metin, diller arası dil, yani "dilden bağımsız bir temsile" dönüştürülür. Hedef metin daha sonra interlingua'dan üretilir. Sistemin en büyük avantajlarından biri, çevrilebileceği hedef dil sayısının yüksek olmasıdır. Ancak, ticari düzeyde işlevsel hale getirilen tek diller arası makine çevirisi sistemi, Caterpillar Teknik İngilizcesini (CTE) diğer dillere çevirmek için tasarlanmış KANT sistemidir (Nyberg ve Mitamura, 1992).

Sözlük tabanlı

Bu tip çeviri, sözlük girişlerine dayalı, sözcüklerin bir sözlük tarafından olduğu gibi çevrileceği anlamına gelir.

İstatistiksel

İstatistiksel makine çevirisi, Kanada Hansard külliyatı, Kanada parlamentosu İngilizce-Fransızca kaydı ve Avrupa Parlamentosu EUROPARL kaydı gibi iki dilli metin külliyatlarına dayalı istatistiksel yöntemler kullanır. Ancak bu tür derlemler birçok dil çifti için nadirdir. İlk istatistiksel makine çevirisi yazılımı, IBM'den CANDIDE idi. Google, SYSTRAN'ı birkaç yıl kullandıktan sonra Ekim 2007'de istatistiksel bir çeviri yöntemine geçti. 2005 yılında Google, sistemlerini eğitmek için Birleşmiş Milletler materyallerinden yaklaşık 200 milyar kelime kullanarak dahili çeviri yeteneklerini geliştirdi; çeviri doğruluğu iyileştirildi.[22] Google Translate ve benzeri istatistiksel çeviri programları, daha önce insanlar tarafından çevrilmiş yüz milyonlarca belgedeki kalıpları tespit ederek ve bulgulara dayalı olarak akıllı tahminler yaparak çalışır. Genel olarak, belirli bir dilde ne kadar çok insan tarafından tercüme edilmiş belge varsa, çevirinin kaliteli olma olasılığı o kadar yüksektir.[23] METIS II ve PRESEMT gibi İstatistiksel Makine çevirisine yönelik daha yeni yaklaşımlar, minimum korpus boyutu kullanır ve bunun yerine örüntü tanıma yoluyla sözdizimsel yapının türetilmesine odaklanır. Daha fazla geliştirme ile bu, istatistiksel makine çevirisinin tek dilli bir metin külliyatından çalışmasına izin verebilir.[24] SMT'nin en büyük zorluğu, çok miktarda paralel metne bağımlı olması, morfoloji bakımından zengin dillerle (özellikle bu tür dillere çeviri yaparken) sorunları ve tekil hataları düzeltememesidir.

Örnek tabanlı

Örnek tabanlı makine çevirisi (EBMT) yaklaşımı, 1984 yılında Makoto Nagao tarafından önerildi.[25][26] Örnek tabanlı makine çevirisi, analoji fikrine dayanır. Bu yaklaşımda, kullanılan derlem zaten çevrilmiş metinleri içeren bir derlemdir. Çevrilecek bir cümle verildiğinde, bu külliyattan benzer alt cümle bileşenleri içeren cümleler seçilir.[27] Benzer cümleler daha sonra orijinal cümlenin alt cümle bileşenlerini hedef dile çevirmek için bir araya getirilir.

Hibrit MT

Hibrit makine çevirisi (HMT), istatistiksel ve kural tabanlı çevirilerin güçlü yönlerinden yararlanır.[28] Yaklaşımlar farklılıklar gösterebilir:

  • İstatistikler tarafından sonradan işlenmiş kurallar : Çeviriler, kurallara dayalı bir motor kullanılarak gerçekleştirilir, daha sonra çıktıyı ayarlamak/düzeltmek için istatistikler kullanılır.
  • Kurallarla yönlendirilen istatistikler : Kurallar istatistik motorunu yönlendirmek amacıyla önceden kullanıldığı gibi çıktıyı işlemek için de kullanılır. Bu yaklaşım çeviri yaparken çok daha fazla güce, esnekliğe ve kontrole sahiptir.

Daha yakın zamanlarda, Nöral MT'nin gelişiyle birlikte, kurallara dayalı, istatistiksel ve sinirsel makine çevirisini birleştiren yeni bir hibrit çeviri sürümü ortaya çıkıyor. Yaklaşım, NMT ve SMT'den yararlanmanın yanı sıra kural kılavuzlu bir iş akışında ön ve son işlemeden yararlanmaya olanak tanır. Dezavantajı, yaklaşımı yalnızca belirli kullanım durumları için uygun kılan karmaşıklıktır.

Nöral MT

MT'ye derin öğrenme tabanlı bir yaklaşım olan nöral makine çevirisi son yıllarda hızlı bir ilerleme kaydetti ve Google, çeviri hizmetlerinin artık önceki istatistiksel yöntemlerine göre bu teknolojiyi tercih ettiğini duyurdu.[29] Bir Microsoft ekibi, 2018'de WMT-2017'de ("EMNLP 2017 İkinci Makine Çevirisi Konferansı") insan eşitliğine ulaştığını iddia etti.[30] Ancak ulaşılan fikir birliği, iddia edilen insan denkliğinin gerçek olmadığı, tamamen sınırlı alanlara, dil çiftlerine ve belirli test paketlerine[31] dayalı olduğu, yani istatistiksel anlamlılık gücünden yoksun olduğu yönündedir. NMT'nin gerçek insan parite performanslarına ulaşması için hala uzun bir yolculuk var.

Deyimsel ifade çevirisini, çok kelimeli ifadeleri ve düşük frekanslı kelimeleri (OOV veya kelime dağarcığı dışı kelime çevirisi olarak da adlandırılır) ele almak için, dil odaklı dilsel özellikler son teknoloji ürünü nöral makine çevirisi (NMT) modellerinde araştırılmıştır.[32] Örneğin, Çince karakter ayrıştırmalarının kök ve vuruşlara NMT'de çok kelimeli ifadeleri çevirmede yardımcı olduğu kanıtlanmıştır.

2022'den itibaren genellikle en iyi makine çevirisi sonuçlarını sağladığı düşünülen DeepL Translator gibi nöral MT araçlarıyla yapılan çeviriler için genellikle yine de bir insan tarafından son düzenleme yapılması gerekiyor.[33][34][35]

Çevirileri iyileştirmek için potansiyel AI tabanlı teknikler

Makine çevirileri için geliştirilmekte olan teknikler şunları içerir:

  • Doğal dil işleme[36][37] – kaynak metnin semantik olarak anlaşılmasını (ör. anlam, duygu, adlandırma ve bağlamlar) ve ayrıca çeviri sonuçlarını iyileştirmek için gerçek dünyayla ilgili bir veri tabanı aracılığıyla ayarlamalar sağlar. Bir çalışmada, "hedef dildeki cümlelerle birlikte çeviriyi" tamamlamak için bir "anlamsal birim kitaplığı" kullanılmıştır.[38]
  • GPT-3 [39][40] kullanılarak son düzenleme

Büyük sorunlar

Makine çevirisi, "Çince鸡枞 gibi bazı anlaşılmaz ifadeler üretebilir." ( Macrolepiota albuminosa ) "Wikipedia" olarak işleniyor.
Kırık Çince "Çince沒有進入" Bali, Endonezya'daki makine çevirisinden. Kırık Çince cümle "bir giriş yok" veya "henüz girmedim" gibi bir anlama geliyor.

Profesyonel edebi çevirmenler veya insan okuyucular tarafından en son gelişmiş MT çıktılarıyla ilgili çeşitli sorunlar sistematik olarak tanımlamıştır.[40] Yaygın sorunlar doğru çevirisi "sağduyu-benzeri semantik dil işleme veya bağlam üzerinden" ancak yapılabilen bölümlerin çevirilerinde yer alıyor.[40] Ayrıca kaynak metinlerde de hatalar olabilir, yüksek kaliteli eğitim (çeviricilerin) verileri eksik olabilir.

Notlar

Konuyla ilgili yayınlar

Kaynakça

  1. ^ a b c d e "Lost in Translation". Atlantic Magazine. December 1998. ss. 81-84.  Birden fazla yazar-name-list parameters kullanıldı (yardım); Yazar |ad1= eksik |soyadı1= (yardım)
  2. ^ Albat, Thomas Fritz. "Systems and Methods for Automatically Estimating a Translation Time." US Patent 0185235, 19 July 2012.
  3. ^ Language and Information: Selected Essays on Their Theory and Application. Reading, Massachusetts: Addison-Wesley. 1964. ss. 174-179.  Yazar |ad1= eksik |soyadı1= (yardım)
  4. ^ The Limits of Machine Translation (MA tez). University of Copenhagen. 2009. s. 5. 17 Ekim 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 12 Mayıs 2020. 
  5. ^ "The Cryptological Origins of Machine Translation: From al-Kindi to Weaver". Amodern. January 2018. 14 Ağustos 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 2 Eylül 2019.  Yazar |ad1= eksik |soyadı1= (yardım)
  6. ^ Universal Language Schemes in England and France, 1600-1800. Toronto: University of Toronto Press. 1975. ISBN 0-8020-5296-7.  Yazar |ad1= eksik |soyadı1= (yardım)
  7. ^ "MECHANICAL TRANSLATION". Computers and Automation 1953-05: Vol 2 Iss 4 (İngilizce). Internet Archive. Berkeley Enterprises. 1 Mayıs 1953. s. 6.  Yazar |ad1= eksik |soyadı1= (yardım)
  8. ^ J. Hutchins (2000). "Warren Weaver and the launching of MT". Early Years in Machine Translation (PDF). Semantic Scholar. Studies in the History of the Language Sciences. 97. s. 17. doi:10.1075/sihols.97.05hut. ISBN 978-90-272-4586-1. 28 Şubat 2020 tarihinde kaynağından (PDF) arşivlendi. 
  9. ^ "Warren Weaver, American mathematician". 13 Temmuz 2020. 6 Mart 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ağustos 2020. 
  10. ^ パーソナルコンピュータによる機械翻訳プログラムの制作 (Japonca). Tokyo: (株)ラッセル社. 13 Ağustos 1986. s. 16. ISBN 494762700X. わが国では1956年、当時の電気試験所が英和翻訳専用機「ヤマト」を実験している。この機械は1962年頃には中学1年の教科書で90点以上の能力に達したと報告されている。(translation (assisted by Google Translate): In 1959 Japan, the National Institute of Advanced Industrial Science and Technology(AIST) tested the proper English-Japanese translation machine Yamato, which reported in 1964 as that reached the power level over the score of 90-point on the textbook of first grade of junior hi-school.) 
  11. ^ "機械翻訳専用機「やまと」-コンピュータ博物館". 19 Ekim 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 4 Nisan 2017. 
  12. ^ Nye (2016). "Speaking in Tongues: Science's centuries-long hunt for a common language". Distillations. 2 (1): 40-43. 3 Ağustos 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Mart 2018. 
  13. ^ Scientific Babel: How Science Was Done Before and After Global English. Chicago, Illinois: University of Chicago Press. 2015. ISBN 9780226000299. 
  14. ^ Wolfgang Saxon (28 Temmuz 1995). "David G. Hays, 66, a Developer Of Language Study by Computer". The New York Times. 7 Şubat 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ağustos 2020. wrote about computer-assisted language processing as early as 1957.. was project leader on computational linguistics at Rand from 1955 to 1968. 
  15. ^ パーソナルコンピュータによる機械翻訳プログラムの制作 (Japonca). Tokyo: (株)ラッセル社. 13 Ağustos 1986. s. 16. ISBN 494762700X. 
  16. ^ Conceptual Information Processing. New York: Elsevier. 2014. s. 5. ISBN 9781483258799.  Yazar |ad1= eksik |soyadı1= (yardım)
  17. ^ Machine Translation and the Information Soup: Third Conference of the Association for Machine Translation in the Americas, AMTA'98, Langhorne, PA, USA, October 28–31, 1998 Proceedings. Berlin: Springer. 29 Haziran 2003. s. 276. ISBN 3540652590. 
  18. ^ "Babel Fish: What Happened To The Original Translation Application?: We Investigate". Digital.com (İngilizce). 18 Kasım 2019. 20 Kasım 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 22 Kasım 2019. 
  19. ^ and gave other examples too
  20. ^ Routledge Encyclopedia of Translation Technology. Oxon: Routledge. 2015. s. 385. ISBN 9780415524841.  Yazar |ad1= eksik |soyadı1= (yardım)
  21. ^ John Lehrberger (1988). Machine Translation: Linguistic Characteristics of MT Systems and General Methodology of Evaluation. John Benjamins Publishing. ISBN 90-272-3124-9. 17 Ekim 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 18 Ekim 2020. 
  22. ^ "Google Translator: The Universal Language". Blog.outer-court.com. 25 Ocak 2007. 20 Kasım 2008 tarihinde kaynağından arşivlendi. Erişim tarihi: 12 Haziran 2012. 
  23. ^ "Inside Google Translate – Google Translate". 16 Nisan 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Nisan 2014. 
  24. ^ "Language-Independent Hybrid MT with PRESEMT". Proceedings of the Second Workshop on Hybrid Approaches to Translation (PDF). Sofya: Association for Computational Linguistics. 2013. ss. 123-130. ISBN 978-1-937284-63-3. 13 Nisan 2014 tarihinde kaynağından (PDF) arşivlendi. 
  25. ^ Nagao, M. 1981. A Framework of a Mechanical Translation between Japanese and English by Analogy Principle, in Artificial and Human Intelligence, A. Elithorn and R. Banerji (eds.) North- Holland, pp. 173–180, 1984.
  26. ^ "the Association for Computational Linguistics – 2003 ACL Lifetime Achievement Award". Association for Computational Linguistics. 12 Haziran 2010 tarihinde kaynağından arşivlendi. Erişim tarihi: 10 Mart 2010. 
  27. ^ "Kitt.cl.uzh.ch [CL Wiki]" (PDF). 7 Ocak 2014 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 18 Kasım 2013. 
  28. ^ Adam Boretz (2 Mart 2009). "Boretz, Adam, "AppTek Launches Hybrid Machine Translation Software" SpeechTechMag.com (posted 2 MAR 2009)". Speechtechmag.com. 9 Haziran 2009 tarihinde kaynağından arşivlendi. Erişim tarihi: 12 Haziran 2012. 
  29. ^ "Google's neural network learns to translate languages it hasn't been trained on". 1 Eylül 2017 tarihinde kaynağından arşivlendi. Erişim tarihi: 4 Eylül 2017. 
  30. ^ "Microsoft reaches a historic milestone, using AI to match human performance in translating news from Chinese to English". 14 Mart 2018. 2 Mart 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Nisan 2021. 
  31. ^ Antonio Toral, Sheila Castilho, Ke Hu, and Andy Way. 2018. Attaining the unattainable? reassessing claims of human parity in neural machine translation. CoRR, abs/1808.10432.
  32. ^ "Multiword Expressions – ACL Wiki". 8 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 8 Mayıs 2021. 
  33. ^ Katsnelson (29 Ağustos 2022). "Poor English skills? New AIs help researchers to write better". Nature (İngilizce). 609 (7925): 208-209. doi:10.1038/d41586-022-02767-9. PMID 36038730. 18 Aralık 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 9 Ocak 2023. 
  34. ^ "DeepL: An Exceptionally Magnificent Language Translator". Medium (İngilizce). 18 Şubat 2022. 27 Temmuz 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 9 Ocak 2023. 
  35. ^ "DeepL outperforms Google Translate – DW – 12/05/2018". Deutsche Welle (İngilizce). 5 Aralık 2018 tarihinde kaynağından arşivlendi. Erişim tarihi: 9 Ocak 2023. 
  36. ^ "Natural Language Processing and Its Applications in Machine Translation: A Diachronic Review". 2020 IEEE 3rd International Conference of Safe Production and Informatization (IICSPI). November 2020. ss. 210-214. doi:10.1109/IICSPI51290.2020.9332458. ISBN 978-1-7281-7738-0. 
  37. ^ Khurana (1 Ocak 2023). "Natural language processing: state of the art, current trends and challenges". Multimedia Tools and Applications (İngilizce). 82 (3): 3713-3744. doi:10.1007/s11042-022-13428-4. ISSN 1573-7721. PMC 9281254 $2. PMID 35855771. 
  38. ^ "English Machine Translation System Based on Semantic Selection and Information Features". Proceedings of the 2022 3rd International Conference on Artificial Intelligence and Education (IC-ICAIE 2022) (İngilizce). Atlantis Press. 27 Aralık 2022. ss. 963-967. doi:10.2991/978-94-6463-040-4_145. ISBN 978-94-6463-039-8. 
  39. ^ Fadelli. "Study assesses the quality of AI literary translations by comparing them with human translations". techxplore.com (İngilizce). 18 Aralık 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 18 Aralık 2022. 
  40. ^ a b c A bot will complete this citation soon. Click here to jump the queue arXiv:[1].

Dış bağlantılar

{{Otorite kontrolü}} [[Kategori:Otomasyon yazılımları]] [[Kategori:Doğal dil işleme görevleri]] [[Kategori:Bilgisayar destekli çeviri]] [[Kategori:Bilişimsel dilbilim]] [[Kategori:Yapay zekâ uygulamaları]] [[Kategori:Makine çevirisi]]

İlgili Araştırma Makaleleri

Çeviri ya da tercüme, bir dildeki bir metnin başka bir dile aktarılması işlemini ve bu süreç sonucunda elde edilen ürünü anlatmak amacıyla kullanılır.

<span class="mw-page-title-main">Roman Jakobson</span>

Roman Osipoviç Jakobson, Rus düşünür.

<span class="mw-page-title-main">Google Çeviri</span> Çeviri aracı

Google Çeviri, İnternet sayfalarını, metinleri veya yüklemiş olduğunuz belgeleri ücretsiz çeviren bir araçtır. Google tarafından sağlanır. İlk olarak 28 Nisan 2006 tarihinde, Arapça ile İngilizce arası çeviri yaparak hizmete girmiştir. Bir web arayüzü, Android ve iOS için mobil uygulamalar, geliştiricilere tarayıcı eklentisi ve yazılım uygulamaları oluşturmada yardımcı olan bir API sunar. Google Translate, çeşitli seviyelerde 100'den fazla dili destekliyor ve Mayıs 2013 itibarıyla günlük 200 milyondan fazla kişiye hizmet veriyor.

Çeviribilim ya da Çeviri bilimi, yazılı ve sözlü çevirinin kuram, betimleme ve uygulamasını konu alan beşeri bilim dalıdır. Sahalar arası bir çalışma alanı olarak çeviribilim, çeviriye destek olan çeşitli sahalardan katkı alır. Bunların arasında metin dilbilim, toplumbilim, tarih, karşılaştırmalı edebiyat, felsefe, filoloji, göstergebilim, edebiyat gibi bilim dalları bulunur. Batı dillerinde “translation studies” (İngilizce), “Translationswissenschaft” (Almanca) ve “traductologie” (Fransızca) gibi adlarla anılır.

Bilgisayar destekli çeviri çeviri sırasında çevirmenleri destekleyen bilgisayar yazılımlarıyla yapılan bir tür çeviridir. BDÇ, çeviri işleminin herhangi bir insan yardımı olmaksızın ya da çeviri öncesinde ya da sonrasında çok az bir insan desteğiyle gerçekleşen makineli çeviri, makine çevirisi ya da bilgisayarlı çeviri ile karıştırılmamalıdır.

İstatistiksel makine çevirisi, iki dilli metin derlemlerinin incelenmesinden elde edilen parametrelerin kullanıldığı istatistiksel modelleri içeren bir makine çevirisi yaklaşımıdır. İstatiksel çeviri yöntemi, makine çevirisi disiplini içerisinde kural tabanlı makine çevirisi ve örnek tabanlı makine çevirisi yaklaşımlarına göre farklılık gösterir.

<span class="mw-page-title-main">Apertium</span>

Apertium, kurallara dayanan bir makine çeviri platformudur. Bu bir özgür yazılımdır ve GNU General Public License şartları altında yayımlanmıştır.

Örnek tabanlı makine çevirisi (EBMT) genellikle çalışma sırasında ana bilgi tabanı paralel metinler olan iki dilli bir külliyatın kullanımı ile karakterize edilen bir makine çevirisi yöntemdir. Bu, aslında bir "benzetme ile çeviri" ve makine öğreniminde vaka - tabanlı muhakeme yaklaşımının bir uygulaması olarak görülebilir.

Duolingo, dil öğrenme uygulamaları üreten ve dil sertifikası sağlayan bir Amerikan eğitim teknolojisi şirketidir.

<span class="mw-page-title-main">Yandex.Çeviri</span> çeviri aracı

Yandex.Çeviri, Yandex tarafından sağlanan amacı metin ve web sayfaları diğer dillere çevirmek olan bir web hizmetidir.

<span class="mw-page-title-main">Hesaplamalı dilbilim</span>

Bilgisayarlı dilbilim veya hesaplamalı dilbilim, doğal dilin istatistiksel veya kural tabanlı modelleme yöntemleriyle ve hesaplamalı bir perspektif ile inceleyen disiplinler arası bir bilgisayar bilimi alanıdır.

<span class="mw-page-title-main">Microsoft Tercüman</span> çok dilli bir makine çeviri bulut hizmeti

Microsoft Tercüman, Microsoft tarafından sağlanan çok dilli bir makine çeviri bulut hizmetidir. Microsoft Translator API-si, birden fazla tüketici, geliştirici ve kurumsal ürüne entegre edilmiştir; Bing, Microsoft Office, SharePoint, Skype for Business, Yammer, Skype Translator, Visual Studio, Internet Explorer, Windows Phone, iPhone ve Apple Watch ve Android telefonu ve Android Wear için Microsoft Tercüman uygulamaları.

<span class="mw-page-title-main">Google Nöral Makine Çevirisi</span> Google tarafından Google Çevirinin akıcılığını ve duyarlılığını artırmak için geliştirilen sistem

Google Nöral Makine Çevirisi (GNMT), Google tarafından geliştirilen ve Google Çeviri’nin akıcılığını ve doğruluğunu artırmak için yapay bir sinir ağı kullanan, Kasım 2016’da tanıtılan bir yapay sinir ağları (NMT) sistemidir.

<span class="mw-page-title-main">Uluslararasılaştırma ve yerelleştirme</span>

Bilgi işlemde, uluslararasılaştırma ve yerelleştirme, genellikle i18n (internationalization) ve L10n (localization) olarak kısaltılır, bilgisayar yazılımını farklı dillere, bölgesel özelliklere ve bir hedef yerel ayarın teknik gereksinimlerine uyarlamanın araçlarıdır. Uluslararasılaştırma, bir yazılım uygulamasının mühendislik değişiklikleri olmaksızın çeşitli dillere ve bölgelere uyarlanabilmesi için tasarlama sürecidir. Yerelleştirme, metni çevirerek ve yerel ayara özel bileşenler ekleyerek uluslararasılaştırılmış yazılımı belirli bir bölge veya dile uyarlama sürecidir. Yerelleştirme, uluslararasılaştırmanın sağladığı altyapıyı veya esnekliği kullanır.

Çeviri belleği (ÇB) veya Çeviri hafızası (ÇB), insan çevirmenlere yardımcı olmak için daha önce çevrilmiş cümleler, paragraflar veya cümle benzeri birimler olabilen "segmentleri" depolayan bir veritabanıdır. Çeviri belleği, kaynak metni ve karşılık gelen çevirisini “çeviri birimleri” adı verilen dil çiftlerinde saklar. Bireysel kelimeler terminoloji temelleri tarafından ele alınır ve ÇB'nin alanı içinde değildir.

<span class="mw-page-title-main">Luther Kutsal Kitabı</span> Almancaya ilk çevirilen Kutsal Kitap nüshası

Luther Kutsal Kitabı veya Luther Kitâb-ı Mukaddesi Protestan reformcu Martin Luther'in Almanca Kutsal Kitap çevirisidir. Luther Yeni Ahit çevirisi ilk olarak Eylül 1522'de yayınlandı ve 1534'te Apokrif ile Eski ve Yeni Ahit'in bir çevirisini içeren tamamlanmış Kutsal Kitap yayımlandı. Luther, 1545 yılına kadar metinde iyileştirmeler yapmaya devam etti. Sadece Latince Vulgate çevirilerini değil ayrıca Yunanca metinleri de kullanan Kutsal Kitap'ın Almancaya ilk tam çevirisidir.

Kumārajīva Kuçar Krallığı'ndan bir Budist keşiş, bilgin, misyoner ve tercümandı. Kumārajīva, Çin Budizminin en büyük tercümanlarından biri olarak görülür. Lu Cheng'e göre Kumarajiva'nın çevirileri "çeviri tekniği veya aslına uygunluk derecesi açısından benzersizdir".

Nöral makine çevirisi (NMT), bir sözcük dizilim olasılığını tahmin etmek için yapay bir sinir ağı kullanan ve genellikle cümlenin tümünü tek bir entegre modelde modelleyen bir makine çevirisi yaklaşımıdır.

Diller Arası Bilgi Erişimi (CLIR), bilgi teknolojileri alanında kullanıcının sorgusunun dilinden farklı bir dilde yazılmış bilgilerin alınmasıyla ilgilenen bir alt alanıdır. Bu alandaki çalışmalar, kullanıcının bilgi ihtiyaçlarını bir dilde ifade ettiği ve sistemlerin ilgili belgeleri başka bir dilde bulup getirdiği durumları ele alır. Çoğu CLIR sistemi, farklı çeviri tekniklerini kullanarak bu işlemi gerçekleştirir.

Diller arası bilgi erişimi (CLIR), farklı dillerde ifade edilen sorguları kabul edilebilir çeviri teknikleri ile arayıp bulma işlemidir. Bilgi erişim sistemlerinde önemli rol oynar ve farklı dillerde bilgiye erişim imkanı sağlayarak küresel bilgi akışına katkıda bulunur.