İçeriğe atla

Çeviri belleği

Çeviri belleği (ÇB) veya Çeviri hafızası (ÇB), insan çevirmenlere yardımcı olmak için daha önce çevrilmiş cümleler, paragraflar veya cümle benzeri birimler (başlıklar, başlıklar veya bir listedeki öğeler) olabilen "segmentleri" depolayan bir veritabanıdır. Çeviri belleği, kaynak metni ve karşılık gelen çevirisini “çeviri birimleri” adı verilen dil çiftlerinde saklar. Bireysel kelimeler terminoloji temelleri tarafından ele alınır ve ÇB'nin alanı içinde değildir.

Çeviri hafızasını kullanan yazılım programları bazen çeviri hafızası yöneticileri (ÇBY) veya çeviri hafızası sistemleri (ÇB sistemleri, çeviri sürecini yönetmeye odaklanan başka bir yazılım türü olan Çeviri yönetim sistemi (ÇYS) ile karıştırılmamalıdır) olarak bilinir.

Çeviri hafızaları tipik olarak özel bir bilgisayar destekli çeviri (BDÇ) aracı, kelime işlem programı, terminoloji yönetim sistemleri, çok dilli sözlük ve hatta ham makine çevirisi çıktısı ile birlikte kullanılır.

Araştırmalar, çok dilli belgeler üreten birçok şirketin çeviri hafızası sistemlerini kullandığını gösteriyor. 2006'da dil uzmanlarıyla yapılan bir ankette, 874 yanıtın %82,5'i ÇB kullanımını doğruladı.[1] ÇB kullanımı, teknik terimler ve basit cümle yapısı (teknik, daha düşük derecede pazarlama ve finansal), bilgi işlem becerileri ve içeriğin tekrarlanabilirliği ile karakterize edilen metin türüyle ilişkilidir.[1]

Çeviri hafızasını kullanma

Program kaynak metni (çevrilecek metni) bölümlere ayırır, bölümler arasındaki eşleşmeleri ve bir çeviri hafızasında depolanan daha önce çevrilmiş kaynak-hedef çiftlerinin kaynak yarısı arasındaki eşleşmeleri arar ve bu eşleşme çiftlerini çeviri tam ve/veya kısmi eşleşmeler olarak sunar. Çevirmen bir eşleşmeyi kabul edebilir, yeni bir çeviriyle değiştirebilir veya kaynağa uyacak şekilde değiştirebilir. Son iki durumda, yeni veya değiştirilmiş çeviri veritabanına gider.

Bazı çeviri hafızası sistemleri yalnızca %100 eşleşme arar, yani yalnızca veri tabanındaki girişlerle tam olarak eşleşen metin bölümlerini alabilirken, diğerleri çevirmene işaretli farklılıklarla sunulan benzer bölümleri almak için bulanık eşleştirme algoritmaları kullanır. Tipik çeviri hafızası sistemlerinin yalnızca kaynak bölümdeki metni aradığına dikkat etmek önemlidir.

Eşleştirme algoritmasının esnekliği ve sağlamlığı, çeviri hafızasının performansını büyük ölçüde belirler, ancak bazı uygulamalar için tam eşleşmelerin geri çağırma oranı %100 eşleşme yaklaşımını haklı çıkarmaya yetecek kadar yüksek olabilir.

Eşleşmenin bulunmadığı bölümlerin çevirmen tarafından manuel olarak çevrilmesi gerekecektir. Bu yeni çevrilen bölümler, gelecekteki çeviriler için ve aynı zamanda o bölümün mevcut metindeki tekrarları için kullanılabilecekleri veritabanında saklanır.

Çeviri hafızası, teknik kılavuzlar gibi çok tekrarlı metinlerde en iyi sonucu verir. Ayrıca, örneğin bir kullanım kılavuzunun yeni bir sürümündeki küçük değişikliklere karşılık gelen, daha önce çevrilmiş bir belgedeki artımlı değişiklikleri çevirmek için de yararlıdırlar. Geleneksel olarak çeviri hafızası, kullanılan dilde çok az tekrar olması gibi basit bir nedenle edebi veya yaratıcı metinler için uygun görülmemektedir. Bununla birlikte, diğerleri onları tekrar eÇBeyen metinler için bile değerli buluyor, çünkü oluşturulan veritabanı kaynakları, terimlerin uygun kullanımını belirlemek için uygunluk araştırmaları, kalite güvencesi (boş bölümler yok) ve inceleme sürecinin basitleştirilmesi (kaynak ve çevirmenler geleneksel bir inceleme ortamında iki belgeyle çalışmak zorundayken hedef segment her zaman birlikte görüntülenir).

Ana faydalar

Çeviri hafızası yöneticileri, teknik belgeleri ve özel sözlükler içeren belgeleri çevirmek için en uygun olanlardır. Avantajları şunlardır:

  • Belgenin tamamen tercüme edilmesini sağlamak (çeviri hafızaları boş hedef segmentleri kabul eÇBez)
  • Ortak tanımlar, ifadeler ve terminoloji dahil olmak üzere tercüme edilen belgelerin tutarlı olmasını sağlamak. Bu, farklı çevirmenler tek bir proje üzerinde çalışırken önemlidir.
  • Çevirmenlerin, genellikle bu biçimleri işlemek için gereken yazılıma sahip olmak zorunda kalmadan çok çeşitli biçimlerdeki belgeleri çevirmesine olanak tanır.
  • Genel çeviri sürecini hızlandırmak; Çeviri bellekleri daha önce çevrilmiş materyali "hatırladığından", çevirmenlerin onu yalnızca bir kez çevirmesi gerekir.
  • Uzun vadeli çeviri projelerinin maliyetlerinin düşürülmesi; örneğin kılavuz metinleri, uyarı mesajları veya belge dizileri yalnızca bir kez çevrilmelidir ve birkaç kez kullanılabilir.
  • Büyük dokümantasyon projeleri için, bir ÇB paketinin kullanımı sayesinde (zaman veya para olarak) tasarruf, yeni bir projenin ilk çevirisi için bile zaten belirgin olabilir, ancak normalde bu tür tasarruflar, yalnızca önceden yapılmış bir projenin sonraki sürümlerinin çevirisi sırasında görülür. çeviri belleğini kullanmadan önce çevrildi.

Ana engeller

Çeviri belleği yöneticilerinin daha geniş kullanımını engelleyen başlıca sorunlar şunlardır:

  • "Çeviri bellekleri" kavramı, önceki çevirilerde kullanılan cümlelerin "geri dönüştürülebileceği" öncülüne dayanmaktadır. Bununla birlikte, çevirinin yol gösterici bir ilkesi, çevirmenin, metnin bileşenlerini değil, metnin mesajını çevirmesi gerektiğidir.
  • Çeviri belleği yöneticileri, mevcut çeviri veya yerelleştirme süreçlerine kolayca uymazlar. ÇB teknolojisinden yararlanmak için çeviri süreçleri yeniden tasarlanmalıdır.
  • Çeviri belleği yöneticileri şu anda tüm belge biçimlerini desteklememektedir ve tüm dosya türlerini desteklemek için filtreler mevcut olmayabilir.
  • Çeviri belleği yöneticilerinin kullanılmasıyla ilgili bir öğrenme eğrisi vardır ve programlar en yüksek etkinlik için özelleştirilmelidir.
  • Tercüme sürecinin tamamının veya bir kısmının dışarıdan temin edildiği veya saha dışında çalışan serbest çevirmenler tarafından yürütüldüğü durumlarda, saha dışındaki çalışanlar, çeviri belleği yöneticisi tarafından oluşturulan metinlerle çalışabilmek için özel araçlara ihtiyaç duyarlar.
  • Birçok çeviri belleği yöneticisinin tam sürümleri, koltuk başına 500 ABD Doları ile 2,500 ABD Doları arasında olabilir ve bu da önemli bir yatırımı temsil edebilir (ancak daha düşük maliyetli programlar da mevcuttur). Bununla birlikte, bazı geliştiriciler, bireysel çevirmenlerin bu araçların tam sürümleriyle oluşturulmuş projeler üzerinde çalışmak için kullanabileceği azaltılmış özellik setleriyle araçlarının ücretsiz veya düşük maliyetli sürümlerini üretir. (Ücretsiz ve shareware ÇB paketleri olduğunu unutmayın, ancak bunların hiçbiri henüz büyük bir pazar payı kazanmamıştır.)
  • Kullanıcının geçmiş çevirilerini çeviri belleği veritabanına aktarma, eğitim ve herhangi bir ek ürünle ilgili maliyetler de önemli bir yatırımı temsil edebilir.
  • Çeviri belleği veritabanlarının bakımı çoğu durumda hala manuel bir işlem olma eğilimindedir ve bunların bakımının yapılmaması, ÇB eşleşmelerinin kullanılabilirliğinin ve kalitesinin önemli ölçüde azalmasına neden olabilir.
  • Daha önce belirtildiği gibi, çeviri belleği yöneticileri, dahili tekrarı olmayan veya revizyonlar arasında değişmeyen kısımlar içermeyen metinler için uygun olmayabilir. Teknik metinler genellikle çeviri belleği için en uygun olanıdır, pazarlama veya yaratıcı metinler ise daha az uygun olacaktır.

Kalite üzerindeki etkiler

ÇB sistemlerinin kullanılması, tercüme edilen metinlerin kalitesi üzerinde etkili olabilir. Ana etkisi, açıkça "hata yayılımı" ile ilgilidir: belirli bir bölümün çevirisi yanlışsa, aslında yanlış çevirinin aynı kaynak metin veya benzer bir sonraki sefer tekrar kullanılması daha olasıdır. kaynak metin çevrilir, böylece hata devam eder. Geleneksel olarak, çevrilmiş metinlerin kalitesi üzerinde iki ana etki tanımlanmıştır: "cümle-salata" etkisi (Bédard 2000; O'Hagan 2009: 50'de aktarılmıştır) ve "gözetleme deliği" etkisi (Heyn 1998). İlki, bir metin, farklı tarzlarda farklı çevirmenler tarafından çevrilmiş olan bir ÇB'dan alınan cümleler kullanılarak çevrildiğinde metin düzeyinde tutarlılık eksikliğine atıfta bulunur. İkincisine göre, çevirmenler, metin içi referanslar içermemeleri için üsluplarını ÇB sisteminin kullanımına uyarlayabilirler, böylece bölümler gelecekteki metinlerde daha iyi kullanılabilir, böylece bağdaşıklık ve okunabilirlik etkilenir (O'Hagan 2009).

Çevrilen metin üzerinde potansiyel ve varsa muhtemelen bilinçsiz bir etki vardır. Farklı diller, bir cümle içindeki mantıksal öğeler için farklı sıralar kullanır ve yarısı çevrilmiş çok yan tümceli bir cümleyle sunulan bir çevirmenin, bir cümleyi tamamen yeniden oluşturma olasılığı daha düşüktür. Tutarlı ampirik kanıtlar (Martín-Mor 2011), çevirmenlerin bir ÇB sistemi yerine bir metin işlemcisi ile çalışırken çok yan tümceli bir cümlenin yapısını büyük olasılıkla değiştireceklerini göstermektedir.

Ayrıca çevirmenin, her bir cümlenin etrafındakilerle ve bir bütün olarak metinle nasıl bir ilişki kurduğuna odaklanmak yerine, metni cümle cümle mekanik olarak ele alma potansiyeli de vardır. Araştırmacılar (Dragsted 2004), bu programların otomatik bölümleme özelliği ile ilgili olan bu etkiyi tanımladılar, ancak bunun çevirilerin kalitesi üzerinde mutlaka olumsuz bir etkisi olması gerekmiyor.

Bu etkilerin, araca özgü olmaktan ziyade eğitimle yakından ilişkili olduğunu unutmayın. Martín-Mor'a (2011) göre, ÇB sistemlerinin kullanılması, özellikle yeni başlayanlar için çevrilen metinlerin kalitesi üzerinde bir etkiye sahiptir, ancak deneyimli çevirmenler bundan kaçınabilir. Pym (2013) "ÇB/MÇ kullanan çevirmenlerin, ilerledikçe her bölümü revize etme eğiliminde olduğunu ve sonunda tüm metnin nihai bir revizyonu için çok az zaman tanıdığını" hatırlatır; bu aslında burada açıklanan etkilerin bazı sorunların nihai nedeni olabilir.

Çeviri hafızası sistemleri türleri

  • Masaüstü: Masaüstü çeviri hafızası araçları, genellikle bireysel çevirmenlerin çevirileri tamamlamak için kullandığı araçlardır. Serbest çevirmenlerin masaüstü bilgisayarına indirip yüklediği programlardır.
  • Sunucu tabanlı veya merkezileştirilmiş: Merkezileştirilmiş çeviri belleği sistemleri, ÇB'yi merkezi bir sunucuda depolar. Masaüstü ÇB ile birlikte çalışırlar ve ÇB eşleşme oranlarını yalnızca masaüstü ÇB ile elde edilen ÇB kaldıracından %30-60 daha fazla artırabilirler.

İşlevler

Aşağıda, bir çeviri hafızasının ana işlevlerinin bir özeti yer almaktadır.

Çevrimdışı işlevler

İçe aktarma

Bu işlev, bir metni ve çevirisini bir metin dosyasından ÇB'ye aktarmak için kullanılır. İçe aktarma, çevirisiyle birlikte bir ÇB'ye içe aktarmak için harici bir kaynak metnin mevcut olduğu bir ham biçimden yapılabilir. Bazen metinlerin kullanıcı tarafından yeniden işlenmesi gerekir. İçe aktarma için kullanılabilecek başka bir biçim daha vardır: yerel biçim . Bu biçim, çeviri belleklerini bir dosyaya kaydeÇBek için ÇB'yi kullanan biçimdir.

Analiz

Analiz süreci aşağıdaki adımları içerir:

Metinsel ayrıştırma
Örneğin bir cümlenin sonundaki nokta ile kısaltmadaki nokta arasındaki farkı ayırt edebilmek için noktalama işaretlerini doğru tanımak çok önemlidir. Bu nedenle, işaretleme bir tür ön düzenlemedir. Genellikle, çevirmenlerin yardım programları aracılığıyla işlenen materyaller, çeviri aşaması çok dilli bir belge üretim hattına gömülü olduğundan, işaretleme içerir. Diğer özel metin öğeleri, işaretleme ile ayrılabilir. Özel adlar ve kodlar gibi çevrilmesi gerekmeyen özel öğeler bulunurken, diğerlerinin yerel biçime dönüştürülmesi gerekebilir.
Dilsel ayrıştırma
Temel form indirgemesi, bir terim bankasından terimlerin otomatik olarak alınması için kelime listeleri ve bir metin hazırlamak için kullanılır. Öte yandan, bir kaynak metinden çok kelimeli terimleri veya deyimleri çıkarmak için sözdizimsel ayrıştırma kullanılabilir. Bu nedenle ayrıştırma, deyimbilimin kelime sırası varyasyonunu normalleştirmek için kullanılır, bu, hangi kelimelerin bir cümle oluşturabileceğidir.
Segmentasyon
Amacı, en kullanışlı çeviri birimlerini seçmektir. Segmentasyon, bir tür ayrıştırma gibidir. Yüzeysel ayrıştırma kullanılarak tek dilli olarak yapılır ve hizalama, segmentasyona dayanır. Çevirmenler segmentasyonları manuel olarak düzeltirse, program kendi hatalarını tekrarlayacağından, belgenin sonraki sürümleri düzeltilmiş segmentasyona dayalı olarak ÇB ile eşleşme bulamaz. Çevirmenler genellikle cümle cümle ilerler, ancak bir cümlenin çevirisi çevredekilerin çevirisine bağlı olabilir.
Hizalama
Kaynak ve hedef metinler arasındaki çeviri yazışmalarını tanımlama görevidir. Hizalamadan segmentasyona geri bildirim olmalı ve iyi bir hizalama algoritması ilk segmentasyonu düzeltebilmelidir.
Terim çıkarma
Girdi olarak önceki bir sözlüğe sahip olabilir. Ayrıca, bilinmeyen terimleri ayıklarken, metin istatistiklerine dayalı ayrıştırmayı kullanabilir. Bunlar, bir çeviri işinde yer alan iş miktarını tahmin etmek için kullanılır. Bu, işi planlamak ve programlamak için çok yararlıdır. Çeviri istatistikleri genellikle kelimeleri sayar ve metindeki tekrar miktarını tahmin eder.

Dışa aktarma

Dışa Aktarma, metni ÇB'den harici bir metin dosyasına aktarır. İçe ve dışa aktarma ters olmalıdır.

Çevrimiçi işlevler

Çeviri yaparken, ÇB'nin temel amaçlarından biri, çevirmenin en iyisini seçebilmesi için bellekteki en yararlı eşleşmeleri almaktır. ÇB, kimlikleri ve farklılıkları gösteren hem kaynak hem de hedef metni göstermelidir.

Alma

Bir ÇB'den birkaç farklı eşleşme türü alınabilir.

Tam eşleşme
Geçerli kaynak segment ile depolanan arasındaki eşleşme karakter karakter eşleşme olduğunda tam eşleşmeler görünür. Bir cümleyi çevirirken, tam eşleşme, aynı cümlenin daha önce çevrildiği anlamına gelir. Tam eşleşmeler "%100 eşleşme" olarak da adlandırılır.
Bağlam İçi Tam (ICE) eşleşme veya Garantili Eşleşme
ICE eşleşmesi, tam olarak aynı bağlamda, yani bir paragrafta aynı yerde gerçekleşen tam eşleşmedir. Bağlam genellikle çevredeki cümleler ve belge dosya adı, tarih ve izinler gibi niteliklerle tanımlanır.
Bulanık eşleşme
Eşleşme tam olmadığında, "bulanık" bir eşleşmedir. Bazı sistemler bu tür eşleşmelere yüzdeler atar; bu durumda bir bulanık eşleşme %0'dan büyük ve %100'den küçüktür. Bu rakamlar, puanlama yöntemi belirtilmedikçe sistemler arasında karşılaştırılabilir değildir.
Uyum
Çevirmen kaynak segmentte bir veya daha fazla kelime seçtiğinde, sistem arama kriterleriyle eşleşen segment çiftlerini alır. Bu özellik, bir terminoloji veri tabanının yokluğunda terimlerin ve deyimlerin çevirilerini bulmak için yararlıdır.

Güncelleme

Bir ÇB, çevirmen tarafından kabul edildiğinde yeni bir çeviri ile güncellenir. Her zaman olduğu gibi, bir veritabanını güncellerken, veritabanının önceki içerikleriyle ne yapılacağı sorusu vardır. Bir ÇB, ÇB'deki girişleri değiştirerek veya silerek değiştirilebilir. Bazı sistemler, çevirmenlerin aynı kaynak segmentin birden çok çevirisini kaydetmesine izin verir.

Otomatik çeviri

Çeviri hafızası araçları genellikle otomatik alma ve değiştirme sağlar.

Otomatik alma
ÇB sistemleri aranır ve sonuçları, çevirmen bir belgede hareket ederken otomatik olarak görüntülenir.
Otomatik ikame
Otomatik değiştirme ile, bir belgenin yeni bir versiyonunun çevrilmesinde tam bir eşleşme ortaya çıkarsa, yazılım eski çeviriyi tekrarlayacaktır. Çevirmen, çeviriyi kaynakla karşılaştırmazsa, önceki çeviride yapılan bir hata tekrarlanır.

Ağ oluşturma, bir çevirmen grubunun bir metni, her birinin ayrı ayrı çalıştığından daha hızlı bir şekilde birlikte çevirmesini sağlar, çünkü bir çevirmen tarafından çevrilen cümleler ve ifadeler diğerleri tarafından kullanılabilir. Ayrıca, çeviri bellekleri son çeviriden önce paylaşılırsa, bir çevirmenin yaptığı hataların diğer ekip üyeleri tarafından düzeltilmesi olasılığı vardır.

Metin belleği

"Metin belleği", önerilen Lisa OSCAR xml:TM standardının temelidir. Metin belleği, yazar belleği ve çeviri belleğinden oluşur.

Çeviri belleği

Benzersiz tanımlayıcılar çeviri sırasında hatırlanır, böylece hedef dil belgesi metin birimi düzeyinde 'tam' hizalanır. Kaynak belge sonradan değiştirilirse, değişmeyen metin birimleri, herhangi bir çevirmen etkileşimine gerek kalmadan doğrudan belgenin yeni hedef sürümüne aktarılabilir. Bu, çeviri belleğiyle 'tam' veya 'mükemmel' eşleşme kavramıdır. xml:TM, belge içi kaldıraçlı ve bulanık eşleştirme için mekanizmalar da sağlayabilir.

Tarih

1970'ler, bilim adamlarının bir ön keşif tartışması turu yürüttüğü ÇB sistemleri için emekleme aşamasıdır. ÇB sistemleri için orijinal fikir genellikle Martin Kay'in "Uygun Yer" makalesine,[2] ancak ayrıntıları tam olarak verilmemiştir. Bu yazıda, depolama sisteminin temel kavramını göstermiştir: "Tercüman, sistemin mağazada ilgili olabilecek herhangi bir şeyi görüntülemesine neden olan bir komut vererek başlayabilir. . . . Devam etmeden önce, benzer malzeme içeren geçmiş ve gelecekteki metin parçalarını inceleyebilir". Kay'in bu gözlemi aslında Peter Arthern'in çevirmenlerin benzer, zaten tercüme edilmiş belgeleri çevrimiçi olarak kullanabileceği önerisinden etkilenmiştir. 1978 tarihli makalesinde[3] bugün ÇB sistemleri dediğimiz şeyin tam olarak gösterilmesini sağladı: Herhangi bir yeni metin bir kelime işlem istasyonuna yazılacaktı ve bu metin yazılırken sistem bu metni daha önce depolanan metinlerle karşılaştıracaktı. [Avrupa Topluluğunun] diğer tüm resmi dillerine tercümesi ile birlikte hafızası. . . . Uygun makine çevirisine göre bir avantaj, bu şekilde alınan tüm pasajların dilbilgisi açısından doğru olmasıdır. Aslında, benim hesaplamalarıma göre, çevirmenlerin verimli bir şekilde çeviri üretmek için kullandıkları zamandan en az yüzde 15 tasarruf sağlayacak elektronik bir "kes ve yapıştır" süreci yürütüyor olmalıyız.

Fikir, ilk olarak Brigham Young Üniversitesi'nden araştırmacı tarafından geliştirilen ALPS (Otomatik Dil İşleme Sistemleri) Araçlarından birleştirildi ve o zamanlar ÇB sistemleri fikri, yalnızca eşleşen dizeleri bulmayı amaçlayan "Tekrar İşleme" adlı bir araçla karıştırıldı. Ancak uzun bir süre sonra, sözde çeviri belleği kavramı ortaya çıktı.

ÇB sistemlerinin gerçek keşif aşaması 1980'ler olacaktır. ÇB sisteminin ilk uygulamalarından biri Sadler ve Vendelmans'ın İki Dilli Bilgi Bankası'nda ortaya çıktı. İki Dilli Bilgi Bankası, biri diğerinin çevirisi olan ve çeviri birimlerinin tümceler arasında çapraz kodlandığı, sözdizimsel ve referanssal olarak yapılandırılmış bir bütünlük çiftidir. İki Dilli Bilgi Bankasının amacı, makine çevirisi ve bilgisayar destekli çeviri uygulamaları için derlemi tabanlı genel amaçlı bir bilgi kaynağı geliştirmektir (Sadler ve Vendelman, 1987). Bir diğer önemli adım ise Brian Harris tarafından "Bi-text" ile atıldı. Bi-text'i, Sadler'in İki Dilli Bilgi Bankası ile benzer yankılar uyandıran çeviri birimleri aracılığıyla çevirmenin etkinliği ile ilgili kaynak ve hedef metinleri "iki boyutta tek bir metin" (1988) olarak tanımlamıştır. Ve Harris'in çalışmasında, bu adı kullanmadan ÇB sistemi gibi bir şey önerdi: tek kelime veya "bütün çeviri birimi" ile aranabilen, eşleştirilmiş çevirilerden oluşan bir veri tabanı, ikinci durumda, aramanın özdeş birimler yerine benzerleri almasına izin verildi. .

ÇB teknolojisi ancak 1990'ların sonlarında geniş ölçekte ticari olarak kullanılabilir hale geldi, bu nedenle birkaç mühendis ve çevirmen tarafından yapılan çabalar. Unutulmaması gereken, Trados (günümüzde SDL Trados) adlı ilk ÇB aracıdır. Bu araçta, kaynak dosyayı açarken ve çeviri belleğini uygularken, metin içindeki herhangi bir "%100 eşleşme" (özdeş eşleşmeler) veya "bulanık eşleşmeler" (benzer, ancak aynı olmayan eşleşmeler) anında ayıklanır ve hedef dosya içine yerleştirilir. Ardından, çeviri belleği tarafından önerilen "eşleşmeler" kabul edilebilir veya yeni alternatiflerle geçersiz kılınabilir. Bir çeviri birimi manuel olarak güncellenirse, gelecekte kullanılmak üzere ve mevcut metinde tekrarlanmak üzere çeviri belleğinde saklanır. Benzer şekilde, hedef dosyadaki "eşleşme" olmayan tüm bölümler manuel olarak çevrilir ve ardından otomatik olarak çeviri belleğine eklenir.

2000'li yıllarda, çevrimiçi çeviri hizmetleri ÇB'yi dahil etmeye başladı. Google Translate gibi makine çevirisi hizmetleri ile Gengo ve Ackuna gibi siteler tarafından sağlanan profesyonel ve "hibrit" çeviri hizmetleri, diller arasında daha verimli bağlantılar kurmak için çevirmenler ve gönüllüler tarafından sağlanan ÇB verilerinin veritabanlarını birleştirir, son kullanıcılara daha hızlı çeviri hizmetleri sunar.[4]

Son trendler

Yakın tarihli bir gelişme, çeviri belleğinin aksine 'metin belleği' (text memory) kavramıdır.[5] Bu aynı zamanda önerilen LISA OSCAR standardının temelidir.[6] xml:TM içindeki metin belleği, 'yazar belleği' ve 'çeviri belleği'nden oluşur. Yazar belleği, yazma döngüsü sırasında değişiklikleri takip etmek için kullanılır. Çeviri hafızası, çeviri hafızası eşleştirmesini uygulamak için yazar belleğindeki bilgileri kullanır. Öncelikle XML belgelerini hedeflese de, xml:TM, XLIFF[7] biçimine dönüştürülebilen herhangi bir belgede kullanılabilir.

İkinci nesil çeviri hafızası

Birinci nesil ÇB sistemlerinden çok daha güçlüdürler, bir dilsel analiz motoru içerirler, segmentleri akıllı terminolojik gruplara ayırmak için yığın teknolojisini kullanırlar ve otomatik olarak belirli sözlükler oluştururlar.

İlgili standartlar

ÇBX

Translation Memory eXchange (ÇX), çeviri tedarikçileri arasında çeviri belleklerinin değişimini sağlayan bir standarttır. ÇBX, çeviri topluluğu tarafından çeviri belleklerini içe ve dışa aktarmanın en iyi yolu olarak benimsenmiştir.[] . Mevcut sürüm 1.4b'dir - orijinal kaynak ve hedef belgelerin ÇBX verilerinden yeniden oluşturulmasına izin verir.

TBX

TermBase eXchange . ISO 30042 olarak revize edilen ve yeniden yayınlanan bu LISA standardı, ayrıntılı sözlüksel bilgileri içeren terminoloji verilerinin değiş tokuşuna izin verir. TBX çerçevesi üç ISO standardı tarafından sağlanır: ISO 12620, ISO 12200 ve ISO 16642. ISO 12620, veri öğesi türleri veya önceden tanımlanmış değerler olarak işlev gören standart adlarla iyi tanımlanmış "veri kategorilerinin" bir envanterini sağlar. ISO 12200 (MARTIF olarak da bilinir), TBX'in temel yapısının temelini oluşturur. ISO 16642 (Terminolojik İşaretleme Çerçevesi olarak da bilinir), genel olarak Terminoloji İşaretleme Dilleri için yapısal bir meta-model içerir.

UTX

Universal Terminoloji eXchange (UTX) biçimi, makine çevirisinin kullanıcı sözlükleri için kullanılmak üzere özel olarak tasarlanmış bir standarttır, ancak genel, insan tarafından okunabilen sözlükler için kullanılabilir. UTX'in amacı, son derece basit ve pratik özelliği sayesinde sözlük paylaşımını ve yeniden kullanımını hızlandırmaktır.

SRX

Segmentation Rules eXchange (SRX), uygulamalar arasında değiş tokuş edilen çeviri belleği verilerinin daha etkin kullanılabilmesi için ÇBX standardını geliştirmeyi amaçlar. Önceki çeviride kullanılan segmentasyon kurallarını belirleme yeteneği, elde edilebilecek kaldıraçları artırabilir.

GMX

GILT Metrics. GILT, (Globalization, Internationalization, Localization, and Translation) anlamına gelir. GILT Metrics standardı üç bölümden oluşur: hacim ölçümleri için GMX-V, karmaşıklık ölçümleri için GMX-C ve kalite ölçümleri için GMX-Q. Önerilen GILT Metrikleri standardı, verilen herhangi bir GILT görevi için iş yükünü ve kalite gereksinimlerini ölçmekle görevlendirilmiştir.

OLIF

Open Lexicon Interchange Format. OLIF, terminolojik ve sözlüksel verilerin değişimi için açık, XML uyumlu bir standarttır. Başlangıçta tescilli makine çevirisi sözlükleri arasında sözlüksel veri alışverişi için bir araç olarak tasarlanmasına rağmen, terminoloji alışverişi için daha genel bir standart haline geldi.[8]

XLIFF

XML Localisation Interchange File Format (XLIFF), herhangi bir yerelleştirme sağlayıcısı tarafından anlaşılabilen tek bir değişim dosyası biçimi sağlamayı amaçlamaktadır. XLIFF, çeviri endüstrisinde XML formatında veri alışverişi için tercih edilen[9][10] yoludur.[11]

TransWS

Translation Web Services. TransWS, yerelleştirme projeleriyle ilgili dosya ve mesajların gönderilmesi ve alınması için Web hizmetlerini kullanmak için gereken çağrıları belirtir. Web Hizmetlerinin kullanımıyla mevcut yerelleştirme sürecinin çoğunun otomasyonu için ayrıntılı bir çerçeve olarak tasarlanmıştır.[12]

xml:TM

Çeviri belleğine xml:TM (XML tabanlı Metin Belleği) yaklaşımı, yazar ve çeviri belleğinden oluşan metin belleği kavramına dayanır.[13] xml:ÇB, XML-INTL tarafından Lisa OSCAR'a bağışlanmıştır.

PO

Gettext Portable Object format. Genellikle bir çeviri belleği formatı olarak kabul edilmese de, Gettext PO dosyaları, çeviri belleklerinde olduğu gibi çeviri belleği süreçlerinde de kullanılan iki dilli dosyalardır. Tipik olarak, bir PO çeviri belleği sistemi, bir dizin ağacı yapısındaki çeşitli ayrı dosyalardan oluşacaktır. PO dosyalarıyla çalışan yaygın araçlar arasında GNU Gettext Tools ve Translate Toolkit bulunur. PO dosyalarını yalnızca kaynak metin dosyalarıymış gibi düzenleyen çeşitli araçlar ve programlar da mevcuttur.

Ayrıca bakınız

  • Bilgisayar destekli çeviri araçlarının karşılaştırılması
  • Çeviri yazılımı listesi
  • Tercüme
  • Text corpus
  • Bilgisayar destekli inceleme
  • Çeviri yazılımı
  • Paralel metin
  • Çevrimiçi iki dilli uyum

Kaynakça

  1. ^ a b Elina Lagoudaki (2006), "Translation Memory systems: Enlightening users' perspective. Key finding of the TM Survey 2006 carried out during July and August 2006. (Imperial College London, Translation Memories Survey 2006), p.16 "Archived copy" (PDF). 25 Mart 2007 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 25 Mart 2007. 
  2. ^ Kay (March 1997). "The Proper Place of Men and Machines in Language Translation". Machine Translation. 12 (1–2): 3-23. doi:10.1023/A:1007911416676. 
  3. ^ Arthern (1978). "Machine Translation and Computerized Terminology Systems: A Translator's Perspective" (PDF). Translating and the Computer: Proceedings of a Seminar, London, 14th November, 1978. ISBN 0444853022. 19 Ağustos 2019 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 7 Ekim 2022. 
  4. ^ Google's AI translation tool seems to have invented its own secret internal language 7 Ekim 2022 tarihinde Wayback Machine sitesinde arşivlendi. Devin Coldewey, TechCrunch, November 22, 2016
  5. ^ "Translating XML Documents with xml:tm". 6 Kasım 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ekim 2022. 
  6. ^ "xml:tm". 6 Kasım 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ekim 2022. 
  7. ^ "XLIFF". 26 Nisan 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ekim 2022. 
  8. ^ "Open Lexicon Interchange Format". 24 Mart 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ekim 2022. 
  9. ^ "DITA Translation SC | OASIS". www.oasis-open.org. 19 Haziran 2006 tarihinde kaynağından arşivlendi. Erişim tarihi: 29 Ocak 2021. 
  10. ^ O’Hagan, Minako, (Ed.) (23 Ağustos 2019), "XML for translation technology", The Routledge Handbook of Translation and Technology, 1 (İngilizce), Abingdon, Oxon: Routledge, ss. 45-60, doi:10.4324/9781315311258-3, ISBN 978-1-315-31125-8, erişim tarihi: 29 Ocak 2021  Yazar |ad1= eksik |soyadı1= (yardım)
  11. ^ "XML Localisation Interchange File Format". 26 Nisan 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ekim 2022. 
  12. ^ "Translation Web Services". 4 Aralık 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ekim 2022. 
  13. ^ Andrzej Zydroń (August 2008). "OAXAL—What is it and why should I care". CIDM Information Management News. 17 Mayıs 2013 tarihinde kaynağından arşivlendi. Erişim tarihi: 30 Mart 2013. At the core of xml:tm are the following concepts which together make up 'Text Memory': Author Memory and Translation Memory. 

İleri okumalar

  • Dragsted, Barbara. (2004). Segmentation in translation and translation memory systems: An empirical investigation of cognitive segmentation and effects of integrating a ÇB system into the translation process. Copenhagen: Samfundslitteratur. 369 p.
  • Heyn, Matthias. (1998). “Translation memories: Insights and prospects”. In: Lynne Bowker; et al. (eds.), Unity in diversity? Current trends in translation studies. Manchester: St. Jerome. P. 123–136.
  • Martín-Mor, Adrià (2011), La interferència lingüística en entorns de Traducció Assistida per Ordinador: Recerca empíricoexperimental. Bellaterra: Universitat Autònoma de Barcelona. URL: http://www.tdx.cat/handle/10803/83987.
  • O’Hagan, Minako. (2009). “Computer-aided translation (CAT)”. In: Mona Baker & Gabriela Saldanha (eds.), Routledge encyclopedia of translation studies. London: Routledge. P. 48–51.
  • Pym, Anthony (2013). Translation Skill-Sets in a Machine-Translation Age. Meta: Translators' Journal, 58 (3), p. 487-503. URL: http://id.erudit.org/iderudit/1025047ar

Dış bağlantılar

İlgili Araştırma Makaleleri

Çeviri ya da tercüme, bir dildeki bir metnin başka bir dile aktarılması işlemini ve bu süreç sonucunda elde edilen ürünü anlatmak amacıyla kullanılır.

<i>Tao Te Ching</i> Çince klasik eser

Dao De Jing M.Ö. 6. yy.'da, Antik Çinli bilge Laozi tarafından yazıldığı düşünülen klasik bir metindir. Eserin özgün adı Laozi dir. İki bölümden oluşur: Dao ve De. Dao evren anlayışının en temel metni sayılır. Dao/Tao, Yol demektir. De/Te, Laozi geleneğinde, yolun kendiliğindenliğinin ayırdımına varmak ve uyumsamak; Kongzi geleneğinde, erdem anlamında kullanılır. Jing/Ching, klasik eser demektir. Eserin, bambu çubuklara yazılmış halde en eski örneği 1963-74 yılları arasında Mawangdui arkeolojik kazı sitesinde, antik mezarlardan yeryüzüne çıkarılmıştır.

Çevirmen bir metni veya sözlü iletişimi bir dilden başka bir dile çevirmeyi meslek edinen kişiye denir. Yazılı çeviri yapan kişiye mütercim, sözlü çeviri yapan kişiye de tercüman adı verilir. Çevirmenler kitap, film, video oyunu, makale, tez, ticarî yazışma ve sözleşmeler, hukukî dokümanlar, vize evrakı gibi belgeleri tercüme eden veya toplantılarda, seminerlerde, konferanslarda ardıl veya eş zamanlı çeviri yapan kişilerdir.

<i>Filokalya</i>

Filokalya; Yunancada "İyi şeylerin sevgisi" anlamına gelen Doğu Ortodoksluğu'nun mistik İsihazm geleneğine ait ruhsal önderlere ve keşişlere ait metinler koleksiyonu. Filokalya'da yer alan yazılar MS 4. yüzyıl ile 15. yüzyıla arasında kaleme alınmıştır. 18. yüzyılda, Kutsal Athos Dağı'ndan Aziz Nikodimos (1749-1809) ve Korint'li Aziz Makarios (1731-1805) adında iki Yunan keşiş tarafından derlendi ve ilk olarak 1782'de Venedik'te yayınlandı. İkinci baskı 1893'te Atina'da yayınlandı ve ilk baskıya ek olarak Patrik Kallistos'un hazırladığı dua üzerine yazılmış metinleri de içermekteydi. Beş ciltlik üçüncü baskısı 1957-1963 yıllarında Astir Yayıncılık Şirketi tarafından Atina'da piyasaya sürüldü. Orijinal Filokalya'daki tüm metinler Yunancadır ve ikisi hariç tümü ilk olarak Yunanca yazılmıştır ve o iki metin de Bizans döneminde Yunancaya çevrilmiştir. Ancak eserin nüfuz alanı asla Yunanca konuşulan topraklarla sınırlı kalmamıştır. Bu eseri ilk defa başka bir dile çeviren kişi, hac ziyareti neticesinde Athos Dağı'na gelmiş, daha sonra da Moldova'ya yerleşmiş Rus keşiş Paisii Velichkovskii (1722-1794) idi. Eserden seçmece metinleri Kilise Slavcası'na çevirdi ve kitabı Moskova'da "Dobrotolublye" adıyla bastırdı. Eser 1822'de tekrar basıldı ve yayınlandı. Bir Rus Gezgincinin Anıları adlı kitapta bahsedilen hacı (gezginci) tarafından çevrilmişti. Kuşkusuz, Filokalya'nın Rus maneviyatına ve kültürüne etkisi muazzam idi. Bunu, kitabın titiz bir okuyucusu olan Dostoyevski'nin yazıları da tek başına yeterince kanıtlar niteliktedir. Rusçaya bir çevirisi Ignatii Brianchaninov (1807-1867) tarafından yapıldı ve çeviri 1857 yılında yayınlandı. Halen Dobrotolubiye adıyla basılan bir diğer Rusça çevirisi de orijinal Yunanca baskıda olmayan birkaç metni eserine dahil etmiş ve Yunanca baskının metinlerindeki bazı pasajları kasten çıkarmış veya özünden farklı bir biçimde anlatımını sürdürmüş Piskopos Münzevi Keşiş Teofan (1815-1894) tarafından yapıldı.

<span class="mw-page-title-main">Google Çeviri</span> Çeviri aracı

Google Çeviri, İnternet sayfalarını, metinleri veya yüklemiş olduğunuz belgeleri ücretsiz çeviren bir araçtır. Google tarafından sağlanır. İlk olarak 28 Nisan 2006 tarihinde, Arapça ile İngilizce arası çeviri yaparak hizmete girmiştir. Bir web arayüzü, Android ve iOS için mobil uygulamalar, geliştiricilere tarayıcı eklentisi ve yazılım uygulamaları oluşturmada yardımcı olan bir API sunar. Google Translate, çeşitli seviyelerde 100'den fazla dili destekliyor ve Mayıs 2013 itibarıyla günlük 200 milyondan fazla kişiye hizmet veriyor.

Yerelleştirme, yazılım geliştirme sürecinde, içeriklerin, süreçlerin, ürünlerin ve özellikle bilgisayar yazılımlarının (Software) belirli bir coğrafyaya ya da etnik topluluğa özgü pazar ya da coğrafi bölgede geçerli yerel dilsel ve kültürel özelliklere uyarlanmasıdır.

Çeviribilim ya da Çeviri bilimi, yazılı ve sözlü çevirinin kuram, betimleme ve uygulamasını konu alan beşeri bilim dalıdır. Sahalar arası bir çalışma alanı olarak çeviribilim, çeviriye destek olan çeşitli sahalardan katkı alır. Bunların arasında metin dilbilim, toplumbilim, tarih, karşılaştırmalı edebiyat, felsefe, filoloji, göstergebilim, edebiyat gibi bilim dalları bulunur. Batı dillerinde “translation studies” (İngilizce), “Translationswissenschaft” (Almanca) ve “traductologie” (Fransızca) gibi adlarla anılır.

Bilgisayar destekli çeviri çeviri sırasında çevirmenleri destekleyen bilgisayar yazılımlarıyla yapılan bir tür çeviridir. BDÇ, çeviri işleminin herhangi bir insan yardımı olmaksızın ya da çeviri öncesinde ya da sonrasında çok az bir insan desteğiyle gerçekleşen makineli çeviri, makine çevirisi ya da bilgisayarlı çeviri ile karıştırılmamalıdır.

Normlar Gideon Toury tarafından geliştirilen çevirmenin süreç öncesi ve çeviri sürecinde aldığı öznel kararlardır. Çevirmenin bu konuda sınırlanamaz hakları vardır. Her çevirmenin kendine özgü normları vardır. Çevirmen, bu normlarla topluma hizmet eder ve bu normları topluma uygun olarak değiştirebilir. Bu bakımdan, çevirmenin aslında toplumsal bir rolü vardır. Sosyo-kültürel sınırlamaların üstesinden gelmek için çevirmen normları kullanır. Sonuç olarak da farklı stratejilerle, yani, farklı normlarla farklı erek metinler ortaya çıkar.

İstatistiksel makine çevirisi, iki dilli metin derlemlerinin incelenmesinden elde edilen parametrelerin kullanıldığı istatistiksel modelleri içeren bir makine çevirisi yaklaşımıdır. İstatiksel çeviri yöntemi, makine çevirisi disiplini içerisinde kural tabanlı makine çevirisi ve örnek tabanlı makine çevirisi yaklaşımlarına göre farklılık gösterir.

Örnek tabanlı makine çevirisi (EBMT) genellikle çalışma sırasında ana bilgi tabanı paralel metinler olan iki dilli bir külliyatın kullanımı ile karakterize edilen bir makine çevirisi yöntemdir. Bu, aslında bir "benzetme ile çeviri" ve makine öğreniminde vaka - tabanlı muhakeme yaklaşımının bir uygulaması olarak görülebilir.

<span class="mw-page-title-main">Makine çevirisi</span>

MT kısaltmasıyla da anılan makine çevirisi, metin veya konuşmayı bir dilden diğerine çevirmek için yazılım kullanımını araştıran bilgisayarlı dilbilimin bir alt alanıdır.

<span class="mw-page-title-main">Microsoft Tercüman</span> çok dilli bir makine çeviri bulut hizmeti

Microsoft Tercüman, Microsoft tarafından sağlanan çok dilli bir makine çeviri bulut hizmetidir. Microsoft Translator API-si, birden fazla tüketici, geliştirici ve kurumsal ürüne entegre edilmiştir; Bing, Microsoft Office, SharePoint, Skype for Business, Yammer, Skype Translator, Visual Studio, Internet Explorer, Windows Phone, iPhone ve Apple Watch ve Android telefonu ve Android Wear için Microsoft Tercüman uygulamaları.

<span class="mw-page-title-main">OmegaT</span>

OmegaT, Java programlama dilinde yazılmış bir bilgisayar destekli çeviri aracıdır. Başlangıçta 2000 yılında Keith Godfrey tarafından geliştirilen bir özgür yazılım olup şu anda Aaron Madlon-Kay liderliğindeki bir ekip tarafından geliştirilmektedir.

<span class="mw-page-title-main">Lokalize</span>

Lokalize, KDE projesi kapsamında esas olarak yazılım yerelleştirme amacıyla geliştirilen ve genel amaçlı Bilgisayar Destekli Çeviri (CAT) uygulaması olarak da kullanılabilen bir özgür yazılımdır. Üretkenlik ve etkinliğe odaklanarak çevirmenin yalnızca metinleri kendi diline çevirmeye dikkatini vermesini sağlar. OpenDocument dosyalarını (*.odt) çevirmek, metni .XLIFF dosyalarına çıkarmak ve geri dönüştürmek için dahili Translate-Toolkit kullanılmaktadır.

Translate Toolkit, bir yerelleştirme ve çeviri araç setidir. Yerelleştirme dosya biçimleri ve yerelleştirme gerektirebilecek dosyalarla çalışmak için bir dizi araç sağlar. Araç seti ayrıca, üzerinde diğer yerelleştirme araçlarının geliştirilebileceği bir API sağlar.

<span class="mw-page-title-main">Luther Kutsal Kitabı</span> Almancaya ilk çevirilen Kutsal Kitap nüshası

Luther Kutsal Kitabı veya Luther Kitâb-ı Mukaddesi Protestan reformcu Martin Luther'in Almanca Kutsal Kitap çevirisidir. Luther Yeni Ahit çevirisi ilk olarak Eylül 1522'de yayınlandı ve 1534'te Apokrif ile Eski ve Yeni Ahit'in bir çevirisini içeren tamamlanmış Kutsal Kitap yayımlandı. Luther, 1545 yılına kadar metinde iyileştirmeler yapmaya devam etti. Sadece Latince Vulgate çevirilerini değil ayrıca Yunanca metinleri de kullanan Kutsal Kitap'ın Almancaya ilk tam çevirisidir.

Nöral makine çevirisi (NMT), bir sözcük dizilim olasılığını tahmin etmek için yapay bir sinir ağı kullanan ve genellikle cümlenin tümünü tek bir entegre modelde modelleyen bir makine çevirisi yaklaşımıdır.

Otomatik özetleme, yapay zekâ ve doğal dil işleme tekniklerini kullanarak metinlerin ana fikirlerini ve önemli bilgilerini otomatik olarak çıkarma ve kısaltma işlemidir. Bu işlem, insan müdahalesi olmadan metnin özünü yakalayan kısa ve öz bir özet oluşturmayı amaçlar.

Diller arası bilgi erişimi (CLIR), farklı dillerde ifade edilen sorguları kabul edilebilir çeviri teknikleri ile arayıp bulma işlemidir. Bilgi erişim sistemlerinde önemli rol oynar ve farklı dillerde bilgiye erişim imkanı sağlayarak küresel bilgi akışına katkıda bulunur.