İçeriğe atla

Derlem dilbilim

Derlem dilbilim; bir dilin, "gerçek dünya" metninin gövdesi olan metin derleminde ifade edildiği şekliyle bir dilin incelenmesidir. Derlem dilbilim, bir dilin güvenilir bir analizinin, minimum deneysel müdahale ile sahada toplanan derlemlerle - o dilin doğal bağlamı ("realia")- ile daha mümkün olduğunu öne sürer. Metin-derlem yöntemi, o dili yöneten soyut kurallar dizisini türetmek için herhangi bir doğal dilde yazılmış metinlerin derlemini kullanır. Bu sonuçlar, konu dili ile benzer bir analizden geçmiş diğer diller arasındaki ilişkileri keşfetmek için kullanılabilir. Bu tür ilk derlemler, kaynak metinlerden manuel olarak türetilmiştir ancak artık bu iş otomatikleştirilmiştir.

Metod

Derlem dilbilim, verilerden teoriye giden bir yolu izlemeye çalışan bir dizi araştırma yöntemi üretmiştir. Wallis ve Nelson (2001) ilk olarak 3A perspektifi olarak adlandırdıkları şeyi tanıtmışlardır: Ek Açıklama, Soyutlama ve Analiz.

  • Açıklama, bir şemanın metinlere uygulanmasından oluşur. Ek açıklamalar, yapısal işaretleme, konuşma parçası etiketleme, ayrıştırma ve çok sayıda diğer temsilleri içerebilir.
  • Soyutlama, şemadaki terimlerin teorik olarak motive edilmiş bir model veya veri kümesindeki terimlere çevrilmesinden (eşlemesinden) oluşur. Soyutlama tipik olarak dilbilimci tarafından yönlendirilen aramayı içerir, ancak örneğin ayrıştırıcılar için kural öğrenmeyi içerebilir.
  • Analiz, veri setinden istatistiksel olarak araştırma, manipüle etme ve genelleştirmeden oluşur. Analiz, istatistiksel değerlendirmeleri, kural tabanlarının optimizasyonunu veya bilgi keşif yöntemlerini içerebilir.

Günümüzde sözcüksel derlemlerin çoğunda, konuşmanın bir kısmı etiketlidir (POS etiketli). Bununla birlikte, 'açıklamasız düz metin' ile çalışan derlem dilbilimcileri bile, göze çarpan terimleri izole etmek için kaçınılmaz olarak bazı yöntemler uygular. Bu gibi durumlarda açıklama ve soyutlama sözcüksel bir aramada birleştirilir.

Açıklamalı bir derlem yayınlamanın avantajı, diğer kullanıcıların daha sonra derlem üzerinde deneyler yapabilmesidir (derlem yöneticisi aracılığıyla). Yaratıcılarınkinden farklı ilgi alanlarına ve farklı bakış açılarına sahip dilbilimciler bu çalışmayı kullanabilir. Verileri paylaşarak, derlem dilbilimcileri derlemi dilbilimsel tartışma ve daha fazla çalışma yeri olarak ele alabilirler.

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Yapısalcılık</span> Kültür teorisi ve metodoloji

Yapısalcılık, 1950'lerde dilbilimden doğmuş; sanat, antropoloji ve psikolojiyi de etkilemiş bir eleştirel analiz biçimidir. Yapısalcılığa göre, kültürel olaylar sözlü ve sözsüz işaret sistemlerinden oluşur. Bu tür sistemler bir "dil" içerir ve bu diller insan aklının ve davranışlarının belirleyici unsuru olma işlevini taşır.

<span class="mw-page-title-main">Dilbilim</span> insan dilinin araştırılması

Dilbilim, dil bilimi, lengüistik ya da lisaniyat; dilleri dilbilgisi, söz dizimi (sentaks), ses bilgisi (fonetik), ses bilimi (fonoloji), biçimbilim (morfoloji) ve edimbilim (pragmatik) gibi çeşitli yönlerden yapısal, anlamsal ve bildirişimin çıkış bağlamını temel alarak sözlerin gönderimlerini ve iletişimde dilin yaptırım gücünü inceleyen bilim dalıdır.

<span class="mw-page-title-main">İstatistik</span>

İstatistik veya sayım bilimi, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir. Belirli bir amaç için verilerin toplanması, sınıflandırılması, çözümlenmesi ve sonuçlarının yorumlanması esasına dayanır. Bu çerçevede yapılan işlemlerin tümüne sayımlama denir.

<span class="mw-page-title-main">Doğal dil işleme</span> bilgisayar bilimi ve dil bilimi alanı

Doğal Dil İşleme, yaygın olarak NLP olarak bilinen yapay zekâ ve dilbilim alt kategorisidir. Türkçe, İngilizce, Almanca, Fransızca gibi doğal dillerin işlenmesi ve kullanılması amacı ile araştırma yapan bilim dalıdır.

Edimbilim, edim bilimi veya pragmatik, işaretlerin kullanımı ve işaretler ile işaretlerin kullanıcıları arasındaki ilişkiyi inceler. Edimbilim, dilsel fiilleri ve dilin kullanımını araştıran dilbilimsel bir alandır. Sözdizim ve anlambilimin yanı sıra dilsel göstergelerin özellikleriyle uğraşan göstergebilimin alt alanıdır.

Göstergebilim, semiyotik veya semiyoloji; göstergelerin yorumlanmasını, üretilmesini veya işaretleri anlama süreçlerini içeren bütün etmenlerin dizgesel bir biçimde incelenmesine dayanan bir bilim dalıdır. Fransızlar semiyoloji terimini kullanmışlardır. Semiyotik disiplinlerarası bir sahadır. Anlam bilimi, dil bilimi, fonetik, mimarlık, sosyoloji, psikanaliz ve daha birçok bilim dalı ve disiplinin oluşturduğu disiplinler arası bir disiplindir. Kültürel kodlar, gelenekler ve metni anlam süreçlerine göre düzenlenmiş işaret sistemleri diye nitelenen her şey semiyotiğin inceleme alanına girmektedir. Semiyoloji, yapısalcılığın modeli olarak düşünülmektedir.

<span class="mw-page-title-main">Google Çeviri</span> Çeviri aracı

Google Çeviri, İnternet sayfalarını, metinleri veya yüklemiş olduğunuz belgeleri ücretsiz çeviren bir araçtır. Google tarafından sağlanır. İlk olarak 28 Nisan 2006 tarihinde, Arapça ile İngilizce arası çeviri yaparak hizmete girmiştir. Bir web arayüzü, Android ve iOS için mobil uygulamalar, geliştiricilere tarayıcı eklentisi ve yazılım uygulamaları oluşturmada yardımcı olan bir API sunar. Google Translate, çeşitli seviyelerde 100'den fazla dili destekliyor ve Mayıs 2013 itibarıyla günlük 200 milyondan fazla kişiye hizmet veriyor.

Sözdizim, söz dizimi ya da Fransızcadan ödünçleme biçimiyle sentaks, doğal dillerdeki cümle kurma ilke ve kurallarını inceleyen ve bu dildeki cümlelerin esnekliğini inceleyen dilbilim dalıdır.
Eski Yunanca "birlikte düzenleme, dizme" anlamına gelen sentaks terimi dilbilimde, doğal dillerde nasıl cümle oluşturulacağına dair bir kurallar ve prensipler çalışmasıdır. Bir bilim dalına ait olmasına ek olarak “Modern İrlandacanın Sözdizimi"nde olduğu gibi, sözdizim terimi herhangi bireysel bir dilin cümle yapısına hâkim olan kurallara ve prensiplere de doğrudan ilgili olarak da kullanılır. Sözdizim, dilin yatay, yani satır şeklinde dizilen bir sistem olduğunu gösterir. Bu diziliş, sesten, morfemlere, morfemlerden daha büyük öbeklere dilin her seviyesinde mevcuttur. Sözdizimin yalnız cümle seviyesini gösteren bir terim olarak kullanılması doğru ama eksik bir kullanımdır.

Konuşma sentezleyici, İnsan seslerinin bilgisayar yapay zekası tarafından üretimidir. Genellikle Metin okuma sistemlerinde kullanılan Konuşma sentezleyicisi bu sistemlerde bir dilin tüm ses bilgisi ve benzeri kurallarına göre çevri yapacak şekilde programlanırlar. Bu sentezleyicinin metni doğru telaffuz etmesini sağlar.

Psikodilbilim veya ruhdilbilim, psikolojik süreçlerle dilsel etkenler arasındaki iletişimi çalışan disiplindir. Bu disiplin başat olarak dilin nasıl işlendiği, zihin ve beyinde nasıl temsillendiği ile ilgilenir; yani, insanların dili edinmesini, kullanmasını, anlamasını ve üretmesini sağlayan psikolojik ve nörobiyolojik faktörlerle...

İstatistiksel makine çevirisi, iki dilli metin derlemlerinin incelenmesinden elde edilen parametrelerin kullanıldığı istatistiksel modelleri içeren bir makine çevirisi yaklaşımıdır. İstatiksel çeviri yöntemi, makine çevirisi disiplini içerisinde kural tabanlı makine çevirisi ve örnek tabanlı makine çevirisi yaklaşımlarına göre farklılık gösterir.

Örnek tabanlı makine çevirisi (EBMT) genellikle çalışma sırasında ana bilgi tabanı paralel metinler olan iki dilli bir külliyatın kullanımı ile karakterize edilen bir makine çevirisi yöntemdir. Bu, aslında bir "benzetme ile çeviri" ve makine öğreniminde vaka - tabanlı muhakeme yaklaşımının bir uygulaması olarak görülebilir.

<span class="mw-page-title-main">Metin madenciliği</span>

Metin madenciliği, çalışmaları metni veri kaynağı olarak kabul eden veri madenciliği çalışmasıdır. Diğer bir tanımla metin üzerinden yapısallaştırılmış veri elde etmeyi amaçlar. Metin madenciliği, metinlerin sınıflandırılması, bölütlenmesi, metinlerden konu çıkarılması, metinler için sınıf taneciklerinin üretilmesi, metinlerde görüş analizi yapılması, metin özetlerinin çıkarılması ve metinin özü ile ilgili ilişki modellemesi gibi çalışmaları hedefler.

<span class="mw-page-title-main">Hesaplamalı dilbilim</span>

Bilgisayarlı dilbilim veya hesaplamalı dilbilim, doğal dilin istatistiksel veya kural tabanlı modelleme yöntemleriyle ve hesaplamalı bir perspektif ile inceleyen disiplinler arası bir bilgisayar bilimi alanıdır.

<span class="mw-page-title-main">Makine çevirisi</span>

MT kısaltmasıyla da anılan makine çevirisi, metin veya konuşmayı bir dilden diğerine çevirmek için yazılım kullanımını araştıran bilgisayarlı dilbilimin bir alt alanıdır.

Bilişsel dilbilim, dili anlama, dil üretimi ve dil ediniminin bilişsel yönleriyle ilgilenen bir bilişsel bilim dalıdır. Bilişsel dilbilimin ana araştırma alanları arasında doğal dillerde kategorizasyon, sözdizimi ve anlambilim arasındaki arayüz, dilin deneyim ve algıdaki temeli ve dil ile düşünce arasındaki ilişki yer almaktadır. Dilin bilişle nasıl etkileşime girdiğini, dilin düşünceleri nasıl oluşturduğunu ve dilin zaman içindeki ortak zihniyetteki değişime paralel olarak evrimini açıklar.

Uygulamalı dilbilim, genel dilbilimin bir alanıdır. Dil öğrenimi araştırmaları, dil betimlemesi, ayrıca dilbilimsel görüş altında doğa bilimleri, kültür bilimi, bilgi bilimi, hukuk ve ruhbilimdeki sorunlarla disiplinlerarası olarak ilgilenmektedir. Diğer alanlardaki dille ilgili problemlerin çözümlenmesinde dilbilimsel teori, metot ve bilgilerin kullanımı da bu alanın konusunu oluşturmaktadır. Araştırma nesnesi olarak dille ilgili çok farklı görüşler ile farklı yaklaşımlar ve dilbilimin başka bilimlerden yararlanma özelliğinden dolayı genel dilbilim ve uygulamalı dilbilim arasında genel belirlenmiş bir sınırlama yoktur. "Uygulamalı dilbilim" kavramı altında ne anlaşıldığı tam olarak net değildir. Bir taraftan gerçek uygulamalı dilleri araştıran bir alt alan olarak anlaşılırken, diğer taraftan uygulama sonunda elde edilen araştırma sonuçlarının kullanılmasıyla ilgili bir alt alan olarak anlaşılmaktadır. Genel/teorik ve uygulamalı dilbilim arasındaki bu özel durum sorun yaratmaktadır. İngiliz dili ile ilgili bilimsel alanda "applied linguistics" mi yoksa "linguistics applied" kavramının kullanılacağı konusundaki adlandırma karşıtlığı tartışılmaktadır.

Dilbilimde, ön insan dili ya da proto insan dili, dünya'daki tüm dillerin atası olan hipotetik ana dildir. Dilin kökeninin tek olduğu, tüm doğal dillerin tek bir kaynaktan türediği (monogenetik) varsayımına dayanır. Bu kavram halen tartışmalıdır ve tarihsel dilbilim tarafından doğrulanmamıştır.

Karşılaştırmalı dilbilim veya karşılaştırmalı-tarihsel dilbilim, dillerin tarihsel ilişkilerini kurmak için karşılaştırılmasıyla ilgilenen tarihsel dilbilimin dalıdır.

Otomatik özetleme, yapay zekâ ve doğal dil işleme tekniklerini kullanarak metinlerin ana fikirlerini ve önemli bilgilerini otomatik olarak çıkarma ve kısaltma işlemidir. Bu işlem, insan müdahalesi olmadan metnin özünü yakalayan kısa ve öz bir özet oluşturmayı amaçlar.