İçeriğe atla

Bağ grameri

Bağ grameri (Link grammar - LG), Davy Temperley ve Daniel Sleator tarafından geliştirilmiş sözdizimi teorisidir. Ağaç benzeri bir hiyerarşi içinde bileşenler oluşturmak yerine kelime çiftleri arasında ilişkiler oluşturur. İki temel parametresi vardır: yön ve mesafe. Link grammar, bağımsal dilbilgisine benzerlik gösterir ama bağımsal dilbilgisi tamlayan bağımlı bir ilişki içerir ve kelimeler arasında ilişki yönü yoktur. Colored Multiplanar Link Grammar (CMLG), kelime çiftleri arasında geçiş ilişkileri sağlayan bir LG uzantısıdır.

Örneğin İngilizce gibi bir özne-yüklem-nesne dilinde, yüklem bir özne bağlantısı oluşturmak için sola ve bir nesne bağlantısı oluşturmak için de sağa bakacaktır. İsimler, nesne bağlantısını tamamlamak için sağa veya özne bağlantısını tamamlamak için sola bakacaktır.

Türkçe gibi bir özne-nesne-yüklem dilinde, yüklem bir nesne bağlantısı oluşturmak için sola ve bir özne bağlantısı oluşturmak için daha sola bakacaktır. İsimlerse hem özne hem de nesne bağlantıları için sağa bakacaktır.

Sözdizimi

Sağa doğru bağlantılar bir + olarak ve sola doğru bağlantılar da bir - ile temsil edilir. İsteğe bağlı bağlantılar {…} şeklinde çengelli parantez içinde bulunur. İstenmeyen bağlantılar herhangi bir sayıda köşeli parantez […] içinde bulunur. Çoklu bağlantılar bir bağlaç & veya mantıksal ayırtım or ile birleştirilir. Her kural bir noktalı virgül ; ile biter.

Örnekler

Örnek 1

Bir ÖYN dil için temel kural dosyası aşağıdaki gibi olabilir:

<belirteç>: D+;
<isim-özne>: {D−} & S+;
<isim-nesne>: {D−} & O−;
<yüklem>: S− & {O+};

Böylece “The boy painted a picture” 'Çocuk bir resim çizdi' İngilizce cümlesi şu şekilde görünür:

           +-----O-----+
 +-D-+--S--+     +--D--+
 |   |     |     |     |
The boy painted  a  picture

Örnek 2

Bunun tersine gizli özneli ÖNY dil için bir kural dosyası aşağıdaki bağlantılardan oluşabilir:

<isim-özne>: S+;
<isim-nesne>: O+;
<yüklem>: {O−} & {S−};

Basit bir Farsça cümle olan man nAn xordam (من نان خوردم) 'Ben ekmeği yedim' şu şekilde görünür:

 +-----S-----+
 |     +--O--+
 |     |     |
man   nAn xordam

Örnek 3

Bir ÖNY dil olan Türkçe için kural dosyası aşağıdaki gibi olabilir:

<isim-özne>: S+;
<isim-nesne>: O+;
<yüklem>: {O−} & {S−};

Kadın portakalı yedi cümlesi de şu şekilde görünür:

  +---------S---------+
  |         +----O----+
  |         |         |
Kadın   portakalı   yedi

Uyarlamaları

Bağ grameri sözdizimi ayrıştırıcısı C ile yazılmış, GNU Genel Kamu Lisansı ile uyumlu BSD ile lisanslı, geliştirimi devam eden doğal dil işleme kütüphanesidir. Yeni sürümleri iyileştirilmiş cümle kapsama, çeşitli hata ve güvenlik düzeltmeleri ve Java dil bağlayıcıları içerir.

Kütüphanenin ayrıca Perl, Python, Ruby, OCaml ve .NET bağlayıcıları da bulunmaktadır. İngilizce kuralları ve kelime listelerini de içeren link-grammar programı Debian, Fedora gibi GNU/Linux dağıtımlarında paket olarak bulunabilir.

Uygulamaları

Özgür kelime işlemci AbiWord anında dilbilgisi denetimi için Bağ Grameri kullanır. Hiçbir yere bağlantı kuramayan kelimelerin altı yeşil olarak çizilir.

Cümlelerdeki kelimeler arasındaki anlamsal ilişkileri ortaya çıkararak bağımsal dilbigisi çıktı üreten anlamsal ilişki çıkarıcı RelEx, link-grammar üstüne kuruludur.

Bağ grameri ayrıca biyomedikal metinlerden ve haberlerde açıklanan olaylardan bilgi ayıklamak ve İngilizceden Almanca ve Türkçeye deneysel makine çevirisi için de kullanılır.

Bağ grameri bağlantı sözlüğü iki farklı doğal dil üretim sistemi NLGen ve NLGen2'nun sözdizimsel doğruluğunu oluşturmak ve doğrulamak için kullanılır. Bağ grameri ayrıca OpenCog YZ projesinde DDİ ardışık düzeninin bir parçası olarak da kullanılır.

Konuyla ilgili yayınlar

Dış bağlantılar

Dil eklentileri

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Doğal dil işleme</span> bilgisayar bilimi ve dil bilimi alanı

Doğal Dil İşleme, yaygın olarak NLP olarak bilinen yapay zekâ ve dilbilim alt kategorisidir. Türkçe, İngilizce, Almanca, Fransızca gibi doğal dillerin işlenmesi ve kullanılması amacı ile araştırma yapan bilim dalıdır.

<span class="mw-page-title-main">Rumence</span> Romanyanın resmî dili

Rumence, Romanya'nın resmî dilidir ve Latin dillerinin doğu koluna mensuptur. Çoğunluğu Romanya ve Moldova'da yaşayan 28 milyon kişi tarafından konuşulur. Moldova'nın resmî dili Moldovaca da Rumence ile aynı olmasına rağmen ülke yasaları kapsamında ülkenin resmî dili Moldovaca olarak yer almaktadır.

Cümlenin ögeleri, cümlede yüklem ile görev ve anlam yönünden yükleme eşlik eden diğer parçalardan her biri. Cümlenin ögeleri tek bir sözcükten veya sözcük grubundan oluşabilir. Ögeler anlamlı ve doğru cümleler kurulabilmesini sağlar. Türkçede cümlenin ögeleri şunlardır:

  1. Yüklemler
  2. Yapım ekleri
  3. Çekim ekleri
  4. Nesneler
  5. Bağlaçlar
  6. Dolaylı tümleçler
  7. Zarf tümleçleri
  8. Edat tümleçleri
  9. Özneler
  10. Noktalama işaretleri

Akadca, Doğu Sami dillerine ait Antik Mezopotamya'da, özellikle Asur ve Babil imparatorluklarında kullanılmış ölü dil. Dil, kayda geçmiş ilk Sami dili olup, aslen soysal açıdan akraba olmadığı Sümerce için kullanılmış çivi yazısı ile yazılmıştır. Akadca ismini Akad İmparatorluğu'nun başkenti Akad şehrinden almıştır. Bir izole dil olan Sümerce ve Akadcanın birbirleri üzerindeki karşılıklı etkileşimleri, bu iki dilin bir dil birliği içerisinde sınıflandırılmasına yol açmıştır.

Fiil veya eylem, varlıkların yaptığı işi, hareketi, oluşu çeşitli ekler alarak şahıs ve zamana bağlı olarak anlatan kelimedir.

Yüklem; cümlede özne tarafından gerçekleştirilen eylemi, oluşu, hareketi veya bir olguyu ya da yargıyı bildiren sözcük veya sözcük grubu. Özne ile birlikte cümlenin ana öğelerinden biridir. Yüklemler fiil veya isim soylu olabilir:

Türkçe dil bilgisi, Türkçeyi meydana getiren ses, sözcük yapılışı, sözcük hazinesi, anlam değişmeleri, tümce kuruluşu ve yapısı gibi ögeleri inceleyip kurallara bağlayan dil bilgisi bütünüdür.

Cümle veya tümce; bir ifade, soru, ünlem veya emiri dile getiren; kendi başına anlamlı sözcükler dizisi. Çoğunlukla özne, tümleç ve yüklemden meydana gelir. Bazen yan cümleciklerle anlamı pekiştirilir veya genişletilir.

Koşaç, isnat edatı veya haber edatı, isim cümlelerinde özne ile yüklemi birleştiren; yükleme güçlü ihtimal, olumluluk, olumsuzluk, süreklilik veya kesinlik kavramları veren -dir eki ile değil kelimesi. Bazı kaynaklarda tüm ek-fiiller koşaç olarak anılır. Koşaçlar isim cümlelerinde özneyi yükleme bağlayan ve yüklemde cümlenin bitiş hâlini oluşturan dilbilgisel ögelerdir.

Kaynak Tanımlama Çerçevesi, metadata model olarak tasarlanmış bir World Wide Web Consortium (W3C) spesifikasyonu olmasına rağmen, çeşitli sözdizim biçemlerinde bilgi modellemek için kullanılan genel bir metoda dönüşmüştür.

İyelik ekleri veya sahiplik ekleri, isimlere ve isim görevinde kullanılan sözcüklere eklenerek kime veya neye ait olduğunu bildiren ekler.

Sözdizim, söz dizimi ya da Fransızcadan ödünçleme biçimiyle sentaks, doğal dillerdeki cümle kurma ilke ve kurallarını inceleyen ve bu dildeki cümlelerin esnekliğini inceleyen dilbilim dalıdır.
Eski Yunanca "birlikte düzenleme, dizme" anlamına gelen sentaks terimi dilbilimde, doğal dillerde nasıl cümle oluşturulacağına dair bir kurallar ve prensipler çalışmasıdır. Bir bilim dalına ait olmasına ek olarak “Modern İrlandacanın Sözdizimi"nde olduğu gibi, sözdizim terimi herhangi bireysel bir dilin cümle yapısına hâkim olan kurallara ve prensiplere de doğrudan ilgili olarak da kullanılır. Sözdizim, dilin yatay, yani satır şeklinde dizilen bir sistem olduğunu gösterir. Bu diziliş, sesten, morfemlere, morfemlerden daha büyük öbeklere dilin her seviyesinde mevcuttur. Sözdizimin yalnız cümle seviyesini gösteren bir terim olarak kullanılması doğru ama eksik bir kullanımdır.

Nesne, cümlede öznenin yaptığı iş ve eylemden doğrudan etkilenen ögedir. Düz tümleç olarak da bilinir. Yüklemi geçişli bir fiil olan cümlelerde bulunur. Yükleme "ne", "neyi" ve "kimi" soruları sorularak bulunur.

Mari (Çirmiş) dili Ural Altay Dil Ailesinin Ural Koluna bağlı Fin/Ugor dilleri ana grubundandır ve 600.000 kişi tarafından konuşulur. Çirmiş dili; Rusya'ya bağlı Mari El Cumhuriyeti başta olmak üzere Rusya'da Tataristan, Udmurtya ve Perm bölgelerinde konuşulur. Etnik Çirmişler, çoğunlukla Ural Dağları'nın doğusunda Vyatka Nehri çevresinde yaşamaktadır.

Biçimbilim, yapıbilim, biçim bilgisi, şekil bilgisi, morfoloji veya yapı bilgisi dilbilimde sözcüklerin içyapısını inceleyen alt dalıdır. Temel inceleme nesnesi, dilin anlam taşıyan en küçük parçaları olan biçimbirimlerdir. Biçimbilim, sözcükleri, nasıl oluşturulduklarını ve diğer sözcüklerle ilişkilerini inceler ve sözcüklerin kök, gövde ve ek gibi bileşenlerinin yapısını çözümler.

<span class="mw-page-title-main">Unua Libro</span> Uluslararası dil Esperantoyu tarif eden ilk yayındır

Unua Libro uluslararası dil Esperanto'yu tarif eden ilk yayındır. Esperanto'nun yaratıcısı Dr. L.L. Zamenhof tarafından hazırlanıp Temmuz 26, 1887 tarihinde Varşova 'da ilk kez olarak Rusça dilinde yayımlanmıştır. Sonraki beş yıl içinde Rusça, İbranice, Lehçe, Fransızca, Almanca ve İngilizce dillerinde kopyaları yayımlanmıştır. Bu kitapçık içinde Lord's Prayer duası, bazı İncil sureleri, bir mektup, şiir, dilin gramerinin temel 16 kuralı ve 900 kelimeden meydana gelen temel vokabüleri içermekteydi. Zamenhof kitabında, "uluslararası bir dil, ulusal dil gibi, ortak bir değerdir" ilanında bulunarak dili kamuya mal etmiştir. Zamenhof eserini "Doktoro Esperanto" takma adı ile imzalamıştır. Bu yeni dili öğrenmeye başlayanlar dile doktorun bu takma adından "Esperanto" demeye başlayınca kısa zamanda bu isim dilin resmi adı haline gelmiştir.

Bağlaşıklık bir cümledeki dilbilgisel unsurların tam, doğru ve birbirleri ile uyumlu şekilde kullanılması ilkesidir. Bu unsurlara örnek olarak cümlenin öğeleri, ekler, yardımcı fiiller, ek-fiiller vs. verilebilir. Bağlaşıklık bir dil bağıntısıdır.

<span class="mw-page-title-main">Lingua Franca Nova</span>

Lingua Franca Nova, C. George Boeree tarafından Shippensburg Üniversitesi'nde geliştirilen yapay dildir. Kelimeleri Latin dilleri Fransızca, İtalyanca, Portekizce, İspanyolca ve Katalanca'dan türetilmiştir. Dil kuralları büyük miktarda basitleştirilmiştir ve Romen kreol dillerine benzer. Öğrenmesi ve anlaması kolaydır. Latin ve kiril harflerini kullanan fonetik bir alfabaye sahiptir.

Eski Farsça, Avestaca ile beraber kayıt altına alınmış iki Eski İran dilinden biridir. Eski Farsça, başlıca Ahameniş dönemi yazıtlarında, kil tabletlerinde ve mühürlerinde görülür.

Japonca, basit sesdizim, saf bir sesli harf sistemi, fonemik ünlü ve ünsüz uzunluğu ve sözcüksel olarak anlamlı bir perde-vurgu ile sondan eklemeli, sentetik, mora-zamanlı bir dildir. Sözcük sırası normalde özne-nesne-fiildir ve edatlar sözcüklerin dilbilgisel işlevini işaretler ve cümle yapısı konu-yorumdur. Cümleleri yalnızca baş-sondur ve bileşik cümleler yalnızca sola dallanır. Cümle-son edatlar, duygusal veya empatik etki eklemek veya soru sormak için kullanılır. İsimlerin gramer numarası veya cinsiyeti yoktur ve tanımlık bulunmamaktadır. Fiiller, öncelikle zaman ve ses için konjuge edilir, ancak kişi için değil. Japonca sıfatlar da çekilir. Japonca, konuşmacının, dinleyicinin ve bahsedilen kişilerin göreceli durumunu belirtmek için fiil biçimleri ve kelime dağarcığı ile karmaşık bir saygı ifadesi sistemine sahiptir.