İçeriğe atla

Needleman-Wunsch algoritması

GATTACA ve GCATGCU arasındaki uyum için puan matrisi.

Needleman-Wunsch algoritması biyoinformatikte, protein veya nükleotit dizilerini hizalamak için kullanılanılan bir algoritmadır. Saul B. Needleman ve Christian D. Wunsch tarafından geliştirilmiş olup, 1970'te yayınlanmıştır.[1] Algoritma, temel olarak, büyük sorunları (örneğin tam diziler) daha küçük sorunlara bölerek çözmeye çalışır; ve bu çözümleri de birleştirerek büyük sorunun çözümünü oluşturur.

Rehber

Algoritma, herhangi iki karakter dizisi için kullanılabilir. Bu rehberde, biz iki küçük DNA dizisi üzerinden gideceğiz.

GCATGCT
GATTACA

(Bunlar aynı DNA'nın iki zinciri değil, farklı DNA'lara ait dizilimlerdir.)

Tabloyu Oluşturun

Öncelikle şekil 1'deki gibi bir tablo çizin. İlk DNA dizisini tablonun ilk satırının üçüncü sütunundan başlayarak sağa doğru, ikinci DNA dizisini de tablonun üçüncü satırının ilk sütünundan başlayarak aşağıya doğru yazın.

Puanlama Sisteminizi Belirleyin

Sırada eşleşen veya eşleşmeyen karakterleri nasıl puanlandıracağımızı belirlemek var. Elimizdeki DNA dizilerine bakarak en iyi hizalamalardan birine bakalım:

GCATG-CU
G-ATTACA

Karakterlerin eşleştiğini, eşleşmediğini ve dizideki boşluklara("-") dikkat edin:

  • Eşleşme: İki karakterin aynı olması
  • Eşleşmeme: İki karakterin farklı olması
  • Boşluk: Bir karakterin, diğer dizideki boşluğa denk gelmesi

Bu üç durumu puanlandırmak için farklı yöntemler var (Puanlama Sistemleri bakınız); ancak şimdilik Needleman ve Wunsch tarafından da kullanılan basit yolu seçeceğiz: Eşleşme +1, Eşleşmeme -1, Boşluk -1 puan.

Tabloyu Doldurun

İkinci satırın, ikinci sütununa 0 yazarak başlayın. Satır satır ilerleyerek devam edin. Herhangi bir hücrenin puanı aşağıdaki şekilde belirlenir:

  • Soldaki hücrenin puanı ile Boşluk puanı (-1) toplanır.
  • Hücrenin bulunduğu satır ve sütun başlıklarındaki karakterleri karşılaştırarak eşleşme olup olmadığı belirlenir. Eşleşme varsa, sol-üst çaprazdaki hücrenin puanına Eşleşme puanı (+1); eşleşme yoksa, Eşleşmeme puanı(-1) toplanır.
  • Yukarıdaki hücrenin puanı ile Boşluk puanı (-1) toplanır.
  • Yukarıdaki üç yöntemden elde edilen puanlar karşılaştırılır, en yüksek olan hücreye yazılır. En yüksek puanın hangi hücre(ler)den elde edildiği oklarla gösterilir.

Okları İzleyin

Tablonun sağ-alt köşesindeki hücreden başlayarak sol-üst köşedeki 0'a ulaşana kadar okları izleyin. Çapraz oklar, eşleşme veya eşleşmemeyi; Sol ve yukarı oklar ise dizideki boşlukları belirtir. Sol oku izlediğinizde, tablonun tepesine yazılan dizide ilerlerken, soluna yazılan dizide aynı karakterde bekleriz; bu yüzden boşluk işaretini kullanırız.

Diziler        En İyi Hizalamalar
-------        ----------------------------------------
GATTACA        G-ATTACA        G-ATTACA        G-ATTACA
GCATGCT        GCATG-CT        GCA-TGCT        GCAT-GCT

Kaynakça

  1. ^ Needleman, Saul B.; and Wunsch, Christian D. (1970). "A general method applicable to the search for similarities in the amino acid sequence of two proteins". Journal of Molecular Biology. 48 (3). ss. 443-53. doi:10.1016/0022-2836(70)90057-4. PMID 5420325. 26 Nisan 2018 tarihinde kaynağından arşivlendi. Erişim tarihi: 22 Kasım 2014. 

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Genetik</span> biyolojinin organizmalardaki kalıtım ve çeşitliliği inceleyen bir dalı

Genetik ya da kalıtım bilimi, biyolojinin organizmalardaki kalıtım ve genetik varyasyonu inceleyen bir dalıdır. Türkçeye Almancadan geçen genetik sözcüğü 1831 yılında Yunanca γενετικός - genetikos ("genitif") sözcüğünden türetildi. Bu sözcüğün kökeni ise γένεσις - genesis ("köken") sözcüğüne dayanmaktadır.

<span class="mw-page-title-main">Periyodik tablo</span> kimyasal elementlerin sınıflandırılması için geliştirilmiş tablo

Periyodik tablo, kimyasal elementlerin sınıflandırılması için geliştirilmiş tablodur. Dilimizde periyodik tablo, periyodik cetvel, periyodik çizelge, elementler tablosu gibi birçok şekilde isimlendirilmiştir. Bu tablo bilinen bütün elementlerin artan atom numaralarına göre sıralanışıdır. Periyodik cetvelden önce de bu yönde çalışmalar yapılmış olmakla birlikte, mucidi genelde Rus kimyager Dmitri Mendeleyev kabul edilir. 1869'da Mendeleyev atomları artan atom ağırlığına göre sıraladığında belli özelliklerin tekrarlandığını fark etti. Özellikleri tekrarlanan elementleri alt alta yerleştirdi ve buna grup adını verdi.

<span class="mw-page-title-main">DNA</span> Canlıların genetik bilgilerini barındıran molekül

Deoksiriboz nükleik asit veya kısaca DNA, tüm organizmaların ve bazı virüslerin canlılık işlevleri ve biyolojik gelişmeleri için gerekli olan genetik talimatları taşıyan bir nükleik asittir. DNA'nın başlıca rolü bilgiyi uzun süre saklamasıdır. Protein ve RNA gibi hücrenin diğer bileşenlerinin inşası için gerekli olan bilgileri içermesinden dolayı DNA; bir kalıp, şablon veya reçeteye benzetilir. Bu genetik bilgileri içeren DNA parçaları gen olarak adlandırılır. Bazı DNA dizilerinin yapısal işlevleri vardır, diğerleri ise bu genetik bilginin ne şekilde kullanılacağının düzenlenmesine yararlar.

<span class="mw-page-title-main">Kalp</span> vücuttaki kanın dolaşmasını sağlayan kendiliğinden kasılma özelliğine sahip organ

Kalp ya da yürek, pek çok hayvanda bulunan kaslı bir organdır. Bu organ dolaşım sisteminin kan damarları yoluyla kan pompalar. Pompalanan kan besin ve oksijeni vücudun gerekli yerlerine taşırken, karbondioksit gibi metabolik atıkları da akciğerlere taşır. İnsanlarda kalp yaklaşık olarak kapalı bir yumruk boyutundadır ve akciğerler arasında, göğüsün orta bölmesinin içindedir. Temel görevi kanı vücuda pompalamak olan kalp, metabolizma eylemleri sonucunda oluşan artık ürünlerin vücuttan uzaklaştırılması, vücut ısısının düzenlenmesi, asit-baz dengesinin korunması, hormonlar ve enzimlerin vücudun gerekli bölgelerine taşınması gibi görevleri yapar. Kalp, dolaşım sistemi içerisinde motor görevi yapar. Kalp insanda dakikada 60-80 atım arasında değişen bir hızla dakikada 5-35 litre arası, günlük ise 9.000 litre kanı vücuda pompalar. Günde yaklaşık 100 bin, yılda 40 milyon, tüm insan hayatı boyunca yaklaşık 2,5 milyar kere, hiç durmadan yaklaşık 8 bin ton kanı vücuda pompalar. Yetişkin bir kadında ortalama ağırlığı 200-280 gram, yetişkin bir erkekte ise 250-390 gram ağırlığındadır. Her kişinin, kalbinin yaklaşık kendi yumruğu büyüklüğünde olduğu sanılır.

<span class="mw-page-title-main">Protein biyosentezi</span>

Protein biyosentezi, hücrenin protein sentezlenmesi için gereken bir biyokimyasal süreçtir. Bu terim bazen sadece protein translasyonu anlamında kullanılsa da transkripsiyon ile başlayıp translasyonla biten çok aşamalı bir süreçtir. Prokaryotlarda ve ökaryotlarda ribozom yapısı ve yardımcı proteinler bakımından farklılık göstermesine karşın, temel mekanizma korunmuştur.

Brainfuck, 1993 yılında programcı Urban Müller tarafından yaratılmış bir programlama dilidir. Yaratılma amacı mümkün olan en küçük boyutlu derleyiciyi üretmektir. Bilinen bazı derleyicileri 200 bayttan küçüktür. Sadece sekiz komutu bulunmakla birlikte Turing-bütün bir dil olduğundan teorik olarak herhangi bir algoritma bu dilde yazılıp işletilebilir.

<span class="mw-page-title-main">Barkod</span> çubuk kod ya da çizgi im

Barkod, çubuk kod ya da çizgi im, verilerin görsel özellikli makinelerin okuyabilmesi için çeşitli kodlama yöntemleriyle sunulmasıdır.

<span class="mw-page-title-main">Genetik kod</span> genetik materyal içinde kodlanan bilginin proteinlere çevrildiği kurallar

Genetik kod, genetik malzemede kodlanmış bilginin canlı hücreler tarafından proteinlere çevrilmesini sağlayan kurallar kümesidir. Kod, kodon olarak adlandırılan üç nükleotitlik diziler ile amino asitler arasındaki ilişkiyi tanımlar. Bir nükleik asit dizisindeki üçlü kodon genelde tek bir amino asidi belirler. Genlerin çok büyük çoğunluğu aynı kodla şifrelendiği için, özellikle bu koda kuralsal veya standart genetik kod olarak değinilir, ama aslında pek çok kod varyantı vardır. Yani, standart genetik kod evrensel değildir. Örneğin, insanlarda, mitokondrilerdeki protein sentezi kuralsal koddan farklı bir genetik koda dayalıdır.

DNA profillemesi, insanların DNA profillerine dayanarak onların kimliklerinin tespitini kolaylaştırmak için forensik bilimcilerin kullandığı bir tekniktir. DNA profilleri, kişinin DNA'sına karşılık gelen şifrelenmiş numara dizileridir, bunlar kişinin kimlik belirteci olarak da kullanılabilir. DNA profillemesi tüm genom dizilemesi ile karıştırılmamalıdır.

<span class="mw-page-title-main">Çoklu dizi hizalaması</span> üç ya da çok biyolojik dizinin hizalaması

Çoklu dizi hizalaması, üç ya da çok biyolojik dizinin dizi hizalamasıdır. Çoğu durumda, girdi kümesindeki sorgu dizilerinin evrimsel bir ilişkiye sahip olduğu, yani ortak bir ataya sahip oldukları varsayılır. Elde edilen çoklu dizi hizalamasından homoloji olduğu çıkarımı yapılabilir ve filogenetik analiz ile dizilerin evrimsel kökenleri değerlendirilebilir. Hizalamanın sağdaki resimdeki gibi gösterimiyle noktasal mutasyonlar, hizalamadaki sütunlardan birinde farklı bir harf olarak, ensersiyon ve delesyonlar ise hizalamadaki satırlardan bir veya daha fazlasında tire şeklinde beliren eklemeler şeklinde mutasyon olayları görülebilir. Protein bölgelerinde, ikincil veya üçüncül yapılarda ve hatta bireysel amino asit veya nükleotitlerin dizi korunumunu değerlendirmek için çoklu dizi hizalamaları sıkça kullanılır.

Biyoenformatikte dizi hizalaması, DNA, RNA veya protein dizilerini düzenleyerek benzer bölgelerin tespit edilmesidir. Bu bölgelerin benzer olması, diziler arasında işlevsel, yapısal veya evrimsel bir ilişki olduğu anlamına gelir. Hizalanmış nükleotit veya aminoasit kalıntı dizileri tipik olarak bir matriksin satırları olarak gösterilir. Kimyasal kalıntıları temsil eden harflerin arasına boşluklar konarak ardışık sütunlarda yer alan aynı veya benzer harflerin bir hizada olması sağlanır.

<span class="mw-page-title-main">Yazmaç öbeği</span>

Yazmaç öbeği, bir merkezi işlem birimindeki işlemci yazmaçlarının bir dizisini ifade etmektedir. Modern tümleşik devre tabanlı yazmaç öbekleri genellikle çok portlu hızlı durağan rastgele erişimli bellekleri (SRAM) kullanılarak sistemlere tümleştirilmektedirler. Bu tür rastgele erişimli bellekleri kullandıkları okuma ve yazma girişlerine göre ayrılır, fakat normal çok portlu durağan rastgele erişimli bellekler okuma ve yazma işlemlerini aynı girişleri kullanarak gerçekleştirebilmektedirler.

Yedi yönetim aracı, organizasyonlarda takım çalışmasıyla uygulamaya konulan iyi kararlar ve bu kararları geliştirici uygulamalarda kullanılan araçlardır. Organizasyonlarda sorunların çözümünde, bir takım çalışmasına ihtiyaç duyulmaktadır. Bunun amacı, takım içinde beyin fırtınasıyla ortaya çıkacak yeni ve yaratıcı fikirlerin problemin çözümü sürecinde uygulamaya konulmasıdır. Organizasyonun yapısında meydana gelen sorunların çözümü bazı aşamalarla gerçekleştirilmektedir. Öncelikle problemlere dair veriler toplanır, bu veriler kayıt altına alınır. Daha sonra bir takım tarafından incelenerek yorumlar yapılır ve detaylı bir planla çözüme gidilir. Bu aşamaların hepsinde yönetim araçlarının kullanılması, sorunun çözümüne büyük katkılar sağlar.

Biyomoleküler yapı biyomoleküllerin yapısıdır. Bu moleküllerin yapısı genelde birincil, ikincil, üçüncül ve dördüncül yapı olarak ayrılır. Bu yapının iskeleti, molekül içinde birbirine hidrojen bağları ile bağlanmış ikincil yapı elemanları tarafından oluşturulur. Bunun sonucunda protein ve nükleik asit yapı bölgeleri oluşur.

İlişkisel veritabanı, 1970 yılında Edgar Frank Codd tarafından önerildiği gibi, organizasyonu ilişkisel veri modeline dayanan bir dijital veritabanıdır. İlişkisel veritabanlarını korumak için kullanılan çeşitli yazılım sistemleri bir ilişkisel veritabanı yönetim sistemi (RDBMS) olarak bilinir. Neredeyse tüm ilişkisel veritabanı sistemleri, sorgulama ve veritabanının bakımı için dil olarak SQL(Structured Query Language) kullanmaktadırlar.

Programlamada, beyaz boşluk tipografide yatay veya dikey alanı temsil eden herhangi bir karakter veya karakter dizisidir. Oluşturulduğunda, bir boşluk karakteri görünür bir işarete karşılık gelmez, ancak genellikle bir sayfadaki bir alanı kaplar. Örneğin, ortak boşluk sembolü U+0020   SPACE, Batı'da kelime bölücü olarak kullanılan betik metinde boş bir noktalama işareti temsil eder.

Birinci normal form veya Birinci normal biçim (1NF), ilişkisel bir veritabanındaki bir ilişkinin özelliğidir. Bir ilişki, ancak ve ancak her bir öznitelik yalnızca atomik (bölünemez) değerler içeriyorsa ve her özniteliğin değeri, bu etki alanından yalnızca tek bir değer içeriyorsa birinci normal biçimdedir (1NF). Terimin ilk tanımı, Edgar Codd'un 1971 tarihli bir konferans makalesinde yapılmıştır.

<span class="mw-page-title-main">Santral dogma (moleküler biyoloji)</span> Biyolojik bir sistem içindeki genetik bilgi akışının açıklanması

Moleküler biyolojinin santral (merkezi) dogması, biyolojik bir sistem içindeki genetik bilgi akışının bir açıklamasıdır. Orijinal anlamı bu olmasa da, genellikle "DNA RNA'yı, RNA proteini yapar" şeklinde ifade edilir İlk olarak 1957'de Francis Crick tarafından ifade edilmiş, 1958'de ise yayınlanmıştır.

Bilgisayar biliminde dizi programlama, işlemlerin bir kerede tüm değerler kümesine uygulanmasına izin veren çözümleri ifade eder. Bu tür çözümler, bilimsel ve mühendislik ortamlarında yaygın olarak kullanılmaktadır.

<span class="mw-page-title-main">Japonca giriş yöntemleri</span>

Japonca giriş yöntemleri, bir bilgisayara Japonca karakterler girmek için kullanılır.