İçeriğe atla

Arızaya dayanıklılık

Arızaya dayanıklılık, bir sistemin bileşenlerinden birisinin tamamen arızalanarak işlemez hale gelmesi ya da bileşenin içinde bir ya da daha fazla arıza oluşması durumunda, sistemin düzgün bir şekilde işlemeye devam edebilme özelliğidir. Eğer sistemin iş kalitesi azalırsa bile, küçük bir arızanın bile tamamen durmaya yol açtığı safça/amatörce tasarlanmış bir sistemle karşılaştırıldığında, iş kalitesindeki azalma arızanın ciddiyetiyle doğru orantılıdır. 'Arızaya dayanıklılık' yüksek kullanılabilirlik tasarımlarında veya kritik-yaşamsal sistemlerde çok rağbet gören bir özelliktir.

Arızaya dayanıklı tasarım bir sistemin herhangi bir parçası başarısız olduğunda sistemin tamamen başarısız olması yerine, muhtemelen azalmış bir oranda, amaçlanan işlevini sürdürmesini sağlar.[1] Kavram en çok da, kısmi arıza/başarısızlık durumunda çıktı miktarındaki azalma veya tepki süresindeki artmaya rağmen, öyle ya da böyle, tam işlevselliğini korumaya devam etmek üzere tasarlanan bilgisayar sistemlerini tanımlamak için kullanılır. Bu durumdaki bir sistemin tamamı donanım ya dayazılımdaki sorunlar sebebiyle durmayacaktır. Başka bir alandaki örnek ise lastiklerinden birisi delinse bile sürülebilir olarak tasarlanmış bir motorlu araç olacaktır. Malzemenin yorulması, aşınma/korozyon, imalat kusurları ya da darbe alma gibi durumlarda dahi bütünlüğünü koruyabilen bir yapı ise başka bir örnektir.

Tekil sistem kapsamında Arızaya dayanıklılık, olağan dışı koşulların oluşmasını önceden tahmin ederek ve bu koşullarla başa çıkabilecek bir sistem kurarak elde edilebilir ve genel olarak öz-dengeleme (self-stabilization) hedeflenerek sistemin arızadan-arındırılmış duruma yaklaşması sağlanabilir. Ancak, eğer sistemin başarısız olmasının sonuçları felaket düzeyindeyse veya yeteri kadar güvenilir yapmanın maliyeti çok yüksekse, daha iyi bir çözüm belki de bir çeşit 'çoğaltma' kullanmak olacaktır. Her hâlükârda, eğer sistemin başarısız olmasının sonuçları felaket düzeyindeyse, sistem güvenli moda düşmek için 'eski haline dönme' (reversion) özelliğini kullanabilmelidir. Bu 'geri-alma'(roll-back) kurtarmasına benzerdir ancak işlev döngüsü içerisinde insan bulunuyorsa, bir insan eylemi olabilecektir.

Terimler/Terminoloji

Saydam olan bir resmin tasarımındaki 'zarif bozulma' (graceful degradation) örneği. En üstteki iki imgenin her biri bileşik imgenin saydamlığı tanıyan bir görüntüleyicide görüntülenmesinin sonucudur. En alttaki iki imgenin her biri ise saydamlık desteği olmayan bir görüntüleyicide görüntülenmesinin sonucudur. Saydamlık maskesi (ortadaki imgenlerin altta olanı, 4. satır) atıldığı için, sadece kaplama (overlay) kısmı kalır (ortadaki imgenlerin üstte olanı, 3. satır); soldaki imge zarifçe bozulacak şekilde tasarlandığı için saydamlık bilgisi olmadan da hala anlamlıdır.

Yüksek derecede arızaya-dayanıklı bir sistem; bir ya da iki bileşeni arızalansa bile aynı seviyede verim üretebilir. Örneğin, yedek elektrik üreteci (jeneratörü) olan bir bina şebeke elektriği kesilse bile duvardaki elektrik çıkışlarına aynı voltaj değerini verecektir.

Arızaya-hazırlıklı (fail safe) veya arızaya-korumalı ya da zarifçe arızalanacak şekilde tasarlanmış bir sistem, azalmış bir oranda işlem görse de ya da tamamen arızalansa da, bunu insanları, mülkü veya veriyi; yaralanmadan, zarardan, gizlilik ihlalinden ya da içeriğin açık edilmesinden koruyacak şekilde yapar. Bilgisayarlarda, bir program tutarlı çıkışı (zarif çıkış -graceful exit) gerçekleştirerek (programın denetimsiz şekilde çakılmasına göre) Arızaya-hazırlıklı olabilir, bu şekilde yaşanan arıza sonrası oluşabilecek veri bozulmasının önüne geçmiş olur. Benzer bir anlam ayrımı, sistem ve ağ güvenliği kapsamındaki, "iyi arızalanmak" ve "kötü arızalanmak" (failing badly) kavramları arasında yapılmaktadır.

Nükleer askeri strateji kapsamındaki "ölümcül başarısızlık" (Fail-deadly) ise tam karşıtı olan bir stratejidir ve hedeflerini, sistemin bir kısmı arızalansa ya da yok olsa dahi, öldürmek ya da yaralamak üzere tasarlanmış silah sistemleri için kullanılabilir.

zarif bozulma (graceful degradation) ya da hafifçe arızalanma (fail soft- bilgisayar sistemlerinde kullanılan "fail safe"[2]'e benzer bir kavram) tecrübe edecek şekilde tasarlanmış olan bir sistem bazı bileşenleri arızalandıktan sonra düşük verim seviyelerinde çalışır. Örneğin bir bina, şebeke elektriği yetersiz geldiğinde, insanların karanlıkta asansörlerde sıkışıp kalmaması için lambaların düşük enerjide ve asansörlerin düşük hızda çalıştırılması sağlanabilir. Bilgisayar sistemindeki bir zarif bozulma örneği olarak çevrimiçi video yayını için yeterli bağlantı bant genişliği yoksa, videonun yüksek çözünülüklü hali yerine düşük çözünülüklü hali yayımlanabilir. Programlamada kullanılan Aşamalı İyileştirme (Progressive enhancement) yöntemi kapsamında eski, küçük ekranlı veya kısıtlı özelliklere sahip internet tarayıcıları için web sayfalarının basit işlevsel biçimleri hazırlanırken daha yeni ve gelişmiş teknolojileri kullanabilen ya da daha geniş görüntüleme olanakları bulunan tarayıcılar için aynı sayfaların daha gelişmiş halleri hazırlanmaktadır.

Arızaya-dayanıklı bilgisayar sistemlerinde (fault-tolerant computer system), sağlam (robust) olarak kabul edilen programlar; arızaya,aykırı duruma veya gerçersiz/yanlış girdiye rağmen, tamamen çökmek yerine, işlevini sürdümek üzere tasarlanmışlardır. Yazılım kırılganlığı (Software brittleness) 'sağlamlık' kavramının tam tersidir. Esnek ağlar (Resilient networks), bazı veri bağlantılarının ya da veri bağlatılarının kesiştiği noktalardan bazılarının arızalanması durumunda dahi (ağın tümünde) veri iletimini devam ettirirler; esnek binaların ve altyapıların da deprem, sel veya çarpışma durumlarında, benzer şekilde sistemin tamamen başarısız olmasını (çökmeyi) engellemesi beklenir.

Yüksek başarısızlık saydamlığına (failure transparency) sahip bir sistem, tam verimle çalışmaya devam etse bile, kullanıcılarına bileşenlerden birinde arıza meydana geldiğini bildirir; böylece arıza gideribilir ya da yaklaşan 'Tam Bozulma/Durma' durumu tahmin edilebilir. Benzer şekilde, hızlı-arıza (fail-fast) türündeki bir bileşen, iş akışının devamındaki bileşenlerin arıza vermesini bekleyip en sonunda arızayı bildirmek yerine, ilk arıza noktasını bildirmek üzere tasarlanmıştır. Bu yöntem altta yatan sorunun daha kolay çözümlenmesini sağlar ve bozuk durumdaki sisteme uygunsuz işlem yapılmasını engelleyebilir.

Bileşenler

Eğer her bileşen, alt bileşenlerinden birisi arızalandığında, işlemeye devam edebiliyorsa, bu durum tüm sistemin benzer şekilde, bileşenlerden birindekiarıza durumunda, işlmeye devam edebilmesini sağlayacaktır. Bir yolcu aracı örnek olarak kullanılacak olursa, bir arabanın patlamayan lastiği ("run-flat" tire) olabilir ki bu lastik katı kauçuk iç çekirdeğe sahip olabilir böylece lastik delinse de patlamayacağından araba kullanılmaya devam edecektir. Delinmiş bir patlamayan ("run-flat") lastik azaltılmış bir hızda kısıtlı bir süre kullanılabilmektedir.

Yedeklilik (Redundancy)

Yedeklilik (Redundancy), arızadan-yoksun bir ortamda fazlalık sayılacak olan, işlevsel yeteneklerin sunulmasıdır.[3]

Böyle bir sistem birincil bileşenlerden birisinin arıza vermesi durumunda kendiliğinden devreye girecek olan yedek bileşenlerden oluşabilir. Örneğin, büyük yük kamyonları lastiklerinden birini kaybetmeleri durumunda herhangi önemli bir sorun yaşamazlar. Sıradan bir araca göre çok fazla lastikleri/tekerleri olduğu için, lastiklerden (yön vermekte kullanılan en ön lastikler haricindeki) herhangi birisi tek başına ciddi öneme sahip değildir.

Sistemin güvenilirliğini artırmak amacıyla sisteme bu yedekliliği ekleme fikrinin öncüsü 1950'li yıllarda John von Neumann olmuştur.[4]

İki çeşit yedeklilik mümkündür:[5] alan yedekliliği/fazlalığı ve zaman yedekliliği/fazlalığı. Alan yedekliliği fazladan bileşenler, işlevler ya da arızasız işlem için gerekli olan veri nesneleri sağlar. Alan yedekliliği ayrıca sisteme eklenen yedek kaynağın türüne göre donanım, yazılım ve bilgi yedekliliği olarak sınıflandırılır. Zaman yedekliliğinde ise hesaplama ya da veri gönderilmesi tekrarlanır ve sonuç, daha önceki sonucun kopyası ile karşılaştırılır.

Ölçütler

Her bileşen için arızaya-dayanıklı tasarım sağlamak genel olarak seçilen bir yöntem değildir. Yedeklilik ile ilişkilendirilen bir bileşen beraberinde çeşitli olumsuzluklar getirir: ağırlık, boyut, güç tüketimi, maliyet değerlerinde olduğu kadar tasarım, doğrulama ve test için ayrılan zamanda da artış görülecektir. O halde, bir bileşenin yedekli olmasına karar verirken bazı soruların cevapları göz önüne alınmalıdır:[6]

  • Bileşen ne kadar önemli? Bir arabada olağan koşullarda radyo önem değildir, dolayısıyla arızaya-dayanıklılık açısından bu bileşen yedekli olması ihtiyacı daha azdır.
  • Arızalanmaya ne kadar yatkın? Arabalardaki tahrik mili (drive shaft) gibi bazı bileşenler arızalanmaya yatkın değildirler dolayısıyla arızaya-dayanıklılık gerekmemektedir.
  • Bileşeni arızaya-dayanıklı hale getirmek ne kadar maliyetli? Örneğin arızaya-dayanıklı olması için yedekli bir araba motoru hem ekonomik açıdan hem de ağırlık ve alan açısından çok maliyetli olacaktır.

Tüm bu sorulara olumlu yanıtlar verebilen bir bileşen örneği arabanın yolcu tutma(restraint) sistemidir. Biz aslında farketmesek de birincil yolcu tutma sistemi kütleçekimidir. Eğer taşıt yuvarlanırsa ya da şiddetli g-kuvveti (kütleçekimi kuvveti) değişimi yaşarsa, o durumda bu yolcu tutma birincil yöntemi başarısız olabilir. Böyle bir kaza sırasında yolcunun "tutulması/sabitlenmesi/emniyete alınması" güvenlik için muazzam derecede önemlidir, böylece ilk sorunun yanıtı olarak bileşenin çok önemli olduğunu söyleyebiliriz. Emniyet kemerlerinden önce yolcuların taşıttan fırlamasına yol açan kazalar yaygındı, böylece ikinci sorunun yanıtı olarak birincil yolcu sisteminin arızalanmaya çok yatkın olduğunu söyleyebiliriz. Emniyet kemerleri gibi bir yedek tutma/sabitleme sisteminin maliyeti oldukça düşüktür hem ekonomik olarak hem de ağırlık ve alan olarak, böylece üçüncü sorunun yanıtı olarak birincil yolcu tutma sistemine (kütleçekimi) yedek olarak eklenecek olan ikincil yolcu tutma sisteminin (emniyet kemeri) maliyetinin düşük olduğunu söyleyebiliriz. Bu yanıtlardan varılacak sonuç şudur: tüm taşıtlara emniyet kemerleri eklemek mükemmel bir fikirdir. Hava yastıkları gibi diğer "ek tutma/sabitleme sistemleri" daha maliyetlidirler ve aynı sorulara alacağınız yanıtları bir test olarak düşünürseniz, bu testten daha dar bir başarı aralığı ile geçerler.

Gereksinimler

Arızaya dayanıklılığın temel gereksinimleri aşağıdaki gibidir:

  1. Hiçbir Tek bozulma noktası (SPOF) olmaması– eğer bir sistem çalışma esnasında bozukluk ile karşılaşırsa, onarım sürecini sekteye uğratmayacak şekilde işlemeye devam edebilmeli.
  2. arıza veren bileşenin yalıtımı – bileşende bozukluk ortaya çıktığında, sistem sıkıntılı bileşeni yalıtabilmelidir.Bu da, tek amacı arıza yalıtımı olan bu işe adanmış arıza algılama düzeneklerinin sisteme eklenmesini gerektirmektedir. Bir arıza durumunda sistemin düzelmesi için arızanın ya da arızalanan bileşenin sınıflandırılması gerekmektedir. Amerika'daki Ulusal Standartlar ve Teknoloji Enstitüsü (NIST) arızaları konuma, sebebe, süreye ve de etkiye göre sınıflandırmaktadır.
  3. Arızanın yayılmasını engellemek amacıyla arıza muhafaza – Bazı arıza düzenekleri arızayı sistemin kalanına yayarak sistem başarısızlığına sebep olabilir. Bu çeşit bir arızanın örneği olarak "yasa dışı radyo vericisi" (rogue transmitter) aletinin bir sistemdeki yasal/resmi iletişimi (sistemle aynı kanala yaptığı aralıksız yayın ile) boğarak sistemin tamamen çökmesine ve hizmet verememesine sebep olması gösterilebilir. Sistemi korumak için arıza veren bileşeni ya da bu vericiyi yalıtacak olan güvenlik duvarı ya da benzeri düzeneklere gereksinim duyulmaktadır.
  4. sistemleri eski haline döndürecek, kullanıma hazır, modeller

Ek olarak, arızaya-dayanıklı sistemler hem önceden kararlaştırılmış hizmet kesintileri hem de belirsiz hizmet kesintileri açısından ele alınırlar. Bu tür çözümlemeler sadece donanım seviyesinde değil de genel olarak yazılım seviyesinde yapılır. İşe yararlık değerine hizmet verebilirlik (availability) denir ve yüzde olarak ifade edilir. Örneğin, 5-9 (5 nines) türünde bir sistem istatistiksel olarak 99.999% hizmet verebilirlik sağlayabilir.

Arızaya-dayanıklı sistemler genelde yedeklilik kavramı üzerine kurulurlar.

Çoğaltma (Replication)

Yedek bileşenler arızaya-dayanıklılığın ilk özelliğine üç şekilde hitap ederler:

  • Çoğaltma(Replication): Aynı sistemin ya da aynı alt sistemin birbirinin eşi olan birden fazla örneğini sağlama, görevleri ya da istekleri bu örneklerin hepsine koşut olarak yönlendirme ve Yeter Sayı (quorum) mantığına göre doğru sonucu seçme;
  • Yedeklilik: Aynı sistemin birbirinin eşi olan birden fazla örneğini sağlama ve arıza durumunda işlem akışını geriye kalan örneklerden birisine yönlendirme yani Yedeğe geçiş (failover) yapma;
  • Çeşitlilik: Aynı gereksinim tanımlaması için bir den fazla farklı uygulanış sağlama ve bunları,belirli bir uygulanışta ortaya çıkan arızalarla başa çıkmak için, çoğaltılmış sistemler gibi kullanma.

RAID 0 dışındaki tüm RAID (Bağımsız Disklerin Artıklıklı/Yedekli Dizisi) uygulamaları, veri yedekliliği (data redundancy) özelliğine sahip, arızaya-dayanıklı kayıt ortamı örnekleridir.

Koşut yedekli düzen(lockstep) türündeki arızaya-dayanıklı sistemler birbirleriyle koşut olarak çalışan çoğaltılmış bileşenleri kullanır. Herhangi bir anda, bir bileşen ve tüm çoğlatılmış yedekleri aynı işlem durumunda olmalıdırlar. Bileşene ve çoğaltılmış her yedeğine aynı girdiler sağlanır ve hepsinden de aynı çıktılar beklenir. Bu bileşenin ve çoğaltılmış yedeklerinin çıktıları oylama devresi kullanılarak karşılaştırılır. Her bileşeni için toplamda iki adet çoğaltım (bileşen ve yedeği) içeren bir makine, çifte modüler yedekli (dual modular redundant - DMR) sistem olarak tanımlanır. Oylama devresi böyle bir sistemde sadece uyumsuzluğu bulabilir ve veri kurtarma için başka yöntemlere başvurulur. Her bileşeni için toplamda üç adet çoğaltım (bileşen ve iki adet yedeği) içeren bir makine, üçlü modüler yedekli (triple modular redundant - TMR) sistem olarak tanımlanır. Oylama devresi böyle bir sistemde 2'ye 1 oylamanın oluştuğu durumda hangi bileşenin arızalı olduğunu bulabilir.Bu durumda, oylama devresi doğru sonucu çıktı olarak verir ve arızalı sonucu atar. Bundan sonra, arızalı sonucu üretmiş olan çoğaltımın iç durumunun kalan ikisinden farklı olduğu varsayılır ve oylama devresi arızalı yedeği kullanmaktan vazgeçerek DMR olarak işlem görmeye başlar. Bu işlem modeli pek çok uygulamada kullanılmaktadır.

Koşut yedekli düzendeki arızaya-dayanıklı makinelerin çok kolayca birbirleriyle eşzamanlı (Synchronization) hale getirilebilirler,bu her bir çoğaltımın her kapısının (gate) aynı sayaç anında aynı durum geçişini yapması ile ve her çoğaltımdaki sayacın saatinin birbiriyle kesinlikle aynı fazda olması ile sağlanır. Ancak Koşut yedekli düzeni bu gereksinim olmadan da kurmak mümkündür.

Çoğaltılmış yedekleri eşzamanlı hale getirme içlerinde saklanan durumunun aynı yapılmasını gerektirir. Çoğaltımlar ön-tanımlı bir başlangıç durumundan başlatılabilirler, örneğin yeniden başlama durumu gibi. Ayrıca,bir çoğaltımın iç durumu başka bir çoğaltıma aktarılabilir (böylece her iki çoğaltımın da iç durumları aynı olur).

DMR yönteminin başka bir çeşidi ise çiftli-yedek (pair-and-spare) yöntemidir. İki adet çoğaltılmış yedek bileşen koşut yedekli düzende bir çift olarak işlev görürler, bu durumda oylama devresi bu çiftin işlemlerinde bir uyumsuzluk tespit ettiğinde Koşut yedekli düzenin o ayağında bir arıza olduğunu belirtmek için bir sinyal üretir. Diğer başka bir çift de tamamen aynı şekilde işler. . "Çiftli-yedek" yöntemi TMR yöntemindeki üç adet çoğaltımın yerine toplamda dört adet çoğaltılmış yedek gerektirir, ancak ticari olarak kullanılabilmiştir (Stratus XA/R Series 300[7]).

Olumsuz tarafları

Arızaya-dayanıklı tasarımın olumlu tarafları belirgin iken, aşağıda listelenen olumsuz tarafları aynı oranda fark edilmemektedir:

  • Aynı bileşendeki arıza algılamasına engel çıkması. Yukarıdaki araç örneğinden devam edecek olursak, her iki arızaya-dayanıklı sistemle birlikte, sürücü lastiğin delindiğini farketmeyebilir. Bu durumda genellikle "otomatik arıza-algılama sistemi" kullanılır. Lastikteki hava basıncı izleyicisi basınç kaybını algılar ve sürücüyü uyarır. Başka bir çözüm ise "el yordamıyla arıza-algılama" yöntemidir, bu yöntemde kişi tüm lastikleri tek tek el yordamıyla denetler.
  • Başka bileşendeki arıza algılamasına engel çıkması. Bu sorunun başka bir çeşidi ise bir bileşendeki arızaya-dayanıklılık başka bir bileşendeki arızanın algılanmasını engellediğinde ortaya çıkar. Örneğin, Eğer B bileşeni A bileşenin çıktısı üzerinde bir işlem yapıyorsa, o zaman B bileşenindeki arızaya-dayanıklılık A bileşenin arızasını gizleyebilir. Eğer B bileşeni daha sonra,örneğin arızaya daha az dayanıklı olan, başka bir çeşidiyle değiştirilirse, sistem aniden çökebilir, böyle bir durumda sorunun yeni B bileşeninde olduğunun düşünülecektir. Ancak sistem çok ayrıntılı bir şekilde incelendikten sonra asıl sorunun A bileşeninde olduğu ortaya çıkacaktır.
  • Arıza düzeltiminin önceliğinin azaltılması. İşletmen arızanın farkında olsa bile arızaya-dayanıklı bir sistem muhtemelen arızanın düzeltiminin önemini azaltacaktır. Eğer arızalar düzeltilmezse bu durum, arızaya-dayanıklı bileşen tamamen çöktüğünde ya da tüm yedek bileşenler ayrıca çalışmaz hale geldiğinde, sistemin çökmesine yol açacaktır.
  • Test etmenin zorluğu. Nükleer reaktör gibi bazı çok önemli arızaya-dayanıklı sistemlerde, yedek bileşenlerin işlevsel olduğunu doğrulamanın kolay bir yolu yoktur. Bunun en bilenen örneği Çernobil kazasıdır, bu kazada işletmenler acil durum yedek soğutmasını birincil ve ikincil soğutmaları devre dışı bırakarak test etmişlerdir.Test sırasında yedeğin çalışmaması, çekirdek erimesine (core meltdown) ve çok aşırı miktarda radyasyon salınmasına yol açmıştır.
  • Maliyeti. Hem arızaya-dayanıklı bileşenler hem de yedek bileşenler genelde maliyeti artırırlar. Bu sadece parasal bir maliyet de olabilir ya da ağırlık gibi diğer alanlarda artış da içerebilir. Örneğin insanlı uzay gemilerinde, o kadar çok yedek ve arızaya-dayanıklı bileşen vardır ki ağırlıkları, aynı derecede güvenlik gerektirmeyen insansız sistemlere göre çok büyük miktarlarda artış gösterir.
  • Kalitesiz bileşenler. Arızaya dayanıklı bir tasarım, kullanılmaması durumunda sistemi işletilmez kılacak olan kalitesiz bileşenlerin kullanımına izin verebilir (Örneğin bileşenlerin aşırı pahalı olması sebebiyle sistemin sadece bir kez ya da hiç kullanılmaması yerine 10 kat daha ucuz olan bileşenin kullanılması gibi). Bu uygulamanın maliyet artış miktarını azaltma ihtimali bulunmasının yanı sıra, çok sayıda kalitesiz bileşen kullanımı da sistemin güvenilirliğini, arızaya dayanıksız olan bir sistemin güvenilirliğine eş ya da ondan daha aşağı seviyelere düşürebilir.

Örnekler

Twitter M2 mobil web sitesi

Donanımsal Arızaya dayanıklılık bazen bozuk parçaların, sistem hala işler haldeyken, çıkarılıp yenileriyle değiştirilmelerini gerektirir (bilgisayar sistemlerindeki karşılığına Çalışırken Parça Değişimi - hot swapping denmektedir). Tek bir yedekle oluşturulmuş böyle bir sisteme tek noktada dayanıklı (single point tolerant) denmektedir ve Arızaya dayanıklı sistemlerin büyük çoğunluğu bu şekildedir. Böyle sistemlerde Bozulmalar arası ortalama süre (mean time between failure - MTBF); işletmenlerin, yedek de ayrıca bozulmadan önce, bozuk aygıtları değiştirmesine yetecek kadar uzun olmalıdır (Ortalama onarım süresi-mean time to repair - MTTR). Bozulmalar arası sürenin olabildiğince uzun olması işleyişe yardımcı olacaktır, ancak bu özellik arızaya-dayanıklı sistemlerde özel olarak gerekmemektedir.

Arızaya dayanıklılık bilgisayar uygulamalarında belirgin bir şekilde başarılıdır. Tandem Computers şirketi bu tür sistemlerin pazarlanması amacıyla kurulmuştur, Aralıksız (NonStop) çalışan sistemlerinde tek-noktada dayanıklılığı kullanmışlardır. Şirketin bu tür sistemlerinin Kesintisiz çalışma süresi (uptime) yıllarla ölçülmektedir.

Arızaya-hazırlıklı mimariler ayrıca bilgisayar yazılımını da kapsayabilir, örneğin işlem (process) çoğaltılması gibi.

Veri biçimleri de ayrıca zarifçe bozulmak üzere tasarlanabilirler. Örneğin HTML, ileriye uyumlu olacak şekilde tasarlanmıştır. Böylece yeni HTML nesnelerinin/tanımlarının, onları anlayamayan/tanımlayamayan Web tarayıcıları tarafından göz ardı edilmesi sağlanmakta ve yüklenen HTML belgesinin dengesiz olması engellenmektedir.

İlgili terimler

Arızaya dayanıklılık ile nadiren sorun yaşayan sistemler arasında bir fark bulunmaktadır. Örneğin,Western Electric şirketinin Çapraz bağlantı(crossbar) sistemlerinin kırk yılda toplam iki saatlik arıza oranları vardı,ve dolayısıyla yüksek oranda arıza oluşmamasına yatkın idiler. Ancak bir arıza meydana geldiğinde tamamen duruyorlardı ve dolayısıyla arızaya dayanıklı değillerdi.

Ayrıca bakınız

Dış bağlantılar

Kaynakça

  1. ^ Johnson, B. W. (1984). "Fault-Tolerant Microprocessor-Based Systems", IEEE Micro, vol. 4, no. 6, pp. 6–21
  2. ^ Stallings, W (2009): Operating Systems. Internals and Design Principles, sixth edition
  3. ^ Laprie, J. C. (1985). "Dependable Computing and Fault Tolerance: Concepts and Terminology", Proceedings of 15th International Symposium on Fault-Tolerant Computing (FTSC-15), pp. 2–11
  4. ^ von Neumann, J. (1956). "Probabilistic Logics and Synthesis of Reliable Organisms from Unreliable Components", in Automata Studies, eds. C. Shannon and J. McCarthy, Princeton University Press, pp. 43–98
  5. ^ Avizienis, A. (1976). "Fault-Tolerant Systems", IEEE Transactions on Computers, vol. 25, no. 12, pp. 1304–1312
  6. ^ Dubrova, E. (2013). "Fault-Tolerant Design", Springer, 2013, ISBN 978-1-4614-2112-2
  7. ^ HW Redundancy (PDF), 14 Haziran 2010, 23 Eylül 2015 tarihinde kaynağından arşivlendi (PDF), erişim tarihi: 3 Ağustos 2015  Page 12

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Sunucu (bilişim)</span> bilgisayar ağlarında, diğer ağ bileşenlerinin (kullanıcıların) erişebileceği, kullanımına ve/veya paylaşımına açık kaynakları barındıran bilgisayar birimi

Sunucu, bilişim alanında "istemci" denilen diğer program ve cihazlara çeşitli işlevler sunan bilgisayar donanımları veya yazılımlarıdır. Bu mimariye istemci-sunucu modeli denir. Sunucular, istemciler arasında veri veya kaynak paylaşımı, bir istemci için hesaplama yapma gibi çeşitli işlevleri yerine getirebilirler. Bu işlevlere genellikle "servis" veya "hizmet" denir. Tek bir sunucu çok sayıda istemciye hizmet verebilir, tek bir istemci de çok sayıda sunucudan hizmet alabilir. İstemci ve sunucu aynı cihaz üzerinde çalışabileceği gibi, istemci ağ üzerinden farklı bir cihazdaki sunucuya da bağlanabilir. Tipik sunucular arasında veritabanı sunucuları, dosya sunucuları, e-posta sunucuları, yazdırma sunucuları, web sunucuları, oyun sunucuları ve uygulama sunucuları sayılabilir.

<span class="mw-page-title-main">Anakart</span>

Anakart, modern bir bilgisayar gibi karmaşık bir elektronik sistemin birincil ve en merkezî baskılı devre kartıdır. Apple bilgisayarlardaki muadiline logic board denir ve bazen mobo olarak kısaltılır. Fiziksel yapı olarak anakartlar özel alaşımlı bir blok üzerine yerleştirilmiş ve üzerinde RAM yuvaları genişleme kartı slotları devreler ve yongalar bulunan kare şeklinde bir plakadır. Bu plaka çalışma sistemini organize eder. Bu organizasyon anakart üzerindeki yonga setleri sayesinde olur.

Redundant Array of Inexpensive Disks ve Redundant Array of Independent Disks kısaca RAID, diskler arasında veri kopyalama veya paylaşımı için birden fazla sabit diski kullanarak yapılan veri depolama tasarısıdır. Tek diske göre, RAID'in yararı, veri bütünlüğünü, hata toleransını, iş çıkarma yeteneğini ve toplam disk kapasitesini artırmasıdır. Özgün uygulamalarda, anahtar avantajı disk kapasiteyi artırmakla beraber disk performansını da yükseltmesi ve verileri eş zamanlı olarak yedeklemeyi sağlamasıdır.

<span class="mw-page-title-main">Bilgisayar güvenliği</span> bilgisayar sistemlerinin ve ağlarının, hırsızlık, hasar, kötüye kullanım gibi durumlara karşı koruma mekanizmaları

Bilgisayar güvenliği, elektronik ortamlarda verilerin veya bilgilerin saklanması ve taşınması esnasında bilgilerin bütünlüğü bozulmadan, izinsiz erişimlerden korunması için, güvenli bir bilgi işleme platformu oluşturma çabalarının tümüdür. Bunun sağlanması için duruma uygun güvenlik politikasının belirlenmesi ve uygulanması gereklidir.

<span class="mw-page-title-main">Simülasyon</span> gerçek bir dünya süreci veya sisteminin işletilmesinin zaman üzerinden taklit edilmesi

Simülasyon veya benzetim, teknik olmayan anlamda bir şeyin benzeri veya sahtesi anlamında kullanılır. Teknik anlamda gerçek bir dünya süreci veya sisteminin işletilmesinin zaman üzerinden taklit edilmesidir. Sistem nesneleri arasında tanımlanmış ilişkileri içeren sistem veya süreçlerin bir modelidir.

Algol değişenleri veya Algol türü ikililer örten çift yıldızların ışık eğrisi biçimlerine göre yapılan sınıflamanın bir grubunu teşkil etmektedirler. Tutulmalar dışındaki ışık şiddetleri kabaca sabittir ve izlenen ufak değişimler basıklık ve yansıma etkilerinden kaynaklanmaktadır. Buna bağlı olarak tutulma başlama ve bitiş zamanları, gözlenen ışık eğrileri üzerinden doğrudan hesaplanabilmektedir. Aralarında çok farklı minimum derinlikleri gösteren sistemler bulunmaktadır. Genelde minimum derinlikleri eşit değildir. Ancak minimum derinlikleri neredeyse birbirine eşit olan Algol türü sistemler de mevcuttur. Bazı örneklerinde ikinci minimum derinliği son derece sığdır veya hiç görünmez.

<span class="mw-page-title-main">Beta Lyrae değişeni</span>

Beta Lyrae değişenleri, birincil ve ikincil yıldız örtülmelerinin farklı miktarlarda ışık azalmasına neden olması ve ışık eğrilerinin sürekli değişmesiyle karakterize edilen bir örten ikili yıldız türüdür. Tutulmalar dışındaki ışık değişiminde kesikli yapılar yoktur ve sürekli bir değişim söz konusudur. Bu koşullar altında tutulma başlangıcı ve bitişini ışık eğrisinden kestirebilmek oldukça zordur. GCVS'deki önerilere göre, EB ve EW türleri arasındaki ayrım, birincil ve ikincil minimum derinlikleri arasındaki farka bakılarak yapılmaktadır. Buna göre EB türü sistemlerin birincil minimum derinlikleri, ikincil minimum derinliklerine göre oldukça fazladır. Yörünge dönemleri genelde 1 günden daha uzundur ve baskın tayf türü B-A arasındadır.

W Ursae Majoris değişeni ışık eğrilerinde izlenen neredeyse eşit derinlikli iki minimum ve süreklilik gösteren ışık değişimleri ile karakterize edilmektedirler. Eşit minimum derinlikleri, bileşen yıldızların eşit yüzey sıcaklığına sahip olduklarının bir göstergesidir. "değen çiftler" olarak da bilinen bu sistemlerin bileşenleri birbirine çok yakındır. Bunun doğal sonucu olarak birbirlerine uyguladıkları ileri düzeyde karşılıklı tedirginlik kuvvetleriyle, küresellikten önemli ölçüde sapmış bileşenler içermektedirler. Yörünge dönemleri oldukça kısadır ve 7 saat – 1 gün arasında değerlere sahiptir.

<span class="mw-page-title-main">Geriye uyumluluk</span>

Telekomünikasyon ve bilişim teknolojisinde yeni aygıtların eski aygıtlar tarafından üretilmiş girdileri çalıştırabilme yeteneğine geriye uyumluluk denir. Yeni standartlar için tasarlanmış bir ürün eski standartlara erişebiliyor, okuyor veya oynatabiliyorsa o ürüne geriye uyumludur denir. Örneğin veri biçimleri ve iletişim protokolünü içeren standartlar gibi.

<span class="mw-page-title-main">Genetik kanalizasyon</span>

Genetik kanalizasyon, yaşadıkları çevrenin değişebilirliği veya sahip oldukları genotipin değişkenliği ne ölçüde olursa olsun, bir popülasyonun aynı fenotipi üretebilme yeteneğinin bir ölçüsüdür. Diğer bir deyişle "dayanıklılık" veya "performans" anlamına gelir ve popülasyonun sağlamlığını ifade eder. Genetik kanalizasyon terimi ilk defa Conrad Hal Waddington tarafından kullanılmıştır. Waddington bu terimi, daha ziyade popülasyonun dayanaklılığını dikkate almak yerine, örneğin tasarlanmış sistemler gibi biyolojik sistemlerin tam olarak aynı şekilde sağlam ve dayanıklı olmadıklarını ifade etmek için kullanmıştır. Biyolojik dayanıklılık veya kanalizasyon, gelişimsel yolların evrim tarafından şekillendirildiğinde belirir. Waddington, organizmaların gelişimleri sırasında "yokuş aşağı" yuvarlandıkları durum için epigenetik yüzey terimini ortaya atmıştır. Bu benzetmede, kanalize edilmiş bir özellik, güvenli bir şekilde fenotipi onun "kaderine" doğru yönlendiren ve yüksek sırtlar ve tepelerle çevrili bir vadi olarak gösterilmiştir. Waddington, bu kanalların evrim süreçleri sırasında epigenetik yüzey tarafından şekillendirildiği ve bu sezginin biyolojik dayanıklılığın benzersiz niteliklerini anlamak için yararlı olduğunu öne sürmüştür.

Hareket işlem sistemi bir işletmede meydana gelen yapılandırılmış ve sürekli yinelenen olguları kaydetmek, izlemek, saklamak, işlemek ve yayımlamak için kullanılan bir bilgisayar tabanlı bilişim sistemidir. Bu olgulara örnek olarak arasında sipariş almak, fatura ve irsaliye hazırlamak, mal ve hizmet teslim almak ya da etmek, bordro hazırlamak gösterilebilir. Bir işletmede kullanılan kaynakların, işletme içinde ve dışındaki çıkar ve ilgi gruplarının her biri açısından anlamlı olan ve zamanla meydana gelen her bir değişimine hareket denir. Hareketler bir kurumun işleyişi sırasında meydana gelen olgulardır. Bu olgular fiziksel, parasal ya da kavramsal kaynakların özelliklerinden birinin, bir bölümünün ya da tümünün değişimini içerir. Kimi zaman bir hareket başka hareketlerin meydana gelmesine neden olur.

<span class="mw-page-title-main">Zorunlu iniş</span> bir hava aracının normal uçuşuna devam etmesinin mümkün olmadığı koşullarda yaptığı iniş

Zorunlu iniş veya mecburî iniş, bir hava aracının normal uçuşuna devam etmesinin mümkün olmadığı koşullarda yaptığı inişi tanımlamakta kullanılan bir havacılık terimi. Bununla birlikte gündelik konuşmada zaman zaman uçuşa müdahale edilmesi ve pilotun inişe zorlanması durumu için de kullanılır.

<span class="mw-page-title-main">Elektrik şebekesi</span>

Elektrik şebekesi üretilen elektrik enerjisini kullanıcılara iletmek için oluşturulmuş bileşik bir ağdır. Elektrik gücü üreten enerji santralları, üretim kaynaklarından talep merkezlerine enerji aktaran iletim (nakil) hatları ve kullanıcılara bağlantı sağlayan bileşik dağıtım hatlarından oluşur.

<span class="mw-page-title-main">Hata ağacı analizi</span>

Hata ağacı analizi (HAA), alt seviyedeki bir dizi olayı birleştirmek için kullanılan Boolean mantığı ile analizi yapılan sistemdeki arzu edilmeyen bir durum için uygulanan, yukarıdan aşağı ve tümdengelim mantığı olan başarısızlık analizidir. Bu analiz yöntemi, esas olarak güvenlik mühendisliği ve güvenilirlik mühendisliği alanlarında sistemlerin nasıl bozulabileceğini anlamak, riski azaltacak en iyi yolları tanımlamak veya sistemin belli bir seviyesindeki başarısızlığı veya emniyetli kaza olaylarının oranlarını belirlemek için kullanılır. HAA havacılık, nükleer enerji, kimyasal süreç, ilaç, petrokimya ve diğer yüksek tehlikenin bulunduğu endüstrilerde kullanılmaktadır, fakat sosyal hizmet sistemi başarısızlıkları ile ilgili risk faktörü tanımlamaları gibi farklı alanlarda da kullanılır. HAA aynı zamanda yazılım mühendisliğinde hata ayıklama amacıyla kullanılır ve hataları tespit etmek için kullanılan sebep-eleme tekniği ile yakından ilişkilidir.

Bir sistem mimarisi veya çoklu sistemlerin mimarisi; sistemin yapısını, davranışını ve biçimselliğini tanımlayan kavramsal modeldir. Bir mimari tanımı; sistemin yapıları ve davranışları hakkında mantıksallığı destekleyecek şekilde organize edilen ilişkiselliğin standart bir açıklaması veya temsilidir.

Karmaşık sistemler, birbiriyle etkileşime girebilecek birçok bileşenden oluşur. Çoğu durumda, böyle bir sistemi bağlantı noktalarının bileşenleri temsil ettiği ve etkileşimlerini birbirine bağladığı bir ağ olarak göstermesi yararlıdır. Karmaşık sistemlere örnek olarak, Dünya'nın küresel iklimi, organizmalar ya da inorganik maddeler, insan beyni, ekosistem, canlı bir hücre ve nihayetinde bütün bir evren gösterilebilir.

Eşzamanlılık denetimi, eşzamanlı işlemler için doğru sonuçların elde edilmesini sağlarken, bu sonuçları da olabildiğince çabuk almayı sağlayan uğraşı alanıdır.Bilgisayar bilimleri, bilgi teknolojileri ve özellikle bilgisayar programlama, işletim sistemleri, çoklu işlemciler ve veritabanı alanlarında önemlidir.

<span class="mw-page-title-main">Erlang (programlama dili)</span> programlama dili

Erlang, Ericsson firması tarafından 1986'da Joe Armstrong, Robert Virding ve Mike Williams önderliğinde geliştirilen genel amaçlı (general-purpose), eş zamanlı (concurrent), dinamik, fonksiyonel ve atık toplama (garbage-collected) özelliğine sahip olan bir dildir. Erlang veya alternatifi olan Erlang/OTP şeklinde tanımlamalar da kullanılabilir. Erlang/OTP işleyiş sürecinin bir parçasıdır ve birçok kullanıma hazır komponent/bileşen sunmaktadır. Erlang/OTP bileşenlerinin birçoğu Erlang programlama dili ile yazılmıştır. Erlang/OTP, bunların yanında bir dizi tasarım prensipleri de sunmaktadır.

Yapısal kablolama, bir bina veya tesis içinde veri iletişimi için gerekli altyapıyı oluşturan bir sistemdir. Bu sistem, bilgisayarlar, telefonlar, güvenlik kameraları, ses ve veri iletişimi gibi farklı cihazların birbirleriyle iletişim kurabilmeleri için kullanılır. İşte yapısal kablolamanın ana bileşenleri ve önemli unsurları:

  1. Kablo: Yapısal kablolamanın temel bileşeni olan kablo, veri iletimini sağlar. Genellikle bakır veya fiber optik kablo kullanılır. Fiber optik kablo, yüksek hızlı veri iletimi için tercih edilirken, bakır kablo daha yaygın olarak kullanılır.
  2. Konut Noktaları: Konut noktaları, kullanıcı cihazlarının yapısal kablolama sistemine bağlandığı yerlerdir. Bu noktalar genellikle RJ-45 Ethernet konektörleri veya RJ-11 telefon konektörleri ile donatılmış duvar prizleridir.
  3. Panolar: Panolar, kabloların merkezi bir noktada toplandığı ve yönlendirildiği yerlerdir. Genellikle anahtar panosu ve dağıtım panoları olarak iki ana türü vardır.
  4. Switch'ler ve Router'lar: Bu cihazlar, verilerin ağ üzerinde yönlendirilmesini ve iletilmesini sağlarlar. Switch'ler, verileri ağdaki farklı cihazlar arasında yönlendirirken, router'lar farklı ağlar arasında veri iletimini sağlar.
  5. Yedeklilik ve Güvenlik: Yapısal kablolama sistemleri, kesintiye uğramaması ve güvenli olması gereken kritik altyapıları destekler. Bu nedenle, yedekli kablo yolları, güç yedeklemesi ve güvenlik önlemleri gibi unsurlar da önemlidir.

Dağıtık sistemler, sanal ve/veya fiziksel ağlar ile birbirine bağlanmış sistemler üzerinde çalışan yazılımların bütün olarak bir yazılımın yürütülmesine imkân verecek şekilde kullanılmasıdır. Dağıtık sistemler, bir yazılımın kesintisiz ve maliyeti az bilişim altyapılarına ihtiyaç duyulması ile ortaya çıkmış bir konudur. Temel olarak bir yazılımın birden fazla bilgisayar üzerinde koşturulması, nasıl ne şekilde koşturulacağının tasarlanması dağıtık sistemler altında incelenir.