Titan (süper bilgisayar)
Şablon:Infobox custom computerTitan veya OLCF-3, Cray tarafından Oak Ridge Ulusal Laboratuvarı'nda çeşitli bilim projelerinde kullanılmak üzere yapılmış bir süper bilgisayardır. Titan, Oak Ridge'deki eski bir süper bilgisayar olan ve geleneksel merkezi işlem birimlerine (CPU'lar) ek olarak grafik işlem birimleri (GPU'lar) kullanan Jaguar'ın bir yükseltmesiydi. Titan, 10 petafloptan fazla performans gösteren bu tür ilk hibritti. Yükseltme Ekim 2011'de başladı, stabilite testine Ekim 2012'de başladı ve 2013'ün başlarında araştırmacıların kullanımına sunuldu. Yükseltmenin ilk maliyeti 60 milyon ABD dolarıydı ve esas olarak Amerika Birleşik Devletleri Enerji Bakanlığı tarafından finanse edildi.
Titan, IBM tarafından inşa edilen ve düğüm başına çok daha fazla GPU özelliğine sahip daha az düğüm ve sistemin paralel dosya sisteminden dosya verilerinin düğüm başına geçici olmayan yerel önbelleğe alınmasının yanı sıra, 2019'da Zirve tarafından Oak Ridge'de gölgede kaldı.[1]
Titan, Nvidia Tesla GPU'ları ile birlikte AMD Opteron CPU'ları Jaguar'a göre hesaplama gücünde büyük bir artış sağlarken enerji verimliliğini artırmak için kullandı. Bu, TOP500 organizasyonu tarafından Kasım 2012 listesinde birincilik almak için yeterliydi, ancak Tianhe-2 Haziran 2013 listesinde Titan'ı geride bıraktı.
Titan herhangi bir bilimsel amaç için mevcuttu; erişim, projenin önemine ve hibrit mimariden yararlanma potansiyeline bağlıdır. Titan'a bağımlılıktan kaçınmak için seçilen herhangi bir program diğer süper bilgisayarlarda da çalıştırılabilir olmalıdır. İlk seçilen altı öncü programdı. Çoğunlukla moleküler ölçekli fizik veya iklim modelleriyle uğraşırken, 25 kişi arkalarında sıraya girdi. GPU'ların dahil edilmesi, yazarları programlarını değiştirmeye zorladı. GPU'ların CPU'lardan çok daha fazla eşzamanlı iş parçacığı sunduğu göz önüne alındığında, değişiklikler tipik olarak paralellik derecesini artırdı. Değişiklikler genellikle yalnızca CPU'lu makinelerde bile daha yüksek performans sağlar.
Tarihçe
Oak Ridge Ulusal Laboratuvarı'ndaki (ORNL) Oak Ridge Liderlik Hesaplama Tesisi'nde (OLCF) 20 petaFLOPS kapasitesine sahip bir süper bilgisayar yaratma planları, Jaguar'ın inşa edildiği 2005 yılına kadar uzanıyordu. Titan'ın kendisi yaklaşık 200 petaflop bir başka sistemle 2016 yılında değiştirilmiştir. Titan için yeni ve 15.000 metrekare bir bina Jaguar'ın mevcut altyapısına eklenerek inşa edildi. GPU'ları tedarik etmek için Nvidia ile 2009 yılında bir anlaşma imzalanmasına rağmen, hassas sistem mimarisi 2010 yılına kadar tamamlanmadı. Titan ilk olarak 16 Kasım 2010'da özel ACM / IEEE Süper Bilgisayar Konferansı'nda (SC10) duyuruldu ve Titan yükseltmesinin ilk aşaması başladığında 11 Ekim 2011'de kamuoyuna duyuruldu.
Jaguar, yaratılışından bu yana çeşitli yükseltmeler aldı. 25 teraFLOPS veren Cray XT3 platformuyla başladı. 2008 yılına kadar Jaguar daha fazla kabinle genişletildi ve XT4 platformuna yükseltilerek 263 teraFLOPS'a ulaştı. 2009'da XT5 platformuna yükseltilerek 1.4 petaFLOPS'a ulaştı. Son yükseltmeleri Jaguar'ı 1.76 petaFLOPS'a getirdi.
Titan, öncelikle ORNL aracılığıyla ABD Enerji Bakanlığı tarafından finanse edildi. Finansman, CPU'ları satın almak için yeterliydi, ancak tüm GPU'ları değil, bu nedenle Ulusal Okyanus ve Atmosfer İdaresi, hesaplama süresi karşılığında kalan düğümleri finanse etmeyi kabul etti. ORNL bilimsel bilgi işlem şefi Jeff Nichols, Titan'ın yaklaşık 60 milyon $ 'a mal olduğunu belirtti. Bu maliyeti NOAA'nın katkısının 10 milyon dolardan çok daha az olduğu, ancak kesin rakamlar ifşa etmeme anlaşmaları kapsamında olduğundan açıklanamamıştır. Cray ile yapılan sözleşmenin tam süresi 97 milyon doları içeriyordu, potansiyel yükseltmeler hariç.
Bir yıl sürecek dönüşüm 9 Ekim 2011'de başladı. Ekim ve Aralık arasında, Jaguar'ın her biri 24 XT5 Blade'e sahip adet kabine sahip 96 kabini XK7 blade'e (düğüm başına bir 16 çekirdekli CPU, blade başına dört düğüm) yükseltildi. Aralık ayında, hesaplama 96 XK7 kabinlerine taşınırken, kalan 104 kabin XK7 Blade'e yükseltildi. ORNL'nin harici ESnet bağlantısı 10 Gbit/s'den 100 Gbit/s'ye yükseltildi ve sistem iç bağlantıları iyileştirildi.
Kaynakça
- ^ "Summit FAQs". ornl.gov. Oak Ridge National Laboratory. 14 Kasım 2014. 29 Kasım 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Kasım 2014.