Ev İleri düşünme Süper bilgisayarlar için büyük değişiklikler nihayet ufukta görünüyor

Süper bilgisayarlar için büyük değişiklikler nihayet ufukta görünüyor

2024

Video: Moana - Uzaklara (Şarkı) (Kasım 2024)

Bu haftaki ISC 17 süper bilgisayar konferansına baktığımızda, süper bilgisayar dünyası önümüzdeki birkaç yıl içinde bazı büyük gelişmeler görecek gibi gözüküyor, ancak dünyanın en hızlı süper bilgisayarlarının iki yılda bir Top 500 listesine yapılan güncelleme çok farklı değildi. önceki sürüm.

Dünyanın en hızlı bilgisayarları, birkaç yıl boyunca listenin başında yer alan iki büyük Çinli makine olmaya devam ediyor: 93 petaflops'un (93 bin trilyon kayan noktadan) sürekli Linpack performansı ile Çin'in Wuxi'deki Ulusal Süper Hesaplama Merkezi'nden Sunway TaihuLight bilgisayarı saniye başına işlem); ve Guangzhou'daki Çin Ulusal Süper Bilgisayar Merkezi'nden Tianhe-2 bilgisayarı, 33.8 petaflops'tan daha uzun süren performansıyla. Bunlar devasa bir farkla en hızlı makineler olmaya devam ediyor.

Üçüncüsü, Intel kullanan bir Cray sistemi olan İsviçre Ulusal Süper Hesaplama Merkezi'nden Piz Daint sistemi. Xeon Linvi'ye 19.6 petaflops performansı ile önceki performansını iki katına çıkarması için yakın zamanda yükseltilmiş olan Nvidia Tesla P100s. Bu listedeki sekiz numaradan yükseldi.

Bu, ABD'nin en üst sistemi olan Oak Ridge Ulusal Laboratuvarı'ndaki Titan sistemi dördüncü sıraya indirdi ve bu ilk kez yirmi yılda ilk üçte ABD sistemi olmadığını gösteriyor. Listenin geri kalan kısmı değişmeden kalıyor, ABD hala ilk 10'un beşinden beşini, Japonya ise iki kişiyi temsil ediyor.

En hızlı bilgisayar listesi fazla değişmese bile, başka yerlerde de büyük değişiklikler var. En güç verimli sistemlerin Green 500 listesinde, ilk ondan dokuzu değişti. Üstte Tsubame 3.0 sistemi, Tokyo Teknoloji Enstitüsü'nde Xeon E5-2680v4 14 çekirdeği, Omni-Path arabağlantı ve watt başına 14.1 gigaflops sağlayan Nvidia Tesla P100'ü temel alan değiştirilmiş bir HPE ICE XA sistemi bulunuyor. Bu, Nvidia'nın DGX Saturn V'inden, firmanın DGX-1 platformuna ve Kasım listesinde bir numara olan P100 yongalarına ve bu sefer on numara olan 9.5 gigaflop / Watt'a dayanan dev bir sıçrama. P100, ilk on Green500 sisteminden dokuzunda.

10 gigaflop / watt değerinin kırılması çok önemli çünkü bugünün teknolojisini kullanarak inşa edilen bir varsayımsal exaflop sisteminin 100 megawatt (MW) altında tüketileceği anlamına geliyor. Bu hala çok fazla - hedef, araştırmacıların gelecek beş yıl içinde görmeyi umduğu exaflop sistemi için 20-30 MW'tır - ancak bu ileriye yönelik büyük bir adımdır.

İlk 500 listesinde olduğu gibi, makinelerin teorik zirve performanslarının sadece yüzde 1-10'unu görmeye meyilli olduğu Yüksek Performanslı Konjuge Gradyanlar (HPCG) benchmarkı gibi farklı kriterlere sahip benzer listelerde yalnızca küçük değişiklikler yapıldı. Sistem - bu durumda, Riken K makinesi - hala 1 petaflop'tan daha azını sağlıyor. Hem TaihuLight hem de Piz Daint sistemleri bu listeye girdi. Araştırmacılar bir exaflop makinesi hakkında konuştuğunda, Linpack kriterini ifade etme eğilimindedirler, ancak HPCG gerçek dünya performansı açısından daha gerçekçi olabilir.

GPU hesaplamasının bir hızlandırıcı olarak ortaya çıkması - hemen hemen her zaman P100 gibi Nvidia GPU işlemcileri kullanarak - son yıllarda bu listelerde en göze çarpan değişiklik oldu, bunu takiben Intel'in kendi hızlandırıcısı olan çok çekirdekli Xeon Phi'nin (dahil) En son Knights Landing versiyonu). Mevcut Top 500 listesi, Nvidia GPU'lu 74 ve Xeon Phi'li 17 (ikisi de üçünü kullanarak) içeren hızlandırıcıları veya işlemcileri kullanan 91 sistemi içerir; biri hızlandırıcı olarak AMD Radeon GPU'ya sahip, ikisi ise Japon bir tedarikçi olan PEZY Computing'den çok çekirdekli bir işlemci kullanan. Ek 13 sistem şimdi ana işleme birimi olarak Xeon Phi'yi (Knights Landing) kullanıyor.

Ancak, süper bilgisayarlarda yapılan büyük değişikliklerin çoğu, bu kavramlar göz önünde bulundurularak tasarlanan daha büyük sistemleri görmeye başladıkça hala ufukta. Bunun bir örneği, 13 numaralı Top 500 listesine giren Barcelona Süper Bilgisayar Merkezindeki yeni MareNostrum 4'tür. Bu, şu ana kadar kurulduğu gibi, bu, Xeon'un yaklaşmakta olan Skylake-SP sürümüne dayanan bir Lenovo sistemidir (resmen Xeon Platinum 8160 24 çekirdekli işlemci). Burada ilginç olan, önümüzdeki birkaç yıl için planlanan üç yeni "gelişmekte olan teknoloji" kümesidir; bunlardan biri, 1.5 Petaflops'tan daha yüksek işlem kapasitesine sahip olacak şekilde tasarlanan IBM Power 9 işlemcilere sahip bir küme ve Nvidia GPU'lar; Xeon Phi'nin Knights Hill versiyonuna dayanan bir saniye; Fujitsu tarafından tasarlanan 64 bit ARMv8 işlemcilere dayanan üçüncü bir model.

Bu kavramlar, Oak Ridge, Argonne ve Lawrence Livermore National Labs'deki CORAL İşbirliğinin bir parçası olarak ABD Enerji Bakanlığı tarafından desteklenen birkaç başka büyük hesaplama projesinde kullanılıyor. İlk önce, IBM Power 9 işlemcilerini ve Nvidia Volta GPU'larını kullanacak ve 150 ila 300'den fazla tepe noktası petaflop teslim etmek üzere seçilecek Oak Ridge'deki Zirve olmalı; ardından Lawrence Livermore'dan Sierra, 100'den fazla zirve petaflopu teslim etmek üzere seçildi.

Ardından, Argonne Ulusal Laboratuvarı'ndaki Aurora süper bilgisayarını, Xeon Phi'nin Knights Hill versiyonuna dayanarak ve 180 tepe petaflop teslim etmek üzere planlanan Cray tarafından inşa etmeliyiz. CORAL sistemleri kurulmalı ve koşu gelecek sene.

Bu arada, Çinli ve Japon gruplar, çoğunlukla benzersiz mimariler kullanarak, yükseltme planladılar. İzlemesi ilginç olmalı.

Daha da büyük bir kayma biraz daha uzak görünüyor: tipik olarak işlemcinin kendi içindeki büyük ölçüde paralel işlem birimlerinde makine öğrenmeye doğru kayma. Linpack numarası 64 bit veya çift hassasiyetli performans anlamına gelirken, birçok derin sinir ağı tabanlı uygulama da dahil olmak üzere tek veya yarı hassasiyetli hesaplamalarla daha iyi çalışan uygulama sınıfları vardır. Nvidia’nın yeni Volta V100 duyurusu ve yakında çıkacak olan Xeon Phi Knights Mill versiyonu gibi yeni işlemciler bundan yararlanıyor. Gösteride Intel, dördüncü çeyrekte üretime girecek olan versiyonun, Quad Fused Multiply Add (QFMA) ve Quad Virtual Neural Network Instruction (QVNNI) olarak adlandırılan "düşük hassasiyetli bilgi işlem için yeni komut setlerine sahip olacağını söyledi. .

Bu kavramların, Google’ın TPU’ları veya Intel'in FPGA’ları ve Nervana cipsleri gibi diğer mimarilere de uygulanabileceğini varsayıyorum.

Bu yıl büyük değişiklikler görmesek bile, gelecek yıl daha fazlasını görmeyi beklemeliyiz. Bir exascale (1000 teraflops) makinesi konsepti hala görüş alanı içinde olmasına rağmen, muhtemelen daha da büyük değişiklikler gerektirecektir.