Video: Here's how Nvidia's potential purchase of Arm could affect the tech sector (Kasım 2024)
Geçen haftaki yonga heyecanı, Intel'in Broadwell'in duyurusundan geliyor olsa da, çoğunlukla Sunucular ve veri merkezleri için tasarlanan yongalara odaklanma eğiliminde olan yıllık Hot Chips konferansında ayrıntılı olarak tartışılan birkaç başka yonga vardı.
Şov, en son girişleri tartışan Intel, Oracle ve IBM ile yüksek kaliteli yongalarla tanınıyor, ancak yalnızca Oracle Sparc M7 gerçekten yeniydi. Bunun yerine, gösterinin çoğu, Nvidia'nın Tegra K1 işlemcisinin 64-bit "Denver" versiyonunun ilk detayları da dahil olmak üzere ARM tabanlı ürünlere odaklandı.
Oracle, Intel ve IBM Sunucu Çipleriyle Yüksek Seviyeyi Hedefliyor
En son teknolojiye sahip cipslerden en etkileyici haber, M7 olarak bilinen SPARC işlemcisinin yeni neslini tartışan Oracle'dan geldi. Bu yonga 32 S4 SPARC çekirdeğine (her biri en fazla sekiz dinamik iş parçacığına sahip), 64 MB L3 önbellek, sekiz DDR4 bellek denetleyicisi (işlemci başına 2 TB'a kadar ve DDR4-2133 ile 160 GBps bellek bant genişliği) ve bağlı sekiz veri analitiği hızlandırıcısına sahip olacak bir yonga ağı.
Çip, her biri paylaşılan L2 önbelleğe sahip dört çekirdekli ve çekirdek küme ile yerel L3 önbelleği arasında 192 GBps'den fazla bant genişliğine sahip bölümlenmiş 8 MB L3 önbellekli sekiz küme halinde düzenlenmiştir. M6'ya kıyasla (12 3.6GHz SPARC S3 çekirdeğine sahip 28nm yonga) M7, bellek bant genişliği, tam sayı verimi, OLTP, Java, ERP sistemleri ve kayan nokta verimi konusunda 3-3, 5 kat daha iyi performans sunuyor. Oracle'ın SPARC Mimarlık Direktörü Stephen Phillips, hedefin artan kazanımlardan ziyade performansta bir adım işlev artışı olduğunu söyledi.
M7 tutkalsız 8 sokete ölçeklenebilir (256 çekirdeğe, 2.000 iş parçacığına ve 16 TB belleğe kadar) ve aralarında bir SMP yapılandırmasında trafiği yönetmek için bir ASIC anahtarına sahip, 32 işlemciye kadar ölçeklenebilir 1, 024 çekirdekli, 8, 192 yivli ve 64 TB'a kadar belleğe sahip bir sistemle. Çok etkileyici. Oracle, geçen yılki SPARC M6'ya kıyasla, çeşitli testlerde 3 ila 3, 5 kat daha iyi performans sunduğunu söyledi. Şirket, bunun 20nm süreçte üretilen ve gelecek yıl sistemlerde kullanılabilecek Oracle'ın kendi yazılım yığını için optimize edileceğini söyledi.
IBM ayrıca, geçen yılki fuarda açıkladığı Power8 hattı hakkında daha fazla bilgi verdi. Çipin bu sürümünde, her biri çekirdek başına 512KB SRAM Seviye 2 önbellek (6 MB toplam L2) ve Seviye 3 önbellek olarak 96 MB paylaşılan gömülü DRAM ile sekiz iş parçacığına sahip 12 çekirdeği vardı. 4, 2 milyar transistörle 650 milimetre ölçen bu dev çip, IBM'in 22nm SOI işleminde üretildi ve IBM'e göre haziran ayında sevkiyata başladı.
Birkaç ay önce IBM, 362 mm 2 ' lik altı çekirdekli bir sürümü duyurdu. Bu yılki konuşmada, IBM'in altı çekirdekli sürümlerden ikisini tek bir pakette 48 adet PCIe Gen 3 ile nasıl bir araya getirebileceği hakkındaydı. IBM, iki çekirdekli bir sürümün toplam 24 çekirdekli ve 192 iş parçacığının iki işlemciden daha iyi performans göstereceğini söyledi 24 çekirdekli (48 iplikli) Xeon Ivy Bridge sunucusu. IBM, Power'ı çoğunlukla yüksek performanslı ve uzmanlaşmış pazarlarda satmaktadır, bu nedenle çoğu insan ikisini karşılaştırmaz, ancak ilginçtir. Power mimarisini daha yaygın hale getirmek için IBM geçen yıl Açık Güç Konsorsiyumu'nu açıkladı ve bu yıl şirket platform için tam bir açık kaynaklı yazılım destesine sahip olduğunu söyledi. Ancak şimdiye kadar, IBM'den başka hiç kimse platforma dayalı bir sunucu açıklayamadı.
Intel, bir yıl önce piyasaya sürülen Xeon E5'in sürümlerini içeren Ivy Bridge'in sunucu sürümü olan "Ivytown" dan bahsetti. Bu yılki konuşmada, Intel’in şu anda, temelde tek bir mimariye sahip olduğu, her biri de 15 çekirdeğe izin veren çipler, iki DDR3 bellek denetleyicisi, üç QPI bağlantısı ve modüler bir zeminde düzenlenmiş 40 PCI Gen 3 şeridi içeren çeperleri kapsayan bir mimariye sahip olduğu üzerinde duruldu. her biri farklı soketler için tasarlanan ve toplam 75'ten fazla varyant olan üç farklı kalıba dönüştürülebilecek plan. Özel ara bağlantı olmadan iki, dört ve sekiz soketli sunucularda kullanılabilir.
Elbette bu çipler, sunucu ünitelerinin büyük çoğunluğunun Intel hesabı olarak bugünlerde sunucu alımlarının büyük kısmını oluşturuyor. Ancak daha önce ISSCC'de birçok bilgi ele alınmıştı ve Intel’in, E5 ailesinin bir sonraki sürümünü (E5-1600v3 ve E5-2600 v3) çok kısa bir süre içinde, bir sürümünün bir versiyonunu kullanarak güncellemesi bekleniyor. Haswell mimarisi Haswell-EP olarak adlandırılır. (Geçen hafta, Dell bu yeni fişlere dayalı yeni iş istasyonlarını açıkladı.)
Intel ayrıca, 2013 yılının sonlarında üretime giren Avoton olarak bilinen Atom C2000'i de görüştü. Bu yonga ve Ivy Bridge ve Haswell yongaları, Intel'in 22nm işlemine dayanıyor.
Nvidia, AMD, ARM için Yeni Pazarlarda Uygulanan Mikro Amaç
Şovun en büyük sürprizi, ARM konuşmacılarının anahtar notları ve Nvidia'nın Tegra K1 işlemcisinin yeni çıkacak "Denver" versiyonunun ayrıntılarını içeren ARM tabanlı teknolojiye odaklanmamıştı.
Bir açılış konuşmasında ARM CTO Mike Muller, sensörlerden sunuculara kadar her şeydeki güç kısıtlarını tartıştı ve ARM'in işletmeye nasıl girmeye çalıştığına odaklandı. Muller, Qualcomm'dan Rob Chandhok'tan bir açılış konuşmasında da yer alan Nesnelerin İnterneti için ARM sensör çiplerini kullanma kavramını da zorladı. Ancak hiçbir şirket yeni çekirdek veya işlemci açıklamamıştır.
Bunun yerine, bu cephedeki büyük haber, K1 işlemcisinin yeni versiyonuyla ilgili daha fazla ayrıntı veren Nvidia'dan geldi. Şirketin Denver projesi ilk kez duyurulduğunda, bu çipin yüksek performanslı bilgi işlem pazarını hedeflemesi bekleniyormuş gibi görünüyordu, ama şimdi şirket daha çok tablet ve otomotiv pazarı gibi şeylere odaklanmış gibi görünüyor. Tegra K1 iki versiyonda gelecek. Bu yılın başlarında duyurulmuş olan ve şu anda şirketin Shield tabletinde gönderilecek olan ilk cihaz, Nvidia'nın zorladığı 4 + 1 yapılandırmasında dört adet 32-bit ARM Cortex-A15 çekirdeğine ve düşük güçlü bir "yardımcı çekirdeğe" sahip birkaç yıl boyunca Tegra hattı.
Denver versiyonu, Nvidia tarafından tasarlanan iki yeni 64 bit çekirdekli çekirdeği ile oldukça farklı ve şirket aldığı performansı artırıyor. Çekirdek yedi yönlü süperskalar (aynı anda yedi mikro-op kadar çalışabileceği anlamına gelir) ve 128KB dört yönlü L1 eğitim önbelleğine ve 64KB dört yönlü L1 veri önbelleğine sahiptir. Çip, bu iki çekirdekten ikisini, her iki çekirdeğe de hizmet eden 2 MB düzey 2 önbellek ile birleştirerek, 192 "CUDA çekirdeği" (grafik çekirdeği), 32 bit K1 ile paylaşıyor. Bu nedenle, 4 + 1 mimarisinden büyük bir ayrılışı temsil ediyor.
Büyük bir değişiklik, Nvidia'nın "dinamik kod optimizasyonu" olarak adlandırdığı ve sık kullanılan ARM kodunu almak ve bunu işlemci için özel olarak optimize edilmiş mikro koda dönüştürmek için tasarlananları içerir. Bu, 128 MB önbellek hafızasına kaydedilir (geleneksel sistem ana belleğinden oyulmuş). Amaç, bu tekniğin genellikle kullandığı kadar güç gerektirmeden sıra dışı bir uygulamanın performansını vermektir. Konsept yeni değil - Transmeta yıllar önce Crusoe yongasıyla denedi - ama Nvidia bunun daha iyi çalıştığını söylüyor.
Nvidia, yeni çipin mevcut dört ya da sekiz çekirdekli mobil işlemcilere kıyasla çok daha yüksek bir performans elde edebileceğini iddia ettiği bazı testler gösterdi - özellikle iPhone'da kullanılan Qualcomm's Snapdragon 800 (MSM8974), Apple A7 (bazen Cyclone) 5'ler - ve hatta bazı ana bilgisayar işlemcileri. Nvidia, bir Atom (Bay Trail) işlemciden daha iyi performans gösterdiğini ve Intel'in 1.4GHz çift çekirdekli Celeron (Haswell) işlemcisine benzer olduğunu söyledi. Tabii ki, bir miktar tuzla birlikte satıcı performans numaralarını almaya meyilliyim: satıcılar sadece referansları seçmekle kalmıyor, aynı saat hızlarından ya da aynı güç çekmesinden bahsettiğimiz net değil.
Bu arada, daha fazla sunucuya yönelik çiplerde AMD, "Seattle" olarak bilinen Opteron A1100'ü hakkında daha fazla konuştu ve şirket şu anda örnekleme yaptığını ve bu yılın sonlarında sunucularda bulunması gerektiğini söyledi. Bu yonga, sekiz 64 bit Cortex A57 CPU çekirdeğine sahiptir; 4 MB L2 önbellek ve 8 MB L3 önbellek; hata düzeltmeli 128 GB'a kadar DDR3 veya DDR4 bellek için iki bellek kanalı; çok sayıda tümleşik G / Ç (her biri PCIe Gen3 ve 6 Gbps SATA ve iki 10 Gbps Ethernet bağlantı noktası olan 8 şerit); güvenli önyükleme için bir Cortex A5 "sistem kontrol işlemcisi"; ve şifreleme ve şifre çözme işlemlerini hızlandırmak için bir hızlandırıcı. GlobalFoundries'in 28nm işleminde üretilmiştir. AMD henüz çipin sıklığı, gücü veya performansı hakkında ayrıntılı bilgi vermedi, ancak çipin temel bir diyagramını gösterdi. (Yukarıda)
Applied Micro, 8 2.4GHZ'ye özel ARMv8 çekirdeği, dört DDR3 bellek denetleyicisi, PCIe Gen3 ve 6Gbps SATA ve 10Gbps Ethernet içeren X-Gene 1 (Storm olarak bilinir) ile piyasadaki ilk ARM sunucu yongasına sahip olduğunu uzun zamandır savunuyor. . Şirket, şu anda TSMC'nin 40nm işleminde üretime geçtiğini söylüyor.
Hot Chips'de, Applied Micro, 2, 8 ila 2, 8 GHz hızında çalışan ve bir RoCE (Converged Ethernet Üzerinden RDMA) Ana Bilgisayarı ekleyen, sekiz veya 16 adet "gelişmiş" çekirdekle sunulacak olan X-Gene 2 (Shadowcat) tasarımını zorladı Kanal Adaptörü, mikro sunucular kümeleri arasında düşük gecikmeli bağlantılar sağlamak için tasarlanmış bir ara bağlantı olarak tasarlanmıştır. Tümü tek bir depolama havuzunu paylaşan, 6.480 iş parçacığı ve 50 TB bellek destekleyen tek bir sunucu rafı ile kümelerde kullanılmak üzere tasarlanmıştır. Şirket, X-Gene 2'nin% 60 daha iyi tam sayı performansı, Memcache'deki performansının iki katı ve% 25 daha iyi Apache Web sunumu sunacağını söyledi. 28nm bir süreçle üretilmiştir ve şu anda örnekleme yapmaktadır.
Applied Micro, X-Gene 2’nin rakip mikroişlemciler (Cavium ThunderX, Intel Atom C2000 "Avoton" ve AMD Opteron A1100 "Seattle") ile tam boyutlu Xeon sunucuları arasındaki boşluğu doldurduğunu söylüyor. Gelecek yıl örneklemeye başlaması planlanan yeni nesil X-Gene 3 (Skylark) hakkında bazı detaylar verdi. Bu çip, 3 GHz'e kadar çalışan 16 ARMv8 çekirdeğe sahip olacak ve 16nm FinFet teknolojisi kullanılarak üretilecektir.