電子發(fā)燒友網(wǎng)報道(文/周凱揚)在今年的ISC2024上,新一期的TOP500全球超算榜單發(fā)布。除了瑞典超級計算機Alps空降第六之外,此次TOP500的前十名在排名上并沒有太大變化,但我們還是從新的成績中找到了一些別的亮點。
AMD實現(xiàn)TOP500近三成覆蓋率
首先是衛(wèi)冕成功的Frontier,這個由HPE打造的大規(guī)模超算系統(tǒng)部署在美國橡樹嶺國家實驗室,此次拿下了1.206 Exaflop/s的HPL算力成績,在開發(fā)人員的優(yōu)化下,相較上次提交的1.194 Exflop/s成績還有所提升。Frontier集成了9472塊AMD Epyc 7713 64核2GHz CPU和37888塊AMD Instinct MI250X GPU。
Frontier超算 / 美國橡樹嶺國家實驗室
憑借AMD頂級Epyc CPU和Instinct GPU的搭配,F(xiàn)rontier可以說是當下已公開系統(tǒng)中,兼顧HPC和AI的最強超算。不僅如此,其能效表現(xiàn)同樣不俗,52.93Gflops/W的成績居于GREEN500能效榜單的第13位。
如果我們觀察余下的TOP500超算,就會看到搭載了MI300A系列GPU的超算系統(tǒng)開始逐漸顯現(xiàn),比如美國勞倫斯利弗莫爾國家實驗室的三臺新系統(tǒng),分別拿下了46、47和48的排名。而這三臺均為El Capitan超算的子系統(tǒng),今年部署完成后預計HPL算力可突破2 Exaflop/s。
根據(jù)AMD的說法,在新發(fā)布的TOP500超算系統(tǒng)中,由AMD硬件驅(qū)動的超算系統(tǒng)增加了29%,達到了156臺。在能效榜單GREEN500上,由AMD硬件驅(qū)動的超算系統(tǒng)也達到了157臺。雖然這與英特爾60%以上的份額還有不小差距,但其增長速度要遠超英特爾。
英特爾首臺E級超算出爐,性能還沒到頂
去年拿下第二的Aurora超算在今年的TOP500上再進一步,獲得了1.012 Exaflop/s的HPL算力成績,成為TOP500歷史上第二臺E級超算,也是基于英特爾硬件的首臺E級超算。由于去年Aurora尚未完成全面部署,所以只是勉強超過第三名的Eagle超算,HPL算力為585.34 PFlop/s。
Aurora超算 / 美國阿貢國家實驗室
如今的Aurora離硬件全面到位還差一點,所以此次提交成績只用到了80%到90%左右的節(jié)點,要在下一次TOP500榜單公布才能完成全面部署。但即便如此,Aurora的成績依然成功突破了E級大關。如果按照這一規(guī)模來估算,加上阿貢實驗室開發(fā)人員的優(yōu)化,Aurora未來也有可能完成逆襲,超過Frontier,不過屆時第一名很有可能會是同樣完成部署的El Capitan。
另外值得一提的是,無論是Aurora還是Frontier,在測試混合精度算力的HPL-MxP上,兩者都獲得了超過10 Exaflop/s的成績。其中Aurora憑借89%的系統(tǒng)拿下了10.6Exaflop/s的成績,位列第一。但這一測試并不能代表絕對的AI性能,尤其是用于新一代的AI負載,因此在這一屆ISC2024上,行業(yè)也在呼吁推出新的AI測試榜單。
由于Aurora部署進度經(jīng)歷了一再推遲,其能效相比其他超算系統(tǒng)略有遜色,只有26.15GFlops/w,這也是為何其系統(tǒng)功耗從去年的24.687MW提升至今年的38.698MW。相較之下算力還要高于Aurora的Frontier系統(tǒng)功耗只有22.786MW。
從目前前十名的榜單來看,基于英特爾Xeon處理器的系統(tǒng)依舊占據(jù)了一半席位,這足以說明英特爾在HPC上的持續(xù)統(tǒng)治地位。這還是在其HPC產(chǎn)品發(fā)布推遲的前提下,未來隨著工藝的推進和發(fā)布計劃重回正軌,英特爾依然有機會找回被奪去的份額。
英偉達開始發(fā)力,Arm CPU+GPU性能與能效雙管齊下
此次TOP500最令人意想不到的應該是英偉達的全面發(fā)力,此前英偉達出現(xiàn)在TOP500榜單上主要是因為其GPU,在TOP500榜單中,半數(shù)帶有加速器的系統(tǒng)都用到了英偉達的GPU。而此次TOP500上,則一共有8臺系統(tǒng)基于英偉達的Grace Hopper處理器。
Alps超算 / 瑞士超算中心
這次空降的第六名是來自瑞士超算中心的Alps超算系統(tǒng),該系統(tǒng)集成了英偉達的GH200超級芯片,算力成績達到了270 PFlop/s。該系統(tǒng)從2021年開始計劃部署,用于氣候、物理和生命科學研究等HPC應用的同時,提供強大的AI算力。
我們?nèi)绻^察同期發(fā)布的GREEN500能效榜單就會發(fā)現(xiàn),基于英偉達Grace Hopper打造的超算系統(tǒng)包攬了前三的位置。這三臺系統(tǒng)分別是德國超算JEDI、英國超算Isambard-AI和波蘭超算Helios GPU,能效分別為72.733Gflops/W、68.835Gflops/W和66.948Gflops/W。即便是TOP500排名第六的Alps,其能效比也有51.98Gflops/W,在GREEN500上排名第14.
結合TOP500上也有不少x86超算使用英偉達的GPU,側面反映了Arm架構在HPC系統(tǒng)上的能效優(yōu)勢。結合未來對于超算能效更加嚴格的要求,英偉達的CPU+GPU超級芯片方案的吸引力會越來越大。
超算的市場格局迎來新一輪劇變
可以看出,超算行業(yè)已經(jīng)不再是過去英特爾一家獨大的場面了,無論是AMD、英偉達等都在迎頭趕上,甚至是以更快的速度奪取市場份額。在x86系統(tǒng)上,AMD的CPU與GPU組合已經(jīng)成為不少超算中心和商業(yè)公司的首選,而且由于供貨較為穩(wěn)定,其部署速度也要快于其他超算系統(tǒng)。
在Arm系統(tǒng)上,英偉達已經(jīng)開始發(fā)力,依仗Grace Hopper提供的性能和能效雙重優(yōu)勢,與HPC方案商合作貢獻了多臺TOP500系統(tǒng)。未來隨著GB200投入市場,憑借Blackwell架構在FP64精度上比Hopper架構高出30%的性能表現(xiàn),相信會有更多的超算系統(tǒng)選擇英偉達的硬件方案。
至于IBM的Power架構,目前前十名中只有老牌榜首Summit采用IBM的Power9 CPU,除此之外就只剩采用自研Arm核心和處理器的富岳超算系統(tǒng)這一特例了。鑒于目前具備自研HPC處理器的廠商并不多,未來各種眾核處理器的HPC系統(tǒng)數(shù)量預計還是維持在個位數(shù),但其性能往往都不容小覷。
與此同時,中國超算系統(tǒng)今年出現(xiàn)了銷聲匿跡的局面,今年的TOP500超算榜單上,沒有一個來自中國的新超算系統(tǒng),位列TOP500的中國超算系統(tǒng),也從104臺減少至80臺。但實際上國內(nèi)也有三臺值得關注的新超算,分別是620 Pflop/s的天河星逸,以及神威海洋之光和天河三號,后兩者的預估性能分別為2.05 Exaflop/s和1.5 Exaflop/s。但很有可能出于地緣政治的原因,國內(nèi)超算紛紛選擇了停止提交HPL成績。
來自美國的超算系統(tǒng)從171臺減少至160臺,從這幾年的趨勢來看,美國更加致力于打造頂級超算。反倒是來自歐洲的超算系統(tǒng)從143臺提升至160臺,正式超過亞洲成為第二名,僅次于北美地區(qū),足見歐盟對于HPC系統(tǒng)的投入。
在系統(tǒng)制造商上,HPE和聯(lián)想依然是最大的兩家制造商,尤其是聯(lián)想,占據(jù)了32.4%的份額。但在總系統(tǒng)算力上,HPE打造的系統(tǒng)占據(jù)了36.1%的份額。這也說明了得益于HPE提供的HPE Cray OS操作系統(tǒng)以及Singshot-11互聯(lián)方案,其在高端系統(tǒng)上更受歡迎。
隨著摩爾定律的放緩或者說終止,在速度的提升上,我們已經(jīng)看到了減緩的跡象,曾經(jīng)在2030年實現(xiàn)10 Exascale的目標已經(jīng)不太可能實現(xiàn)了,如今的能效指標也不允許我們一味地擴大超算規(guī)模。
-
amd
+關注
關注
25文章
5589瀏覽量
136381 -
英特爾
+關注
關注
61文章
10196瀏覽量
174706 -
摩爾定律
+關注
關注
4文章
640瀏覽量
79875 -
HPC
+關注
關注
0文章
333瀏覽量
24339 -
超算
+關注
關注
1文章
117瀏覽量
9355
發(fā)布評論請先 登錄
評論