電子發(fā)燒友網(wǎng)報道(文/周凱揚)從去年11月公布的最新TOP500超算系統(tǒng)排名上,我們可以看出AMD已經(jīng)開始蠶食原本屬于英特爾的份額,而且速度不容小覷。而英偉達則因為在GPU上的頭號交椅地位,成了堅持所有堅持CPU+GPU架構(gòu)超算的首選。
非但如此,英偉達開始在ARM生態(tài)上有所動作,推出了Grace這樣的高性能CPU,并被瑞士超算中心的超級計算機系統(tǒng)阿爾卑斯所用。然而近來的一系列動向表明,超算市場并不會就此維持定局。
英特爾:GPU和異構(gòu)開始猛追
英特爾耕耘了這么多年HPC和超算市場,自然不會白白認輸,尤其是自己的圖形部門正在崛起的情況下。于是,就在上周的投資者大會上,英特爾公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一個Xeon插槽的設計,由此推出全新的XPU,代號名為Falcon Shores。
Falcon Shores將融合通用x86處理器核心和高度并行計算的Xe-HPC GPU核心,并結(jié)合英特爾自研的高帶寬共享內(nèi)存。根據(jù)英特爾的說法,這種CPU+GPU+通用內(nèi)存的架構(gòu)可以將單個插槽的計算密度提升5倍,與現(xiàn)有的設計相比,可將性能功耗比提升5倍以上。
這對于英特爾目前的戰(zhàn)略來說,基本上可以說是必選的一條技術路線??紤]到英特爾在先進封裝技術上并未止步,工藝節(jié)點也開始跟上主流代工廠的節(jié)奏,異構(gòu)計算的設計已經(jīng)在英特爾近期推出的諸多產(chǎn)品中得到了驗證,通用內(nèi)存也已經(jīng)在業(yè)界成了改善延遲提高帶寬的常用手段之一。況且英特爾已經(jīng)在其Sapphire Rapids Xeon服務器處理器上用到了HBM2e這類高帶寬內(nèi)存,F(xiàn)alcon Shores中自研的高帶寬內(nèi)存會有何等性能確實令人好奇。
Falcon Shores的另一大優(yōu)勢在與靈活的核心配比,根據(jù)工作負載來調(diào)整x86核心與Xe核心。英特爾在會上不斷給出十萬億億級的概念,這樣的性能在Falcon Shores的性能下似乎是可行的,不過這一XPU正式進入超算市場的時間不會太快,而是要等到2024年,借助那時的埃米級工藝和Foveros封裝技術才能實現(xiàn)。
英偉達:不放棄ARM,也不放棄互聯(lián)
前陣子英偉達收購ARM失敗的消息傳來,不少人認為英偉達會就此放棄這塊蛋糕,然而英偉達CEO黃仁勛卻表示他們并不會就此放棄ARM生態(tài),未來將繼續(xù)推出Grace這樣基于ARM架構(gòu)的CPU。之所以能有如此的底氣,在于英偉達那20年的ARM架構(gòu)授權(quán)。
目前擁有ARM架構(gòu)授權(quán)的企業(yè)屈指可數(shù),更不用說64位的授權(quán),并將其用于HPC市場了。英偉達如今這種ARM CPU+GPU的路線,看似是在搶英特爾和AMD的生意,但面向的市場其實又有所不同。
Grace雖然性能不差,但與這些x86 CPU在通用計算上相比還是略遜一籌,況且也不是所有研究機構(gòu)或超算中心都會像日本一樣,構(gòu)建富岳或紫藤花這種規(guī)模的ARM超算。英偉達追求的并不是在通用計算上超過其他兩家數(shù)十年的積累,而是專注于AI算力。訓練自然語言處理模型、利用GPU加速深度學習,這才是英偉達的優(yōu)勢所在。
這時問題來了,為何超算不選擇其它通用CPU或其它的GPU產(chǎn)品呢?這樣既能兼顧通用計算性能,也能用的GPU的加速性能。這是因為英偉達準備了專用于自家CPU和GPU的互聯(lián)技術NVLink。過去僅有GPU產(chǎn)品的英偉達僅僅將NVLink技術用于GPU之間的互聯(lián),如今在Grace出現(xiàn)后,NVLink 4.0可以為Grace CPU和英偉達GPU牽線搭橋。
更不用說英偉達已經(jīng)在2020年收購了Mellanox,要知道在最新的TOP500超算中,除了使用常規(guī)的25/100G以太網(wǎng)互聯(lián)外,基本都用到了Mellanox的互聯(lián)技術。英偉達與Mellanox的結(jié)合,直接覆蓋了三分之二的頂級超算系統(tǒng)。未來的NVLink有了Mellanox的幫忙更是難以匹敵,所以并不是英偉達擔心競品的出現(xiàn),而是其性能表現(xiàn)之強,讓你不得不選擇他們旗下的產(chǎn)品。
小結(jié)
英特爾在超算上的發(fā)力歸根結(jié)底還是靠Xe HPC這樣的GPU核心,但作為GPU新秀的英特爾短時間還是無法撼動英偉達在超算上的地位。而英偉達的ARM計劃未來如何演進也令人十分期待,畢竟這一產(chǎn)品線不像其消費級GPU,還未有任何路線圖公布。但喜人的一點是,超算從百億億級過渡到十萬億億級的過程中,勢必會有更多的創(chuàng)新方案出現(xiàn)。
原文標題:超算硝煙再起,CPU+GPU還能玩出新花樣?
文章出處:【微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
-
ARM
+關注
關注
134文章
9351瀏覽量
377419 -
英特爾
+關注
關注
61文章
10195瀏覽量
174664 -
cpu
+關注
關注
68文章
11077瀏覽量
217022
原文標題:?超算硝煙再起,CPU+GPU還能玩出新花樣?
文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】+NVlink技術從應用到原理
物聯(lián)網(wǎng)未來發(fā)展趨勢如何?
工業(yè)電機行業(yè)現(xiàn)狀及未來發(fā)展趨勢分析
未來物流發(fā)展趨勢與TMS的關系
《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--了解算力芯片GPU
【一文看懂】大白話解釋“GPU與GPU算力”

評論