電子發(fā)燒友網報道(文/周凱揚)數據中心作為CPU、GPU和加速器廠商最為關注的市場,自然也少不了RISC-V這個新架構來摻和一腳。我們在之前的文章中也對RISC-V在數據中心的進展做了一些介紹,RISC-V雖然在服務器通用CPU上發(fā)力跡象不明顯,但要說AI加速器這類產品,很有可能會是RISC-V打入數據中心市場的最佳方向。
谷歌的RISC-V戰(zhàn)略
自己設計芯片的服務器廠商之一,谷歌,似乎也開始打算用上RISC-V。在今年9月美國的AI硬件峰會上,SiFive首席架構師和谷歌的TPU芯片架構師展示了他們的合作方案。谷歌的TPU是谷歌設計專用于機器學習的加速器,用于在數據中心上運行TensorFlow、Pytorch和JAX等機器學習框架。
而TPU的主要計算單元就是矩陣乘法打算(MXU),由脈動陣列中的128x128乘法/累積器組成,在最小配置v4版TPU中包含4個TPU芯片,每個TPU芯片都有8個MXU,是TPU v3版的兩倍,而且每個MXU都能使用BF16執(zhí)行每周期16K的乘積累加運算。
然而,谷歌發(fā)現雖然TPU的機器學習算力雖然夠用,但客戶在利用這類大型AI加速器時,往往無法用它來完成其他的復雜計算負載,所以谷歌的做法是將SiFive的X280處理器核心,作為TPU的協處理器,用來提供維護和運行代碼,跑加速器沒法運行的內核。
雖然SiFive的X280主打的是加速AI/ML計算,但主要是針對邊緣端,比如AR/VR、數碼相機等等,并非用于數據中心的大型AI加速器。但在與谷歌等廠商的合作下,SiFive推出了一個名為矢量定制協處理器接口(VCIX)的技術,可以讓大型AI加速器直接與X280的32x512位矢量寄存器文件高速通信。
這相比其他方案來說,矢量寄存器層級上的訪問不僅可以提供更大的帶寬、比PCIe更低延遲,還能簡化軟件棧、省下更多的硬件資源。X280和TPU核心分工合作,前者負責運行完整的Linux系統和虛擬機管理程序,后者負責密集的機器學習運算。
英特爾HorseCreek初見端倪
早在去年,英特爾就宣布將會用到SiFive的P550高性能RISC-V核心,以及自己的7nm工藝(即現在的Intel4工藝)來打造一款RISC-V SoC,代號名為HorseCreek。雖然到了2022年,SiFive最高性能的核心已經成了P650。但作為一個十三級流水線、三發(fā)射、亂序的64位RISC-V核心,P550的性能仍然是相當能打的,SiFive給到的定位也是對標ARM的Cortex-A75,同時只需不到一半的面積。
不過消息公布后,英特爾雖然又開展了一系列與RISC-V相關的行動,比如加入RISC-V國際基金會、IFS支持RISC-V芯片代工和推出RISC-V的FPGA開發(fā)平臺等等,但HorseCreek卻始終不見蹤影。
而在今年的IntelInnovation大會上,英特爾的不少合作伙伴都在現場搭建了展臺,也有參會者終于在現場看到了HorseCreek的真面目。在Intel4工藝的加持下,HorseCreek將4個2.2GHz的SiFiveP550核心、DDR5和PCIe5集成到了4mmx4mm的單個裸片上,連英特爾CEO PatGelsinger本人也親自來展臺查看HorseCreek的開發(fā)平臺。
根據展臺上公開的數據,HorseCreek配備了三級緩存,包括私有二級緩存和通用三級緩存。DDR5這塊集成了英特爾的DDR PHY、DFI接口與Cadence的DDR內存控制器,支持到5600頻率的DDR5內存,PCIe5.0部分集成了英特爾的PCIePhy和新思的PCIeRootHub控制器。除了英特爾提供的PLL、內存編譯器、標準單元等數模IP以外,HorseCreek還用到了其他的IP,比如西門子的DFT和新思的NOC Fabric。
從以上數據可以看出,HorseCreek是一個集SiFive、英特爾和EDA廠商IP大成的SoC。如此強大的SoC加上豐富的接口支持,完全可以用于數據中心里。不過,HorseCreek的首個終端產品形態(tài)應該是SiFive的下一代HiFive開發(fā)板。上一代的HiFive Unmatched開發(fā)板已經售罄了,在疫情相關的供應鏈問題下,SiFive已經放棄了補貨的打算,轉而全力去打造下一代基于HorseCreek的HiFive開發(fā)板。
又一個千核RISC-V芯片
在戴爾的HPC社區(qū)大會上,來自美國的初創(chuàng)半導體公司InspireSemiconductor公布了他們?yōu)閿祿行奶峁┑腞ISC-V加速器方案,同時還給出了另一個有趣的說法,那就是現有的高性能計算方案已經“不夠好”了。
在他們看來,目前的主流數據中心CPU都太慢了,無論有無加速器的輔助都是如此,而在有了加速器以后,90%的高性能計算都是由加速器負責了。再者就是GPU和FPGA的方案,InspireSemiconductor指出這兩者的編程太復雜了,不僅鎖定了軟件棧,而且需要特定的技能才能獲得足夠好的計算結果。而ASIC和AI加速器的風險又太高了,從成本、時間上看都是如此。
為此,InspireSemiconductor推出了他們的RISC-V加速器方案,Thunderbird。Thunderbird在單芯片上集成了2560個64位的CPU核心,單個PCIe加速卡上的核心數量更是超過5000個。InspireSemiconductor稱他們用到了創(chuàng)新的高速互聯方案,在高效利用這么多核心的同時,最高可以組成256個芯片的陣列。
相較其他加速器和GPU方案,Thunderbird加速器也有著功耗上的優(yōu)勢,單芯片的功耗在175W左右,同時他們給出了20W/Tflops的能效比,看來Thunderbird的峰值算力大概就在8.75Tflops左右了。雖然會上InspireSemiconductor也展示了谷歌、聯想和IBM等客戶或合作伙伴的一些反饋,但這些不少是客套話,是否已經用于這些公司的數據中心方案中還不好說。
InspireSemiconductor同時承諾了一個對開發(fā)者友好的軟件生態(tài)系統,但他們并沒有給出自己的軟件方案,而是指出Thunderbird將充分利用RISC-V已有的豐富軟件生態(tài)系統,比如OneAPI等,所以不必像競品芯片那樣去開發(fā)一次性的軟件棧。如此一來更適合那些喜歡標準CPU編程模型的開發(fā)者,無需像GPU那樣去學習CUDA、OpenCL,而是可以用Pragma和MPI這樣的標準編譯器方案。
AI編程上也是如此,InspireSemiconductor指出流行的AI框架,諸如TensorFlow、Pytorch和Glow等都已有了對RISC-V的支持,Linux也在操作系統支持的行列中。如此看來,InspireSemiconductor目前應該只提供了純硬件方案,而這樣的產品是否能在市面上取得成功,目前看來完全取決于英特爾Codeplay那邊的OneAPI軟件生態(tài)了。
谷歌的RISC-V戰(zhàn)略
自己設計芯片的服務器廠商之一,谷歌,似乎也開始打算用上RISC-V。在今年9月美國的AI硬件峰會上,SiFive首席架構師和谷歌的TPU芯片架構師展示了他們的合作方案。谷歌的TPU是谷歌設計專用于機器學習的加速器,用于在數據中心上運行TensorFlow、Pytorch和JAX等機器學習框架。
而TPU的主要計算單元就是矩陣乘法打算(MXU),由脈動陣列中的128x128乘法/累積器組成,在最小配置v4版TPU中包含4個TPU芯片,每個TPU芯片都有8個MXU,是TPU v3版的兩倍,而且每個MXU都能使用BF16執(zhí)行每周期16K的乘積累加運算。
然而,谷歌發(fā)現雖然TPU的機器學習算力雖然夠用,但客戶在利用這類大型AI加速器時,往往無法用它來完成其他的復雜計算負載,所以谷歌的做法是將SiFive的X280處理器核心,作為TPU的協處理器,用來提供維護和運行代碼,跑加速器沒法運行的內核。

雖然SiFive的X280主打的是加速AI/ML計算,但主要是針對邊緣端,比如AR/VR、數碼相機等等,并非用于數據中心的大型AI加速器。但在與谷歌等廠商的合作下,SiFive推出了一個名為矢量定制協處理器接口(VCIX)的技術,可以讓大型AI加速器直接與X280的32x512位矢量寄存器文件高速通信。
這相比其他方案來說,矢量寄存器層級上的訪問不僅可以提供更大的帶寬、比PCIe更低延遲,還能簡化軟件棧、省下更多的硬件資源。X280和TPU核心分工合作,前者負責運行完整的Linux系統和虛擬機管理程序,后者負責密集的機器學習運算。
英特爾HorseCreek初見端倪
早在去年,英特爾就宣布將會用到SiFive的P550高性能RISC-V核心,以及自己的7nm工藝(即現在的Intel4工藝)來打造一款RISC-V SoC,代號名為HorseCreek。雖然到了2022年,SiFive最高性能的核心已經成了P650。但作為一個十三級流水線、三發(fā)射、亂序的64位RISC-V核心,P550的性能仍然是相當能打的,SiFive給到的定位也是對標ARM的Cortex-A75,同時只需不到一半的面積。
不過消息公布后,英特爾雖然又開展了一系列與RISC-V相關的行動,比如加入RISC-V國際基金會、IFS支持RISC-V芯片代工和推出RISC-V的FPGA開發(fā)平臺等等,但HorseCreek卻始終不見蹤影。

根據展臺上公開的數據,HorseCreek配備了三級緩存,包括私有二級緩存和通用三級緩存。DDR5這塊集成了英特爾的DDR PHY、DFI接口與Cadence的DDR內存控制器,支持到5600頻率的DDR5內存,PCIe5.0部分集成了英特爾的PCIePhy和新思的PCIeRootHub控制器。除了英特爾提供的PLL、內存編譯器、標準單元等數模IP以外,HorseCreek還用到了其他的IP,比如西門子的DFT和新思的NOC Fabric。

又一個千核RISC-V芯片
在戴爾的HPC社區(qū)大會上,來自美國的初創(chuàng)半導體公司InspireSemiconductor公布了他們?yōu)閿祿行奶峁┑腞ISC-V加速器方案,同時還給出了另一個有趣的說法,那就是現有的高性能計算方案已經“不夠好”了。
在他們看來,目前的主流數據中心CPU都太慢了,無論有無加速器的輔助都是如此,而在有了加速器以后,90%的高性能計算都是由加速器負責了。再者就是GPU和FPGA的方案,InspireSemiconductor指出這兩者的編程太復雜了,不僅鎖定了軟件棧,而且需要特定的技能才能獲得足夠好的計算結果。而ASIC和AI加速器的風險又太高了,從成本、時間上看都是如此。
為此,InspireSemiconductor推出了他們的RISC-V加速器方案,Thunderbird。Thunderbird在單芯片上集成了2560個64位的CPU核心,單個PCIe加速卡上的核心數量更是超過5000個。InspireSemiconductor稱他們用到了創(chuàng)新的高速互聯方案,在高效利用這么多核心的同時,最高可以組成256個芯片的陣列。

InspireSemiconductor同時承諾了一個對開發(fā)者友好的軟件生態(tài)系統,但他們并沒有給出自己的軟件方案,而是指出Thunderbird將充分利用RISC-V已有的豐富軟件生態(tài)系統,比如OneAPI等,所以不必像競品芯片那樣去開發(fā)一次性的軟件棧。如此一來更適合那些喜歡標準CPU編程模型的開發(fā)者,無需像GPU那樣去學習CUDA、OpenCL,而是可以用Pragma和MPI這樣的標準編譯器方案。
AI編程上也是如此,InspireSemiconductor指出流行的AI框架,諸如TensorFlow、Pytorch和Glow等都已有了對RISC-V的支持,Linux也在操作系統支持的行列中。如此看來,InspireSemiconductor目前應該只提供了純硬件方案,而這樣的產品是否能在市面上取得成功,目前看來完全取決于英特爾Codeplay那邊的OneAPI軟件生態(tài)了。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。
舉報投訴
-
英特爾
+關注
關注
61文章
10195瀏覽量
174667 -
谷歌
+關注
關注
27文章
6231瀏覽量
108118 -
數據中心
+關注
關注
16文章
5226瀏覽量
73510 -
RISC-V
+關注
關注
46文章
2563瀏覽量
48799
發(fā)布評論請先 登錄
相關推薦
熱點推薦
英特爾2025年Q1營收127億美元,數據中心與AI業(yè)務可圈可點
? 今日,英特爾公布2025年第一季度財報。數據顯示,英特爾第一季度營收達127億美元,超出預期指引,產品業(yè)務營收為118億美元,其中數據中心
英特爾至強6處理器助力數據中心整合升級
繼去年9月重磅推出英特爾 至強 6900性能核處理器后,英特爾進一步擴充至強6產品家族,于近期發(fā)布了包括至強6700性能核處理器及至強6500性能核處理器在內的多款新品,以更豐富的產品組合、卓越性能與出色能效,應對橫跨數據中心、
英特爾至強6:如何煉就數據中心“全能型選手”
面對數據中心領域日益激烈的競爭,英特爾緊抓核心產品,繼去年推出128核的至強6900P之后,近期又添“新兵”——至強6700P和至強6500P,進一步豐富了至強6產品線。英特爾至強6性能核處理器專為

英特爾Michelle Johnston Holthaus:深耕x86,持續(xù)為AI數據中心注入芯動力
“英特爾深耕數據中心市場數十余年,并通過x86架構引領標準制定和行業(yè)發(fā)展。目前,英特爾的處理器正為絕大多數數據中心提供動力?!?b class='flag-5'>英特爾臨時聯合

英特爾數據中心CPU銷量降至14年最低
近年來,英特爾在數據中心CPU市場的表現備受關注。據最新數據顯示,由于來自AMD的競爭加劇,英特爾在2024年的數據中心CPU銷量創(chuàng)下了十多
RISC-V發(fā)展及FPGA廠商為什么選擇RISC-V
Microsemi 于 2017 年開始在其 FPGA 中提供 RISC-V 軟核,Lattice 于 2020 年開始提供,英特爾 (Altera) 于 2021 年

AMD數據中心營收首超英特爾
在這一領域的地位開始受到挑戰(zhàn),也預示著數據中心市場競爭格局的轉變。 具體數據顯示,AMD 在2024年第三季度的數據中心業(yè)務收入達到了35.49億美元(按照當前匯率計算,約合人民幣25
AMD數據中心業(yè)務首超英特爾,Nvidia異軍突起
長期以來,英特爾在數據中心CPU市場占據主導地位,其Xeon處理器為絕大多數服務器提供動力。大約七、八年前,AMD的處理器在市場份額中還只是個位數。然而,這一局面已經發(fā)生了翻天覆地的變化。盡管
RISC-V,即將進入應用的爆發(fā)期
自己增加指令和自己的功能。RISC-V架構可以用于數據中心、車用、移動設備等任何AI需求產品。
展望RISC-V前景,此前硅谷芯片傳奇Jim Keller曾指出,“RISC-V的潛力是
發(fā)表于 10-31 16:06
RISC-V擁有巨大市場潛力的原因
敏感的市場尤其有吸引力。
5、行業(yè)支持:越來越多的行業(yè)巨頭和初創(chuàng)公司開始支持RISC-V,這不僅包括芯片制造商,還包括軟件開發(fā)商和系統設計公司。2023年,包括谷歌、英特爾、英偉達、高
發(fā)表于 09-30 14:20
英特爾發(fā)布至強6性能核處理器,攜手生態(tài)加速數據中心算力升級
英特爾至強6處理器在云計算、數據中心架構創(chuàng)新、綠色可持續(xù)發(fā)展等諸多領域的應用實踐,并攜手多家產業(yè)伙伴進行了聯合發(fā)布。

英特爾數據中心XPU產品最新進展:預計2027年發(fā)布
據匈牙利媒體PROHARDVER!的最新報道,英特爾正緊鑼密鼓地在其內部開發(fā)新一代數據中心XPU產品,并有望于2027年正式發(fā)布。這一消息標志著英特爾在數據中心計算領域的又一重要布局,
risc-v的發(fā)展歷史
Foundation),旨在促進RISC-V架構的發(fā)展和推廣。該基金會由大量的企業(yè)和機構支持,包括英特爾、Nvidia、谷歌、華為、IBM、紅帽、西部數據等。
2015年:
發(fā)表于 07-29 17:20
RISC-V適合什么樣的應用場景
研發(fā)成本,不受任何專利或版權制約,這對于汽車電子等成本敏感型領域尤為重要。
5. 數據中心和云計算
高性能和能效比:RISC-V處理器在性能和能效比方面表現出色,適用于數據中心和云計算領域對高性能計算
發(fā)表于 07-29 17:16
RISC-V在中國的發(fā)展機遇有哪些場景?
的理想選擇。
生態(tài)系統建設:多家頭部芯片公司和生態(tài)廠商正在積極推進RISC-V在車規(guī)級產品的布局,這將有助于RISC-V在汽車領域的快速發(fā)展。
4. 數據中心和高性能計算(HPC)
性能與能效比
發(fā)表于 07-29 17:14
評論