一区二区在线观看热视频,男人天堂免费东京热,色色网站在线免费观看

電子發(fā)燒友網報道（文/周凱揚）數據中心作為CPU、GPU和加速器廠商最為關注的市場，自然也少不了RISC-V這個新架構來摻和一腳。我們在之前的文章中也對RISC-V在數據中心的進展做了一些介紹，RISC-V雖然在服務器通用CPU上發(fā)力跡象不明顯，但要說AI加速器這類產品，很有可能會是RISC-V打入數據中心市場的最佳方向。

谷歌的RISC-V戰(zhàn)略

自己設計芯片的服務器廠商之一，谷歌，似乎也開始打算用上RISC-V。在今年9月美國的AI硬件峰會上，SiFive首席架構師和谷歌的TPU芯片架構師展示了他們的合作方案。谷歌的TPU是谷歌設計專用于機器學習的加速器，用于在數據中心上運行TensorFlow、Pytorch和JAX等機器學習框架。

而TPU的主要計算單元就是矩陣乘法打算（MXU），由脈動陣列中的128x128乘法/累積器組成，在最小配置v4版TPU中包含4個TPU芯片，每個TPU芯片都有8個MXU，是TPU v3版的兩倍，而且每個MXU都能使用BF16執(zhí)行每周期16K的乘積累加運算。

然而，谷歌發(fā)現雖然TPU的機器學習算力雖然夠用，但客戶在利用這類大型AI加速器時，往往無法用它來完成其他的復雜計算負載，所以谷歌的做法是將SiFive的X280處理器核心，作為TPU的協處理器，用來提供維護和運行代碼，跑加速器沒法運行的內核。

雖然SiFive的X280主打的是加速AI/ML計算，但主要是針對邊緣端，比如AR/VR、數碼相機等等，并非用于數據中心的大型AI加速器。但在與谷歌等廠商的合作下，SiFive推出了一個名為矢量定制協處理器接口（VCIX）的技術，可以讓大型AI加速器直接與X280的32x512位矢量寄存器文件高速通信。

這相比其他方案來說，矢量寄存器層級上的訪問不僅可以提供更大的帶寬、比PCIe更低延遲，還能簡化軟件棧、省下更多的硬件資源。X280和TPU核心分工合作，前者負責運行完整的Linux系統和虛擬機管理程序，后者負責密集的機器學習運算。

英特爾HorseCreek初見端倪

早在去年，英特爾就宣布將會用到SiFive的P550高性能RISC-V核心，以及自己的7nm工藝（即現在的Intel4工藝）來打造一款RISC-V SoC，代號名為HorseCreek。雖然到了2022年，SiFive最高性能的核心已經成了P650。但作為一個十三級流水線、三發(fā)射、亂序的64位RISC-V核心，P550的性能仍然是相當能打的，SiFive給到的定位也是對標ARM的Cortex-A75，同時只需不到一半的面積。

不過消息公布后，英特爾雖然又開展了一系列與RISC-V相關的行動，比如加入RISC-V國際基金會、IFS支持RISC-V芯片代工和推出RISC-V的FPGA開發(fā)平臺等等，但HorseCreek卻始終不見蹤影。

而在今年的IntelInnovation大會上，英特爾的不少合作伙伴都在現場搭建了展臺，也有參會者終于在現場看到了HorseCreek的真面目。在Intel4工藝的加持下，HorseCreek將4個2.2GHz的SiFiveP550核心、DDR5和PCIe5集成到了4mmx4mm的單個裸片上，連英特爾CEO PatGelsinger本人也親自來展臺查看HorseCreek的開發(fā)平臺。

根據展臺上公開的數據，HorseCreek配備了三級緩存，包括私有二級緩存和通用三級緩存。DDR5這塊集成了英特爾的DDR PHY、DFI接口與Cadence的DDR內存控制器，支持到5600頻率的DDR5內存，PCIe5.0部分集成了英特爾的PCIePhy和新思的PCIeRootHub控制器。除了英特爾提供的PLL、內存編譯器、標準單元等數模IP以外，HorseCreek還用到了其他的IP，比如西門子的DFT和新思的NOC Fabric。

從以上數據可以看出，HorseCreek是一個集SiFive、英特爾和EDA廠商IP大成的SoC。如此強大的SoC加上豐富的接口支持，完全可以用于數據中心里。不過，HorseCreek的首個終端產品形態(tài)應該是SiFive的下一代HiFive開發(fā)板。上一代的HiFive Unmatched開發(fā)板已經售罄了，在疫情相關的供應鏈問題下，SiFive已經放棄了補貨的打算，轉而全力去打造下一代基于HorseCreek的HiFive開發(fā)板。

又一個千核RISC-V芯片

在戴爾的HPC社區(qū)大會上，來自美國的初創(chuàng)半導體公司InspireSemiconductor公布了他們?yōu)閿祿行奶峁┑腞ISC-V加速器方案，同時還給出了另一個有趣的說法，那就是現有的高性能計算方案已經“不夠好”了。

在他們看來，目前的主流數據中心CPU都太慢了，無論有無加速器的輔助都是如此，而在有了加速器以后，90%的高性能計算都是由加速器負責了。再者就是GPU和FPGA的方案，InspireSemiconductor指出這兩者的編程太復雜了，不僅鎖定了軟件棧，而且需要特定的技能才能獲得足夠好的計算結果。而ASIC和AI加速器的風險又太高了，從成本、時間上看都是如此。

為此，InspireSemiconductor推出了他們的RISC-V加速器方案，Thunderbird。Thunderbird在單芯片上集成了2560個64位的CPU核心，單個PCIe加速卡上的核心數量更是超過5000個。InspireSemiconductor稱他們用到了創(chuàng)新的高速互聯方案，在高效利用這么多核心的同時，最高可以組成256個芯片的陣列。

相較其他加速器和GPU方案，Thunderbird加速器也有著功耗上的優(yōu)勢，單芯片的功耗在175W左右，同時他們給出了20W/Tflops的能效比，看來Thunderbird的峰值算力大概就在8.75Tflops左右了。雖然會上InspireSemiconductor也展示了谷歌、聯想和IBM等客戶或合作伙伴的一些反饋，但這些不少是客套話，是否已經用于這些公司的數據中心方案中還不好說。

InspireSemiconductor同時承諾了一個對開發(fā)者友好的軟件生態(tài)系統，但他們并沒有給出自己的軟件方案，而是指出Thunderbird將充分利用RISC-V已有的豐富軟件生態(tài)系統，比如OneAPI等，所以不必像競品芯片那樣去開發(fā)一次性的軟件棧。如此一來更適合那些喜歡標準CPU編程模型的開發(fā)者，無需像GPU那樣去學習CUDA、OpenCL，而是可以用Pragma和MPI這樣的標準編譯器方案。

AI編程上也是如此，InspireSemiconductor指出流行的AI框架，諸如TensorFlow、Pytorch和Glow等都已有了對RISC-V的支持，Linux也在操作系統支持的行列中。如此看來，InspireSemiconductor目前應該只提供了純硬件方案，而這樣的產品是否能在市面上取得成功，目前看來完全取決于英特爾Codeplay那邊的OneAPI軟件生態(tài)了。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯系本站處理。舉報投訴

英特爾

英特爾

+關注

關注
61

文章
10195

瀏覽量
174667
谷歌

谷歌

+關注

關注
27

文章
6231

瀏覽量
108118
數據中心

數據中心

+關注

關注
16

文章
5226

瀏覽量
73510
RISC-V

RISC-V

+關注

關注
46

文章
2563

瀏覽量
48799

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

英特爾與谷歌開始為RISC-V進軍數據中心鋪路

評論