在計算架構(gòu)和負(fù)載變得愈發(fā)復(fù)雜和多樣的情況下,處理器廠商紛紛開始了自己的造詞之路。要想體現(xiàn)產(chǎn)品定位,又要讓大家對其縮寫印象深刻,所以PU成了最常見的后綴?,F(xiàn)在的處理器家族中已經(jīng)有了不少成員,除了常見的CPU、GPU、APU之外,按照處理對象的不同,在人工智能和深度學(xué)習(xí)的崛起下,NPU和TPU也紛紛出現(xiàn)。
DPU模糊的定義
不過這些已經(jīng)定義明確的處理單元并不是我們今天的主角,而是找到了全新定義的xPU。什么是xPU,其實很難定義,這其中有DPU(數(shù)據(jù)處理單元)、IPU(基礎(chǔ)設(shè)施處理單元)和FAC(功能加速卡),這些剛冒頭的產(chǎn)品就是xPU,它們代表了從SmartNIC演化過來并超越其定位的新時代加速器硬件。除了SmartNIC以外,這些xPU雖然命名不同,但其實很多時候,它們是完全重合的,現(xiàn)在為了方便,很多時候也以DPU統(tǒng)稱。

BlueField-3 DPU / 英偉達(dá)
這樣說DPU的定義還是很模糊,我們就從其特點來看。SmartNIC往往需要主CPU來完成管理工作,DPU雖然往往也屬于一個主系統(tǒng)中的部件,但卻可以做到完全獨立,可以部署到邊緣、JBOF存儲和網(wǎng)關(guān)上,并為它們提供網(wǎng)絡(luò)接口和虛擬功能。它的另一項職責(zé)就是幫CPU減輕負(fù)擔(dān),節(jié)省服務(wù)器上有限的處理器核心。
因此,盡管DPU看起來和一些PCIe智能網(wǎng)卡或GPU差不多,但它本質(zhì)上就是一個為數(shù)據(jù)流和數(shù)據(jù)包處理提供加速、卸載和本地服務(wù)的微型服務(wù)器,在服務(wù)器中提供一個獨立單元的同時,又不乏協(xié)助其他單元的處理能力。
什么樣的任務(wù)需要DPU?
至于為什么要用到DPU,這就不得不談到日益增加的數(shù)據(jù)密集型任務(wù)了,短視頻、實時金融交易的興起,高帶寬的數(shù)據(jù)流要求數(shù)據(jù)中心對網(wǎng)絡(luò)、存儲、安全和AI/ML進行高效的處理。比如谷歌在數(shù)年前就提到,在他們的數(shù)據(jù)中心里,有三分之一的任務(wù)都是數(shù)據(jù)密集型的,這些都是交由底層基礎(chǔ)設(shè)施完成的,而且這類任務(wù)的占比是在逐步增加的。因為CPU和GPU這樣的通用計算單元并不擅長,所以專門針對這類任務(wù)優(yōu)化的DPU就得出來擔(dān)此大任了。其次就是企業(yè)數(shù)據(jù)中心和公共數(shù)據(jù)中心也想獲得超大規(guī)模巨頭廠商那樣的效率,做到這一點就必須解聚那些昂貴的硬件資源,比如SSD、GPU等,DPU為數(shù)據(jù)中心的解聚提供了極高的效率,優(yōu)化了擁有成本、占用面積和安全性。
DPU可以完成各個方面的卸載與加速,尤其是在網(wǎng)絡(luò)、安全和存儲這三大塊。在網(wǎng)絡(luò)端,DPU可以有效實現(xiàn)虛擬路由器,輔助數(shù)據(jù)包交換、定義交換規(guī)則等工作,減少延遲的同時還能夠提高吞吐量;在安全上,DPU可以用于下一代防火墻(NGFW)的加速,完成數(shù)據(jù)包過濾、內(nèi)容檢測和報頭檢測與重寫,將性能提高數(shù)倍以上;在存儲上,DPU可以卸載高速NVMe/TCP,進一步提升存儲性能。最關(guān)鍵的是,這三者都能有效地接管CPU控制面的負(fù)載,節(jié)省CPU本身的計算核心。

基于DPU的服務(wù)器存儲方案 / Fungible
以上是DPU為服務(wù)器提供的加強,主要以PCIe加速卡的形式來提供,此外,還有單獨的DPU存儲產(chǎn)品。傳統(tǒng)的CPU存儲方案中,整個系統(tǒng)由DRAM、x86 CPU、SmartNIC、加速器和PCIe接口組成,而在未來的存儲方案,比如高性能存儲、計算型存儲和軟件定義網(wǎng)絡(luò)應(yīng)用的存儲中,單片集成的方案更能滿足要求,這就是與DRAM結(jié)合的DPU存儲產(chǎn)品。這種方案不僅可以提升IOPS,也能進一步降低能耗。
正因如此,數(shù)據(jù)中心會用DPU來完成數(shù)據(jù)密集型任務(wù),從而減少功耗、擁有成本和占用空間。此外,他們也會用到基于DPU的存儲、GPU/TPU資源池和主機卡,來高效地完成高成本硬件資源的解聚。
DPU市場混戰(zhàn)
在不少廠商對DPU的宣傳中,往往都會提到這將是除了CPU和GPU之外的第三大硬件。大家可能覺得類似的承諾,好像一些AI處理器也有提到,但市面上還是GPU占據(jù)主導(dǎo)地位,DPU又會有何不同呢?事實證明,市場對DPU的信心很足,這我們從入局DPU的廠商就能看出。

云霄DPU / 云豹智能
如今制造DPU的企業(yè)分為三種,一是初創(chuàng)公司,比如:云豹智能、星云智聯(lián)、中科馭數(shù)、云脈芯聯(lián)、芯啟源、大禹智芯、Fungible等;二是市面上一些已有的服務(wù)器巨頭,比如AMD/Xilinx、英特爾、Marvel、英偉達(dá);三是CSP(云服務(wù)供應(yīng)商)廠商,比如亞馬遜AWS、微軟Azure、阿里云等等。后者更多是負(fù)責(zé)設(shè)計或者聯(lián)合設(shè)計這些xPU,好專用于自己的云服務(wù)器。最終售賣這些DPU的除了DPU廠商外,還有基礎(chǔ)設(shè)施的OEM和ODM,增值分銷商和集成方案廠商,CSP廠商在售賣服務(wù)器的時候,自然也會以間接的方式來體現(xiàn)DPU的價值。
隨著Mellanox被英偉達(dá)收購,Pensando被AMD收購,而Fungible的DPU主要針對存儲加速和卸載,雖然沒有被收購,但也收獲了軟銀的主導(dǎo)的融資。國內(nèi)的DPU廠商同樣備受青睞,比如騰訊屢次投資的云豹智能,字節(jié)跳動投資的云脈芯聯(lián),美團和百度投資的星云智聯(lián)等,這些投資方要么是CSP,要么擁有超大規(guī)模的數(shù)據(jù)中心,他們不像其他CSP大廠,硬件設(shè)計能力缺乏或有限,卻也看到了DPU的前景。
DPU并不完美
即便大廠看好,但從現(xiàn)狀來看,部署DPU對某些中小企業(yè)來說依然是雙刃劍。固然,DPU可以卸載基礎(chǔ)設(shè)施的任務(wù),減輕其負(fù)擔(dān),讓服務(wù)器的CPU空出來專注在應(yīng)用本身,更高的效率、更低的擁有成本和更高的安全性也都隨之而來,這些優(yōu)點是幾乎每個服務(wù)器都能享受到的。
但在部分服務(wù)器中,引入DPU不免增加了服務(wù)器的資本投入,而且相較于CPU、GPU這類硬件來說,它只能卸載和加速特定的負(fù)載,并不是一個通用加速單元。此外,部分服務(wù)器在增加DPU的情況下還是會導(dǎo)致功耗提升,在服務(wù)器、數(shù)據(jù)中心紛紛開始節(jié)能減排的當(dāng)下,如何權(quán)衡各個組件的功耗無疑會是一個大問題。還有就是相關(guān)的開發(fā),DPU的靈活性體現(xiàn)在可編程上,但這需要進行一定的編程能力,加上目前每家廠商都在單干,也沒有一個標(biāo)準(zhǔn)的接口,所以在適配上絕對不輕松,這也是不少DPU選擇Arm作為核心架構(gòu)的原因,就是為了減少其編程的難度。
也正是因為以上這些理由,從市場滲透率上來看,DPU主要是還是大規(guī)模的CSP廠商用的更多一點,加上托管應(yīng)用的增加,這一塊未來也會驅(qū)動DPU產(chǎn)品的銷售。對于自研DPU的CSP來說,他們肯定會繼續(xù)加大這方面的投入,進一步降低成本,而對于第三方廠商來說,英偉達(dá)、AMD和英特爾這些服務(wù)器CPU、GPU廠商無疑會更有優(yōu)勢,因為他們提供競爭力更強的集成方案。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
服務(wù)器
+關(guān)注
關(guān)注
13文章
9791瀏覽量
87927 -
DPU
+關(guān)注
關(guān)注
0文章
393瀏覽量
24925 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3948瀏覽量
93690
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
高壓放大器在粒子加速器研究中的應(yīng)用
粒子加速器是現(xiàn)代科學(xué)研究中不可或缺的大型實驗裝置,廣泛應(yīng)用于物理學(xué)、化學(xué)、材料科學(xué)、生物學(xué)等多個領(lǐng)域。其核心原理是利用電場和磁場對帶電粒子進行加速和約束,使粒子達(dá)到極高的能量,從而為研究微觀世界

粒子加速器?——?科技前沿的核心裝置
粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場在高真空環(huán)境中對帶電粒子(如電子、質(zhì)子、離子)進行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術(shù)現(xiàn)已發(fā)展成為集高能物理、核物理、

基于雙向塊浮點量化的大語言模型高效加速器設(shè)計
本文提出雙向塊浮點(BBFP)量化格式及基于其的LLMs加速器BBAL,通過雙向移位與重疊位設(shè)計顯著降低量化誤差,提升非線性計算效率,實現(xiàn)精度、吞吐量和能效的顯著優(yōu)化,相關(guān)成果被國際頂級會議 DAC 2025 接收。

第三期 “亞馬遜云科技創(chuàng)業(yè)加速器” 正式啟動
新 助力生成式 AI 初創(chuàng)企業(yè)釋放潛能,加速全球化進程 ? 北京 ——2025 年 4 月 18 日 亞馬遜云科技今日宣布,第三期 "亞馬遜云科技創(chuàng)業(yè)加速器" 正式啟動。亞馬遜云科技將聯(lián)合包括啟明創(chuàng)
發(fā)表于 04-18 10:46
?171次閱讀
小型加速器中子源監(jiān)測系統(tǒng)解決方案
小型加速器中子源是一種基于先進加速器技術(shù)的中子產(chǎn)生裝置,憑借體積小、成本低、安全性高的優(yōu)勢,在醫(yī)學(xué)、工業(yè)、科研、安全、能源等多個領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力和價值。無論是用于醫(yī)學(xué)領(lǐng)域的精準(zhǔn)放療,還是工業(yè)

消息稱AMD Instinct MI400 AI加速器將配備8個計算芯片
近日,據(jù)外媒 videocardz 報道,參考 AMD 最新推出的 AMD - GFX 補丁程序,其中暗示 AMD 旗下的 Instinct MI400 AI 加速器設(shè)計將有重大變革,其將配備 8
利用NVIDIA DPF引領(lǐng)DPU加速云計算的未來
DPU 的強大功能,并優(yōu)化 GPU 加速計算平臺。作為一種編排框架和實施藍(lán)圖,DPF 使開發(fā)者、服務(wù)提供商和企業(yè)能夠無縫構(gòu)建 BlueField 加速的云原生軟件平臺。

EE-436:使用ADSP-SC59x/2159x高性能FIR/IIR加速器
電子發(fā)燒友網(wǎng)站提供《EE-436:使用ADSP-SC59x/2159x高性能FIR/IIR加速器.pdf》資料免費下載
發(fā)表于 01-07 14:12
?0次下載


IBM將在云平臺部署AMD加速器
IBM與AMD近期宣布了一項重要合作協(xié)議,根據(jù)協(xié)議,IBM將在其云平臺上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業(yè)客戶在生成式AI模型方面的性能和能效,進一步推動AI技術(shù)的創(chuàng)新與應(yīng)用。
磁調(diào)制式電流傳感器在粒子加速器中的應(yīng)用
粒子加速器是一種利用電磁場加速帶電粒子(如質(zhì)子、電子、離子等)至極高速度的裝置。其工作原理基于洛倫茲力定律,即當(dāng)帶電粒子在電磁場中運動時,會受到垂直于其速度方向的力作用,從而改變其運動狀態(tài)。粒子
具有邊沿速率加速器的TXB和TXS電壓電平轉(zhuǎn)換器的注意事項
電子發(fā)燒友網(wǎng)站提供《具有邊沿速率加速器的TXB和TXS電壓電平轉(zhuǎn)換器的注意事項.pdf》資料免費下載
發(fā)表于 09-04 09:52
?0次下載

利用邊沿速率加速器和自動感應(yīng)電平轉(zhuǎn)換器
電子發(fā)燒友網(wǎng)站提供《利用邊沿速率加速器和自動感應(yīng)電平轉(zhuǎn)換器.pdf》資料免費下載
發(fā)表于 09-02 11:58
?1次下載

適用于數(shù)據(jù)中心應(yīng)用中的硬件加速器的直流/直流轉(zhuǎn)換器解決方案
電子發(fā)燒友網(wǎng)站提供《適用于數(shù)據(jù)中心應(yīng)用中的硬件加速器的直流/直流轉(zhuǎn)換器解決方案.pdf》資料免費下載
發(fā)表于 08-26 09:38
?0次下載

IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書
數(shù)據(jù)中心的第三顆“主力芯片”,主要通過其專用處理器優(yōu)化數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲、安全等處理性能,助力服務(wù)器運行效率顯著提升,有效降低成本。因此,在新型數(shù)據(jù)中心建設(shè)時,圍繞 DPU 構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)的基礎(chǔ)設(shè)施
發(fā)表于 07-24 15:32
評論