2025年,隨著DeepSeek等AI大模型的火爆,DAU增長(zhǎng)速度不斷刷新行業(yè)記錄。然而,另一方面,海量并發(fā)用戶請(qǐng)求訪問(wèn)激增,服務(wù)器資源被迅速耗盡,多次出現(xiàn)網(wǎng)頁(yè)和API無(wú)法訪問(wèn)的情況。同時(shí),AI大模型的火爆也吸引攻擊者使用多種技術(shù)和手段持續(xù)攻擊。上述問(wèn)題暴露了AI大模型規(guī)模應(yīng)用面臨的三大挑戰(zhàn):AI推理基礎(chǔ)設(shè)施能力不足、AI推理網(wǎng)絡(luò)架構(gòu)及技術(shù)待完善、AI服務(wù)網(wǎng)絡(luò)安全防護(hù)能力待提升。
近日,在中國(guó)云網(wǎng)智聯(lián)大會(huì)期間,中國(guó)移動(dòng)研究院攜手華為及產(chǎn)業(yè)合作伙伴,重磅發(fā)布了《分布式推理網(wǎng)絡(luò)(Distributed Inference Network,DIN)技術(shù)白皮書》,聚焦AI發(fā)展面臨的挑戰(zhàn),定義了分布式推理網(wǎng)絡(luò)的目標(biāo)架構(gòu),結(jié)合分布式計(jì)算、邊緣智能和動(dòng)態(tài)調(diào)度技術(shù),加速普惠AI發(fā)展進(jìn)入“推理時(shí)刻”。
白皮書從AI模型發(fā)展趨勢(shì)、推理服務(wù)網(wǎng)絡(luò)需求、分布式推理架構(gòu)及關(guān)鍵技術(shù)等方面進(jìn)行了闡述,重點(diǎn)闡述了分布式推理網(wǎng)絡(luò)采用可擴(kuò)展分布架構(gòu),綜合運(yùn)用多種關(guān)鍵技術(shù)實(shí)現(xiàn)端、邊、網(wǎng)、算的有效協(xié)同,提供差異化、高安全、高并發(fā)、高頻次的網(wǎng)絡(luò)連接服務(wù)保障。
關(guān)鍵技術(shù)一: 節(jié)點(diǎn)間互聯(lián)質(zhì)量保障技術(shù)
為滿足推理業(yè)務(wù)的低時(shí)延、高可靠、大帶寬等需求,邊緣推理設(shè)備如新一代AI路由器及智能單板等,基于AI進(jìn)行應(yīng)用精準(zhǔn)識(shí)別,根據(jù)AI推理呈現(xiàn)應(yīng)用級(jí)QoE,按照業(yè)務(wù)需要實(shí)現(xiàn)路徑調(diào)優(yōu)或精準(zhǔn)擴(kuò)容,實(shí)現(xiàn)應(yīng)用級(jí)差異化、確定性的體驗(yàn)保障。同時(shí),分布式推理業(yè)務(wù)催生了海量數(shù)據(jù)高效傳輸需求,這對(duì)廣域網(wǎng)絡(luò)提出了“零丟包”和“極低抖動(dòng)”的雙重挑戰(zhàn),彈性無(wú)損、流級(jí)流控等關(guān)鍵技術(shù)實(shí)時(shí)感知網(wǎng)絡(luò)擁塞狀況,基于精準(zhǔn)流控反壓、層次化細(xì)粒度切片實(shí)現(xiàn)網(wǎng)絡(luò)無(wú)損和微秒級(jí)抖動(dòng)等極致性能。
關(guān)鍵技術(shù)二: 推理服務(wù)的調(diào)度技術(shù)
模型調(diào)度是DIN的主要功能之一,旨在根據(jù)用戶需求、設(shè)備性能、網(wǎng)絡(luò)狀態(tài)等多重因素,按需動(dòng)態(tài)生成業(yè)務(wù)調(diào)度策略,將業(yè)務(wù)沿最佳路徑調(diào)度到目的推理服務(wù)節(jié)點(diǎn)。通過(guò)高效的模型調(diào)度,DIN能夠在復(fù)雜多變的環(huán)境中實(shí)現(xiàn)資源的智能分配,為用戶提供低延遲、高可用的AI服務(wù),同時(shí)降低運(yùn)營(yíng)成本。
關(guān)鍵技術(shù)三: 模型推理安全防護(hù)技術(shù)
DIN利用嵌入AI技術(shù),具備入侵檢測(cè)和防御能力,與安全平臺(tái)協(xié)同,做到惡意流量快速感知、自動(dòng)阻斷;通過(guò)以太網(wǎng)相干PHYSec技術(shù)對(duì)模型分發(fā)、KV Cache等數(shù)據(jù)實(shí)現(xiàn)低時(shí)延、零開(kāi)銷的物理層比特流安全加密,防止百公里鏈路傳遞過(guò)程中被中間節(jié)點(diǎn)竊取或篡改。
展望未來(lái),華為積極配合中國(guó)移動(dòng)實(shí)現(xiàn)分布式推理網(wǎng)絡(luò)的演進(jìn)和部署,通過(guò)華為AI WAN解決方案優(yōu)勢(shì),助力中國(guó)移動(dòng)構(gòu)建融合端、邊、網(wǎng)、算的DIN技術(shù)體系和標(biāo)準(zhǔn)體系,解決大模型在個(gè)人、家庭及企業(yè)應(yīng)用中的成本、效率與場(chǎng)景適配難題,加速AI普惠化發(fā)展,引領(lǐng)邁向全面智能社會(huì)。
-
華為
+關(guān)注
關(guān)注
216文章
35209瀏覽量
255864 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
7814瀏覽量
90925 -
中國(guó)移動(dòng)
+關(guān)注
關(guān)注
22文章
5626瀏覽量
73319
原文標(biāo)題:AI WAN@517 電信日 | 中國(guó)移動(dòng)攜手華為等推出分布式推理網(wǎng)絡(luò)技術(shù),加速普惠AI進(jìn)入“推理時(shí)刻”
文章出處:【微信號(hào):Huawei_Fixed,微信公眾號(hào):華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
東進(jìn)技術(shù)發(fā)布《后量子密碼技術(shù)白皮書(2025版)》

中國(guó)移動(dòng)攜手華為發(fā)布網(wǎng)絡(luò)運(yùn)行大模型2.0
高通發(fā)布ADAS技術(shù)白皮書,助力中國(guó)車企普及先進(jìn)駕駛輔助系統(tǒng)

評(píng)論