英偉達(dá)GTC25亮點(diǎn)：NVIDIA Dynamo開(kāi)源庫(kù)加速并擴(kuò)展AI推理模型

NVIDIA Dynamo 提高了推理性能，同時(shí)降低了擴(kuò)展測(cè)試時(shí)計(jì)算 (Scaling Test-Time Compute) 的成本；在 NVIDIA Blackwell 上的推理優(yōu)化將 DeepSeek-R1 上的吞吐量提高了 30 倍

NVIDIA 發(fā)布了開(kāi)源推理軟件 NVIDIA Dynamo，旨在以高效率、低成本加速并擴(kuò)展 AI 工廠中的 AI 推理模型。

作為 NVIDIA Triton 推理服務(wù)器的后續(xù)產(chǎn)品，NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件，旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協(xié)調(diào)并加速數(shù)千個(gè) GPU 之間的推理通信，并使用分離服務(wù)將大語(yǔ)言模型 (LLM) 的處理階段和生成階段在不同 GPU 上分離開(kāi)來(lái)。這使得每個(gè)階段的特定需求可以進(jìn)行單獨(dú)優(yōu)化，并確保更大程度地利用 GPU 資源。

NVIDIA Dynamo 完全開(kāi)源并支持 PyTorch、SGLang、NVIDIA TensorRT-LLM 和 vLLM，使企業(yè)、初創(chuàng)公司和研究人員能夠開(kāi)發(fā)和優(yōu)化在分離推理時(shí)部署 AI 模型的方法。

“全世界各行業(yè)都在訓(xùn)練 AI 模型以不同的方式進(jìn)行思考和學(xué)習(xí)，從而使模型復(fù)雜度持續(xù)升級(jí)?！?NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示，“為了實(shí)現(xiàn)自定義推理 AI 的未來(lái)，NVIDIA Dynamo 可以在這些模型上進(jìn)行規(guī)?；渴穑瑥亩鵀?AI 工廠實(shí)現(xiàn)降本增效”。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5309

瀏覽量
106417
AI

AI

+關(guān)注

關(guān)注
88

文章
35164

瀏覽量
279998

原文標(biāo)題：GTC25 | NVIDIA Dynamo 開(kāi)源庫(kù)加速并擴(kuò)展 AI 推理模型

文章出處：【微信號(hào)：NVIDIA_China，微信公眾號(hào)：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

NVIDIA英偉達(dá)
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁(yè)

Hot VR、AR與MR的發(fā)展歷史以及商業(yè)應(yīng)用實(shí)例
Hot NVIDIA RTX與GTX的區(qū)別是什么？

New 2025 NVIDIA創(chuàng)業(yè)企業(yè)展示杭州站圓滿收官
New NVIDIA 將恢復(fù)H20芯片在中國(guó)的銷售 NVIDIA CEO 黃仁勛在美國(guó)和中國(guó)加大推廣AI

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進(jìn)現(xiàn)實(shí)

腦極體
17小時(shí)前

423 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（2）

三菱電機(jī)半導(dǎo)體
5小時(shí)前

255 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（1）

三菱電機(jī)半導(dǎo)體
6小時(shí)前

262 閱讀

英飛凌TLD7002-16 OTP PRG的常見(jiàn)問(wèn)題解析

駿龍電子
6小時(shí)前

236 閱讀

DC/DC轉(zhuǎn)換器電路板安裝過(guò)程中的焊接技巧與導(dǎo)通檢查要點(diǎn)

駿龍電子
6小時(shí)前

268 閱讀

LCD1602中文資料

lanlanw
211 KB

免費(fèi)

1450下載

dvol容器化數(shù)據(jù)庫(kù)版本控制

ah此生不換
1.65 MB

免費(fèi)

0下載

Lita聊天機(jī)器人

李鴻
0.10 MB

2積分

3下載

納米克隆開(kāi)源資料分享

陳存樓
0.22 MB

免費(fèi)

0下載

Allegro元件封裝(焊盤)制作教程

xtapeyd
0.06 MB

2積分

2下載

省錢+環(huán)保+個(gè)性：打造一臺(tái)永不“過(guò)時(shí)”的自定義電腦！

早知
1天前

364 閱讀

【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】+溫度大氣壓檢測(cè)及顯示

jinglixixi
1天前

569 閱讀

【RA-Eco-RA6M4開(kāi)發(fā)板評(píng)測(cè)】+01+開(kāi)箱測(cè)評(píng)+UART+PWM+LED

jf_18702540
2天前

538 閱讀

【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】2、打造復(fù)古游戲機(jī)（Batocera鏡像+FBNeo虛擬機(jī)，多款游戲ROM分享）

左岸cpx
2天前

564 閱讀

【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】+兩種開(kāi)發(fā)板間的比較

jinglixixi
2天前

502 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

英偉達(dá)GTC25亮點(diǎn)：NVIDIA Dynamo開(kāi)源庫(kù)加速并擴(kuò)展AI推理模型

評(píng)論