99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開(kāi)源庫(kù)加速并擴(kuò)展AI推理模型

NVIDIA英偉達(dá) ? 來(lái)源: NVIDIA英偉達(dá) ? 2025-03-20 15:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Dynamo 提高了推理性能,同時(shí)降低了擴(kuò)展測(cè)試時(shí)計(jì)算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理優(yōu)化將 DeepSeek-R1 上的吞吐量提高了 30 倍

NVIDIA 發(fā)布了開(kāi)源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴(kuò)展 AI 工廠中的 AI 推理模型。

作為 NVIDIA Triton 推理服務(wù)器的后續(xù)產(chǎn)品,NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件,旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協(xié)調(diào)并加速數(shù)千個(gè) GPU 之間的推理通信,并使用分離服務(wù)將大語(yǔ)言模型 (LLM) 的處理階段和生成階段在不同 GPU 上分離開(kāi)來(lái)。這使得每個(gè)階段的特定需求可以進(jìn)行單獨(dú)優(yōu)化,并確保更大程度地利用 GPU 資源。

NVIDIA Dynamo 完全開(kāi)源并支持 PyTorch、SGLang、NVIDIA TensorRT-LLM 和 vLLM,使企業(yè)、初創(chuàng)公司和研究人員能夠開(kāi)發(fā)和優(yōu)化在分離推理時(shí)部署 AI 模型的方法。

“全世界各行業(yè)都在訓(xùn)練 AI 模型以不同的方式進(jìn)行思考和學(xué)習(xí),從而使模型復(fù)雜度持續(xù)升級(jí)?!?NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,“為了實(shí)現(xiàn)自定義推理 AI 的未來(lái),NVIDIA Dynamo 可以在這些模型上進(jìn)行規(guī)?;渴穑瑥亩鵀?AI 工廠實(shí)現(xiàn)降本增效”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106417
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279998

原文標(biāo)題:GTC25 | NVIDIA Dynamo 開(kāi)源庫(kù)加速并擴(kuò)展 AI 推理模型

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    揭曉英偉達(dá)最強(qiáng)芯片!Blackwell Ultra、Rubin芯片亮相,新機(jī)器人壓軸

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)北京時(shí)間3月19日晚間,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在2025年GTC開(kāi)發(fā)者大會(huì)上發(fā)表了主題演講,介紹了英偉達(dá)
    的頭像 發(fā)表于 03-19 09:05 ?1809次閱讀
    揭曉<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>最強(qiáng)芯片!Blackwell Ultra、Rubin芯片亮相,新機(jī)器人壓軸

    詳解 LLM 推理模型的現(xiàn)狀

    領(lǐng)域的最新研究進(jìn)展,特別是自DeepSeekR1發(fā)布后興起的推理時(shí)間計(jì)算擴(kuò)展相關(guān)內(nèi)容。在LLM中實(shí)施和改進(jìn)推理簡(jiǎn)單來(lái)說(shuō),基于LLM的推理模型是一種旨在通過(guò)生成中間
    的頭像 發(fā)表于 04-03 12:09 ?507次閱讀
    詳解 LLM <b class='flag-5'>推理模型</b>的現(xiàn)狀

    英偉達(dá)GTC2025亮點(diǎn)NVIDIA認(rèn)證計(jì)劃擴(kuò)展至企業(yè)存儲(chǔ)領(lǐng)域,加速AI工廠部署

    ,現(xiàn)在已將企業(yè)存儲(chǔ)納入其中,旨在通過(guò)加速計(jì)算、網(wǎng)絡(luò)、軟件和存儲(chǔ),助力企業(yè)更高效地部署 AI 工廠。 在企業(yè)構(gòu)建 AI 工廠的過(guò)程中,獲取高質(zhì)量數(shù)據(jù)對(duì)于確保 AI
    的頭像 發(fā)表于 03-21 19:38 ?1095次閱讀

    英偉達(dá)GTC2025亮點(diǎn)NVIDIA、Alphabet 和谷歌攜手開(kāi)啟代理式與物理AI的未來(lái)

    聯(lián)合計(jì)劃涵蓋基礎(chǔ)設(shè)施和開(kāi)源模型優(yōu)化,在機(jī)器人、藥物研發(fā)等領(lǐng)域取得巨大進(jìn)展 具有長(zhǎng)期合作伙伴關(guān)系的 NVIDIA、Alphabet 和谷歌宣布了多項(xiàng)新計(jì)劃,旨在推動(dòng) AI 發(fā)展、普及
    的頭像 發(fā)表于 03-21 15:10 ?1160次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮點(diǎn)</b>:<b class='flag-5'>NVIDIA</b>、Alphabet 和谷歌攜手開(kāi)啟代理式與物理<b class='flag-5'>AI</b>的未來(lái)

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Oracle 數(shù)據(jù)庫(kù)NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,
    的頭像 發(fā)表于 03-21 12:01 ?704次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮點(diǎn)</b>:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英偉達(dá)GTC2025亮點(diǎn) NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    推理模型,讓開(kāi)發(fā)者以前所未有的方式控制世界生成。 NVIDIA 還推出了兩款由 NVIDIA Omniverse 和 Cosmos 平臺(tái)提供支持的新藍(lán)圖,為開(kāi)發(fā)者提供用于機(jī)
    的頭像 發(fā)表于 03-20 19:01 ?886次閱讀

    英偉達(dá)GTC25亮點(diǎn)NVIDIA Blackwell Ultra 開(kāi)啟 AI 推理新時(shí)代

    英偉達(dá)GTC25亮點(diǎn)NVIDIA Blackwell Ultra 開(kāi)啟 AI
    的頭像 發(fā)表于 03-20 15:35 ?733次閱讀

    新思科技亮相英偉達(dá)GTC 2025大會(huì)

    為了實(shí)現(xiàn)這一速度提升,新思科技在GTC全球AI大會(huì)上宣布,正在使用英偉達(dá) CUDA-X庫(kù)優(yōu)化其下一代半導(dǎo)體開(kāi)發(fā)解決方案。公司還在擴(kuò)大對(duì)
    的頭像 發(fā)表于 03-19 17:53 ?814次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    Oracle 數(shù)據(jù)庫(kù)NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI ? ? ? 美國(guó)加利福尼亞州圣何塞 —— GTC
    發(fā)表于 03-19 15:24 ?358次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>

    NVIDIA 推出開(kāi)放推理 AI 模型系列,助力開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)

    NVIDIA 后訓(xùn)練的全新 Llama Nemotron 推理模型,為代理式 AI 提供業(yè)務(wù)就緒型基礎(chǔ) 埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike
    發(fā)表于 03-19 09:31 ?237次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開(kāi)放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>系列,助力開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 <b class='flag-5'>AI</b> 平臺(tái)

    智譜推出深度推理模型GLM-Zero預(yù)覽版

    近日,智譜公司正式發(fā)布了其深度推理模型GLM-Zero的預(yù)覽版——GLM-Zero-Preview。這款模型標(biāo)志著智譜在擴(kuò)展強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練推理模型方面的重大突破,成為其首個(gè)專注于增強(qiáng)
    的頭像 發(fā)表于 01-03 10:42 ?510次閱讀

    智譜GLM-Zero深度推理模型預(yù)覽版正式上線

    近日,智譜公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上線。這款模型是智譜首個(gè)基于擴(kuò)展強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練的推理模型,標(biāo)志著智譜在
    的頭像 發(fā)表于 01-02 10:55 ?522次閱讀

    阿里云發(fā)布開(kāi)源多模態(tài)推理模型QVQ-72B-Preview

    近日,阿里云宣布了一項(xiàng)重大技術(shù)突破,正式發(fā)布了業(yè)界首個(gè)開(kāi)源多模態(tài)推理模型——QVQ-72B-Preview。這一模型的問(wèn)世,標(biāo)志著阿里云在AI技術(shù)領(lǐng)域的又一次重要飛躍
    的頭像 發(fā)表于 12-27 10:28 ?616次閱讀

    阿里云開(kāi)源推理模型QwQ

    近日,阿里云通義團(tuán)隊(duì)宣布推出全新AI推理模型QwQ-32B-Preview,并同步實(shí)現(xiàn)了開(kāi)源。這一舉措標(biāo)志著阿里云在AI推理領(lǐng)域邁出了重要一
    的頭像 發(fā)表于 11-29 11:30 ?1172次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1
    的頭像 發(fā)表于 07-25 09:48 ?1062次閱讀