99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA在多模態(tài)生成式AI領域的突破性進展

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-05-15 10:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在今年的國際學習表征大會(ICLR)上,NVIDIA 發(fā)表了 70 余篇論文,其內容涵蓋醫(yī)療、機器人、自動駕駛汽車以及大語言模型等領域。

推動 AI 進步需要采用全棧式方法,這依賴于包括加速處理器和網絡技術在內的強大計算基礎設施,并將其與優(yōu)化的編譯器、算法及應用程序相連接。

NVIDIA Research 正在該領域進行全方位的創(chuàng)新,并在此過程中為幾乎所有行業(yè)提供支持。在近日舉行的國際學習表征大會(ICLR)上,NVIDIA 提交了 70 余篇論文,展示了 AI 在自動駕駛汽車、醫(yī)療、多模態(tài)內容創(chuàng)作、機器人等領域的應用進展。

NVIDIA 應用深度學習研究副總裁 Bryan Catanzaro 表示:“ICLR 是全球最具影響力的 AI 會議之一,研究人員在此發(fā)布推動各行各業(yè)進步的關鍵技術創(chuàng)新。NVIDIA 今年提交的研究成果旨在加速計算堆棧的各個層級,從而增強 AI 在各行業(yè)的影響力和實用性?!?/p>

解決現(xiàn)實世界挑戰(zhàn)的研究工作

NVIDIA 在 ICLR 上提交的多篇論文聚焦多模態(tài)生成式 AI 領域的突破性進展,以及 AI 訓練和合成數(shù)據(jù)生成的新方法,具體包括:

Fugatto:Fugatto 是世界上最靈活的音頻生成式 AI 模型。根據(jù)輸入的文本提示和音頻文件,它能夠生成或修改包含任意的音樂、人聲和聲音組合的作品。在 ICLR 上展示的其他 NVIDIA 模型對音頻大語言模型(LLM)進行了改進,以使其更好地理解語音。

HAMSTER:這篇論文提出了一種視覺-語言-動作模型的分層設計方案,它可以更好地從域外微調數(shù)據(jù)(即無需在真實機器人硬件上收集的低成本數(shù)據(jù))中遷移知識,進而提升機器人在測試場景中的技能水平。

Hymba:這個小語言模型家族采用混合模型架構,由此創(chuàng)造的 LLM 融合了 Transformer 模型和狀態(tài)空間模型的優(yōu)勢,實現(xiàn)了高分辨率記憶檢索、高效的上下文總結以及常識推理任務。借助這種混合模型架構,Hymba 在保持性能的前提下將吞吐量提升了 3 倍,緩存減少至約1/4。

LongVILA:該訓練流程實現(xiàn)了高效的視覺語言模型訓練與推理,以支持長視頻理解。使用長視頻訓練 AI 模型時,需要大量算力和密集內存,而這篇論文提出的系統(tǒng)可以高效地并行處理長視頻的訓練和推理,在 256 塊 GPU 上進行訓練時可擴展到多達 200 萬個 token。LongVILA 在 9 個主流視頻基準測試中均達到當前最優(yōu)性能。

LLaMaFlex:這篇論文提出了一種全新的零樣本生成技術,可從單個大型模型來構建一系列壓縮 LLM 家族。研究人員發(fā)現(xiàn),LLaMaFlex 生成的壓縮模型在精度上媲美或優(yōu)于現(xiàn)有剪枝、彈性架構及從頭訓練的模型。相比剪枝和知識蒸餾等技術,這種能力能夠顯著降低訓練模型家族的成本。

Proteina:該模型可以生成多樣且可設計的蛋白質骨架,即維持蛋白質結構的框架。它采用 Transformer 模型架構,參數(shù)數(shù)量是此前模型的 5 倍。

SRSA:這個框架解決了使用現(xiàn)有技能庫教會機器人執(zhí)行新任務的難題。這意味著機器人無需從頭學習,而是能夠將現(xiàn)有技能應用并適配到新任務中。研究人員開發(fā)了預測最相關預置技能的框架,使機器人在執(zhí)行未知任務時的零樣本成功率提高了 19%。

STORM:通過僅需少量快照即可推斷出精確的 3D 表示,該模型能夠重建動態(tài)戶外場景,比如行駛的汽車或隨風搖曳的樹木。該模型能夠在 200 毫秒內重建大規(guī)模戶外場景,在自動駕駛開發(fā)中具有應用潛力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    29748

    瀏覽量

    212974
  • NVIDIA
    +關注

    關注

    14

    文章

    5309

    瀏覽量

    106448
  • AI
    AI
    +關注

    關注

    88

    文章

    35167

    瀏覽量

    280105

原文標題:NVIDIA Research 在 ICLR 大會引領新一波多模態(tài)生成式 AI 浪潮

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    華為公布AI基礎設施架構突破性進展

    近日,華為公司常務董事、華為云計算CEO張平安在華為云生態(tài)大會2025上公布了AI基礎設施架構突破性進展——推出基于新型高速總線架構的CloudMatrix 384超節(jié)點集群,并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線。
    的頭像 發(fā)表于 04-12 15:09 ?1025次閱讀

    NVIDIA實現(xiàn)神經網絡渲染技術的突破性增強功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神經網絡渲染技術的突破性增強功能。NVIDIA 與微軟合作,將在 4 月的 Microsoft DirectX 預覽版中增加神經網絡著
    的頭像 發(fā)表于 04-07 11:33 ?447次閱讀

    2025設備管理新范式:生成AI故障知識庫中的創(chuàng)新應用

    生成 AI 提供了全新的解決方案,引領設備管理進入“健康治理”新紀元。傳統(tǒng)設備管理深陷知識困局,知識沉淀遭遇“三重斷點”,而生成
    的頭像 發(fā)表于 03-31 10:44 ?441次閱讀
    2025設備管理新范式:<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b><b class='flag-5'>在</b>故障知識庫中的創(chuàng)新應用

    移遠通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗

    全系智能模組產品已全面接入火山引擎豆包VLM(視覺語言)模態(tài)AI大模型。這一突破性進展表明,搭載移遠任意智能模組的終端設備,均可無縫融合
    發(fā)表于 03-21 14:12 ?285次閱讀
    移遠通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>大模型,重塑智能交互新體驗

    移遠通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗

    智能模組產品已全面接入火山引擎豆包VLM(視覺語言)模態(tài)AI大模型。這一突破性進展表明,搭載移遠任意智能模組的終端設備,均可無縫融合
    的頭像 發(fā)表于 03-20 19:03 ?433次閱讀
    移遠通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>大模型,重塑智能交互新體驗

    NVIDIA Omniverse擴展至生成物理AI領域

    NVIDIA近日宣布,其Omniverse?平臺再次實現(xiàn)重大突破,成功推出多個生成AI模型和藍圖,將Omniverse的應用范圍進一步擴展
    的頭像 發(fā)表于 01-13 10:56 ?769次閱讀

    NVIDIA推出多個生成AI模型和藍圖

    NVIDIA 宣布推出多個生成 AI 模型和藍圖,將 NVIDIA Omniverse 一體化進一步擴展至物理
    的頭像 發(fā)表于 01-08 10:48 ?640次閱讀

    麻省理工科技評論:2025年AI領域突破性技術

    《麻省理工科技評論》于1月3日公布2025年十大突破性技術,其中AI相關技術有:生成AI搜索:整合
    的頭像 發(fā)表于 01-07 23:40 ?1048次閱讀
    麻省理工科技評論:2025年<b class='flag-5'>AI</b><b class='flag-5'>領域</b><b class='flag-5'>突破性</b>技術

    全新NVIDIA NIM微服務實現(xiàn)突破性進展

    全新 NVIDIA NIM 微服務實現(xiàn)突破性進展,可助力氣象技術公司開發(fā)和部署 AI 模型,實現(xiàn)對降雪、結冰和冰雹的預測。
    的頭像 發(fā)表于 11-21 10:07 ?677次閱讀

    NVIDIA助力Amdocs打造生成AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型(LLM)和領域適配模型的解決方案。該公司還在使用
    的頭像 發(fā)表于 11-19 14:48 ?913次閱讀

    高通與智譜推動模態(tài)生成AI體驗的終端側部署

    此前,驍龍峰會首日,智譜與高通技術公司宣布合作將GLM-4V端側視覺大模型,面向驍龍8至尊版進行深度適配和推理優(yōu)化,支持豐富的模態(tài)交互方式,進一步推動模態(tài)
    的頭像 發(fā)表于 11-08 09:55 ?754次閱讀

    AI大模型的最新研究進展

    AI大模型的最新研究進展體現(xiàn)在多個方面,以下是對其最新進展的介紹: 一、技術創(chuàng)新與突破 生成
    的頭像 發(fā)表于 10-23 15:19 ?1539次閱讀

    NVIDIA視覺生成AI的最新進展

    NVIDIA Research 發(fā)表 50 篇論文,介紹 AI 軟件創(chuàng)意產業(yè)、自動駕駛汽車開發(fā)、醫(yī)療和機器人領域的潛在應用。
    的頭像 發(fā)表于 09-09 10:08 ?996次閱讀

    NVIDIA AI助力SAP生成AI助手Joule加速發(fā)展

    美國佛羅里達州奧蘭舉行的 SAP Sapphire 大會上,NVIDIA 與這家企業(yè)軟件公司公布了搭載NVIDIA AI Enterpr
    的頭像 發(fā)表于 09-09 09:37 ?822次閱讀

    NVIDIA加速計算和生成AI領域的創(chuàng)新

    最新發(fā)布的公司 2024 財年可持續(xù)發(fā)展報告開篇的一封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA 加速計算和生成
    的頭像 發(fā)表于 09-09 09:18 ?923次閱讀