近日,北京大學(xué)與智元機(jī)器人的聯(lián)合實(shí)驗(yàn)室有了重大成果,北?攜?智元機(jī)器?團(tuán)隊(duì)提出 OmniManip 架構(gòu)。
在具身智能領(lǐng)域,將視覺(jué)語(yǔ)言基礎(chǔ)模型(VLMs)應(yīng)用于機(jī)器人實(shí)現(xiàn)通用操作一直是核心問(wèn)題。目前存在兩大挑戰(zhàn),一是VLMs缺乏精確3D理解能力,二是難以將高層次推理轉(zhuǎn)化為機(jī)器人低層次動(dòng)作。
為解決這些難題,OmniManip架構(gòu)應(yīng)運(yùn)而生。它基于以對(duì)象為中心的3D交互基元,把VLM的高層次推理能力轉(zhuǎn)化為機(jī)器人的低層次高精度動(dòng)作。針對(duì)大模型幻覺(jué)和真實(shí)環(huán)境操作的不確定性,OmniManip引入了VLM規(guī)劃和機(jī)器人執(zhí)行的雙閉環(huán)系統(tǒng)設(shè)計(jì)。
OmniManip的關(guān)鍵設(shè)計(jì)亮點(diǎn)頗多,包括基于VLM的任務(wù)解析,可將復(fù)雜任務(wù)分解為多個(gè)明確主動(dòng)物體、被動(dòng)物體和動(dòng)作類型的結(jié)構(gòu)化階段。還有閉環(huán)機(jī)器人執(zhí)行,通過(guò)物體6D姿態(tài)跟蹤器實(shí)時(shí)更新物體位姿,轉(zhuǎn)換為機(jī)械臂操作軌跡。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29757瀏覽量
213055 -
語(yǔ)言模型
+關(guān)注
關(guān)注
0文章
561瀏覽量
10802
發(fā)布評(píng)論請(qǐng)先 登錄
智子科技攜小智機(jī)器人首秀高校講臺(tái)
宇樹(shù)科技攜兩款機(jī)器人亮相2025GDC
寧德時(shí)代自研機(jī)器人團(tuán)隊(duì)成立,探索多元科技領(lǐng)域
字節(jié)豆包大模型團(tuán)隊(duì)提出稀疏模型架構(gòu)
字節(jié)豆包大模型團(tuán)隊(duì)推出UltraMem稀疏架構(gòu)
寧德時(shí)代自研機(jī)器人團(tuán)隊(duì)成立
智元與匯川加碼,機(jī)器人如何利好電機(jī)市場(chǎng)?
《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型
走進(jìn)北大 | 算能RISC-V通用處理器設(shè)計(jì)成功開(kāi)課

“0元購(gòu)”智元靈犀X1機(jī)器人,軟硬件全套圖紙和代碼全公開(kāi)!資料免費(fèi)下載!
飛利浦家電全球首席執(zhí)行官攜全球高層團(tuán)隊(duì)來(lái)華 持續(xù)看好中國(guó)市場(chǎng)

【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 未知領(lǐng)域的感受
AMD贊助多支FIRST機(jī)器人競(jìng)賽團(tuán)隊(duì)
軟通動(dòng)力與智元機(jī)器人攜手亮相世界機(jī)器人大會(huì)

評(píng)論