99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器人也能純視覺控制?MIT華人博士團(tuán)隊(duì)登上Nature主刊

Hobby觀察 ? 來源:電子發(fā)燒友 ? 作者:梁浩斌 ? 2025-07-16 00:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)“純視覺”的概念在近幾年的智能駕駛領(lǐng)域被提到的次數(shù)不少,特斯拉、小鵬、以及傳聞準(zhǔn)備重組的極越,都早已全面押注到“純視覺”的智能駕駛技術(shù)。一些智駕方案商為了推動(dòng)產(chǎn)品落地,也正在加速推出純視覺的方案,以降低系統(tǒng)成本。

而在機(jī)器人領(lǐng)域,傳感器的應(yīng)用一直都是業(yè)界研究的核心,包括3D ToF相機(jī)、激光雷達(dá)、毫米波雷達(dá)、觸覺傳感器、各種力矩傳感器等,在目前主流的機(jī)器人領(lǐng)域都有廣泛應(yīng)用。

然而最近刊登在Nature主刊上的一篇論文,展示了一個(gè)機(jī)器人“純視覺”方案。

傳統(tǒng)機(jī)器人控制方案

傳統(tǒng)機(jī)器人是由高剛度材料精密加工部件構(gòu)成,在結(jié)構(gòu)上,通過低公差關(guān)節(jié)連接,可以簡化為理想化的剛性連桿運(yùn)動(dòng)學(xué)鏈。而為了讓系統(tǒng)了解目前機(jī)器人的狀態(tài),就需要使用多種傳感器進(jìn)行監(jiān)測,比如在每個(gè)關(guān)節(jié)配備高精度的傳感器,像角度編碼器等,實(shí)時(shí)測量關(guān)節(jié)的狀態(tài)變化,這些數(shù)據(jù)可以用于完整重建機(jī)器人的3D位姿,再通過基于動(dòng)力學(xué)模型設(shè)計(jì)控制算法(如PID、MPC),將期望運(yùn)動(dòng)軌跡轉(zhuǎn)換為執(zhí)行器指令。

論文中提到,傳統(tǒng)的機(jī)器人控制方案存在局限性。首先是依賴機(jī)器人預(yù)設(shè)的結(jié)構(gòu)和傳感器,要求機(jī)器人必須具有離散關(guān)節(jié)和嵌入式傳感器,無法適用于缺乏傳感器的軟體或混合材料機(jī)器人。

其次,在使用柔性結(jié)構(gòu)的機(jī)器人中,需要解決大變形、粘彈性、材料疲勞等復(fù)雜問題,傳統(tǒng)的基于連續(xù)介質(zhì)力學(xué)的模型計(jì)算成本過高,很難實(shí)現(xiàn)實(shí)時(shí)控制。同時(shí),傳統(tǒng)的模型無法處理關(guān)節(jié)間隙或者制造公差導(dǎo)致的非線性動(dòng)態(tài)。

另外,因?yàn)槟P蛯?duì)于機(jī)器人公差的要求非常高,依賴精密制造和高性能材料,成本過高,開發(fā)周期長,不利于機(jī)器人的普及。

“純視覺”機(jī)器人控制方案有什么優(yōu)勢?

該論文由麻省理工學(xué)院(MIT)的多位研究人員合作完成,其中論文前三作分別是李思哲、張安南和陳博遠(yuǎn),均于MIT計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)攻讀博士學(xué)位。

那為什么會(huì)想到用“純視覺”來構(gòu)建機(jī)器人控制系統(tǒng)?論文團(tuán)隊(duì)提到,這項(xiàng)工作的靈感是來自于人類感知,人類通過用游戲控制器來控制機(jī)器人,可以在幾分鐘內(nèi)就學(xué)會(huì)拾取和放置物體,而我們唯一用到的傳感器就是眼睛。

在論文中,該“純視覺”機(jī)器人控制方案是使用了名為Visuomotor Jacobian Field(視覺運(yùn)動(dòng)雅可比場)的技術(shù)。這是一種機(jī)器學(xué)習(xí)方法,可以使用單個(gè)視頻攝像頭獲得的數(shù)據(jù)來控制機(jī)器人。

首先,團(tuán)隊(duì)使用12個(gè)消費(fèi)級(jí)RGB-D視頻攝像頭捕獲的、執(zhí)行隨機(jī)生成命令的多視圖視頻訓(xùn)練了框架,無需人工注釋或?qū)<叶ㄖ萍纯蓪W(xué)習(xí)控制新機(jī)器人。在進(jìn)行訓(xùn)練后,這個(gè)方法僅使用單個(gè)視頻攝像頭就能控制機(jī)器人執(zhí)行期望的動(dòng)作。
wKgZPGh2JD6ABLASAAM6m-vNGPg749.png
其中,視覺運(yùn)動(dòng)雅可比場的框架主要包含兩個(gè)關(guān)鍵部分,首先是一個(gè)基于深度學(xué)習(xí)的狀態(tài)評(píng)估模型,這個(gè)模型可以僅通過單一視頻流就可以推斷出機(jī)器人的三維狀態(tài),編碼了它的三維幾何形狀和微分運(yùn)動(dòng)學(xué),即可以確認(rèn)在任何可能得指令下,機(jī)器人在三維空間中任何點(diǎn)的移動(dòng)方式。

其次是一個(gè)逆動(dòng)力學(xué)控制器,在二維圖像空間或三維空間中一密集的方式將期望的運(yùn)動(dòng)參數(shù)化,實(shí)時(shí)計(jì)算并輸出機(jī)器人控制指令。研究團(tuán)隊(duì)發(fā)現(xiàn),將演示軌跡參數(shù)化為密集的點(diǎn)運(yùn)動(dòng)是控制各種類型機(jī)器人系統(tǒng)的關(guān)鍵,因?yàn)榭勺冃魏挽`巧機(jī)器人的運(yùn)動(dòng)不能被單個(gè)三維框架上指定的剛性變換很好地約束,參數(shù)化使得廣泛的系統(tǒng)可以模仿基于視頻的演示。
wKgZPGh2JEeAbLylAAW7QFugYIc135.png
最終,通過該方法獲得了跨平臺(tái)的機(jī)器人控制能力。團(tuán)隊(duì)在使用16自由度的商用Allegro靈巧手進(jìn)行測試時(shí),關(guān)節(jié)角度誤差可以小于3°,指尖位置誤差小于4mm;使用3D打印的15氣動(dòng)通道軟體手時(shí),可以實(shí)現(xiàn)精準(zhǔn)抓取工具,并具備抗遮擋能力;在采用剪切拉脹材料的HSA柔性腕平臺(tái)上應(yīng)用時(shí),附加350g負(fù)重后仍實(shí)現(xiàn)7.3 mm精度;采用3D打印的Poppy教育機(jī)械臂,零部件公差較大的情況下,誤差可以小于6 mm。

另外該方案能夠?qū)崿F(xiàn)無專家干預(yù)以及機(jī)器人的泛化能力,可以自動(dòng)發(fā)現(xiàn)機(jī)器人的運(yùn)動(dòng)學(xué)結(jié)構(gòu),無需標(biāo)注執(zhí)行器與部件的對(duì)應(yīng)關(guān)系。同時(shí)訓(xùn)練數(shù)據(jù)雖然僅包含隨機(jī)的命令,但可以泛化到未被訓(xùn)練的運(yùn)動(dòng)。

采用該方案進(jìn)行機(jī)器人控制,可以顯著降低機(jī)器人自動(dòng)化的門檻,降低機(jī)器人控制成本。其中關(guān)鍵創(chuàng)新在于將傳統(tǒng)機(jī)器人控制的建模問題轉(zhuǎn)化為基于視覺的自監(jiān)督學(xué)習(xí)問題,為生物啟發(fā)式機(jī)器人的實(shí)際部署開辟了新路徑。




聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29730

    瀏覽量

    212834
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    廣和通視覺技術(shù)在智能割草機(jī)器人領(lǐng)域的應(yīng)用

    。這份來自市場的權(quán)威肯定,印證了視覺技術(shù)路線在智能割草機(jī)器人領(lǐng)域的巨大潛力,以及其賦終端產(chǎn)品的卓越表現(xiàn),成為消費(fèi)者高復(fù)雜專業(yè)工具的購買核心依據(jù)。
    的頭像 發(fā)表于 07-11 11:21 ?341次閱讀

    盤點(diǎn)#機(jī)器人開發(fā)平臺(tái)

    地瓜機(jī)器人RDK X5開發(fā)套件地瓜機(jī)器人RDK X5開發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機(jī)器人開發(fā)套件 Kria KR260機(jī)器人開發(fā)套件 Kria KR260-
    發(fā)表于 05-13 15:02

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    閱讀心得體會(huì):ROS2機(jī)器人視覺與地圖構(gòu)建技術(shù) 通過對(duì)本書第7章(ROS2視覺應(yīng)用)和第8章(ROS2地圖構(gòu)建)的學(xué)習(xí),我對(duì)機(jī)器人視覺感知和
    發(fā)表于 05-03 19:41

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品

    識(shí)別聯(lián)調(diào)。 進(jìn)迭時(shí)空致力于為智能機(jī)器人提供完整全棧優(yōu)化的RISC-V AI軟硬件解決方案,第一代RISC-V AI CPU芯片K1已完成AI視覺感知、AI語音處理、自動(dòng)避障、路徑規(guī)劃、運(yùn)動(dòng)控制
    發(fā)表于 04-25 17:59

    海康機(jī)器人布局關(guān)節(jié)機(jī)器人業(yè)務(wù)

    關(guān)節(jié)機(jī)器人領(lǐng)域迎來一位實(shí)力選手。繼布局移動(dòng)機(jī)器人機(jī)器視覺業(yè)務(wù)后,海康機(jī)器人正在拓展新的產(chǎn)品線。
    的頭像 發(fā)表于 03-20 10:47 ?724次閱讀

    名單公布!【書籍評(píng)測活動(dòng)NO.58】ROS 2智能機(jī)器人開發(fā)實(shí)踐

    手機(jī)為平臺(tái)的移動(dòng)互聯(lián)網(wǎng)時(shí)代,下一個(gè)以機(jī)器人為核心的智能機(jī)器人時(shí)代,是否會(huì)遵循這樣的邏輯? 隨著ROS 2的誕生,智能機(jī)器人開發(fā)迎來新篇章 ,它不僅為開發(fā)者提供了更為強(qiáng)大、靈活的工具,
    發(fā)表于 03-03 14:18

    寧德時(shí)代自研機(jī)器人團(tuán)隊(duì)成立

    寧德時(shí)代在機(jī)器人領(lǐng)域的布局正逐步展開。去年底,該公司開始加大對(duì)機(jī)器人領(lǐng)域的投入,并已在上海組建了一支由數(shù)十構(gòu)成的團(tuán)隊(duì),專注于自研機(jī)器人本體
    的頭像 發(fā)表于 02-12 09:22 ?587次閱讀

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊

    具身智能機(jī)器人的基礎(chǔ)模塊,這個(gè)是本書的第二部分內(nèi)容,主要分為四個(gè)部分:機(jī)器人計(jì)算系統(tǒng),自主機(jī)器人的感知系統(tǒng),自主機(jī)器人的定位系統(tǒng),自主機(jī)器人
    發(fā)表于 01-04 19:22

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+兩本互為支持的書

    之極。 《計(jì)算機(jī)視覺之PyTorch數(shù)字圖像處理》為《具身智能機(jī)器人系統(tǒng)》提供了感知和識(shí)別能力,而《具身智能機(jī)器人系統(tǒng)》則為《計(jì)算機(jī)視覺之PyTorch數(shù)字圖像處理》提供了執(zhí)行體。讀好
    發(fā)表于 01-01 15:50

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型

    。 多模態(tài)融合的創(chuàng)新與突破 機(jī)器人控制技術(shù)的另一個(gè)重要突破在于多模態(tài)大模型的應(yīng)用。相比于僅通過文字進(jìn)行人機(jī)交互的傳統(tǒng)方法,現(xiàn)代機(jī)器人能夠融合視覺、聲音、定位等多模態(tài)輸入信息,為任務(wù)執(zhí)行
    發(fā)表于 12-29 23:04

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    的快速發(fā)展,相關(guān)人才的需求在不斷增加,通過閱讀該書可以幫助大家系統(tǒng)性地了解和分析當(dāng)前具身智能機(jī)器人系統(tǒng)的發(fā)展現(xiàn)狀和前沿研究,為未來的研究和開發(fā)工作提供指導(dǎo)。此外,本書還可以為研究人員和工程師提供具體
    發(fā)表于 12-20 19:17

    《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

    搜索策略等規(guī)劃算法,強(qiáng)調(diào)了軌跡規(guī)劃需要考慮機(jī)器人的運(yùn)動(dòng)學(xué)約束。在軌跡規(guī)劃中,機(jī)器人需要同時(shí)考慮最大曲率、加速度限制等物理約束,生成平滑可行的運(yùn)動(dòng)軌跡。強(qiáng)化學(xué)習(xí)在規(guī)劃控制中的應(yīng)用很有創(chuàng)
    發(fā)表于 12-19 22:26

    解鎖機(jī)器人視覺與人工智能的潛力,從“盲人機(jī)器”改造成有視覺能力的機(jī)器人(上)

    正如人類依賴眼睛和大腦來解讀世界,機(jī)器人需要自己的視覺系統(tǒng)來有效運(yùn)作。沒有視覺,機(jī)器人就如同蒙上雙眼的人類,僅能執(zhí)行預(yù)編程的命令,容易碰撞
    的頭像 發(fā)表于 10-12 09:56 ?786次閱讀
    解鎖<b class='flag-5'>機(jī)器人</b><b class='flag-5'>視覺</b>與人工智能的潛力,從“盲人<b class='flag-5'>機(jī)器</b>”改造成有<b class='flag-5'>視覺</b>能力的<b class='flag-5'>機(jī)器人</b>(上)

    AMD贊助多支FIRST機(jī)器人競賽團(tuán)隊(duì)

    AMD 在 2024 賽季贊助了多支 FIRST 機(jī)器人競賽團(tuán)隊(duì)。FIRST 機(jī)器人競賽旨在教導(dǎo)高中生如何構(gòu)建能夠執(zhí)行特定任務(wù)的機(jī)器人,同時(shí)
    的頭像 發(fā)表于 09-18 09:45 ?870次閱讀

    焊接機(jī)器人視覺控制技術(shù)有哪些組成

    了提升焊接精度和自動(dòng)化水平的重要手段。今天創(chuàng)想智控小編和大家一起了解焊接機(jī)器人視覺控制技術(shù)由哪些組成。 ? 焊接機(jī)器人視覺
    的頭像 發(fā)表于 08-15 16:23 ?660次閱讀