99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)RGB-D SLAM系統(tǒng)

INDEMIND ? 來源:INDEMIND ? 2025-07-04 15:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期用于視覺SLAM的3D高斯?jié)姙R(3DGS)技術(shù)在跟蹤和高保真建圖方面取得了顯著進(jìn)展。然而,其順序優(yōu)化框架以及對(duì)動(dòng)態(tài)物體的敏感性限制了其在現(xiàn)實(shí)場(chǎng)景中的實(shí)時(shí)性能和魯棒性。為此,我們提出了UP-SLAM,這是一種適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)RGB-D SLAM系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,UP-SLAM在定位精度方面(高出59.8%)和渲染質(zhì)量方面(峰值信噪比高出4.57分貝)均優(yōu)于最先進(jìn)的方法,同時(shí)保持實(shí)時(shí)性能,并在動(dòng)態(tài)環(huán)境中生成可重復(fù)使用且無偽影的靜態(tài)地圖。

? 文章:

UP-SLAM: Adaptively Structured Gaussian SLAM with Uncertainty Prediction in Dynamic Environments

? 作者:

Wancai Zheng, Linlin Ou, Jiajie He, Libo Zhou, Xinyi Yu, Yan Wei

? 論文鏈接:

https://arxiv.org/abs/2505.22335

? 編譯:

INDEMIND

01 本文核心內(nèi)容

視覺SLAM是具身智能和虛擬現(xiàn)實(shí)的核心技術(shù)。傳統(tǒng)的SLAM算法通常假設(shè)環(huán)境是靜態(tài)的,這促進(jìn)了眾多有效系統(tǒng)的開發(fā)。然而,這種假設(shè)限制了SLAM在動(dòng)態(tài)現(xiàn)實(shí)環(huán)境中的適用性,從而阻礙了機(jī)器人技術(shù)及相關(guān)領(lǐng)域的進(jìn)步。近期的SLAM方法利用物體檢測(cè)和多視圖幾何理論來降低動(dòng)態(tài)物體的影響。盡管這些方法增強(qiáng)了系統(tǒng)在動(dòng)態(tài)環(huán)境中的魯棒性,但它們嚴(yán)重依賴于對(duì)動(dòng)態(tài)物體的先驗(yàn)知識(shí)以及檢測(cè)算法的可靠性。高保真場(chǎng)景表示技術(shù)的進(jìn)步,如神經(jīng)輻射場(chǎng)(NeRF)和3D高斯?jié)姙R(3DGS),激發(fā)了將不確定性建模引入3D重建的探索。

近期的研究表明,納入不確定性預(yù)測(cè)能夠顯著增強(qiáng)對(duì)瞬態(tài)場(chǎng)景元素的魯棒性。這些具有不確定性感知能力的模型即使在間歇性遮擋的情況下也能實(shí)現(xiàn)高質(zhì)量的重建。然而,這些方法依賴于有利條件,例如精確的相機(jī)姿態(tài)和稀疏的視角,這在使用連續(xù)幀輸入的SLAM系統(tǒng)中很難實(shí)現(xiàn)。為了解決這些挑戰(zhàn),我們提出了一種名為UP-SLAM的實(shí)時(shí)RGB-D SLAM系統(tǒng),用于動(dòng)態(tài)環(huán)境中的穩(wěn)健姿態(tài)估計(jì)和靜態(tài)場(chǎng)景重建。

我們的方法將3DGS壓縮為由多個(gè)淺層多層感知機(jī)(MLP)編碼的結(jié)構(gòu)化錨點(diǎn)。引入概率八叉樹以實(shí)現(xiàn)錨點(diǎn)的自適應(yīng)調(diào)整,從而刪除由動(dòng)態(tài)物體引起的冗余錨點(diǎn)。此外,通過將運(yùn)動(dòng)掩碼生成與地圖優(yōu)化解耦,UP-SLAM實(shí)現(xiàn)了同步跟蹤和建圖,支持實(shí)時(shí)定位。在跟蹤過程中,我們提出了一種無需訓(xùn)練、基于優(yōu)化的多模態(tài)一致性估計(jì)方法,該方法融合了幾何線索與DINO特征,以實(shí)現(xiàn)有效的動(dòng)態(tài)物體識(shí)別。在映射過程中,為了進(jìn)一步增強(qiáng)動(dòng)態(tài)條件下的重建效果,設(shè)計(jì)了一種利用正弦位置編碼的時(shí)間編碼器,將幀間信息嵌入到多層感知機(jī)(MLP)中,從而提高表示能力。此外,動(dòng)態(tài)對(duì)象在不同幀中不一致的外觀和運(yùn)動(dòng)為不確定性預(yù)測(cè)提供了有價(jià)值的線索。因此,將魯棒的DINO特征輸入到淺層MLP中進(jìn)行逐像素不確定性估計(jì),從而實(shí)現(xiàn)連續(xù)的運(yùn)動(dòng)掩碼細(xì)化,并增強(qiáng)重建的魯棒性。

本文的貢獻(xiàn)可概括為:

?提出了一種不確定性感知的并行跟蹤與映射框架,無需依賴預(yù)定義的語義標(biāo)注即可有效減輕動(dòng)態(tài)干擾,從而構(gòu)建高質(zhì)量、無偽影的靜態(tài)地圖。

?提出了一種具有概率八叉樹的自適應(yīng)結(jié)構(gòu)化3DGS場(chǎng)景表示,支持在動(dòng)態(tài)環(huán)境中自動(dòng)分配或修剪高斯基元。這種方法提高了定位精度并減小了模型大小。

?將方法整合到ORB-SLAM3中,并在多個(gè)數(shù)據(jù)集上進(jìn)行了全面評(píng)估。此外,還引入了一種在動(dòng)態(tài)環(huán)境中評(píng)估渲染質(zhì)量的協(xié)議。

?項(xiàng)目地址:https://aczheng-cai.github.io/up_slam.github.io/

02 方法架構(gòu)

圖2展示了UP-SLAM系統(tǒng)的概覽。

be73f46a-52e3-11f0-b715-92fbcf53809c.png

UP-SLAM以一系列RGB和深度圖像作為輸入,并采用并行化的跟蹤和建圖架構(gòu)來提高整體效率。在跟蹤線程中,系統(tǒng)執(zhí)行實(shí)時(shí)定位并生成用于建圖的關(guān)鍵幀。動(dòng)態(tài)區(qū)域檢測(cè)由來自建圖線程的多模態(tài)殘差引導(dǎo),從而實(shí)現(xiàn)穩(wěn)健且實(shí)時(shí)的跟蹤。建圖線程采用概率錨點(diǎn)來構(gòu)建自適應(yīng)結(jié)構(gòu)化的3DGS表示,這在減小模型大小的同時(shí)提高了重建質(zhì)量。為了在動(dòng)態(tài)環(huán)境中提高建圖質(zhì)量,從DINOv2中提取的穩(wěn)健2D視覺特征被蒸餾到3DGS表示中以構(gòu)建多模態(tài)殘差,這些殘差監(jiān)督淺層MLP進(jìn)行逐像素不確定性預(yù)測(cè),并實(shí)現(xiàn)運(yùn)動(dòng)掩碼的持續(xù)優(yōu)化。

03 實(shí)驗(yàn)結(jié)果

1. 實(shí)驗(yàn)設(shè)置

為了證明所提方法的優(yōu)勢(shì),我們將它與16種方法進(jìn)行了比較,這些方法按以下類別劃分:

(a)經(jīng)典SLAM方法:ORB-SLAM3;

(b)經(jīng)典動(dòng)態(tài)SLAM方法:ReFusion、DynaSLAM、EM-Fusion;

(c)基于NeRF的SLAM方法:iMAP、NICE-SLAM、Vox-Fusion、Co-SLAM、ESLAM;

(d)基于NeRF的動(dòng)態(tài)SLAM:RoDyn-SLAM;

(e)基于3DGS的SLAM:Photo-SLAM、GS-SLAM、SplaTAM;

(f)基于3DGS的動(dòng)態(tài)SLAM方法:DG-SLAM、Gassidy、WildGS-SLAM。

所有方法均使用動(dòng)態(tài)數(shù)據(jù)集進(jìn)行評(píng)估,具體包括TUMRGB-D數(shù)據(jù)集、波恩RGB-D數(shù)據(jù)集以及MoCapRGB-D數(shù)據(jù)集,此外還使用了一個(gè)靜態(tài)環(huán)境數(shù)據(jù)集ScanNet數(shù)據(jù)集。對(duì)于非開源方法,我們報(bào)告原始結(jié)果;對(duì)于開源方法,我們報(bào)告五次運(yùn)行的平均結(jié)果。加粗字體表示最佳結(jié)果,下劃線表示次優(yōu)結(jié)果。我們從每個(gè)類別中選取了具有代表性的基線方法。

2. 跟蹤性能評(píng)估

動(dòng)態(tài)場(chǎng)景

與DG-SLAM相比,我們的方法在定位精度上平均提高了59.8%。值得注意的是,如表2所示,其平均定位精度提高了84.7%,這主要是因?yàn)镈G-SLAM基于歷史幾何信息實(shí)現(xiàn)了開放集能力,但在復(fù)雜的動(dòng)態(tài)環(huán)境中不夠穩(wěn)健。盡管DynaSLAM在表3中表現(xiàn)良好,這是由于其預(yù)定義的動(dòng)態(tài)物體處理策略,但在表1、2中出現(xiàn)了明顯的漂移。這種性能下降源于這些數(shù)據(jù)集中存在大量難以預(yù)先定義的動(dòng)態(tài)物體,尤其是在表2和雨傘(Umb.)序列中。

be84e9f0-52e3-11f0-b715-92fbcf53809c.png

be90c9dc-52e3-11f0-b715-92fbcf53809c.png

靜態(tài)場(chǎng)景

在公開的靜態(tài)ScanNet數(shù)據(jù)集上對(duì)UP-SLAM進(jìn)行評(píng)估,以檢驗(yàn)其魯棒性。雖然動(dòng)態(tài)物體識(shí)別被用于提高動(dòng)態(tài)環(huán)境中的SLAM系統(tǒng)的魯棒性,但識(shí)別不準(zhǔn)確可能會(huì)對(duì)靜態(tài)場(chǎng)景中的定位精度產(chǎn)生不利影響。如表5所示,我們的方法在定位精度上比為靜態(tài)環(huán)境設(shè)計(jì)的SLAM系統(tǒng)平均提高了10.2%。此外,它還實(shí)現(xiàn)了8.1%的提升。與同樣適用于動(dòng)態(tài)場(chǎng)景的DG-SLAM相比,平均改進(jìn)情況。結(jié)果表明,我們的方法在靜態(tài)和動(dòng)態(tài)環(huán)境中均保持了強(qiáng)勁的性能。

bea155fe-52e3-11f0-b715-92fbcf53809c.png

3. 映射性能評(píng)估

如表6所示,我們的方法在渲染質(zhì)量方面取得了顯著提升,峰值信噪比(PSNR)平均提高了5.47分貝。Photo-SLAM的渲染質(zhì)量與WildGSSLAM相當(dāng),這主要得益于其在低動(dòng)態(tài)序列(例如Ball_track和Mv_box2)中的魯棒性。然而,在高度動(dòng)態(tài)的環(huán)境中,定位失敗削弱了渲染結(jié)果的實(shí)際意義。此外,DG-SLAM缺乏穩(wěn)健的高斯基元初始化策略,導(dǎo)致重建不完整,顯著降低了渲染質(zhì)量。圖4提供了渲染結(jié)果的視覺比較。兩種靜態(tài)SLAM方法,SplaTAM和Photo-SLAM,無法生成靜態(tài)地圖。DG-SLAM和單目動(dòng)態(tài)SLAM方法WildGS-SLAM均存在不同程度的失敗。相比之下,UP-SLAM能夠有效去除動(dòng)態(tài)物體,并構(gòu)建出高保真、無偽影的靜態(tài)地圖。

beaf125c-52e3-11f0-b715-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50441
  • SLAM
    +關(guān)注

    關(guān)注

    24

    文章

    441

    瀏覽量

    32509
  • 視覺
    +關(guān)注

    關(guān)注

    1

    文章

    163

    瀏覽量

    24375
  • 3維動(dòng)態(tài)環(huán)境

    關(guān)注

    0

    文章

    2

    瀏覽量

    864

原文標(biāo)題:高精度、高魯棒!面向動(dòng)態(tài)環(huán)境的實(shí)時(shí)視覺SLAM,動(dòng)態(tài)、靜態(tài)環(huán)境雙提升!

文章出處:【微信號(hào):gh_c87a2bc99401,微信公眾號(hào):INDEMIND】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    一種適用于模擬/數(shù)字混合信號(hào)環(huán)境的接地技術(shù)

    本文分享了一種適用于模擬/數(shù)字混合信號(hào)環(huán)境的接地技術(shù)。
    發(fā)表于 04-25 07:46

    一種適用于室內(nèi)復(fù)雜環(huán)境的高精度、環(huán)境自適應(yīng)性強(qiáng)的定位算法

    摘要對(duì)于室內(nèi)復(fù)雜環(huán)境來說, 適用于室外定位的 GPS 系統(tǒng)和蜂窩移動(dòng)網(wǎng)絡(luò)在室內(nèi)中的定位精度明顯惡化, 無法滿足室內(nèi)用戶精確定位的需求。因此, 研究一種
    發(fā)表于 08-18 08:12

    如何去開發(fā)款基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)

    基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)?如何去開發(fā)款基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)?基于
    發(fā)表于 09-08 06:12

    一種適用于嵌入式系統(tǒng)的模塊動(dòng)態(tài)加載技術(shù)

    嵌入式系統(tǒng)中的模塊動(dòng)態(tài)加載技術(shù)摘要提出一種適用于嵌入式系統(tǒng)的模塊動(dòng)態(tài)加載技術(shù),設(shè)計(jì)實(shí)現(xiàn)簡(jiǎn)單,占用
    發(fā)表于 12-20 06:32

    RGB-D圖像是什么

    RGB-D圖像其實(shí)是兩幅圖像。
    的頭像 發(fā)表于 11-01 11:46 ?1.9w次閱讀

    一種適用于動(dòng)態(tài)場(chǎng)景的SLAM方法

    同時(shí)定位與地圖構(gòu)建(SLAM)作為機(jī)器人領(lǐng)域的硏究熱點(diǎn),近年來取得了快速發(fā)展,但多數(shù)SLAM方法未考慮應(yīng)用場(chǎng)景中的動(dòng)態(tài)或可移動(dòng)目標(biāo)。針對(duì)該問題,提出一種
    發(fā)表于 03-18 10:39 ?21次下載
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動(dòng)態(tài)</b>場(chǎng)景的<b class='flag-5'>SLAM</b>方法

    用于SLAM的神經(jīng)隱含可擴(kuò)展編碼

    我們提出了NICE-SLAM,個(gè)密集的RGB-D SLAM系統(tǒng),它具有實(shí)時(shí)性、可擴(kuò)展性、預(yù)測(cè)性
    的頭像 發(fā)表于 01-30 11:19 ?1011次閱讀

    用于快速高保真RGB-D表面重建的神經(jīng)特征網(wǎng)格優(yōu)化的GO-Surf

    我們提出了GO-Surf,一種直接的特征網(wǎng)格優(yōu)化方法,用于RGB-D序列中準(zhǔn)確和快速地重建表面。
    的頭像 發(fā)表于 03-17 16:35 ?1014次閱讀

    用于神經(jīng)場(chǎng)SLAM的矢量化對(duì)象建圖

    vMAP 是一種基于神經(jīng)場(chǎng)的對(duì)象級(jí)密集 SLAM 系統(tǒng),可根據(jù) RGB-D 輸入流實(shí)時(shí)自動(dòng)構(gòu)建對(duì)象級(jí)場(chǎng)景模型。
    的頭像 發(fā)表于 06-15 09:29 ?1136次閱讀
    <b class='flag-5'>用于</b>神經(jīng)場(chǎng)<b class='flag-5'>SLAM</b>的矢量化對(duì)象建圖

    個(gè)動(dòng)態(tài)環(huán)境下的實(shí)時(shí)語義RGB-D SLAM系統(tǒng)

    大多數(shù)現(xiàn)有的視覺SLAM方法嚴(yán)重依賴于靜態(tài)世界假設(shè),在動(dòng)態(tài)環(huán)境中很容易失效。本文提出了個(gè)動(dòng)態(tài)環(huán)境
    的頭像 發(fā)表于 08-25 16:49 ?1082次閱讀
    <b class='flag-5'>一</b>個(gè)<b class='flag-5'>動(dòng)態(tài)</b><b class='flag-5'>環(huán)境</b>下的<b class='flag-5'>實(shí)時(shí)</b>語義<b class='flag-5'>RGB-D</b> <b class='flag-5'>SLAM</b><b class='flag-5'>系統(tǒng)</b>

    一種適用于動(dòng)態(tài)場(chǎng)景的多層次地圖構(gòu)建算法

    本文提出了一種適用于動(dòng)態(tài)場(chǎng)景的多層次地圖構(gòu)建算法,如圖1所示的系統(tǒng)框架。首先,利用YOLOX[8]獲取場(chǎng)景的語義信息,采用多目標(biāo)跟蹤算法對(duì)漏檢進(jìn)行補(bǔ)償,利用DBSCAN密度聚類算法和深
    發(fā)表于 08-28 10:56 ?1040次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動(dòng)態(tài)</b>場(chǎng)景的多層次地圖構(gòu)建算法

    一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng)

    提出了一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng),該系統(tǒng)由完整的前端和后端模塊組成,包括里程計(jì)、回環(huán)檢測(cè)、子圖融
    的頭像 發(fā)表于 11-29 10:35 ?950次閱讀
    <b class='flag-5'>一種</b>基于<b class='flag-5'>RGB-D</b>圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(<b class='flag-5'>SLAM</b>)<b class='flag-5'>系統(tǒng)</b>

    常用的RGB-D SLAM解決方案

    BundleFusion是一種稠密的實(shí)時(shí)室內(nèi)場(chǎng)景三維重建算法框架。輸入為RGB-D相機(jī)采集的并且是對(duì)齊好的RGB圖像和深度圖的數(shù)據(jù)流。輸出為重建好的稠密三維場(chǎng)景模型。
    的頭像 發(fā)表于 04-16 09:37 ?1563次閱讀
    常用的<b class='flag-5'>RGB-D</b> <b class='flag-5'>SLAM</b>解決方案

    一種適用于動(dòng)態(tài)環(huán)境實(shí)時(shí)視覺SLAM系統(tǒng)

    既能保證效率和精度,又無需GPU,行業(yè)第個(gè)達(dá)到此目標(biāo)的視覺動(dòng)態(tài)SLAM系統(tǒng)。
    的頭像 發(fā)表于 09-30 14:35 ?1348次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動(dòng)態(tài)</b><b class='flag-5'>環(huán)境</b>的<b class='flag-5'>實(shí)時(shí)</b>視覺<b class='flag-5'>SLAM</b><b class='flag-5'>系統(tǒng)</b>

    一種適用于動(dòng)態(tài)環(huán)境的3DGS-SLAM系統(tǒng)

    當(dāng)前基于神經(jīng)輻射場(chǎng)(NeRF)或3D高斯?jié)姙R(3DGS)的SLAM方法在重建靜態(tài)3D場(chǎng)景方面表現(xiàn)出色,但在動(dòng)態(tài)環(huán)境中的跟蹤和重建方面卻面臨著
    的頭像 發(fā)表于 06-13 10:10 ?310次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動(dòng)態(tài)</b><b class='flag-5'>環(huán)境</b>的3DGS-<b class='flag-5'>SLAM</b><b class='flag-5'>系統(tǒng)</b>