99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MG-SLAM:融合結(jié)構(gòu)化線特征優(yōu)化高斯SLAM算法

3D視覺工坊 ? 來源:計(jì)算機(jī)視覺工坊 ? 2024-11-11 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

0. 這篇文章干了啥?

同步定位與地圖構(gòu)建 (SLAM) 是計(jì)算機(jī)視覺中的一個(gè)基本問題,旨在在同時(shí)跟蹤相機(jī)姿勢的同時(shí)對環(huán)境進(jìn)行地圖構(gòu)建?;趯W(xué)習(xí)的密集 SLAM 方法,尤其是神經(jīng)輻射場 (NeRF) 方法,在捕獲密集光度信息和提供準(zhǔn)確的全局重建方面表現(xiàn)出顯著的進(jìn)步,而傳統(tǒng)系統(tǒng)則基于稀疏點(diǎn)云或體素。然而,NeRF 方法仍然存在過度平滑、場景表示受限和計(jì)算效率低下等缺點(diǎn)。最近,基于高斯的 SLAM已成為一種利用體積輻射場的有前途的方法。利用顯式 3D 高斯表示,高斯 SLAM 可提供高保真渲染和細(xì)粒度場景重建,從而克服了基于 NeRF 的方法的局限性。

盡管高斯 SLAM 具有優(yōu)勢,但它在室內(nèi)場景中仍面臨顯著挑戰(zhàn),因?yàn)槭覂?nèi)場景通常以無紋理表面和復(fù)雜的空間布局為特征。這些環(huán)境由于缺乏相機(jī)姿勢優(yōu)化所必需的足夠紋理細(xì)節(jié)而阻礙了穩(wěn)健的跟蹤。此外,由于遮擋或視野覆蓋有限,室內(nèi)場景的復(fù)雜幾何形狀通常會導(dǎo)致大量未觀察到的區(qū)域。這些看不見的區(qū)域?qū)Ω咚?SLAM 構(gòu)成了關(guān)鍵但尚未探索的挑戰(zhàn),因?yàn)楦咚贡硎竞茈y在沒有多視圖優(yōu)化的情況下插入未觀察到的幾何形狀。因此,地圖上看不見的區(qū)域留下了大量的漏洞和空白,這個(gè)問題在以前的高斯 SLAM 研究中基本上被忽視了。

為了克服這些挑戰(zhàn),我們利用著名的曼哈頓世界假設(shè)作為細(xì)化和完成場景幾何圖形的基礎(chǔ)策略。該假設(shè)認(rèn)為,構(gòu)建的環(huán)境主要遵循網(wǎng)格狀結(jié)構(gòu),表面和線條與三個(gè)正交方向?qū)R。這些線條和平面對高斯 SLAM 系統(tǒng)中的跟蹤和映射過程施加了有意義的約束。具體來說,我們涵蓋了跟蹤、映射和場景完成方面的增強(qiáng)。在跟蹤中,我們利用從結(jié)構(gòu)化場景中得出的線特征作為無紋理區(qū)域中的穩(wěn)健特征基礎(chǔ),對這些線段進(jìn)行反向投影和重新投影以進(jìn)行姿勢優(yōu)化和全束調(diào)整。在映射中,我們對重新投影的線特征應(yīng)用光度損失來細(xì)化地圖。這種方法確保重建的場景緊密遵循環(huán)境的真實(shí)結(jié)構(gòu),從而提高其幾何精度和渲染質(zhì)量。此外,曼哈頓世界假設(shè)有助于識別和插值結(jié)構(gòu)化表面,例如地板和天花板。這些平面對于定義空間的整體幾何形狀至關(guān)重要,但在捕獲的視圖中通常會被部分遮擋或缺失。通過分割這些不完整的表面(通過提取的線作為邊界進(jìn)行細(xì)化),我們可以通過生成新的高斯函數(shù)來預(yù)測它們在直接觀察到的部分之外的延續(xù)。這種策略使我們能夠優(yōu)化場景中大表面的表示,從而增強(qiáng)渲染地圖的完整性。最后,我們通過泊松重構(gòu)合并正則化項(xiàng),將高斯表示壓縮為網(wǎng)格表面。這種方法能夠提取以前在高斯 SLAM 系統(tǒng)中無法獲得的高質(zhì)量網(wǎng)格,使其隨時(shí)可用于下游任務(wù)。

下面一起來閱讀一下這項(xiàng)工作~

1. 論文信息

標(biāo)題:Structure Gaussian SLAM with Manhattan World Hypothesis

作者:Shuhong Liu, Heng Zhou, Liuzhuozheng Li, Yun Liu, Tianchen Deng, Yiming Zhou, Mingrui Li

機(jī)構(gòu):東京大學(xué)、哥倫比亞大學(xué)、國家信息學(xué)研究所、上海交通大學(xué)、薩爾州應(yīng)用科學(xué)大學(xué)、大連理工大學(xué)

原文鏈接:https://arxiv.org/abs/2405.20031v1

2. 摘要

高斯 SLAM 系統(tǒng)在提高實(shí)時(shí)重建的效率和保真度方面取得了重大進(jìn)展。然而,這些系統(tǒng)在復(fù)雜的室內(nèi)環(huán)境中經(jīng)常會遇到不完整的重建,其特點(diǎn)是由于障礙物或有限的視角導(dǎo)致未觀察到的幾何形狀而產(chǎn)生大量空洞。為了應(yīng)對這一挑戰(zhàn),我們提出了曼哈頓高斯 SLAM (MG-SLAM),這是一個(gè)利用曼哈頓世界假設(shè)來提高幾何準(zhǔn)確性和完整性的 RGB-D 系統(tǒng)。通過無縫集成來自結(jié)構(gòu)化場景的融合線段,MG-SLAM 可確保在無紋理的室內(nèi)區(qū)域中進(jìn)行穩(wěn)健的跟蹤。此外,提取的線和平面假設(shè)允許在缺失幾何形狀的區(qū)域中戰(zhàn)略性地插入新的高斯函數(shù),從而實(shí)現(xiàn)高效的場景完成。在合成場景和真實(shí)世界場景上進(jìn)行的大量實(shí)驗(yàn)表明,這些進(jìn)步使我們的方法能夠?qū)崿F(xiàn)最先進(jìn)的性能,標(biāo)志著高斯 SLAM 系統(tǒng)功能的顯著提升。

3. 效果展示

MG-SLAM 利用線段在相機(jī)姿態(tài)估計(jì)和場景重建方面實(shí)現(xiàn) SOTA 結(jié)果。此外,通過應(yīng)用結(jié)構(gòu)表面約束,我們通過對缺失的幾何體進(jìn)行新的高斯插值來增強(qiáng)和完善場景。

10f385ec-9053-11ef-a511-92fbcf53809c.png

在Replica Apartment 數(shù)據(jù)集場景 frl_apartment_4 上的線段提取結(jié)果的消融實(shí)驗(yàn)。

113851ea-9053-11ef-a511-92fbcf53809c.png

4. 主要貢獻(xiàn)

? 我們提出了 MG-SLAM,這是一種新穎的 RGB-D 高斯 SLAM 系統(tǒng),它利用了曼哈頓世界假設(shè) [5]。該假設(shè)引入了線和平面,用于神經(jīng)密集型 SLAM 系統(tǒng)的穩(wěn)健跟蹤、地圖細(xì)化和表面補(bǔ)全。

? 我們使用提取的代表平面邊界的線段建立假設(shè)表面。這些表面指導(dǎo)我們有效地插入新的高斯函數(shù)來填補(bǔ)重建地圖中的間隙和空洞,無縫解決當(dāng)前高斯 SLAM 系統(tǒng)由于未觀察到的幾何形狀而面臨限制的區(qū)域。

? 在大型合成和真實(shí)世界數(shù)據(jù)集上進(jìn)行的大量實(shí)驗(yàn)表明,我們的系統(tǒng)提供了最先進(jìn)的 (SOTA) 跟蹤和全面的地圖重建,在真實(shí)世界場景中實(shí)現(xiàn)了 ATE 降低 50% 和 PSNR 增強(qiáng) 5dB,同時(shí)以極高的幀速率運(yùn)行。這些進(jìn)步明顯優(yōu)于以前的高斯 SLAM 系統(tǒng)。

5. 基本原理是啥?

所提出的 MG-SLAM 的兩階段流水線圖示。上部可視化了跟蹤和建圖系統(tǒng)的并行過程。下部展示了場景完成和網(wǎng)格提取的后優(yōu)化。在曼哈頓世界假設(shè)的約束下,MG-SLAM 引入了線段和結(jié)構(gòu)化表面來增強(qiáng)相機(jī)姿態(tài)估計(jì)和地圖重建。我們利用一種特定的策略來融合線段,以確??煽康刈R別線特征。高斯表示,包括專用于線段重建的專用損失項(xiàng)。

115f94f8-9053-11ef-a511-92fbcf53809c.png

6. 實(shí)驗(yàn)結(jié)果

使用表 1 中的 ScanNet 數(shù)據(jù)集和Replica-V1 數(shù)據(jù)集對重建質(zhì)量進(jìn)行了定量評估。我們的方法提供了 SOTA 結(jié)果,在兩個(gè)數(shù)據(jù)集上的 PSNR 均顯著優(yōu)于其他基于高斯的方法 4dB。跟蹤評估結(jié)果如表 2 所示。我們的方法顯著降低了 ATE RMSE(cm)誤差,比高斯基線提高了 50%。此外,得益于我們的線融合策略,MG-SLAM 還表現(xiàn)出優(yōu)于傳統(tǒng) SLAM 系統(tǒng)的跟蹤性能。

1190cc76-9053-11ef-a511-92fbcf53809c.png

11c6c948-9053-11ef-a511-92fbcf53809c.png

為了評估系統(tǒng)在大型室內(nèi)環(huán)境中的穩(wěn)健性,我們在 Replica Apartment 數(shù)據(jù)集上評估了 MG-SLAM。該數(shù)據(jù)集包含廣泛的多房間場景、復(fù)雜的物體幾何形狀和跨房間的循環(huán)軌跡。表 3 展示了我們的方法與 SplaTAM和 MonoGS在五個(gè)選定場景中的渲染質(zhì)量對比。MG-SLAM 在這些基線上顯示出顯著的改進(jìn),特別是在具有兩層八室布局的廣泛公寓 0 場景中實(shí)現(xiàn)了 7dB 的改進(jìn)。這種最佳性能主要?dú)w功于融合線段的加入,這為環(huán)路閉合和姿勢優(yōu)化奠定了堅(jiān)實(shí)的基礎(chǔ)。圖 5 展示了公寓場景的新視圖渲染結(jié)果。我們的方法在幾何精度和精細(xì)細(xì)節(jié)豐富度方面比高斯基線有顯著的增強(qiáng)。

11fce0dc-9053-11ef-a511-92fbcf53809c.png

12294866-9053-11ef-a511-92fbcf53809c.png

7. 總結(jié)

在本研究中,我們提出了 MG-SLAM,這是一種基于曼哈頓世界假設(shè)的高斯 SLAM 方法。MG-SLAM 采用線段進(jìn)行穩(wěn)健的姿態(tài)估計(jì)和地圖細(xì)化。此外,通過利用線段和平面假設(shè),我們可以在缺失幾何的間隙上有效地插入新的高斯函數(shù)。大量實(shí)驗(yàn)表明,我們的方法提供了最先進(jìn)的跟蹤和映射性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 結(jié)構(gòu)化
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    10406
  • SLAM算法
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    2619

原文標(biāo)題:GS SLAM最新SOTA!MG-SLAM:使用結(jié)構(gòu)化線特征提升高斯SLAM

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于深度學(xué)習(xí)的增強(qiáng)版ORB-SLAM3詳解

    ORB-SLAM3雖是當(dāng)前最先進(jìn)的SLAM之一,但由于使用傳統(tǒng)的ORB(定向FAST和旋轉(zhuǎn)BRIEF)特征,在尺度、旋轉(zhuǎn)和光照發(fā)生顯著變化時(shí)可能會表現(xiàn)出局限性。
    的頭像 發(fā)表于 07-14 17:21 ?233次閱讀
    基于深度學(xué)習(xí)的增強(qiáng)版ORB-<b class='flag-5'>SLAM</b>3詳解

    一種適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)RGB-D SLAM系統(tǒng)

    近期用于視覺SLAM的3D高斯潑濺(3DGS)技術(shù)在跟蹤和高保真建圖方面取得了顯著進(jìn)展。然而,其順序優(yōu)化框架以及對動(dòng)態(tài)物體的敏感性限制了其在現(xiàn)實(shí)場景中的實(shí)時(shí)性能和魯棒性。為此,我們提出
    的頭像 發(fā)表于 07-04 15:14 ?220次閱讀
    一種適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)RGB-D <b class='flag-5'>SLAM</b>系統(tǒng)

    一種適用于動(dòng)態(tài)環(huán)境的3DGS-SLAM系統(tǒng)

    當(dāng)前基于神經(jīng)輻射場(NeRF)或3D高斯潑濺(3DGS)的SLAM方法在重建靜態(tài)3D場景方面表現(xiàn)出色,但在動(dòng)態(tài)環(huán)境中的跟蹤和重建方面卻面臨著挑戰(zhàn)。
    的頭像 發(fā)表于 06-13 10:10 ?314次閱讀
    一種適用于動(dòng)態(tài)環(huán)境的3DGS-<b class='flag-5'>SLAM</b>系統(tǒng)

    三維高斯潑濺大規(guī)模視覺SLAM系統(tǒng)解析

    近期興起的神經(jīng)輻射場(NeRF)與三維高斯潑濺(3DGS)技術(shù)在視覺SLAM中展現(xiàn)出令人鼓舞的突破性成果。然而,當(dāng)前主流方法多依賴RGBD傳感器,并且僅適用于室內(nèi)環(huán)境。在大規(guī)模室外場景中的重建魯棒性
    的頭像 發(fā)表于 05-27 14:13 ?356次閱讀
    三維<b class='flag-5'>高斯</b>潑濺大規(guī)模視覺<b class='flag-5'>SLAM</b>系統(tǒng)解析

    基于高斯的稠密視覺SLAM研究

    基于高斯的場景表示在新視角下會出現(xiàn)幾何失真,這大大降低了基于高斯的跟蹤方法的準(zhǔn)確性。這些幾何不一致主要源于高斯基元的深度建模以及在深度融合過程中表面之間的相互干擾。為了解決這些問題,我
    的頭像 發(fā)表于 05-15 10:36 ?320次閱讀
    基于<b class='flag-5'>高斯</b>的稠密視覺<b class='flag-5'>SLAM</b>研究

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    SLAM結(jié)構(gòu)化環(huán)境中更穩(wěn)定,而視覺SLAM(如ORB-SLAM3)更適合動(dòng)態(tài)場景。 SLAM Toolbox的實(shí)踐應(yīng)用
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】+ROS2應(yīng)用案例

    方法,包括SLAM Toolbox的使用。 通過學(xué)習(xí)這一部分,我了解到SLAM的基本原理,包括特征提取、特征匹配、地圖構(gòu)建和定位等關(guān)鍵步驟。書中還介紹了如何在ROS 2中使用
    發(fā)表于 04-27 11:42

    一種基于點(diǎn)、和消失點(diǎn)特征的單目SLAM系統(tǒng)設(shè)計(jì)

    本文提出了一種穩(wěn)健的單目視覺SLAM系統(tǒng),該系統(tǒng)同時(shí)利用點(diǎn)、和消失點(diǎn)特征來進(jìn)行精確的相機(jī)位姿估計(jì)和地圖構(gòu)建,有效解決了傳統(tǒng)基于點(diǎn)特征SLAM
    的頭像 發(fā)表于 03-21 17:07 ?471次閱讀
    一種基于點(diǎn)、<b class='flag-5'>線</b>和消失點(diǎn)<b class='flag-5'>特征</b>的單目<b class='flag-5'>SLAM</b>系統(tǒng)設(shè)計(jì)

    托盤“智”運(yùn),SLAM導(dǎo)航 地牛式AGV機(jī)器人,“7*24小時(shí)”工作!

    AGV地牛小巧靈活,載重大,采用激光SLAM導(dǎo)航,可智能控制路線。支持定制云平臺監(jiān)控,多級安全措施保障安全。適用于多行業(yè)倉儲物流,提高搬運(yùn)效率,降低人力投入。
    的頭像 發(fā)表于 02-11 17:56 ?454次閱讀
    托盤“智”運(yùn),<b class='flag-5'>SLAM</b>導(dǎo)航  地牛式AGV機(jī)器人,“7*24小時(shí)”工作!

    一種基于MASt3R的實(shí)時(shí)稠密SLAM系統(tǒng)

    精心設(shè)計(jì)的集成式硬件與軟件堆棧,實(shí)現(xiàn)穩(wěn)健且精準(zhǔn)的視覺SLAM已成為可能。然而,SLAM尚未能成為一種即插即用的算法,因其需要硬件方面的專業(yè)知識以及校準(zhǔn)操作。即便對于僅配備單個(gè)攝像頭且無諸如IMU等額外傳感器的最簡設(shè)置而言,也不存
    的頭像 發(fā)表于 12-27 15:25 ?1476次閱讀

    利用VLM和MLLMs實(shí)現(xiàn)SLAM語義增強(qiáng)

    語義同步定位與建圖(SLAM)系統(tǒng)在對鄰近的語義相似物體進(jìn)行建圖時(shí)面臨困境,特別是在復(fù)雜的室內(nèi)環(huán)境中。本文提出了一種面向?qū)ο?b class='flag-5'>SLAM的語義增強(qiáng)(SEO-SLAM)的新型SLAM系統(tǒng),借
    的頭像 發(fā)表于 12-05 10:00 ?1415次閱讀
    利用VLM和MLLMs實(shí)現(xiàn)<b class='flag-5'>SLAM</b>語義增強(qiáng)

    最新圖優(yōu)化框架,全面提升SLAM定位精度

    已經(jīng)實(shí)現(xiàn)了準(zhǔn)確的估計(jì)。然而,在大規(guī)模問題中更新協(xié)方差矩陣在計(jì)算上是昂貴的?;趫D的方法最早由Lu和Milios在1997年引入,隨著圖的增長,計(jì)算成本較低。隨著計(jì)算能力的提高,基于圖的SLAM優(yōu)化算法
    的頭像 發(fā)表于 11-12 11:26 ?1247次閱讀
    最新圖<b class='flag-5'>優(yōu)化</b>框架,全面提升<b class='flag-5'>SLAM</b>定位精度

    激光雷達(dá)在SLAM算法中的應(yīng)用綜述

    SLAM算法運(yùn)行的重要傳感器?;诩す饫走_(dá)的SLAM算法,對激光雷達(dá)SLAM總體框架進(jìn)行介紹,詳細(xì)闡述前端里程計(jì)、后端
    的頭像 發(fā)表于 11-12 10:30 ?2573次閱讀
    激光雷達(dá)在<b class='flag-5'>SLAM</b><b class='flag-5'>算法</b>中的應(yīng)用綜述

    算法角度看 SLAM(第 2 部分)

    作者: Aswin S Babu 正如我們在[第 1 部分]中所討論的,SLAM 是指在無地圖區(qū)域中估計(jì)機(jī)器人車輛的位置,同時(shí)逐步繪制該區(qū)域地圖的過程。根據(jù)使用的主要技術(shù),SLAM 算法可分為三種
    的頭像 發(fā)表于 10-02 16:39 ?799次閱讀
    從<b class='flag-5'>算法</b>角度看 <b class='flag-5'>SLAM</b>(第 2 部分)