99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何用3D Occupancy處理遮擋問題下的圖像匹配?

3D視覺工坊 ? 來源:3D視覺工坊 ? 2024-01-06 10:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. 寫在前面

圖像匹配是SLAM和圖像檢索的核心任務(wù),但是傳統(tǒng)的圖像匹配很難處理遮擋問題。今天筆者將為大家分享一篇曠視的開源工作Occ2Net,使用3D Occupancy來解決遮擋問題下的圖像匹配。

下面一起來閱讀一下這項(xiàng)工作~

2. 摘要

圖像匹配是各種視覺應(yīng)用中基本且關(guān)鍵的任務(wù),如同時(shí)定位與地圖構(gòu)建( Simultaneous Localization and Mapping,SLAM )和圖像檢索,這些應(yīng)用都需要精確的位姿估計(jì)。然而,現(xiàn)有的大多數(shù)方法忽略了由相機(jī)運(yùn)動(dòng)和場景結(jié)構(gòu)引起的物體之間的遮擋關(guān)系。在本文中,我們提出了一種新的圖像匹配方法Occ2Net,該方法使用3D占有率建模遮擋關(guān)系,并在遮擋區(qū)域中推斷匹配點(diǎn)。得益于占有率估計(jì)( Occupancy Estimation,OE )模塊中編碼的歸納偏差,它大大簡化了多視圖一致3D表示的引導(dǎo),從而可以集成來自多個(gè)視圖的信息。它與一個(gè)遮擋感知( Occlusion-Aware,OA )模塊一起,結(jié)合了注意力層和旋轉(zhuǎn)對(duì)齊,以實(shí)現(xiàn)遮擋點(diǎn)和可見點(diǎn)之間的匹配。我們?cè)谡鎸?shí)世界和模擬數(shù)據(jù)集上評(píng)估了我們的方法,并在幾個(gè)指標(biāo)上展示了其優(yōu)于最先進(jìn)方法的性能,特別是在遮擋場景中。

3. 效果展示

先看一下問題描述,( a )和( b )是從不同視點(diǎn)拍攝的圖像,而( c )顯示了遮擋區(qū)域的匹配過程。在( c )中,兩個(gè)顯示器顯示綠色和紅色的掩模,表示在( b )中可見但在( a )中被遮擋的區(qū)域。由于相機(jī)運(yùn)動(dòng),兩個(gè)圖像的視差很大。雖然存在大量的重疊區(qū)域,但大的視差導(dǎo)致了遮擋,很大程度上減少了可見匹配對(duì)的數(shù)量。通過使用Occ2Net提取一致的占用特征并在( a )和( b )之間進(jìn)行匹配,( a )中被遮擋的顯示器仍然可以在( b )中進(jìn)行匹配,從而使Occ2Net具備了在遮擋情況下進(jìn)行匹配的能力。

99f028e0-abe4-11ee-8b88-92fbcf53809c.jpg

4. 具體原理是什么?

Occ2Net框架,通過隱式地模擬物體-遮擋關(guān)系,實(shí)現(xiàn)遮擋下的匹配。首先提取特征,然后應(yīng)用OA模塊獲得粗匹配塊,最后將精細(xì)特征與OE模塊中的3D占用估計(jì)相結(jié)合進(jìn)行精細(xì)匹配。

wKgZomWYuiqAKOimAAWQIGVZt34365.png

5. 和其他SOTA方法對(duì)比如何?

ScanNet、TartanAir-indoor、TartanAir-outdoor的匹配實(shí)例。綠色和黃色線條表示正確匹配,紅色線條(誤差大于10個(gè)像素)為錯(cuò)誤匹配。

位姿誤差的百分比AUC對(duì)比,Occ2Net最優(yōu)。

9a25527c-abe4-11ee-8b88-92fbcf53809c.jpg

6. 總結(jié)

這篇文章提出了一種遮擋問題下的圖像匹配方式,設(shè)計(jì)了一種網(wǎng)絡(luò)結(jié)構(gòu)Occ2Net,可以在一定程度上感知遮擋點(diǎn)的存在。Occ2Net使用特征提取來獲得多尺度的全局和位置特征,這些特征有助于猜測遮擋信息。OA模塊使用了注意力和旋轉(zhuǎn)對(duì)齊,這有助于在后期的由粗到精的過程中得到更多正確的匹配對(duì)。OE模塊使用3D占用估計(jì)結(jié)合精細(xì)特征進(jìn)行精細(xì)匹配。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SLAM
    +關(guān)注

    關(guān)注

    24

    文章

    441

    瀏覽量

    32489
  • 圖像匹配
    +關(guān)注

    關(guān)注

    0

    文章

    21

    瀏覽量

    8897

原文標(biāo)題:如何處理遮擋問題下的圖像匹配?

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    3D LED液晶電視設(shè)計(jì)方案

    的不同圖像,簡單來說就是2維(2D)的圖像根據(jù)灰度的差別進(jìn)行摳像渲染,生成左右眼的兩幀圖像?! ?.2.2 3D
    發(fā)表于 07-11 18:05

    3D圖像的速度控制

    你好! 現(xiàn)在我有個(gè)問題想請(qǐng)教大家, 我怎么做一個(gè)3D圖像的渦輪扇葉然后通過控制器調(diào)整它的速度然后再3D圖像中開始轉(zhuǎn)并且根據(jù)控制量改變?cè)?b class='flag-5'>3D
    發(fā)表于 11-30 23:25

    基于Dragonboard 410c平臺(tái)的機(jī)器3D視覺—攝像機(jī)標(biāo)定原理

    和原理,這是我們進(jìn)行3D視覺處理的基礎(chǔ),在Dragonboard 410c上我們可以方便的用USB攝像頭進(jìn)行圖像采集,但是通常我們買的USB攝像頭采集到的圖像會(huì)帶有一定的畸變,這些畸變
    發(fā)表于 09-28 10:32

    基于ToF的3D活體檢測算法研究

    人臉。這是由于目前基于RGB等2D空間的主流活體檢測方案未考慮光照、遮擋等干擾因素對(duì)于檢測的影響,而且存在計(jì)算量大的缺點(diǎn)。而數(shù)跡智能團(tuán)隊(duì)研發(fā)的3D SmartToF活體檢測方案則可以有效解決此問題。那么
    發(fā)表于 01-06 07:30

    浩辰3D的「3D打印」你會(huì)用嗎?3D打印教程

    設(shè)計(jì)。由浩辰CAD公司研發(fā)的浩辰3D作為從產(chǎn)品設(shè)計(jì)到制造全流程的高端3D設(shè)計(jì)軟件,不僅能夠提供完備的2D+3D一體化解決方案,還能一站式集成3D打印的多元化數(shù)據(jù)
    發(fā)表于 05-27 19:05

    3D圖像的主流技術(shù)有哪幾種?

    3D圖像的主流技術(shù)有哪幾種?Bora傳感器的功能亮點(diǎn)是什么?
    發(fā)表于 05-28 06:37

    3D圖像生成算法的原理是什么?

    什么是3D圖形芯片?3D圖像生成算法的原理是什么?
    發(fā)表于 06-04 06:29

    基于深度學(xué)習(xí)和3D圖像處理的精密加工件外觀缺陷檢測系統(tǒng)

    檢測,檢測準(zhǔn)確性和檢測穩(wěn)定性較差、容易誤判。 基于深度學(xué)習(xí)和3D圖像處理的精密加工件外觀缺陷檢測系統(tǒng)創(chuàng)新性結(jié)合深度學(xué)習(xí)以及3D圖像
    發(fā)表于 03-08 13:59

    3D圖像引擎,3D圖像引擎原理

    3D圖像引擎,3D圖像引擎原理 產(chǎn)生的背景和定義 隨著計(jì)算機(jī)軟、硬件突飛猛進(jìn)的發(fā)展,計(jì)算機(jī)圖形學(xué)在各個(gè)行業(yè)的應(yīng)用也得
    發(fā)表于 03-26 15:54 ?1509次閱讀

    平面人物秒變3D模式,圖片中的人物可以從平面中“跑出來”,動(dòng)起來

    而在此過程中最主要的挑戰(zhàn)是重構(gòu)后的3D人物與照片中原形人物的輪廓緊密匹配,這事實(shí)上非常困難,因?yàn)樯眢w可能被部分遮擋,通常被其他身體部分遮擋,比如有人站立時(shí)雙臂交叉在胸前,這使得機(jī)器難以
    的頭像 發(fā)表于 12-27 09:15 ?1.2w次閱讀

    iPhone 12沒有3D屏幕無法顯示3D圖像?

    最新的iphone 12系列使用后置激光雷達(dá)傳感器,可以拍攝令人印象深刻的3D照片和掃描圖像,但是iPhone 12沒有3D屏幕無法顯示3D圖像
    的頭像 發(fā)表于 12-04 14:46 ?4607次閱讀

    谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

    谷歌發(fā)明的由2D圖像生成3D圖像的技術(shù),利用3D估計(jì)神經(jīng)網(wǎng)絡(luò)圖像信息的補(bǔ)全以及預(yù)測,融合了拍攝角
    的頭像 發(fā)表于 12-24 12:55 ?5089次閱讀
    谷歌發(fā)明的由2<b class='flag-5'>D</b><b class='flag-5'>圖像</b>生成<b class='flag-5'>3D</b><b class='flag-5'>圖像</b>技術(shù)解析

    華為基于AI技術(shù)實(shí)現(xiàn)3D圖像數(shù)字服務(wù)

    華為3D建模服務(wù)(3D Modeling Kit)是華為在圖形圖像領(lǐng)域又一技術(shù)開放,面向有3D模型、動(dòng)畫制作等能力訴求的應(yīng)用開發(fā)者,基于AI技術(shù),提供
    的頭像 發(fā)表于 08-12 14:50 ?5384次閱讀

    用于3D掃描的嵌入式圖像預(yù)處理

    電子發(fā)燒友網(wǎng)站提供《用于3D掃描的嵌入式圖像預(yù)處理.zip》資料免費(fèi)下載
    發(fā)表于 11-07 10:14 ?0次下載
    用于<b class='flag-5'>3D</b>掃描的嵌入式<b class='flag-5'>圖像</b>預(yù)<b class='flag-5'>處理</b>

    特斯拉的Occupancy Network占用網(wǎng)絡(luò)如何解決無法識(shí)別物體的難題呢?

    Occupancy Network并非特斯拉發(fā)明,最先提出Occupancy Network的是2018年的論文《Occupancy Networks: Learning 3D Rec
    的頭像 發(fā)表于 04-16 17:29 ?2642次閱讀
    特斯拉的<b class='flag-5'>Occupancy</b> Network占用網(wǎng)絡(luò)如何解決無法識(shí)別物體的難題呢?