99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度剖析3D視覺(jué)定位技術(shù)

新機(jī)器視覺(jué) ? 來(lái)源:華為云社區(qū) ? 作者:華為云社區(qū) ? 2021-04-01 14:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言

所謂3D視覺(jué)定位指的是根據(jù)事先構(gòu)建的3D模型及相關(guān)信息,計(jì)算取得某張圖像在拍攝時(shí)相機(jī)的位置和姿態(tài)。這是3D視覺(jué)的一項(xiàng)十分重要的技術(shù),可以用來(lái)幫助實(shí)現(xiàn)人員定位與導(dǎo)航。本博文將基于2019年CVPR論文From Coarse to Fine: Robust Hierarchical Localization at Large Scale所采用的分級(jí)定位方案對(duì)該技術(shù)進(jìn)行簡(jiǎn)要的介紹。

基本原理

3D視覺(jué)定位的直接目標(biāo)是計(jì)算當(dāng)前圖像的照相機(jī)位姿,解決該問(wèn)題的直接方案是建立3D點(diǎn)與2D點(diǎn)之間的匹配關(guān)系,通過(guò)二者的匹配關(guān)系估計(jì)相機(jī)位姿,這一問(wèn)題被稱作PnP(Pespective-n-Point)問(wèn)題。求解PnP問(wèn)題的方法有很多,常見(jiàn)的有P3P、EPnP、UPnP等,具體的如何實(shí)現(xiàn)本文不做介紹,讀者可以自行搜索PnP問(wèn)題的相關(guān)理論。而視覺(jué)定位需要解決的一大關(guān)鍵問(wèn)題是如何建立3D點(diǎn)與2D點(diǎn)之間的匹配關(guān)系。對(duì)于這一點(diǎn),論文作者Sarlin提出過(guò)一種分級(jí)定位的方案,以下將詳細(xì)介紹該方案。

分級(jí)定位

e7de8e74-92a7-11eb-8b86-12bb97331649.png

分級(jí)定位的框架大約可以分成三步:預(yù)檢索、共視聚類、局部匹配與定位。

預(yù)檢索

預(yù)檢索的意義在于獲取前k張與當(dāng)前圖像最相似的圖像,判斷相似的依據(jù)通常是通過(guò)匹配圖像的全局特征。一般而言,產(chǎn)生全局特征的方法可以依賴于局部特征所組成的詞袋,不過(guò)近些年,一些深度學(xué)習(xí)方案也被引入了進(jìn)來(lái),例如NetVLAD或更加輕量級(jí)的MobileNetVLAD。最終通過(guò)獲取當(dāng)前圖像的全局特征的k個(gè)最近鄰來(lái)獲取預(yù)檢索得到的相近圖集。

共視聚類

然而由于可能產(chǎn)生的錯(cuò)誤匹配,所獲取到的預(yù)檢索圖集并不一定全部都面向同一場(chǎng)景,這時(shí)就需要先將面向不同場(chǎng)景的圖像區(qū)分開來(lái),這項(xiàng)技術(shù)就被稱作共視聚類,簡(jiǎn)而言之就是將具有共視關(guān)系的圖像聚成一類。

ea0522da-92a7-11eb-8b86-12bb97331649.png

這一過(guò)程實(shí)際十分簡(jiǎn)單,它是通過(guò)匹配同名點(diǎn)來(lái)獲取的,這些同名點(diǎn)在早先進(jìn)行的3D建模過(guò)程中通過(guò)特征的提取與匹配已經(jīng)建立了對(duì)應(yīng)的關(guān)系。若兩個(gè)圖像中存在穩(wěn)定的同名點(diǎn),則認(rèn)為二者共視,分成一類,否則分成兩類。

局部匹配與定位

一般認(rèn)為圖像數(shù)量較多的類所對(duì)應(yīng)的場(chǎng)景是正確場(chǎng)景的可能性較大。因此從這一場(chǎng)景開始,嘗試獲取相機(jī)位姿。獲取的方式主要依賴求解PnP問(wèn)題,因此需要首先構(gòu)建當(dāng)前圖像的2D關(guān)鍵點(diǎn)在3D模型中的坐標(biāo)位置。在尚不知道相機(jī)姿態(tài)前,這一信息的獲取需要首先匹配當(dāng)前圖像和場(chǎng)景內(nèi)的圖像,特別要匹配那些能夠?qū)?yīng)到3D位置的2D特征點(diǎn),若能夠匹配上則確定了當(dāng)前圖像中的2D點(diǎn)和3D點(diǎn)的對(duì)應(yīng)關(guān)系,繼而即可通過(guò)對(duì)PnP問(wèn)題的求解獲取相機(jī)位姿。

總結(jié)

本博文基于當(dāng)前被廣泛采用的分級(jí)視覺(jué)定位方法對(duì)在3D視覺(jué)領(lǐng)域廣泛使用的視覺(jué)定位方法進(jìn)行了簡(jiǎn)要介紹,其主要可以被分為三個(gè)步驟,即預(yù)檢索、共視聚類、局部匹配與定位,最終通過(guò)求解PnP問(wèn)題來(lái)獲取當(dāng)前圖像的位姿,從而確定拍攝者的位置。筆者后續(xù)將繼續(xù)保持對(duì)3D視覺(jué)領(lǐng)域的研究和關(guān)注,并繼續(xù)輸出相關(guān)博文。

參考文獻(xiàn)

Sarlin P E, Cadena C, Siegwart R, et al. From coarse to fine: Robust hierarchical localization at large scale[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019: 12716-12725.

Sarlin P E, Debraine F, Dymczyk M, et al. Leveraging deep visual descriptors for hierarchical efficient localization[J]. arXiv preprint arXiv:1809.01019, 2018.

Arandjelovic R, Gronat P, Torii A, et al. NetVLAD: CNN architecture for weakly supervised place recognition[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2016: 5297-5307.

來(lái)源:華為云社

文鏈接:https://bbs.huaweicloud.com/blogs/229261

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2959

    瀏覽量

    110800
  • 照相機(jī)
    +關(guān)注

    關(guān)注

    0

    文章

    69

    瀏覽量

    27300
  • 導(dǎo)航
    +關(guān)注

    關(guān)注

    7

    文章

    555

    瀏覽量

    43169

原文標(biāo)題:3D視覺(jué)定位技術(shù)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    人形機(jī)器人 3D 視覺(jué)路線之爭(zhēng):激光雷達(dá)、雙目和 3D - ToF 誰(shuí)更勝一籌?

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)在人形機(jī)器人的設(shè)計(jì)方案中,3D 視覺(jué)技術(shù)是實(shí)現(xiàn)環(huán)境感知與智能化決策的核心支撐之一。它能夠助力人形機(jī)器人完成環(huán)境感知與建模、動(dòng)態(tài)目標(biāo)檢測(cè)與跟蹤、物體操作與精細(xì)控制等
    的頭像 發(fā)表于 04-15 00:14 ?2718次閱讀

    3D視覺(jué)引領(lǐng)工業(yè)變革

    隨著工業(yè)智能化的推進(jìn),3D視覺(jué)技術(shù)正為制造業(yè)帶來(lái)變革。市場(chǎng)規(guī)模逐年擴(kuò)大,技術(shù)應(yīng)用與市場(chǎng)競(jìng)爭(zhēng)日益激烈。
    的頭像 發(fā)表于 07-07 11:08 ?100次閱讀
    <b class='flag-5'>3D</b><b class='flag-5'>視覺(jué)</b>引領(lǐng)工業(yè)變革

    海伯森3D閃測(cè)傳感器,工業(yè)檢測(cè)領(lǐng)域的高精度利器

    隨著信息技術(shù)的飛速進(jìn)步,第四次視覺(jué)革命深度融合“人”“機(jī)”“物”,基于光學(xué)原理的3D視覺(jué)檢測(cè)技術(shù)
    的頭像 發(fā)表于 06-20 17:46 ?871次閱讀
    海伯森<b class='flag-5'>3D</b>閃測(cè)傳感器,工業(yè)檢測(cè)領(lǐng)域的高精度利器

    安森美這款iToF傳感器讓3D深度測(cè)量技術(shù)輕松落地

    現(xiàn)代工業(yè)自動(dòng)化的成功離不開3D視覺(jué)技術(shù)的強(qiáng)大功能。傳統(tǒng)的2D傳感器只能提供平面圖像,這使其在設(shè)備檢測(cè)等應(yīng)用中的效能大打折扣。2D傳感器可以讀
    的頭像 發(fā)表于 03-28 14:31 ?557次閱讀
    安森美這款iToF傳感器讓<b class='flag-5'>3D</b><b class='flag-5'>深度</b>測(cè)量<b class='flag-5'>技術(shù)</b>輕松落地

    3D打印中XPR技術(shù)對(duì)于打印效果的影響?

    我是3D打印設(shè)備的制造商,我想具體了解下3D打印中XPR技術(shù)對(duì)于打印效果的影響? 或者是否能提供對(duì)應(yīng)的專利信息以備查閱
    發(fā)表于 02-18 07:59

    英倫科技裸眼3D便攜屏有哪些特點(diǎn)?

    英倫科技裸眼3D便攜屏采用了領(lǐng)先的光場(chǎng)裸眼3D技術(shù),無(wú)需佩戴3D眼鏡即可觀看,給用戶帶來(lái)裸眼看3D視頻的體驗(yàn),為用戶帶來(lái)更加便捷和自由的
    的頭像 發(fā)表于 02-06 14:20 ?505次閱讀
    英倫科技裸眼<b class='flag-5'>3D</b>便攜屏有哪些特點(diǎn)?

    多維精密測(cè)量:半導(dǎo)體微型器件的2D&amp;3D視覺(jué)方案

    精密視覺(jué)檢測(cè)技術(shù)有效提升了半導(dǎo)體行業(yè)的生產(chǎn)效率和質(zhì)量保障。友思特自研推出基于深度學(xué)習(xí)平臺(tái)和視覺(jué)掃描系統(tǒng)的2D
    的頭像 發(fā)表于 01-10 13:54 ?704次閱讀
    多維精密測(cè)量:半導(dǎo)體微型器件的2<b class='flag-5'>D</b>&amp;<b class='flag-5'>3D</b><b class='flag-5'>視覺(jué)</b>方案

    3D 視覺(jué)引領(lǐng)技術(shù)革新,3C 薄片精準(zhǔn)抓取推動(dòng)自動(dòng)化上料升級(jí)

    ,隨著3D視覺(jué)技術(shù)的快速發(fā)展,這一技術(shù)難題得到了有效解決。3D視覺(jué)
    的頭像 發(fā)表于 12-27 15:18 ?459次閱讀
    <b class='flag-5'>3D</b> <b class='flag-5'>視覺(jué)</b>引領(lǐng)<b class='flag-5'>技術(shù)</b>革新,<b class='flag-5'>3</b>C 薄片精準(zhǔn)抓取推動(dòng)自動(dòng)化上料升級(jí)

    uvled光固化3d打印技術(shù)

    說(shuō)到UVLED光固化3D打印技術(shù),那可是當(dāng)下3D打印領(lǐng)域的一股清流?。∵@項(xiàng)技術(shù)利用紫外線和光固化樹脂來(lái)制造3D打印模型,原理簡(jiǎn)單又高效。UV
    的頭像 發(fā)表于 12-24 13:13 ?745次閱讀
    uvled光固化<b class='flag-5'>3d</b>打印<b class='flag-5'>技術(shù)</b>

    3D 視覺(jué)定位技術(shù):汽車零部件制造的智能變革引擎

    在汽車零部件制造領(lǐng)域,傳統(tǒng)工藝正面臨著前所未有的挑戰(zhàn)。市場(chǎng)對(duì)于零部件精度與生產(chǎn)效率近乎苛刻的要求,促使企業(yè)尋求突破之道。而 3D 視覺(jué)定位技術(shù),為汽車零部件制造開啟了精準(zhǔn)
    的頭像 發(fā)表于 12-10 17:28 ?955次閱讀
    <b class='flag-5'>3D</b> <b class='flag-5'>視覺(jué)</b><b class='flag-5'>定位</b><b class='flag-5'>技術(shù)</b>:汽車零部件制造的智能變革引擎

    探索3D視覺(jué)技術(shù)在活塞桿自動(dòng)化抓取中的應(yīng)用

    隨著工業(yè)4.0時(shí)代的到來(lái),智能制造成為工業(yè)發(fā)展的重要趨勢(shì)。作為智能制造的關(guān)鍵技術(shù)之一,3D視覺(jué)技術(shù)在活塞桿抓取領(lǐng)域的應(yīng)用前景十分廣闊。
    的頭像 發(fā)表于 09-07 15:38 ?474次閱讀

    適用于3D機(jī)器視覺(jué)的高度可擴(kuò)展的TI DLP技術(shù)

    電子發(fā)燒友網(wǎng)站提供《適用于3D機(jī)器視覺(jué)的高度可擴(kuò)展的TI DLP技術(shù).pdf》資料免費(fèi)下載
    發(fā)表于 08-23 09:57 ?0次下載
    適用于<b class='flag-5'>3D</b>機(jī)器<b class='flag-5'>視覺(jué)</b>的高度可擴(kuò)展的TI DLP<b class='flag-5'>技術(shù)</b>

    微視傳感高性能3D視覺(jué)產(chǎn)品亮相2024上海機(jī)器視覺(jué)

    近日,2024上海機(jī)器視覺(jué)展在上海新國(guó)際博覽中心隆重舉行,微視傳感攜最新的高性能3D視覺(jué)產(chǎn)品亮相E2館2121展位,得到廣泛關(guān)注,這次展會(huì)不僅是微視傳感展示創(chuàng)新技術(shù)的舞臺(tái),更是與行業(yè)同
    的頭像 發(fā)表于 08-06 15:15 ?978次閱讀
    微視傳感高性能<b class='flag-5'>3D</b><b class='flag-5'>視覺(jué)</b>產(chǎn)品亮相2024上海機(jī)器<b class='flag-5'>視覺(jué)</b>展

    3D視覺(jué)技術(shù)廣闊的應(yīng)用前景

    隨著工業(yè)自動(dòng)化領(lǐng)域的迅猛進(jìn)步,對(duì)制造過(guò)程中抓取作業(yè)的精度與效率提出了更為嚴(yán)苛的要求。作為機(jī)械構(gòu)造中的核心組件,活塞桿的精準(zhǔn)抓取成為了保障產(chǎn)品質(zhì)量、提升生產(chǎn)效率的關(guān)鍵環(huán)節(jié)。在此背景下,3D視覺(jué)技術(shù)以其獨(dú)到的優(yōu)勢(shì),在活塞桿抓取應(yīng)用中
    的頭像 發(fā)表于 07-29 15:56 ?675次閱讀
    <b class='flag-5'>3D</b><b class='flag-5'>視覺(jué)</b><b class='flag-5'>技術(shù)</b>廣闊的應(yīng)用前景

    居然還有這樣的10.1寸光場(chǎng)裸眼3D視覺(jué)訓(xùn)練平板電腦?

    在這個(gè)科技飛速發(fā)展的時(shí)代,我們?yōu)槟鷰?lái)了一款革命性的產(chǎn)品——10.1寸光場(chǎng)裸眼3D視覺(jué)訓(xùn)練平板電腦。這款平板電腦不僅讓您無(wú)需佩戴3D眼鏡就能享受逼真的立體視覺(jué)效果,還通過(guò)先進(jìn)的
    的頭像 發(fā)表于 07-25 14:09 ?604次閱讀
    居然還有這樣的10.1寸光場(chǎng)裸眼<b class='flag-5'>3D</b><b class='flag-5'>視覺(jué)</b>訓(xùn)練平板電腦?