99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于反向傳播PnP優(yōu)化的端到端可學習幾何視覺介紹

3D視覺工坊 ? 來源:泡泡機器人SLAM ? 2023-02-06 16:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要

深度網(wǎng)絡(luò)在從大量數(shù)據(jù)中學習模式方面表現(xiàn)出色。另一方面,許多幾何視覺任務(wù)被指定為優(yōu)化問題。

為了將深度學習和幾何視覺無縫地結(jié)合起來,至關(guān)重要的是進行端到端的學習和幾何優(yōu)化。

為了實現(xiàn)這一目標,我們提出了BPnP,這是一個新穎的網(wǎng)絡(luò)模塊,通過Perspective-nPoints(PnP)求解器反向傳播梯度,以指導神經(jīng)網(wǎng)絡(luò)的參數(shù)更新。

基于隱式微分,我們表明一個 "獨立的 "PnP求解器的梯度可以被準確有效地導出,就像優(yōu)化器塊是一個可微分的函數(shù)。

我們通過將BPnP納入一個深度模型來驗證它,該模型可以從訓練數(shù)據(jù)集中學習相機的內(nèi)在因素、相機的外在因素(姿勢)和三維結(jié)構(gòu)。

此外,我們開發(fā)了一個用于物體姿勢估計的端到端可訓練管道,該管道通過將基于特征的熱圖損失與二維-三維重投影誤差相結(jié)合,實現(xiàn)了更高的準確性。

由于我們的方法可以擴展到其他優(yōu)化問題,我們的工作有助于以一種原則性的方式實現(xiàn)可學習的幾何視覺。

主要貢獻

我們的主要貢獻是一個名為BPnP的新型網(wǎng)絡(luò)模塊,它包含了一個PnP求解器。BPnP通過PnP "層 "反向傳播梯度,以指導神經(jīng)網(wǎng)絡(luò)權(quán)重的更新,從而利用既定的目標函數(shù)(二維-三維重投影誤差的平方和)和幾何視覺問題的求解器實現(xiàn)端到端的學習。

盡管只結(jié)合了一個PnP求解器,我們展示了BPnP如何被用來學習有效的深度特征表征,用于多種幾何視覺任務(wù)(姿勢估計、運動結(jié)構(gòu)、相機校準)。

我們還將我們的方法與最先進的幾何視覺任務(wù)的方法進行比較。從根本上說,我們的方法是基于隱式微分的。

主要方法

反向傳播的PnP算法: 讓g表示一個 "函數(shù) "形式的PnP求解器

7e1ebcc0-a402-11ed-bfe3-dac502259ad0.png

從n個2D-3D的對應(yīng)關(guān)系中返回攝像機的6DOF姿態(tài)y和其內(nèi)部參數(shù)K∈R3×3

7e4a7a40-a402-11ed-bfe3-dac502259ad0.png

其中(xi , zi)是第i個對應(yīng)關(guān)系。讓π(-|y, K)是三維點在圖像平面上的投影變換,姿態(tài)為y,相機本征為K。

從本質(zhì)上講,g的 "評估 "需要解決優(yōu)化問題如下:

7e66062a-a402-11ed-bfe3-dac502259ad0.png

7e926062-a402-11ed-bfe3-dac502259ad0.png

ri表示第i對對應(yīng)關(guān)系的重投影誤差。

7ea00474-a402-11ed-bfe3-dac502259ad0.png

πi是三維點zi在圖像平面上的投影。

我們的最終目標是將g納入一個可學習的模型中,其中x、z和K可以是一個深度網(wǎng)絡(luò)的(中間)輸出。此外,公式(4)的求解器應(yīng)該被用來參與網(wǎng)絡(luò)參數(shù)的學習。為此,我們需要把g當作一個可微調(diào)的函數(shù),這樣它的"梯度 "就可以反向傳播到網(wǎng)絡(luò)的其他部分。接下來我們將詳細介紹如何對反向傳播的梯度進行計算。

1. 隱式函數(shù)定理(IFT) 這里簡單公式推導了IFT隱式函數(shù)定理。

7eaeabb4-a402-11ed-bfe3-dac502259ad0.png

7edbe502-a402-11ed-bfe3-dac502259ad0.png

7f04826e-a402-11ed-bfe3-dac502259ad0.png

IFT允許計算一個函數(shù)g相對于其輸入a的導數(shù),而不需要函數(shù)的明確形式,但有一個函數(shù)f約束a和g(a)。

2. 構(gòu)造約束函數(shù)f

為了調(diào)用隱式微分的IFT,我們首先需要定義約束函數(shù)f(a, b)。對于我們的問題,我們使用所有四個變量x、y、z和K來構(gòu)造f。

但我們將f視為一個雙變量函數(shù)f(a, b),其中a在{x, z, K}中取值--取決于要得到的偏導--而b=y(即g的輸出姿勢)。

為了維護約束函數(shù)f(a,b),我們利用了優(yōu)化過程的靜止約束。

在這里,將PnP求解器的目標函數(shù)g表示為:

7f12e598-a402-11ed-bfe3-dac502259ad0.png

由于PnP求解器的輸出姿態(tài)y是目標函數(shù)的局部最優(yōu),所以可以通過對目標的一階導數(shù)與y的關(guān)系來建立一個靜止約束,即:

7f384cde-a402-11ed-bfe3-dac502259ad0.png

給出一個PnP求解器的輸出姿勢y = [y1, ..., ym] T,我們構(gòu)建f,可以寫為:

7f641742-a402-11ed-bfe3-dac502259ad0.png

7f963ce0-a402-11ed-bfe3-dac502259ad0.png

3. 前向和反向傳播

我們對g的PnP公式基本上是執(zhí)行最小二乘法(LS)估計,這對離群值(x、z和K的惡劣誤差)并不穩(wěn)健。

另外,我們可以采用一個更穩(wěn)健的目標,如加入M-估計器[56]或使離群值的數(shù)量最大化[15]。

然而,我們的結(jié)果表明,LS實際上更合適,因為它對輸入測量中的誤差的敏感性鼓勵學習快速收斂到不產(chǎn)生x、z和K中的異常值的參數(shù)。

相反,一個穩(wěn)健的目標會阻止異常值的誤差信號,導致學習過程不穩(wěn)定。

鑒于(4),解算器的選擇仍然存在。

為了進行隱式微分,我們不需要精確地解決(4),因為cij只是(4)的靜止條件,任何局部最小值都能滿足。

為此,我們采用Levenberg-Marquardt(LM)算法,該算法保證了局部收斂。

作為一種迭代算法,LM在求解(4)時需要初始化y(0)。

我們通過將(1)重寫為:"(1)"來明確這種依賴關(guān)系:

7fd1889a-a402-11ed-bfe3-dac502259ad0.png

在反向傳播中,我們首先構(gòu)建f,然后得到g相對于其每個輸入的雅可比系數(shù),即:

800098a6-a402-11ed-bfe3-dac502259ad0.png

給出輸出梯度,BPnP返回輸入梯度:

80179bd2-a402-11ed-bfe3-dac502259ad0.png

算法流程如下圖所示:

802578b0-a402-11ed-bfe3-dac502259ad0.png

主要結(jié)果:

805896b4-a402-11ed-bfe3-dac502259ad0.png80e32fae-a402-11ed-bfe3-dac502259ad0.png812bd664-a402-11ed-bfe3-dac502259ad0.png








審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:BPnP:基于反向傳播PnP優(yōu)化的端到端可學習幾何視覺

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    已來,智駕仿真測試該怎么做?

    智駕方案因強泛化能力、可持續(xù)學習與升級等優(yōu)勢備受矚目,但這對仿真測試帶來了巨大挑戰(zhàn)??抵\探索了一種有效的
    的頭像 發(fā)表于 12-04 09:59 ?3217次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>已來,智駕仿真測試該怎么做?

    基于WiMAX接入技術(shù)的網(wǎng)絡(luò)架構(gòu)

    基于WiMAX接入技術(shù)的網(wǎng)絡(luò)架構(gòu) 本文首先分析了WiMAX技術(shù)的市場驅(qū)動力和影響其成功部署的關(guān)鍵因素,隨后介紹了一個基于WiMAX接入技術(shù)的
    發(fā)表于 10-20 21:03 ?780次閱讀

    反向傳播算法的工作原理

    反向傳播算法(BP算法)是目前用來訓練人工神經(jīng)網(wǎng)絡(luò)的最常用且最有效的算法。作為谷歌機器學習速成課程的配套材料,谷歌推出一個演示網(wǎng)站,直觀地介紹
    的頭像 發(fā)表于 07-02 16:01 ?1w次閱讀
    <b class='flag-5'>反向</b><b class='flag-5'>傳播</b>算法的工作原理

    深讀解析反向傳播算法在解決模型優(yōu)化問題的方面應(yīng)用

    反向傳播算法隸屬于深度學習,它在解決模型優(yōu)化問題的方面有著重要的地位。
    的頭像 發(fā)表于 11-01 15:48 ?5937次閱讀
    深讀解析<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>算法在解決模型<b class='flag-5'>優(yōu)化</b>問題的方面應(yīng)用

    的自動駕駛研發(fā)系統(tǒng)介紹

    Nvidia是比較早做控制車輛工作的公司,其方法訓練CNN模型完成從單個前向攝像頭的圖像像素車輛控制的映射。 其系統(tǒng)自動學習一些處理
    的頭像 發(fā)表于 07-13 09:30 ?5361次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的自動駕駛研發(fā)系統(tǒng)<b class='flag-5'>介紹</b>

    基于深度神經(jīng)網(wǎng)絡(luò)的圖像壓縮方法

    人工設(shè)計的算法分別進行優(yōu)化近年來,基于深度神經(jīng)網(wǎng)絡(luò)的圖像壓縮方法在圖像壓縮中取得了豐碩的成果,相比傳統(tǒng)方法,
    發(fā)表于 04-08 09:30 ?16次下載
    基于深度神經(jīng)網(wǎng)絡(luò)的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>圖像壓縮方法

    基于生成式對抗網(wǎng)絡(luò)的圖像去霧模型

    圖像中霧的特征;其次,采用殘差學習思想直接從退化圖像中學習清晣圖像的特征,實現(xiàn)的去霧;最
    發(fā)表于 04-12 15:03 ?20次下載
    基于生成式對抗網(wǎng)絡(luò)的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>圖像去霧模型

    的IO鏈接解決方案

    的IO鏈接解決方案
    發(fā)表于 05-10 10:43 ?1次下載
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的IO鏈接解決方案

    結(jié)合深度學習的自編碼器物理層優(yōu)化方案

    碼器物理層優(yōu)化方案。通過兩階段訓練模式提髙神經(jīng)網(wǎng)絡(luò)的泛化性,同時利用自編碼器壓縮特性量化信道狀態(tài)信息(CSI)并進行重建,降低CSI反饋導致的系統(tǒng)開銷。仿真結(jié)果表明,該方案通過分
    發(fā)表于 05-24 15:18 ?7次下載

    BP(BackPropagation)反向傳播神經(jīng)網(wǎng)絡(luò)介紹及公式推導

    BP(BackPropagation)反向傳播神經(jīng)網(wǎng)絡(luò)介紹及公式推導(電源和地電氣安全間距)-該文檔為BP(BackPropagation)反向傳播
    發(fā)表于 07-26 10:31 ?48次下載
    BP(BackPropagation)<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>神經(jīng)網(wǎng)絡(luò)<b class='flag-5'>介紹</b>及公式推導

    一種對紅細胞和白細胞圖像分類任務(wù)的主動學習工作流程

    細胞成像的分割和分類等技術(shù)是一個快速發(fā)展的領(lǐng)域研究。就像在其他機器學習領(lǐng)域一樣,數(shù)據(jù)的標注是非常昂貴的,并且對于數(shù)據(jù)標注的質(zhì)量要求也非常的高。針對這一問題,本篇文章介紹一種對紅細胞和白細胞圖像分類任務(wù)的主動學習
    的頭像 發(fā)表于 08-13 10:27 ?1643次閱讀

    神經(jīng)網(wǎng)絡(luò)反向傳播算法的優(yōu)缺點有哪些

    神經(jīng)網(wǎng)絡(luò)反向傳播算法(Backpropagation Algorithm)是一種廣泛應(yīng)用于深度學習和機器學習領(lǐng)域的優(yōu)化算法,用于訓練多層前饋
    的頭像 發(fā)表于 07-03 11:24 ?2062次閱讀

    測試用例怎么寫

    編寫測試用例是確保軟件系統(tǒng)從頭到尾能夠正常工作的關(guān)鍵步驟。以下是一個詳細的指南,介紹如何編寫
    的頭像 發(fā)表于 09-20 10:29 ?963次閱讀

    連接視覺語言大模型與自動駕駛

    自動駕駛在大規(guī)模駕駛數(shù)據(jù)上訓練,展現(xiàn)出很強的決策規(guī)劃能力,但是面對復雜罕見的駕駛場景,依然存在局限性,這是因為
    的頭像 發(fā)表于 11-07 15:15 ?702次閱讀
    連接<b class='flag-5'>視覺</b>語言大模型與<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自動駕駛

    什么是BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法

    BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法(Backpropagation Algorithm)是一種用于訓練神經(jīng)網(wǎng)絡(luò)的有效方法。以下是關(guān)于BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法的
    的頭像 發(fā)表于 02-12 15:18 ?760次閱讀