99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

場(chǎng)景流論文速記—RGBD圖像場(chǎng)景流

電子設(shè)計(jì) ? 來(lái)源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2020-12-10 19:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

簡(jiǎn)單記一下最近看的六篇場(chǎng)景流論文~其中3篇是關(guān)于RGBD圖像的場(chǎng)景流,另外3篇是關(guān)于點(diǎn)云的場(chǎng)景流。
來(lái)源:https://zhuanlan.zhihu.com/p/85663856
作者:林小北

所謂場(chǎng)景流,就是光流的三維版本,表述了圖像/點(diǎn)云中每個(gè)點(diǎn)在前后兩幀的變化情況。目前對(duì)場(chǎng)景流的研究還局限在實(shí)驗(yàn)室階段,由于缺乏實(shí)際數(shù)據(jù)(打標(biāo)成本太高)以及客觀的評(píng)價(jià)指標(biāo),離工程應(yīng)用還有不小的距離。此外,巨大的計(jì)算量也是一個(gè)瓶頸。以下論文可以在文末直接下載。

《Deep Rigid Instance Scene Flow》 CVPR 2019

輸入:雙目攝像頭的前后幀左右圖像

核心思想:把場(chǎng)景流分割成多個(gè)actor的運(yùn)動(dòng),利用MaskRCNN進(jìn)行Instance Segmentation,每個(gè)Instance的Motion都應(yīng)該與深度和光流一致。

首先,利用三個(gè)預(yù)先訓(xùn)練好的子網(wǎng)絡(luò)提取視覺(jué)線索:

a. 利用MaskRCNN進(jìn)行Instance Segmentation
b. 利用PSM-Net計(jì)算深度圖(disparity map)
c. 利用PWC-Net計(jì)算光流

之后,采用高斯牛頓法最小化下面三個(gè)能量函數(shù)之和得到3D motion:

a. Photometric Error:前一幀左邊圖像的inlier像素點(diǎn),與第二幀的投影位置的像素點(diǎn)必須盡量一致
b. Rigid Fitting:估計(jì)出的剛體運(yùn)動(dòng)必須與觀察到的深度和光流信息一致
c. Flow Consistency:估計(jì)出的剛體運(yùn)動(dòng)在2d上的投影必須和光流一致

《Learning Rigidity in Dynamic Scenes with a Moving Camera for 3D Motion Field Estimation》 ECCV 2018

輸入:前后幀圖像的RGBD信息

核心思想:把圖像分割為rigid/no-rigid區(qū)域,計(jì)算rigid區(qū)域的ego motion后再結(jié)合光流即可得到scene flow。

先利用兩個(gè)預(yù)先訓(xùn)練好的子網(wǎng)絡(luò)提取特征:

a. 利用PWCNet提取前后兩幀的光流
b. 利用 rigidity-transform network (RTN)預(yù)測(cè)ego-motion以及rigidity mask

之后,結(jié)合光流、rigidity mask對(duì)ego motioon進(jìn)行refine,保證rigity里面的像素點(diǎn)的光流與ego-motion一致。

最后,綜合利用光流、rigidity mask、ego motioon信息即可得到scene flow。

備注:本文的另一個(gè)貢獻(xiàn)是提出了一個(gè)用于場(chǎng)景流的數(shù)據(jù)庫(kù)REFRESH。在kitti的inference結(jié)果如下,不是很好。

《Every Pixel Counts ++: Joint Learning of Geometry and Motion with 3D Holistic Understanding》TPAMI

輸入:?jiǎn)文?雙目攝像頭的前后幀圖像

核心思想:先用三個(gè)子網(wǎng)絡(luò)估計(jì)光流、深度、camera motion,送入holistic 3D motion parser (HMP) 按照幾何關(guān)系即可計(jì)算出rigid background的motion和moving objects的motion。

三個(gè)子網(wǎng)絡(luò)先分別進(jìn)行預(yù)訓(xùn)練,再結(jié)合HMP考慮如下loss優(yōu)化三個(gè)子網(wǎng)絡(luò):

a. Rigid-aware structural matching:按照3D motion投影后rigid部分的結(jié)構(gòu)特點(diǎn)應(yīng)該match
b. Edge-aware local smoothness:投影后的深度和光流的應(yīng)該保持smoothness
c. Rigid-aware 3D motion consistency:rigid background的moving object motion值應(yīng)該盡量小
d. Flow motion consistency in occluded regions:occluded regions的光流前后映射應(yīng)該一致
e. Multi-scale penalization:累加4個(gè)尺度的loss

備注:在雙目攝像頭的表現(xiàn)優(yōu)于單目。通過(guò)joint learning,光流、深度、camera motion的表現(xiàn)均有提升。

在Kitti上的表現(xiàn)如下,算是差強(qiáng)人意吧。

本文作者還有一篇工作《Every Pixel Counts: Unsupervised Geometry Learning with Holistic 3D Motion Understanding》,是關(guān)于估計(jì)ego motion的。

《FlowNet3D: Learning Scene Flow in 3D Point Clouds》 CVPR 2018

輸入:僅使用點(diǎn)云數(shù)據(jù)

核心思想:采用pointnet++作為基本模塊,提取前后兩幀點(diǎn)云特征并進(jìn)行融合、上采樣,直接擬合出scene flow

網(wǎng)絡(luò)結(jié)構(gòu)如下:

a. 4組set conv layer:pointnet++ 提取點(diǎn)云特征
b. 1組flow embedding layer: 把前后兩幀的點(diǎn)云特征mix,第一幀的取中心點(diǎn),其臨近點(diǎn)從第二幀取,再提取特征
c. 4組set upconv layer:上采樣,新增點(diǎn)從鄰近點(diǎn)獲取特征

loss為smooth L1 loss

備注:在合成數(shù)據(jù)集上訓(xùn)練的模型可以直接在kitti上work,但與圖像場(chǎng)景流的論文不同,沒(méi)有把background和moving object做區(qū)分,沒(méi)有考慮ego motion。

《HPLFlowNet: Hierarchical Permutohedral Lattice FlowNet for Scene Flow Estimation on Large-scale Point Clouds》 CVPR 2019

輸入:僅使用點(diǎn)云數(shù)據(jù)

核心思想:采用Bilateral Convolutional Layers作為基本模塊,提取前后兩幀點(diǎn)云特征并進(jìn)行融合、上采樣,直接擬合出scene flow。

備注:與FlowNet3D的整體結(jié)構(gòu)一樣,都是下采樣-融合-上采樣。Bilateral Convolutional Layers能夠快速處理高維稀疏數(shù)據(jù),是不同于PointNet的一種濾波操作。

《PointFlowNet: Learning Representations for Rigid Motion Estimation from Point Clouds》 CVPR 2019

輸入:僅使用點(diǎn)云數(shù)據(jù)

核心思想:利用點(diǎn)云數(shù)據(jù)提取特征后,分別生成ego motion、scene flow、rigid motion、objection location,再整合結(jié)果輸出

細(xì)節(jié)如下:

a. 采用VolexNet作為feature encoder
b. 把前后兩幀的特征進(jìn)行concate,接入context encoder
c. 之后,接入三個(gè)分支:

i. ego-miotion regressor
ii. sceneflow decoder -> rigid motion decoder(證明了rigid motion decoder 無(wú)法使用卷積層,故此處采用了fc)
iii. objection location decoder

d. 把檢測(cè)出的object和motion融合得到結(jié)果

loss為 Scene Flow Loss + Rigid Motion Loss + Ego-motion Loss + Detection Loss

備注:本文思路與圖像類方法很像,也是考慮各個(gè)instance的motion。

總結(jié)

  • Deep Rigid Instance Scene Flow:

輸入為雙目圖像,用MaskRCNN把動(dòng)靜態(tài)障礙物分開(kāi)。三個(gè)子網(wǎng)絡(luò)分別獨(dú)立訓(xùn)練并計(jì)算出Instance Segmentation、深度圖、光流,利用三個(gè)子網(wǎng)絡(luò)的結(jié)果計(jì)算motion,進(jìn)而得到scene flow。

  • Learning Rigidity in Dynamic Scenes with a Moving Camera for 3D Motion Field Estimation:

輸入為RGBD圖像,兩個(gè)子網(wǎng)絡(luò)分別獨(dú)立訓(xùn)練并算出光流、ego-motion&rigid mask,refine ego motion后算出scene flow。

  • Every Pixel Counts ++:

輸入為單目/雙目攝像頭,先用三個(gè)子網(wǎng)絡(luò)估計(jì)光流、深度、camera motion,再按照幾何關(guān)系計(jì)算出rigid background的motion和moving objects的motion,之后根據(jù)一致性對(duì)三個(gè)子網(wǎng)絡(luò)進(jìn)行優(yōu)化。

  • FlowNet3D 以及 HPLFlowNet:

分別對(duì)前后兩幀點(diǎn)云下采樣提取特征并進(jìn)行融合、上采樣,直接擬合出scene flow。

  • PointFlowNet(思路類似Deep Rigid Instance Scene Flow):

采用volexnet提取前后兩幀點(diǎn)云特征并融合,先檢測(cè)出object、計(jì)算出ego motion、scene flow,再去回歸各個(gè)object的motion。

審核編輯:符乾江
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35128

    瀏覽量

    279679
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49013

    瀏覽量

    249401
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    什么是反時(shí)限過(guò)保護(hù)?深入解析反時(shí)限過(guò)保護(hù)的應(yīng)用場(chǎng)景與優(yōu)勢(shì)

    在電力系統(tǒng)中,過(guò)保護(hù)是保障設(shè)備安全運(yùn)行和電網(wǎng)穩(wěn)定性的重要環(huán)節(jié)。其中,反時(shí)限過(guò)保護(hù)以其獨(dú)特的動(dòng)作特性,在特定應(yīng)用場(chǎng)景下發(fā)揮著不可替代的作用。本文將深入探討反時(shí)限過(guò)保護(hù)的原理、優(yōu)勢(shì),
    的頭像 發(fā)表于 07-17 13:53 ?50次閱讀
    什么是反時(shí)限過(guò)<b class='flag-5'>流</b>保護(hù)?深入解析反時(shí)限過(guò)<b class='flag-5'>流</b>保護(hù)的應(yīng)用<b class='flag-5'>場(chǎng)景</b>與優(yōu)勢(shì)

    使用FX3測(cè)試程序中的數(shù)據(jù)時(shí),遇到了每8個(gè)字節(jié)重復(fù)的場(chǎng)景,是什么原因?qū)е碌模?/a>

    我在使用 FX3 測(cè)試程序中的數(shù)據(jù)時(shí),遇到了每 8 個(gè)字節(jié)重復(fù)的場(chǎng)景。
    發(fā)表于 05-21 06:59

    弧光保護(hù)裝置與傳統(tǒng)過(guò)保護(hù)的差異

    弧光保護(hù)裝置與傳統(tǒng)過(guò)保護(hù)的差異: 對(duì)比項(xiàng)弧光保護(hù)裝置傳統(tǒng)過(guò)保護(hù) 檢測(cè)對(duì)象電弧光+電流突變僅電流幅值 動(dòng)作時(shí)間5-15ms 1100ms-2s 適用場(chǎng)景開(kāi)關(guān)柜內(nèi)部短路線路過(guò)載/遠(yuǎn)端短路 抗干擾能力多判據(jù)融合,誤動(dòng)率低易受電機(jī)啟
    發(fā)表于 05-07 09:59

    在石化行業(yè),GUTOR UPS主要應(yīng)用哪些場(chǎng)景

    GUTOR UPS在石化行業(yè)適用于哪些場(chǎng)景。
    發(fā)表于 03-06 15:41

    敏捷合成器的技術(shù)原理和應(yīng)用場(chǎng)景

    敏捷合成器,作為一種高性能的信號(hào)發(fā)生器,其技術(shù)原理和應(yīng)用場(chǎng)景值得深入探討。技術(shù)原理敏捷合成器的技術(shù)原理主要基于先進(jìn)的頻率合成技術(shù)和數(shù)字信號(hào)處理技術(shù)。它通常具有寬頻率范圍、快速建立和可編程的相位、頻率
    發(fā)表于 02-20 15:25

    RTOS的緩沖區(qū)機(jī)制解析

    SAFERTOS中的緩沖區(qū)(Stream buffer)機(jī)制,可以實(shí)現(xiàn)任務(wù)到任務(wù)或中斷到任務(wù)之間的通信。字節(jié)流是由發(fā)送方寫(xiě)入緩沖區(qū),接收方讀取緩沖區(qū)數(shù)據(jù)。緩沖區(qū)作為隊(duì)列的輕量級(jí)級(jí)替代方案,適合單讀單寫(xiě)場(chǎng)景,寫(xiě)者在
    的頭像 發(fā)表于 02-14 11:33 ?540次閱讀
    RTOS的<b class='flag-5'>流</b>緩沖區(qū)機(jī)制解析

    控行業(yè)中的恒壓泵和灌流泵的區(qū)別

    控恒壓泵和灌流泵的主要區(qū)別在于它們的工作原理、應(yīng)用場(chǎng)景以及流量控制的穩(wěn)定性和精度?。 一、工作原理? 微控恒壓泵:基于氣體驅(qū)動(dòng)技術(shù),能夠精準(zhǔn)輸出恒定壓力的微量流體,實(shí)現(xiàn)無(wú)脈沖流動(dòng)。它設(shè)計(jì)精巧
    的頭像 發(fā)表于 02-05 16:03 ?418次閱讀

    華為支付-(可選)特定場(chǎng)景配置操作

    如涉及以下場(chǎng)景,需提前完成相關(guān)產(chǎn)品的開(kāi)通或配置操作。如不涉及,則不需要配置。 場(chǎng)景一:產(chǎn)品開(kāi)通操作 部分支付場(chǎng)景接入涉及產(chǎn)品開(kāi)通,未開(kāi)通產(chǎn)品直接接入,商戶請(qǐng)求華為支付開(kāi)放的API接口時(shí)可能會(huì)導(dǎo)致
    發(fā)表于 01-21 10:30

    多用示波器的原理和應(yīng)用場(chǎng)景

    多用示波器是一種功能強(qiáng)大的電子測(cè)量?jī)x器,其原理和應(yīng)用場(chǎng)景如下:一、原理多用示波器主要是利用電子示波管的特性,將人眼無(wú)法直接觀測(cè)的交變電信號(hào)轉(zhuǎn)換成圖像,顯示在熒光屏上以便測(cè)量。具體來(lái)說(shuō),當(dāng)被測(cè)信號(hào)輸入
    發(fā)表于 01-09 15:42

    系統(tǒng)放大器的技術(shù)原理和應(yīng)用場(chǎng)景

    系統(tǒng)放大器是一種重要的電子設(shè)備,其技術(shù)原理和應(yīng)用場(chǎng)景都具有一定的專業(yè)性和廣泛性。以下是對(duì)系統(tǒng)放大器的技術(shù)原理和應(yīng)用場(chǎng)景的詳細(xì)介紹:一、技術(shù)原理系統(tǒng)放大器的工作原理基于電子器件的非線性特性,通過(guò)控制
    發(fā)表于 11-18 14:46

    HarmonyOS NEXT應(yīng)用元服務(wù)開(kāi)發(fā)控件位置調(diào)整場(chǎng)景與重新設(shè)置新焦點(diǎn)位置的場(chǎng)景

    一、控件位置調(diào)整場(chǎng)景 移動(dòng)過(guò)程中需要實(shí)時(shí)播報(bào)即將移動(dòng)到的位置,新位置的播報(bào)會(huì)打斷老位置的播報(bào),放置到確定位置后,需要再播報(bào)已經(jīng)放置的位置信息,盡量保證視障用戶耳朵聽(tīng)到的信息和我們通過(guò)眼睛看到的信息
    發(fā)表于 10-25 09:49

    實(shí)時(shí)示波器的技術(shù)原理和應(yīng)用場(chǎng)景

    波形圖像。在信號(hào)處理方面,示波器首先將接收到的被測(cè)信號(hào)進(jìn)行放大和濾波等處理,以確保信號(hào)的準(zhǔn)確性和穩(wěn)定性。然后,通過(guò)A/D轉(zhuǎn)換技術(shù),將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),以便進(jìn)行后續(xù)的數(shù)字處理和顯示。二、應(yīng)用場(chǎng)景
    發(fā)表于 10-23 14:22

    如何有效解決固耦合問(wèn)題

    固耦合問(wèn)題的基本概念 固耦合問(wèn)題是指在流體和固體相互作用的過(guò)程中,流體的運(yùn)動(dòng)受到固體邊界的影響,同時(shí)固體的變形和應(yīng)力狀態(tài)也受到流體的作用。固耦合問(wèn)題具有以下特點(diǎn): 1.1 多學(xué)科性:
    的頭像 發(fā)表于 08-09 15:16 ?1677次閱讀

    LED恒驅(qū)動(dòng)芯片:升壓恒和降壓恒的區(qū)別和應(yīng)用場(chǎng)景

    輸入電壓,使其高于LED正常工作電壓,以實(shí)現(xiàn)恒定的LED電流輸出。在升壓恒驅(qū)動(dòng)中,驅(qū)動(dòng)電路將輸入電壓升高至所需電壓,并保持輸出電流恒定。 升壓恒驅(qū)動(dòng)適用于需要將低電壓源提升至較高電壓來(lái)驅(qū)動(dòng)LED的場(chǎng)景,例如電池供電的手持設(shè)備
    的頭像 發(fā)表于 08-09 13:47 ?4415次閱讀

    FPGA與MCU的應(yīng)用場(chǎng)景

    肯定是不同的。在需要處理多個(gè)高速數(shù)據(jù)場(chǎng)景下,F(xiàn)PGA的多通道IO接口設(shè)計(jì)能力顯得尤為重要,例如PCIe、DDR還是其他高速通信協(xié)議。FPGA可以進(jìn)行高速數(shù)字信號(hào)處理,能夠以極高的效率執(zhí)行數(shù)
    發(fā)表于 07-29 15:45