99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

3D 點(diǎn)云的無監(jiān)督膠囊網(wǎng)絡(luò) 多任務(wù)上實(shí)現(xiàn)SOTA

工程師鄧生 ? 來源:機(jī)器之心Pro ? 作者:杜偉、小舟 ? 2021-01-02 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這是一種為 3D 點(diǎn)云提出的無監(jiān)督膠囊架構(gòu),并且在 3D 點(diǎn)云重構(gòu)、配準(zhǔn)和無監(jiān)督分類方面優(yōu)于 SOTA 方法。

理解對(duì)象是計(jì)算機(jī)視覺的核心問題之一。傳統(tǒng)方法而言,理解對(duì)象任務(wù)可以依賴于大型帶注釋的數(shù)據(jù)集,而無監(jiān)督方法已經(jīng)消除了對(duì)標(biāo)簽的需求。近來,研究人員試圖將這些方法擴(kuò)展到 3D 點(diǎn)云問題上,但無監(jiān)督 3D 學(xué)習(xí)領(lǐng)域卻進(jìn)展寥寥。

近日,包括 Weiwei Sun、Andrea Tagliasacchi、Geoffrey Hinton 等來自英屬哥倫比亞大學(xué)、谷歌研究院、多倫多大學(xué)的研究者提出了用于 3D 點(diǎn)云的無監(jiān)督膠囊網(wǎng)絡(luò)。Hinton 對(duì)此表示:在不受監(jiān)督的情況下找到一個(gè)對(duì)象的自然組件以及這些組件的內(nèi)在參照系是學(xué)習(xí)將解析圖像轉(zhuǎn)換為局部整體層級(jí)結(jié)構(gòu)的重要一步。如果以點(diǎn)云開始,則可以做到。

具體而言,研究者通過排列等變(permutation-equivariant)的注意力計(jì)算對(duì)象的膠囊分解,并通過訓(xùn)練成對(duì)的隨機(jī)旋轉(zhuǎn)對(duì)象來自監(jiān)督該過程。本研究的核心思想是將注意力掩模聚合為語(yǔ)義關(guān)鍵點(diǎn),并使用它們來監(jiān)督滿足膠囊不變性或等方差的分解。這不僅可以訓(xùn)練語(yǔ)義上一致的分解,還能夠?qū)W習(xí)以對(duì)象為中心的推理的規(guī)范化操作。在這種情況下,既不需要分類標(biāo)簽,也不需要手動(dòng)對(duì)齊的訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練。

最后,通過以無監(jiān)督的方式學(xué)習(xí)以對(duì)象為中心的表征,該方法在 3D 點(diǎn)云重構(gòu)、配準(zhǔn)和無監(jiān)督分類方面優(yōu)于 SOTA 方法。研究者表示將很快公布源代碼和數(shù)據(jù)集。

4eaf897ed7574ed59f400ace87532372.png

論文鏈接:https://arxiv.org/abs/2012.04718

項(xiàng)目主頁(yè):https://canonical-capsules.github.io/

方法

該網(wǎng)絡(luò)在未對(duì)齊的點(diǎn)云上進(jìn)行訓(xùn)練,如下圖 2 所示:研究者訓(xùn)練了一個(gè)將點(diǎn)云分解為多個(gè)組件的網(wǎng)絡(luò),并通過 Siamese 訓(xùn)練設(shè)置實(shí)現(xiàn)不變性 / 等方差。

5bebc405bb414dbb9a5dce0bc059afeb.png

然后研究者將點(diǎn)云規(guī)范化為學(xué)習(xí)的參照系,并在該坐標(biāo)空間中執(zhí)行自動(dòng)編碼。

損失

正如無監(jiān)督方法中常見的那樣,該研究的框架依賴于大量的損失,這些損失控制著力圖在表征中獲得的不同特征。請(qǐng)注意所有這些損失是如何不受監(jiān)督且不需要標(biāo)簽的。研究者根據(jù)他們監(jiān)督的網(wǎng)絡(luò)部分組織損失,包括分解、規(guī)范化和重建。

網(wǎng)絡(luò)架構(gòu)

研究者簡(jiǎn)要介紹了實(shí)現(xiàn)細(xì)節(jié),包括網(wǎng)絡(luò)架構(gòu)。

編碼器 E。我們的架構(gòu)是基于 [42] 提出一種類似于點(diǎn)網(wǎng)的架構(gòu),具有殘差連接和注意力上下文歸一化;

解碼器 D。公式 (4) 中的解碼器基于每個(gè)膠囊運(yùn)行。本研究采用的解碼器架構(gòu)類似于 AtlasNetV2 [13](帶有可訓(xùn)練的網(wǎng)格)。不同之處在于本研究通過相應(yīng)的膠囊姿態(tài)轉(zhuǎn)換每個(gè)膠囊的解碼點(diǎn)云;

dbd4a1f441fd4c9a89d4d0aa1c45b1c3.png

回歸器 K。研究者只需連接描述符,并通過 ReLU 激活函數(shù)調(diào)用一系列全連接層,以回歸 P 膠囊定位。在輸出層,研究者使用線性激活函數(shù),并進(jìn)一步減去輸出平均值,以使回歸位置在規(guī)范化框架中以零為中心(zero-centered);

規(guī)范化描述符。由于本研究的描述符只是近似旋轉(zhuǎn)不變(通過擴(kuò)展),研究者發(fā)現(xiàn)在規(guī)范化之后重新提取膠囊描述符β_k 很有用。

實(shí)驗(yàn)及結(jié)果

自動(dòng)編碼

研究者針對(duì)兩個(gè)訓(xùn)練基線(在單類別和多類別變體中經(jīng)過了訓(xùn)練)評(píng)估了用于訓(xùn)練網(wǎng)絡(luò)任務(wù)(重建 / 自動(dòng)編碼)的方法的性能:

AtlasNetV2 [13],一種使用基于補(bǔ)?。╬atch-based)多頭解碼器的 SOTA 自動(dòng)編碼器;

3D-PointCapsNet [58],一種利用膠囊架構(gòu)的 3D 點(diǎn)云自動(dòng)編碼器。

下表 1 是定量分析的結(jié)果,本文方法在對(duì)齊和未對(duì)齊的設(shè)置下均取得了 SOTA 的性能結(jié)果。

7d47aedc4e5d4d9f89153a3912802b6d.png

下圖 3 是定性分析的結(jié)果。研究者給出了基于分解的 3D 點(diǎn)云重建方法以及 3D-PointCapsNet [58]、AtlasNetV2 [13]的重建結(jié)果。

f08ee44ceab24b2fb22d4217aee82c19.jpeg

配準(zhǔn)

研究者在配準(zhǔn) 3D 點(diǎn)云的能力方面評(píng)估了該方法的性能,并與以下 3 個(gè)基準(zhǔn)進(jìn)行了比較:

Deep Closest Points (DCP) [52]:一種基于深度學(xué)習(xí)的點(diǎn)云配準(zhǔn)方法;

DeepGMR–RRI [56],一種 SOTA 方法,該方法可以將云分解為具有旋轉(zhuǎn)不變特征的高斯混合;

DeepGMR–XYZ [56],其中將原始 XYZ 坐標(biāo)用作輸入,而不使用旋轉(zhuǎn)不變特征;

本研究采用的變體方法 RRI,其中使用 RRI 特征 [6] 作為該架構(gòu)的唯一輸入。本文使用 RRI 特征的方法遵循 DeepGMR 訓(xùn)練協(xié)議,并訓(xùn)練 100 個(gè)周期,而對(duì)于 DCP 和 DeepGMR,本研究使用了原作者的官方實(shí)現(xiàn)。定量分析的結(jié)果如下表 2 所示:

f7a4ad2beb7e4ee394eb40f5d523d540.png

無監(jiān)督分類

除了重建和配準(zhǔn)(這兩者是與訓(xùn)練損失直接相關(guān)的任務(wù))之外,本研究還通過分類任務(wù)評(píng)估了方法的有效性,該分類任務(wù)與訓(xùn)練損失沒有任何關(guān)系。結(jié)果如下表 3 所示,本文方法均實(shí)現(xiàn)了 SOTA 的 Top-1 準(zhǔn)確率。

6ca8fd7c6ef74954b39d2ea9f3b673cd.png

控制變量實(shí)驗(yàn)

此外,為了進(jìn)一步分析規(guī)范化膠囊(Canonical Capsules)的不同組件對(duì)性能的影響,本研究進(jìn)行了一系列控制變量實(shí)驗(yàn),結(jié)果如下表 4、表 6、表 7 所示:

74e0564e8a694571bda86714282352a4.png

表 4:損失的影響。

9d4ee60782ac40cd8ace2a6e714b3355.png

表 6:規(guī)范描述符的有效性。

2f6de421c8d845359ac147b7ebea0952.png

表 7:點(diǎn)的數(shù)量對(duì)性能的影響。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2959

    瀏覽量

    110730
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    7976

    瀏覽量

    140024
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7814

    瀏覽量

    90925
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    光子精密雙目3D線激光輪廓測(cè)量?jī)x,擺脫視覺盲區(qū),1臺(tái)更比2臺(tái)強(qiáng)!

    光子精密雙目3D線激光輪廓測(cè)量?jī)x(GL-8160D),在GL-8000系列的基礎(chǔ)創(chuàng)新升級(jí)。GL-8160D采用全新雙目單線設(shè)計(jì),突破傳統(tǒng)3D
    的頭像 發(fā)表于 07-16 17:21 ?152次閱讀
    光子精密雙目<b class='flag-5'>3D</b>線激光輪廓測(cè)量?jī)x,擺脫視覺盲區(qū),1臺(tái)更比2臺(tái)強(qiáng)!

    TechWiz LCD 3D應(yīng)用:FFS仿真

    建模任務(wù) 堆棧結(jié)構(gòu) 建模過程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結(jié)構(gòu),并生成3D結(jié)構(gòu) 2.3 使用TechWiz LCD 3D進(jìn)行各項(xiàng)參數(shù)計(jì)算 3
    的頭像 發(fā)表于 07-14 14:08 ?110次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應(yīng)用:FFS仿真

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    ,本案例使用TechWiz LCD 3D進(jìn)行局部摩擦的設(shè)置。 1. 建模任務(wù) 1.1進(jìn)行局部摩擦配置 2. 建模過程 以下是建模過程中部分重要步驟的說明 2.1在TechWiz Layout中創(chuàng)建結(jié)構(gòu)
    發(fā)表于 06-16 08:46

    TechWiz LCD 3D應(yīng)用:微液晶分子摩擦排布

    ) 結(jié)構(gòu)創(chuàng)建完成后在TechWiz LCD 3D中加載并進(jìn)行相關(guān)參數(shù)設(shè)置 2.2在TechWiz LCD 3D軟件中設(shè)置微擾方式為用戶自定義,并設(shè)置微擾角度 2.3其它設(shè)置 此例僅對(duì)比使用微擾方式
    發(fā)表于 06-10 08:44

    3D AD庫(kù)文件

    3D庫(kù)文件
    發(fā)表于 05-28 13:57 ?5次下載

    告別漫長(zhǎng)等待! 3D測(cè)量竟然可以如此的絲滑

    據(jù)進(jìn)行實(shí)時(shí)處理,快速得到全視角的彩色高精度2D圖像和3D點(diǎn)。產(chǎn)品優(yōu)勢(shì)01高精度的在線3D檢測(cè)采用業(yè)界頂級(jí)的CMOS感光元件和超低畸變遠(yuǎn)心光
    的頭像 發(fā)表于 05-12 18:01 ?318次閱讀
    告別漫長(zhǎng)等待! <b class='flag-5'>3D</b>測(cè)量竟然可以如此的絲滑

    TechWiz LCD 3D應(yīng)用:微液晶分子摩擦排布

    ) 結(jié)構(gòu)創(chuàng)建完成后在TechWiz LCD 3D中加載并進(jìn)行相關(guān)參數(shù)設(shè)置 2.2在TechWiz LCD 3D軟件中設(shè)置微擾方式為用戶自定義,并設(shè)置微擾角度 2.3其它設(shè)置 此例僅對(duì)比使用微擾方式
    發(fā)表于 04-01 08:59

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個(gè)關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成3D場(chǎng)景和3D標(biāo)簽,具備重要的研究?jī)r(jià)值。現(xiàn)有主流算法主要依賴于點(diǎn)
    的頭像 發(fā)表于 03-17 13:44 ?468次閱讀
    一種以圖像為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>

    對(duì)于結(jié)構(gòu)光測(cè)量、3D視覺的應(yīng)用,使用100%offset的lightcrafter是否能用于點(diǎn)生成的應(yīng)用?

    你好,我有一些對(duì)于offset的疑問,希望能夠得到解答。 對(duì)于結(jié)構(gòu)光測(cè)量、3D視覺的應(yīng)用,使用100%offset的lightcrafter是否能用于點(diǎn)生成的應(yīng)用? 標(biāo)定和三角重建算法和zero
    發(fā)表于 02-28 06:20

    BEVFusion —面向自動(dòng)駕駛的多任務(wù)多傳感器高效融合框架技術(shù)詳解

    ,激光雷達(dá)在3D視圖中捕獲數(shù)據(jù)。1. 核心目標(biāo)與創(chuàng)新?目標(biāo)? 解決多模態(tài)傳感器(攝像頭、激光雷達(dá)等)在3D感知任務(wù)中的異構(gòu)數(shù)據(jù)融合難題,實(shí)現(xiàn)高效、通用的
    的頭像 發(fā)表于 02-26 20:33 ?3854次閱讀
    BEVFusion —面向自動(dòng)駕駛的<b class='flag-5'>多任務(wù)</b>多傳感器高效融合框架技術(shù)詳解

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    ,本案例使用TechWiz LCD 3D進(jìn)行局部摩擦的設(shè)置。 1. 建模任務(wù) 1.1進(jìn)行局部摩擦配置 2. 建模過程 以下是建模過程中部分重要步驟的說明 2.1在TechWiz Layout中創(chuàng)建結(jié)構(gòu)
    發(fā)表于 02-08 08:52

    C#通過Halcon實(shí)現(xiàn)3D點(diǎn)重繪

    C# 通過 Halcon 實(shí)現(xiàn) 3D 點(diǎn)重繪
    發(fā)表于 01-05 09:16 ?0次下載

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    ,本案例使用TechWiz LCD 3D進(jìn)行局部摩擦的設(shè)置。 1. 建模任務(wù) 1.1進(jìn)行局部摩擦配置 2. 建模過程 以下是建模過程中部分重要步驟的說明 2.1在TechWiz Layout中創(chuàng)建結(jié)構(gòu)
    發(fā)表于 01-03 08:58

    TechWiz LCD 3D應(yīng)用:撓曲電效用仿真

    完成后在TechWiz LCD 3D中加載并進(jìn)行相關(guān)參數(shù)設(shè)置 2.2在TechWiz LCD 3D軟件中開啟應(yīng)用撓曲電效應(yīng)的功能 2.3其它設(shè)置 液晶設(shè)置 電壓條件設(shè)置 光學(xué)分析部分,添加偏振片 結(jié)果查看 3.1 V-T曲線 3.2 結(jié)果對(duì)比
    發(fā)表于 12-10 13:43

    歡創(chuàng)播報(bào) 騰訊元寶首發(fā)3D生成應(yīng)用

    1 騰訊元寶首發(fā)3D生成應(yīng)用 只需一張照片,便能迅速打造獨(dú)一二的3D角色。7月16日,騰訊旗下大模型應(yīng)用“騰訊元寶”上線了“3D角色夢(mèng)工廠”玩法,騰訊元寶也是首個(gè)擁有打印級(jí)
    的頭像 發(fā)表于 07-18 11:39 ?1225次閱讀
    歡創(chuàng)播報(bào) 騰訊元寶首發(fā)<b class='flag-5'>3D</b>生成應(yīng)用