99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

KITTI 3D檢測(cè)數(shù)據(jù)集

新機(jī)器視覺 ? 來(lái)源:新機(jī)器視覺 ? 作者:千百度@知乎 ? 2022-05-31 10:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

77c8d9f8-e01e-11ec-ba43-dac502259ad0.png

基于Lidar的object檢測(cè)模型包括Point-based [PointRCNN(CVPR19), IA-SSD(CVPR22)等], Voxel-based [PointPillars(CVPR19), CenterPoint(CVPR21)等],Point-Voxel-based [PV-RCNN(CVPR20), HVPR(CVPR21)等]和Multi-view-based[PIXOR(CVPR18)等]等。本博客主要記錄,作為菜鳥的我,在KITTI數(shù)據(jù)集上(3類)基于PyTorch實(shí)現(xiàn)PointPillars的一些學(xué)習(xí)心得, 訓(xùn)練和測(cè)試的pipeline如Figure 1所示。這里按照深度學(xué)習(xí)算法的流程進(jìn)行展開: 數(shù)據(jù) + 網(wǎng)絡(luò)結(jié)構(gòu) + 預(yù)測(cè)/可視化 + 評(píng)估,和實(shí)現(xiàn)的代碼結(jié)構(gòu)是一一對(duì)應(yīng)的,完整代碼已更新于github//github.com/zhulf0804/PointPillars [說(shuō)明 - 代碼的實(shí)現(xiàn)是通過閱讀mmdet3dv0.18.1源碼, 加上自己的理解完成的。因?yàn)椴粫?huì)寫cuda, 所以cuda代碼和少量代碼是從mmdet3dv0.18.1復(fù)制過來(lái)的。]

78442ec8-e01e-11ec-ba43-dac502259ad0.jpg

一、KITTI 3D檢測(cè)數(shù)據(jù)集

1.1 數(shù)據(jù)集信息:

·KITTI數(shù)據(jù)集論文:Are we ready for autonomous driving? the kitti vision benchmark suite[CVPR 2012] 和Vision meets robotics: The kitti dataset[IJRR 2013]·KITTI數(shù)據(jù)集下載(下載前需要登錄): point cloud(velodyne, 29GB), images(image_2, 12 GB), calibration files(calib, 16 MB)和labels(label_2, 5 MB)。數(shù)據(jù)velodyne, calib 和 label_2的讀取詳見utils/io.py。

1.2 ground truth label信息 [file]

對(duì)每一幀點(diǎn)云數(shù)據(jù), label是 n個(gè)15維的向量, 組成了8個(gè)維度的信息。

786aee6e-e01e-11ec-ba43-dac502259ad0.png

1)訓(xùn)練時(shí)主要用到的是類別信息(type) 和3d bbox 信息 (location, dimension, rotation_y).2)觀測(cè)角(alpha)和旋轉(zhuǎn)角(rotation_y)的區(qū)別和聯(lián)系可以參考博客blog.csdn.net/qq_161375。

1.3 坐標(biāo)系的變換

因?yàn)間t label中提供的bbox信息是Camera坐標(biāo)系的,因此在訓(xùn)練時(shí)需要使用外參等將其轉(zhuǎn)換到Lidar坐標(biāo)系; 有時(shí)想要把3d bbox映射到圖像中的2d bbox方便可視化,此時(shí)需要內(nèi)參。具體轉(zhuǎn)換關(guān)系如Figure 2。坐標(biāo)系轉(zhuǎn)換的代碼見utils/process.py。

78b98984-e01e-11ec-ba43-dac502259ad0.jpg

1.4 數(shù)據(jù)增強(qiáng)

數(shù)據(jù)增強(qiáng)應(yīng)該是Lidar檢測(cè)中很重要的一環(huán)。發(fā)現(xiàn)其與2D檢測(cè)中的增強(qiáng)差別較大,比如3D中會(huì)做database sampling(我理解的是把gt bbox進(jìn)行cut-paste), 會(huì)做碰撞檢測(cè)等。在本庫(kù)中主要使用了采用了5種數(shù)據(jù)增強(qiáng), 相關(guān)代碼在dataset/data_aug.py
  • 采樣gt bbox并將其復(fù)制到當(dāng)前幀的點(diǎn)云
    • 從Car, Pedestrian, Cyclist的database數(shù)據(jù)集中隨機(jī)采集一定數(shù)量的bbox及inside points, 使每類bboxes的數(shù)量分別達(dá)到15, 10, 10.
    • 將這些采樣的bboxes進(jìn)行碰撞檢測(cè), 通過碰撞檢測(cè)的bboxes和對(duì)應(yīng)labels加到gt_bboxes_3d, gt_labels
    • 把位于這些采樣bboxes內(nèi)點(diǎn)刪除掉, 替換成bboxes內(nèi)部的點(diǎn).
  • bbox 隨機(jī)旋轉(zhuǎn)平移
    • 以某個(gè)bbox為例, 隨機(jī)產(chǎn)生num_try個(gè)平移向量t和旋轉(zhuǎn)角度r, 旋轉(zhuǎn)角度可以轉(zhuǎn)成旋轉(zhuǎn)矩陣(mat).
    • 對(duì)bbox進(jìn)行旋轉(zhuǎn)和平移, 找到num_try中第一個(gè)通過碰撞測(cè)試的平移向量t和旋轉(zhuǎn)角度r(mat).
    • 對(duì)bbox內(nèi)部的點(diǎn)進(jìn)行旋轉(zhuǎn)和平移.
    • 對(duì)bbox進(jìn)行旋轉(zhuǎn)和平移.
  • 隨機(jī)水平翻轉(zhuǎn)
    • points水平翻轉(zhuǎn)
    • bboxes水平翻轉(zhuǎn)
  • 整體旋轉(zhuǎn)/平移/縮放
    • object旋轉(zhuǎn), 縮放和平移
    • point旋轉(zhuǎn), 縮放和平移
  • 對(duì)points進(jìn)行shuffle: 打亂點(diǎn)云數(shù)據(jù)中points的順序。
Figure3是對(duì)上述前4種數(shù)據(jù)增強(qiáng)的可視化結(jié)果。

78e2ec70-e01e-11ec-ba43-dac502259ad0.jpg

二、網(wǎng)絡(luò)結(jié)構(gòu)與訓(xùn)練

790ffaf8-e01e-11ec-ba43-dac502259ad0.png

7944643c-e01e-11ec-ba43-dac502259ad0.png

2.2 GT值生成

Head的3個(gè)分支基于anchor分別預(yù)測(cè)了類別, bbox框(相對(duì)于anchor的偏移量和尺寸比)和旋轉(zhuǎn)角度的類別, 那么在訓(xùn)練時(shí), 如何得到每一個(gè)anchor對(duì)應(yīng)的GT值呢 ? 相關(guān)代碼見model/anchors.py

79a33d0e-e01e-11ec-ba43-dac502259ad0.png

79daebe6-e01e-11ec-ba43-dac502259ad0.png

2.3 損失函數(shù)和訓(xùn)練

現(xiàn)在知道了類別分類head, bbox回歸head和朝向分類head的預(yù)測(cè)值和GT值, 接下來(lái)介紹損失函數(shù)。相關(guān)代碼見loss/loss.py

7a01fcf4-e01e-11ec-ba43-dac502259ad0.png

總loss = 1.0*類別分類loss + 2.0*回歸loss + 2.0*朝向分類loss。模型訓(xùn)練: 優(yōu)化器torch.optim.AdamW(), 學(xué)習(xí)率的調(diào)整torch.optim.lr_scheduler.OneCycleLR(); 模型共訓(xùn)練160epoches。

三、單幀預(yù)測(cè)和可視化

基于Head的預(yù)測(cè)值和anchors, 如何得到最后的候選框呢 ? 相關(guān)代碼見model/pointpillars.py。一般經(jīng)過以下幾個(gè)步驟:基于預(yù)測(cè)的類別分?jǐn)?shù)的scores, 選出nms_pre (100) 個(gè)anchors: 每一個(gè)anchor具有3個(gè)scores, 分別對(duì)應(yīng)屬于每一類的概率, 這里選擇這3個(gè)scores中最大值作為該anchor的score; 根據(jù)每個(gè)anchor的score降序排序, 選擇anchors。

7a278974-e01e-11ec-ba43-dac502259ad0.png

3. 逐類進(jìn)行以下操作:
  • 過濾掉類別score 小于 score_thr (0.1) 的bboxes
  • 基于nms_thr (0.01), nms過濾掉重疊框:

7a9bf3a4-e01e-11ec-ba43-dac502259ad0.png

另外, 基于Open3d實(shí)現(xiàn)了在Lidar和Image里3d bboxes的可視化, 相關(guān)代碼見test.pyutils/vis_o3d.py。下圖是對(duì)驗(yàn)證集中id=000134的數(shù)據(jù)進(jìn)行可視化的結(jié)果。

7acf8ade-e01e-11ec-ba43-dac502259ad0.jpg

7af3dce0-e01e-11ec-ba43-dac502259ad0.jpg

四、模型評(píng)估

評(píng)估指標(biāo)同2D檢測(cè)類似, 也是采用AP, 即Precison-Recall曲線下的面積。不同的是, 在3D中可以計(jì)算3D bbox, BEV bbox 和 (2D bbox, AOS)的AP。先說(shuō)明一下AOS指標(biāo)和Difficulty的定義。

7b52c138-e01e-11ec-ba43-dac502259ad0.png

Difficulty: 根據(jù)2d框的高度, 遮擋程度和截?cái)喑潭? 把bbox分為 difficulty=0, 1, 2 或 其它。相關(guān)定義具體查看代碼pre_process_kitti.py#L16-32。這里以3D bbox為例, 介紹類別=Car,difficulty=1AP的計(jì)算。注意, difficulty=1的數(shù)據(jù)實(shí)際上是指difficulty<=1的數(shù)據(jù); 另外這里主要介紹大致步驟, 具體實(shí)現(xiàn)見evaluate.py。1.計(jì)算3D IoU (utils/process.pyiou3d(bboxes1, bboxes2)), 用于判定一個(gè)det bbox是否和gt bbox匹配上 (IoU > 0.7)。2.根據(jù)類別=Car,difficulty=1選擇gt bboxes和det bboxes。
  • gt bboxes: 選擇類別=Car,difficulty<=1的bboxes;
  • det bboxes: 選擇預(yù)測(cè)類別=Car的bboxes。
3. 確定P-R曲線中的點(diǎn)對(duì)(Pi, Ri)對(duì)應(yīng)的score閾值。

7bed7ae8-e01e-11ec-ba43-dac502259ad0.png

7c33fc20-e01e-11ec-ba43-dac502259ad0.jpg

五、總結(jié)點(diǎn)云檢測(cè), 相比于點(diǎn)云中其它任務(wù)(分類, 分割和配準(zhǔn)等), 邏輯和代碼都更加復(fù)雜, 但這并不是體現(xiàn)在網(wǎng)絡(luò)結(jié)構(gòu)上, 更多的是體現(xiàn)在數(shù)據(jù)增強(qiáng), Anchors和GT生成, 單幀推理等。點(diǎn)云檢測(cè), 相比于2D圖像檢測(cè)任務(wù), 不同的是坐標(biāo)系變換, 數(shù)據(jù)增強(qiáng)(碰撞檢測(cè), 點(diǎn)是否在立方體判斷等), 斜長(zhǎng)方體框IoU的計(jì)算等; 評(píng)估方式因?yàn)榭紤]到DontCare, difficulty等, 也更加復(fù)雜一些.初次接觸基于KITTI的3D檢測(cè), 如有理解錯(cuò)誤的, 還請(qǐng)指正; 內(nèi)容太多了, 如有遺漏, 待以后補(bǔ)充。 審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 可視化
    +關(guān)注

    關(guān)注

    1

    文章

    1264

    瀏覽量

    21871
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25460
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122811

原文標(biāo)題:3D點(diǎn)云 (Lidar)檢測(cè)入門篇 : PointPillars PyTorch實(shí)現(xiàn)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    海伯森3D閃測(cè)傳感器,工業(yè)檢測(cè)領(lǐng)域的高精度利器

    隨著信息技術(shù)的飛速進(jìn)步,第四次視覺革命深度融合“人”“機(jī)”“物”,基于光學(xué)原理的3D視覺檢測(cè)技術(shù)迎來(lái)爆發(fā)式發(fā)展,成為工業(yè)生產(chǎn)中更高效的檢測(cè)利器。3D視覺技術(shù)通過非接觸性、高速性、
    的頭像 發(fā)表于 06-20 17:46 ?875次閱讀
    海伯森<b class='flag-5'>3D</b>閃測(cè)傳感器,工業(yè)<b class='flag-5'>檢測(cè)</b>領(lǐng)域的高精度利器

    3D AD庫(kù)文件

    3D庫(kù)文件
    發(fā)表于 05-28 13:57 ?5次下載

    3D閃存的制造工藝與挑戰(zhàn)

    3D閃存有著更大容量、更低成本和更高性能的優(yōu)勢(shì),本文介紹了3D閃存的制造工藝與挑戰(zhàn)。
    的頭像 發(fā)表于 04-08 14:38 ?1068次閱讀
    <b class='flag-5'>3D</b>閃存的制造工藝與挑戰(zhàn)

    ?超景深3D檢測(cè)顯微鏡技術(shù)解析

    在現(xiàn)代科技領(lǐng)域,顯微鏡技術(shù)的發(fā)展始終是推動(dòng)科學(xué)研究和技術(shù)進(jìn)步的重要引擎。上海桐爾作為這一領(lǐng)域的探索者,其超景深3D檢測(cè)顯微鏡技術(shù)的突破,為科學(xué)研究、工業(yè)檢測(cè)和醫(yī)療診斷等領(lǐng)域帶來(lái)了全新的可能性。這項(xiàng)
    發(fā)表于 02-25 10:51

    英倫科技裸眼3D便攜屏有哪些特點(diǎn)?

    英倫科技裸眼3D便攜屏采用了領(lǐng)先的光場(chǎng)裸眼3D技術(shù),無(wú)需佩戴3D眼鏡即可觀看,給用戶帶來(lái)裸眼看3D視頻的體驗(yàn),為用戶帶來(lái)更加便捷和自由的視覺享受。
    的頭像 發(fā)表于 02-06 14:20 ?507次閱讀
    英倫科技裸眼<b class='flag-5'>3D</b>便攜屏有哪些特點(diǎn)?

    SciChart 3D for WPF圖表庫(kù)

    SciChart 3D for WPF 是一個(gè)實(shí)時(shí)、高性能的 WPF 3D 圖表庫(kù),專為金融、醫(yī)療和科學(xué)應(yīng)用程序而設(shè)計(jì)。非常適合需要極致性能和豐富的交互式 3D 圖表的項(xiàng)目。 使用我們
    的頭像 發(fā)表于 01-23 13:49 ?631次閱讀
    SciChart <b class='flag-5'>3D</b> for WPF圖表庫(kù)

    騰訊混元3D AI創(chuàng)作引擎正式發(fā)布

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具將為用戶帶來(lái)前所未有的3D內(nèi)容創(chuàng)作體驗(yàn),標(biāo)志著騰訊在AI技術(shù)領(lǐng)域的又一重大突破。 混元3D AI創(chuàng)作引擎憑借其強(qiáng)大
    的頭像 發(fā)表于 01-23 10:33 ?602次閱讀

    騰訊混元3D AI創(chuàng)作引擎正式上線

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具,標(biāo)志著騰訊在3D內(nèi)容生成領(lǐng)域邁出了重要一步。 混元3D AI創(chuàng)作引擎的核心功能極為強(qiáng)大,用戶只需通過簡(jiǎn)單的提示詞
    的頭像 發(fā)表于 01-22 10:26 ?602次閱讀

    3D掃描技術(shù)醫(yī)療領(lǐng)域創(chuàng)新實(shí)踐,積木易搭3D掃描儀Mole助力定制個(gè)性化手臂康復(fù)輔具

    1、“3D掃描+3D打印”技術(shù)為矯形修復(fù)、醫(yī)療輔助器具定制等領(lǐng)域帶來(lái)突破性創(chuàng)新 近年來(lái),隨著AI、大數(shù)據(jù)3D掃描、3D打印、云計(jì)算、物聯(lián)網(wǎng)
    的頭像 發(fā)表于 10-31 11:25 ?717次閱讀
    <b class='flag-5'>3D</b>掃描技術(shù)醫(yī)療領(lǐng)域創(chuàng)新實(shí)踐,積木易搭<b class='flag-5'>3D</b>掃描儀Mole助力定制個(gè)性化手臂康復(fù)輔具

    湖北三維掃描儀3D掃描黑色反光件3D偏差比對(duì)尺寸檢測(cè)設(shè)備-CASAIM

    3D掃描
    中科院廣州電子
    發(fā)布于 :2024年09月26日 09:46:46

    3D激光線掃輪廓傳感器在汽車行業(yè)的汽車車縫檢測(cè)的應(yīng)用

    在實(shí)際應(yīng)用中,3D激光線掃傳感器可以集成到自動(dòng)化檢測(cè)系統(tǒng)中,與機(jī)器人或自動(dòng)化輸送系統(tǒng)配合,實(shí)現(xiàn)對(duì)汽車車縫的全面檢測(cè)。這些系統(tǒng)通常包括傳感器、控制軟件、數(shù)據(jù)處理單元和用戶界面,能夠自動(dòng)分
    的頭像 發(fā)表于 09-14 09:00 ?920次閱讀
    <b class='flag-5'>3D</b>激光線掃輪廓傳感器在汽車行業(yè)的汽車車縫<b class='flag-5'>檢測(cè)</b>的應(yīng)用

    透明塑料件噴粉3D掃描CAV全尺寸檢測(cè)逆向3D建模設(shè)計(jì)服務(wù)-CASAIM

    3D建模
    中科院廣州電子
    發(fā)布于 :2024年08月30日 10:04:53

    安寶特產(chǎn)品 安寶特3D Analyzer:智能的3D CAD高級(jí)分析工具

    安寶特3D Analyzer包含多種實(shí)用的3D CAD高級(jí)分析工具,包括自動(dòng)比對(duì)模型、碰撞檢測(cè)、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠有效提升3D CAD模型
    的頭像 發(fā)表于 08-07 10:13 ?787次閱讀
    安寶特產(chǎn)品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級(jí)分析工具

    深視智能3D相機(jī)在軸承內(nèi)徑檢測(cè)的應(yīng)用

    3D相機(jī)
    深視智能科技
    發(fā)布于 :2024年07月23日 10:33:54

    廣東3D掃描鈑金件外觀尺寸測(cè)量3D偏差檢測(cè)對(duì)比解決方案CASAIM

    3D掃描
    中科院廣州電子
    發(fā)布于 :2024年07月22日 16:13:45