99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

在各種檢測器的所有模塊實現(xiàn)無監(jiān)督預訓練

jf_pmFSk4VX ? 來源:GiantPandaCV ? 2023-08-01 11:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. 背景介紹

近年來,大規(guī)模預訓練后微調優(yōu)化方法在計算機視覺中取得了重大進展。一系列預訓練算法被設計出來,以學習特定領域的或任務感知的概念,以提升下游性能。就目標檢測而言,當前方法通常利用ImageNet來預訓練骨干網(wǎng)絡,采用面向分類的監(jiān)督。然而,與面向檢測的微調過程相比,這種預訓練方法存在三個差異,如圖1所示。

數(shù)據(jù):大多數(shù)預訓練方法是在單個以物體為中心的數(shù)據(jù)集上進行的,如ImageNet。但是,檢測數(shù)據(jù)集,例如COCO,通常由不同尺度和位置的多個物體組成。數(shù)據(jù)特征和領域上的差異可能導致預訓練偏離下游任務。

模型:由于檢測器的多樣性和復雜性,當前預訓練算法主要關注模型內的部分模塊(例如骨干網(wǎng)絡)。檢測器中的某些關鍵組件(例如RPN和回歸頭)仍然是隨機初始化的。

任務:現(xiàn)有預訓練方法僅將分類任務視為替代任務,未能捕獲包括建議生成、目標分配和框回歸在內的與物體相關的位置上下文。

這些差異可能導致受限的結果、較差的泛化能力和較慢的收斂速度。

2. 相關知識補充

目標檢測。 當前的目標檢測算法可以根據(jù)不同的預測流程分為基于錨點、基于點和基于查詢的方法。基于錨點的方法在每個像素上生成多個具有預定義大小和尺度的錨點。它們通常通過交并比將訓練樣本劃分為正樣本和負樣本?;邳c的方法旨在找到與每個對象相對應的參考點,這可以是每個實例的中心點,預定義或自學習的關鍵點 。與基于錨點和基于點的方法中使用預定義的先驗知識不同,基于查詢的方法通過一組可學習的查詢來表示不同的對象。

自監(jiān)督預訓練。 自監(jiān)督學習充分利用了大量無標注數(shù)據(jù)來學習結構化的數(shù)據(jù)特征,預訓練的權重被轉移到下游任務中以確保良好的初始化。已經(jīng)為無監(jiān)督預訓練提出了許多替代任務,例如特征聚類 ,著色,上下文預測,旋轉預測和圖像填充。一方面,對比學習通過最大化來自同一實例的不同視圖的相似度來捕獲良好的表征 ,在多個下游任務中取得了有競爭力的性能。另一方面,Mask Image Modeling (MIM)最近在自監(jiān)督學習中引起了越來越多的關注。MIM不需要特定的數(shù)據(jù)增強,并且對下游任務具有更強大的泛化能力。

目標檢測的自監(jiān)督預訓練。 盡管無監(jiān)督預訓練在目標檢測中顯示出了有競爭力的結果,但直接將圖像級預訓練知識轉移到密集級下游任務存在一系列不一致之處。為減小預訓練和微調之間的差距,一些方法通過探索不同視圖之間的局部特征相似性來提出密集級對比學習。一些研究人員發(fā)現(xiàn)僅預訓練骨干網(wǎng)絡是不夠的,他們嘗試預訓練其他常見模塊,如FPN 。然而,這些方法需要從頭開始進行大量的預訓練,檢測器中的其他關鍵模塊(如RetinaNet 中的回歸頭)仍然是隨機初始化的。另一方面,UP-DETR和DETReg 通過引入?yún)^(qū)域匹配和特征重構替代任務來預訓練整個DETR樣式檢測器。盡管這些方法可以對整個模型進行充分的預訓練,但DETR定向的替代任務無法直接應用于其他檢測方法。相比之下,AlignDet實現(xiàn)了各種檢測器的高效充分的自監(jiān)督預訓練。

3. 方法詳解

最近的工作通過構建無監(jiān)督預訓練替代任務來擴展“預訓練和微調”方法,與僅使用監(jiān)督預訓練的方法相比,這些方法取得了更高的性能。然而,與檢測過程相比,當前預訓練方法在數(shù)據(jù)、模型和任務上存在不一致之處,如圖1所示。盡管可以通過大規(guī)模標注數(shù)據(jù)集的訓練來緩解這些不一致,但它需要巨大的計算資源和手工標注成本。這些問題和局限激發(fā)我們提出AlignDet,一個通用的自監(jiān)督框架,用于減小預訓練和微調階段中的差異。

ba50e4da-2fa2-11ee-9e74-dac502259ad0.png

圖2 AlignDet的預訓練流程圖。監(jiān)督和自監(jiān)督預訓練都可以用于圖像域階段,以捕捉整體視覺概念。對于框域預訓練,首先采用選擇性搜索生成無監(jiān)督建議作為偽標簽,然后對每個建議進行擴充,構建兩個具有不同尺度和變換的視圖。每個預測框用于構建對比學習和協(xié)調相關損失,以適應檢測任務。

整個預訓練流程如圖2所示。在以下小節(jié)中,我們分別在第3.1節(jié)和第3.2節(jié)中介紹圖像域預訓練和框域預訓練。我們提供了偽代碼,以便更直觀地理解AlignDet流程,以及與其他方法在技術細節(jié)上的比較見補充材料。

3.1 圖像域預訓練

圖像域預訓練優(yōu)化骨干網(wǎng)絡,為后續(xù)的框域預訓練提取高層語義特征,如圖2左側的步驟1所示。一方面,給定圖像x,骨干網(wǎng)絡可以在完全監(jiān)督的設置下與分類器和分類類別進行預訓練。另一方面,最近出現(xiàn)的無監(jiān)督學習算法有助于通過大量無標注數(shù)據(jù)捕獲更普適的表征。以SimSiam 為例,從輸入圖像中構造兩個視圖和,并采用不同的數(shù)據(jù)增強。骨干網(wǎng)絡可以通過最大化不同視圖的相似性來學習普適的表征,并且利用預測器和停止梯度用來防止模式崩潰。

圖像域預訓練通常在大規(guī)模的圖像分類數(shù)據(jù)集(如ImageNet)上進行,其中每個樣本主要包含一個或少數(shù)幾個主要物體位于圖像中心。這里存在一個差距,因為在預訓練過程無法訪問包含不同尺度和位置的多個物體目標數(shù)據(jù)集。此外,檢測頭仍然是隨機初始化的,回歸工作在此圖像域預訓練中也未明確學習到。為此,我們設計框域預訓練以減小這些差異。

3.2 框域預訓練

wKgZomTIf6WAdk2MAAMv-iD3gRQ925.jpg
wKgZomTIf7iASeEnAAEPGjlowrE082.jpg

4. 結論

本文中,我們指出預訓練和微調階段在目標檢測中存在數(shù)據(jù)、模型和任務的差異,并提出了AlignDet來解決這些問題。AlignDet學習分類和回歸知識,實現(xiàn)高效針對所有模塊的預訓練。值得注意的是,AlignDet是第一個實現(xiàn)各種檢測器完全無監(jiān)督預訓練的框架。我們廣泛的實驗表明,AlignDet可以在各種設置下顯著提升檢測性能,包括不同的檢測器、骨干網(wǎng)絡、數(shù)據(jù)設置和微調計劃。我們相信我們的工作為目標檢測中的預訓練問題提供了有價值的洞見,并開辟了新的研究方向。




審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 檢測器
    +關注

    關注

    1

    文章

    894

    瀏覽量

    48723
  • MIM
    MIM
    +關注

    關注

    0

    文章

    13

    瀏覽量

    9513
  • 圖像變換
    +關注

    關注

    0

    文章

    5

    瀏覽量

    1585

原文標題:ICCV2023-AlignDet:在各種檢測器的所有模塊實現(xiàn)無監(jiān)督預訓練

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    軸承異步電機轉子徑向位移白檢測

    訓練構建轉子位移預測模型,利用位移預測模型的泛化能力,進行轉子位移估計。仿真結果表明,提出的位移估計方法能夠準確檢測轉子徑向位移信號,并且能實現(xiàn)電機位移傳感
    發(fā)表于 07-14 17:45

    5 GHz 802.11ax 超線性 WLAN 前端模塊,帶集成對數(shù)檢測器 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()5 GHz 802.11ax 超線性 WLAN 前端模塊,帶集成對數(shù)檢測器相關產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有5 GHz 802.11ax 超線性 WLAN 前端模塊,帶集成
    發(fā)表于 07-02 18:32
    5 GHz 802.11ax 超線性 WLAN 前端<b class='flag-5'>模塊</b>,帶集成對數(shù)<b class='flag-5'>檢測器</b> skyworksinc

    帶功率檢測器的 5 GHz 前端模塊 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()帶功率檢測器的 5 GHz 前端模塊相關產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有帶功率檢測器的 5 GHz 前端模塊的引腳圖、接線圖、封裝手冊、中文資料、英文資料,帶功率
    發(fā)表于 06-19 18:35
    帶功率<b class='flag-5'>檢測器</b>的 5 GHz 前端<b class='flag-5'>模塊</b> skyworksinc

    使用MATLAB進行監(jiān)督學習

    監(jiān)督學習是一種根據(jù)未標注數(shù)據(jù)進行推斷的機器學習方法。監(jiān)督學習旨在識別數(shù)據(jù)中隱藏的模式和關系,無需任何監(jiān)督或關于結果的先驗知識。
    的頭像 發(fā)表于 05-16 14:48 ?698次閱讀
    使用MATLAB進行<b class='flag-5'>無</b><b class='flag-5'>監(jiān)督</b>學習

    阿童木雙張檢測器汽車沖壓產(chǎn)線的應用

    檢測器
    阿童木(廣州)智能科技有限公司
    發(fā)布于 :2025年04月10日 17:31:44

    用PaddleNLP4060單卡上實踐大模型訓練技術

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 之前我們分享了《從零開始訓練一個大語言模型需要投資多少錢》,其中高昂的訓練費用讓許多對大模型訓練
    的頭像 發(fā)表于 02-19 16:10 ?1009次閱讀
    用PaddleNLP<b class='flag-5'>在</b>4060單卡上實踐大模型<b class='flag-5'>預</b><b class='flag-5'>訓練</b>技術

    局域網(wǎng)地址檢測器

    局域網(wǎng)地址檢測器是一款非常實用的IP地址沖突快速檢測工具。這款它功能強大、操作簡單,能幫助用戶快速檢測同一局域網(wǎng)內遇到IP沖突的問題,需要的用戶可下載!  局域網(wǎng)地址
    發(fā)表于 02-17 17:00 ?2次下載

    壓力檢測器有哪些優(yōu)勢

    現(xiàn)代工業(yè)與基礎設施管理中,壓力檢測器作為監(jiān)測與控制系統(tǒng)的關鍵組件,扮演著重要的角色。壓力檢測器集高精度、高穩(wěn)定性與便捷操作于一體,供水、排水、消防水系統(tǒng)、輸油管道、輸氣管道等多個領
    的頭像 發(fā)表于 01-07 17:09 ?731次閱讀

    直播預約 |數(shù)據(jù)智能系列講座第4期:訓練的基礎模型下的持續(xù)學習

    神經(jīng)網(wǎng)絡,特別是訓練的基礎模型研究得到了廣泛的應用,但其仍然主要依賴于大量樣本上的批量式訓練。本報告將探討實現(xiàn)模型的增量式
    的頭像 發(fā)表于 10-18 08:09 ?610次閱讀
    直播預約 |數(shù)據(jù)智能系列講座第4期:<b class='flag-5'>預</b><b class='flag-5'>訓練</b>的基礎模型下的持續(xù)學習

    UCC28070實現(xiàn)橋功率因數(shù)校正(PFC)調節(jié)設計

    電子發(fā)燒友網(wǎng)站提供《UCC28070實現(xiàn)橋功率因數(shù)校正(PFC)調節(jié)設計.pdf》資料免費下載
    發(fā)表于 10-17 10:17 ?17次下載
    UCC28070<b class='flag-5'>實現(xiàn)</b><b class='flag-5'>無</b>橋功率因數(shù)校正(PFC)<b class='flag-5'>預</b>調節(jié)<b class='flag-5'>器</b>設計

    高效液相色譜儀的檢測器有哪些

    高效液相色譜儀(HPLC)是一種廣泛應用于化學分析、生物醫(yī)藥、環(huán)境監(jiān)測等領域的分離和檢測技術。HPLC的檢測器是整個系統(tǒng)的關鍵部分,它能夠將色譜柱分離出的組分轉化為可測量的信號,從而實現(xiàn)對樣品的定量
    的頭像 發(fā)表于 08-08 10:43 ?3125次閱讀

    熒光檢測器用的是什么燈光

    現(xiàn)象。熒光是指物質受到激發(fā)光照射后,吸收光能并躍遷到高能級,然后返回基態(tài)的過程中釋放出光能的現(xiàn)象。熒光檢測器通過測量熒光物質所發(fā)出的熒光信號,來分析物質的濃度、結構等信息。 熒光檢測器
    的頭像 發(fā)表于 08-08 10:38 ?1715次閱讀

    熒光檢測器適用范圍有哪些

    、材料科學等多個方面。 一、生物分子檢測 核酸檢測 熒光檢測器核酸檢測中具有重要應用,如DNA測序、基因表達分析、基因突變
    的頭像 發(fā)表于 08-08 10:35 ?2383次閱讀

    熒光檢測器用來檢測什么物質

    光能后,部分能量以光的形式重新釋放出來,這種光稱為熒光。熒光檢測器通過測量熒光的強度、波長等參數(shù),實現(xiàn)對物質的定性和定量分析。 熒光檢測器的工作原理主要包括以下幾個步驟: 激發(fā):熒光檢測器
    的頭像 發(fā)表于 08-08 10:34 ?2011次閱讀

    熒光檢測器激發(fā)波長和發(fā)射波長怎么設置

    熒光檢測器是一種常用的生物化學分析儀器,廣泛應用于蛋白質、核酸、細胞等生物分子的定量、定性和定位分析。熒光檢測器的工作原理是利用熒光物質特定波長下吸收光能,然后以較長波長的形式釋放出來,通過測量
    的頭像 發(fā)表于 08-08 10:31 ?6704次閱讀