99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

頂刊TIP 2023!浙大提出:基于全頻域通道選擇的的無監(jiān)督異常檢測

CVer ? 來源:APRIL機器人智能感知與學(xué)習(xí) ? 2024-01-11 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.導(dǎo)語

503f6dc2-b040-11ee-8b88-92fbcf53809c.png ? 近年來,無監(jiān)督異常檢測任務(wù)逐漸受到大家關(guān)注,其中基于密度和分類的方法在無監(jiān)督異常檢測中占據(jù)主導(dǎo)地位,而基于重構(gòu)的方法由于重構(gòu)能力差、性能不高而很少被提及,但后者不需要額外花費大量的訓(xùn)練樣本進行無監(jiān)督訓(xùn)練,具有更大的實用價值。本文著重改進基于重構(gòu)的方法,從頻率的角度處理感知異常檢測任務(wù)(sensory anomaly detection),提出了一種新的全頻率通道選擇重構(gòu)網(wǎng)絡(luò)(Omni-frequency Channel-selection Reconstruction,OCR-GAN)。實驗結(jié)果證明了提出方法的有效性和優(yōu)越性,例如,在沒有額外訓(xùn)練數(shù)據(jù)的情況下(不使用預(yù)訓(xùn)練模型或者其他數(shù)據(jù)集,即模型train from scratch),在MVTec AD數(shù)據(jù)集上實現(xiàn)了新的最先進的98.3檢測AUC,顯著地比基于重建的基線高+38.1↑,比SOTA高?+0.3↑。 ?

2.背景介紹

504302ca-b040-11ee-8b88-92fbcf53809c.png 異常檢測是視覺圖像理解中的一項重要的二分類任務(wù),用于區(qū)分給定圖像是否偏離預(yù)定義的正常分布,在現(xiàn)實世界中有各種應(yīng)用,例如新穎性檢測、工業(yè)產(chǎn)品質(zhì)量監(jiān)控、缺陷修復(fù)等?,F(xiàn)實應(yīng)用中,異常檢測任務(wù)可以分為感知異常檢測(Sensory Anomaly Detection,見圖1左圖)和語義異常檢測(Semantic Anomaly Detection,見圖1右圖)兩大類,前者只存在協(xié)變量偏差而不存在語義偏差(常用MVTec AD[1]、DAGM[2]、KolektorSDD[3]等數(shù)據(jù)集),而后者則相反(常用CIFAR-10[4]數(shù)據(jù)集)。

504b192e-b040-11ee-8b88-92fbcf53809c.png

圖1感知AD和語義AD任務(wù)圖解

異常檢測任務(wù)中獲取異常樣本耗時且成本較高,這驅(qū)動我們開展更實用的無監(jiān)督AD方法研究。目前的無監(jiān)督異常檢測方法主要分為三類,如圖2所示。

1)Density-based方法:基于密度的方法通常采用預(yù)訓(xùn)練的模型來提取輸入圖像的有意義嵌入向量,測試圖像時通過計算嵌入表示與參考表示分布之間的相似度以得到異常分?jǐn)?shù)。這種方法在MVTec AD等數(shù)據(jù)集上取得了較高的指標(biāo)分?jǐn)?shù),但需要預(yù)訓(xùn)練模型加持且可解釋性不足。

2)Classification-based方法:基于分類的方法試圖找到正常/異常數(shù)據(jù)的分類邊界,一般使用代理任務(wù)訓(xùn)練的模型來檢測異常,因此該類方法依賴于代理任務(wù)與測試數(shù)據(jù)的匹配程度,且需要預(yù)訓(xùn)練模型和額外的訓(xùn)練數(shù)據(jù)。

3)Reconstruction-based方法:基于重構(gòu)的方法包含一個用于重構(gòu)輸入圖像的生成器結(jié)構(gòu),異常分?jǐn)?shù)可解釋為重構(gòu)誤差。這類方法不需要預(yù)訓(xùn)練的模型和額外的訓(xùn)練數(shù)據(jù),但目前該類方法相較于其他方法表達能力略有差距。

本文重點研究基于重構(gòu)的方法,期望增強生成器的重構(gòu)能力以提升模型的異常檢測能力。

506c0db4-b040-11ee-8b88-92fbcf53809c.png

圖2無監(jiān)督異常檢測方法pipeline對比 對于一幅圖像,不同的頻段包含不同類型的信息,例如低頻代表更多的語義信息,高頻代表更詳細的紋理信息。在此思想的推動下,我們發(fā)現(xiàn)異常檢測任務(wù)中正常和異常圖像的頻率分布存在明顯差異,如圖3所示。

5096ac4a-b040-11ee-8b88-92fbcf53809c.png

圖3 MVTec AD數(shù)據(jù)集中正常和異常樣本的能量隨頻率的分布,陰影表示標(biāo)準(zhǔn)差

基于此,我們認為僅使用一個生成器來學(xué)習(xí)RGB圖像的全頻率重建是困難且不合適的,因此提出了一種利用多頻分支分別重構(gòu)不同頻帶信息的異常檢測框架,并設(shè)計了合適的結(jié)構(gòu)以提升模型的異常檢測效果,相較于對比方法取得了最SOTA結(jié)果,如圖4所示。

509ef47c-b040-11ee-8b88-92fbcf53809c.png

圖4不同方法AUROC檢測結(jié)果對比圖

具體地,本文有如下幾點貢獻:

1)從頻域的角度重新思考了正常和異常圖像的區(qū)別,提出了一種全頻率通道選擇重構(gòu)網(wǎng)絡(luò)(Omni-frequency Channel-selection Reconstruction,OCR-GAN)。

2)提出了頻率解耦(Frequency Decoupling,F(xiàn)D)模塊來獲取圖像的不同頻帶信息,實現(xiàn)多分支的全頻重建。

3)提出了通道選擇(Channel Selection,CS)模塊來實現(xiàn)多支路之間的全頻率交互和不同信道特征的自適應(yīng)選擇。

4)大量的實驗證明了提出方法的優(yōu)越性,例如,我們在沒有額外訓(xùn)練數(shù)據(jù)的MVTec AD數(shù)據(jù)集上實現(xiàn)了新的SOTA 98.3檢測AUROC,相較于沒有額外訓(xùn)練數(shù)據(jù)的基于重構(gòu)方法獲得了+18.3↑提升,同時相較于SOTA方法獲得了+0.3↑提升。

3.方法介紹

50af48d6-b040-11ee-8b88-92fbcf53809c.png 3.1??總覽我們的方法包含多個生成器對不同頻率圖像進行重建,同時與鑒別器D交替訓(xùn)練以進一步提高模型性能。具體來說,我們提出了一個有效的頻率解耦模塊(FD)來解耦輸入圖像到全頻圖像,以及一個通道選擇模塊(CS)在多個頻率編碼器之間通過自適應(yīng)通道選擇的方式進行特征交互。模型完成訓(xùn)練后的推理階段,重構(gòu)圖像與原圖像的重構(gòu)誤差作為圖像的異常得分。

50b28f3c-b040-11ee-8b88-92fbcf53809c.png

圖5OCR-GAN方法示意圖

3.2 頻率解耦模塊

圖像中不同的頻段包含不同類型的信息,例如低頻代表更多的語義信息,高頻代表更詳細的紋理信息。該模塊用來將原始圖像分解為多個頻段圖像,以獲得信息更豐富的全頻段顯性表達,具體包含如下3個過程:

1)將原始圖像與5x5高斯核進行卷積,獲得下采樣圖像

2)通過多次上下采樣操作得到一組模糊圖像

3)模糊圖像按照處理深度不同程度地丟失了一些高頻信息,進一步計算相鄰圖像之間的差值得到全頻域圖像。圖5顯示了多個不同頻域分量的定性表示結(jié)果。

3.3 通道選擇模塊

在只有FD模塊的異常檢測框架中,多頻率分支相對獨立,這違背了不同頻率相輔相成的客觀事實。為此,我們設(shè)計了一種新穎的通道選擇模塊,實現(xiàn)了多支路間的頻域交互和不同通道特征的自適應(yīng)選擇。圖6(a)展示了雙頻率下CS模塊的微觀詳細結(jié)構(gòu),即只包含低頻和高頻特征,但其可以很容易地擴展到多分支。圖6(b)展示了CS模塊與頻率編碼器之間的宏觀交互方式。

50b680b0-b040-11ee-8b88-92fbcf53809c.png

圖6 (a)CS模塊示意圖;(b)CS模塊與多頻編碼器交互方式

4.實驗結(jié)果

50be22d4-b040-11ee-8b88-92fbcf53809c.png 4.1? 定量對比

本文與主流的異常檢測方法(AGAN[5]、AE[6]、Skip-GANomaly[7]、GradCon[8]、Puzzle-AE[9]、DGAD[10]、DRAEM[11]、DifferNet[12]、CutPaste[13]、InTra[14])在多個數(shù)據(jù)集上進行定量對比實驗。如表1/2/3/4所示,提出的OCR-GAN在MVTec AD上獲得了98.3 AUROC結(jié)果,且在全部數(shù)據(jù)集上都獲取了SOTA結(jié)果,相較于對比方法取得了明顯優(yōu)勢。

50c56a8a-b040-11ee-8b88-92fbcf53809c.png

表1MVTecAD結(jié)果對比表

50e59d32-b040-11ee-8b88-92fbcf53809c.png

表2 DAGM結(jié)果對比表

50f8351e-b040-11ee-8b88-92fbcf53809c.png

表3KolektorSDD結(jié)果對比表

51020eea-b040-11ee-8b88-92fbcf53809c.png

表4 CIFAR-10結(jié)果對比表

4.2 定性對比

圖7展示了不同重建方法的定性對比,可以看到本文提出的方法對輸入圖像的正常區(qū)域具有很好的重建結(jié)果,對于異常區(qū)域具有明顯的區(qū)分性,證明了OCR-GAN的有效性。

511dd3d2-b040-11ee-8b88-92fbcf53809c.png

圖7 不同方法的重建結(jié)果對比

4.3 解釋性實驗及剝離實驗

1)圖8展示了不同模塊對異常得分分布影響,可以看到,在基線直方圖中,正常樣本和異常樣本無法通過異常得分進行有效區(qū)分。逐步增加FD和CS模塊后,模型的區(qū)分能力得到了提高,表明每個模塊對方法結(jié)果都有貢獻。

514dc394-b040-11ee-8b88-92fbcf53809c.png

圖8不同模塊組合下的異常得分分布圖

2)我們將每個測試樣本的潛在空間特征從D的最后一個卷積層映射到一個二維子空間。如圖9顯示,正常和異常樣本在潛在空間中具有較強的聚類效應(yīng),且具有明顯的區(qū)分性。

516384ae-b040-11ee-8b88-92fbcf53809c.png

圖9 正常/異常樣本t-SNE分布圖

3)表5展示了頻率分支對于模型結(jié)果影響。結(jié)果表明,僅使用高頻信息比使用低頻信息效果更好,這意味著異常區(qū)域包含更多的高頻信息。然而,由于缺乏不同頻率支路之間的信息交互,單獨使用雙頻支路效果有限,而設(shè)計的CS模塊可以很好地處理該問題,進一步提高了模型的性能。

5187a2d0-b040-11ee-8b88-92fbcf53809c.png

表5 頻率分支數(shù)量剝離實驗結(jié)果

5.總結(jié)與展望

51a2c6b4-b040-11ee-8b88-92fbcf53809c.png

本文從頻域的角度提出了一種基于重構(gòu)的OCR-GAN異常檢測方法。具體來說,我們提出了FD模塊將輸入圖像解耦到不同的頻率空間,并將圖像重建過程建模為并行的全頻率圖像恢復(fù)的組合。為了更好地實現(xiàn)不同編碼器之間的頻率交互,我們提出了一種定制的CS模塊,其可以自適應(yīng)地在多個支路之間選擇不同的信道以增強每一個頻域的特征。我們的方法在沒有額外訓(xùn)練數(shù)據(jù)的情況下,在Sensory AD和Semantic AD任務(wù)上相較于同時代方法具有明顯的優(yōu)勢。未來,我們將進一步探索AD任務(wù)中輕量化模型的設(shè)計,同時構(gòu)建更具有挑戰(zhàn)性的實際應(yīng)用數(shù)據(jù)集。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 異常檢測
    +關(guān)注

    關(guān)注

    1

    文章

    44

    瀏覽量

    9856
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3522

    瀏覽量

    50449
  • 生成器
    +關(guān)注

    關(guān)注

    7

    文章

    322

    瀏覽量

    21918
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25463

原文標(biāo)題:頂刊TIP 2023!浙大提出:基于全頻域通道選擇的的無監(jiān)督異常檢測

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于transformer和自監(jiān)督學(xué)習(xí)的路面異常檢測方法分享

    鋪設(shè)異常檢測可以幫助減少數(shù)據(jù)存儲、傳輸、標(biāo)記和處理的壓力。本論文描述了一種基于Transformer和自監(jiān)督學(xué)習(xí)的新方法,有助于定位異常區(qū)域。
    的頭像 發(fā)表于 12-06 14:57 ?2392次閱讀
    基于transformer和自<b class='flag-5'>監(jiān)督</b>學(xué)習(xí)的路面<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>方法分享

    提高IT運維效率,深度解讀京東云AIOps落地實踐(異常檢測篇)

    基于深度學(xué)習(xí)對運維時序指標(biāo)進行異常檢測,快速發(fā)現(xiàn)線上業(yè)務(wù)問題 時間序列的異常檢測是實際應(yīng)用中的一個關(guān)鍵問題,尤其是在 IT 行業(yè)。我們沒有采用傳統(tǒng)的基于閾值的方法來實現(xiàn)
    的頭像 發(fā)表于 05-22 16:38 ?435次閱讀
    提高IT運維效率,深度解讀京東云AIOps落地實踐(<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>篇)

    機器學(xué)習(xí)異常檢測實戰(zhàn):用Isolation Forest快速構(gòu)建標(biāo)簽異常檢測系統(tǒng)

    本文轉(zhuǎn)自:DeepHubIMBA監(jiān)督異常檢測作為機器學(xué)習(xí)領(lǐng)域的重要分支,專門用于在缺乏標(biāo)記數(shù)據(jù)的環(huán)境中識別異常事件。本文深入探討
    的頭像 發(fā)表于 06-24 11:40 ?648次閱讀
    機器學(xué)習(xí)<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>實戰(zhàn):用Isolation Forest快速構(gòu)建<b class='flag-5'>無</b>標(biāo)簽<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>系統(tǒng)

    tip122-tip127參數(shù)中文資料

    tip122-tip127參數(shù) pdf資料 該TIP120,TIP121和TIP122疏外延基NPN達林頓功率晶體管采用TO-220塑料封裝。與互補類型的
    發(fā)表于 09-19 16:44 ?168次下載
    <b class='flag-5'>tip122-tip</b>127參數(shù)中文資料

    基于聲學(xué)分段模型的監(jiān)督語音樣例檢測

    基于聲學(xué)分段模型的監(jiān)督語音樣例檢測_李勃昊
    發(fā)表于 01-07 16:24 ?0次下載

    用于自步學(xué)習(xí)的監(jiān)督屬性選擇算法資料介紹

    針對現(xiàn)有屬性選擇算法平等地對待每個樣本而忽略樣本之間的差異性,從而使學(xué)習(xí)模型無法避免噪聲樣本影響問題,提出一種融合自步學(xué)習(xí)理論的監(jiān)督屬性選擇
    發(fā)表于 12-07 13:40 ?5次下載

    監(jiān)督機器學(xué)習(xí)如何保護金融

    監(jiān)督機器學(xué)習(xí)是近年才發(fā)展起來的反欺詐手法。目前國內(nèi)反欺詐金融服務(wù)主要是應(yīng)用黑白名單、有監(jiān)督學(xué)習(xí)和監(jiān)督機器學(xué)習(xí)的方法來實現(xiàn)。
    發(fā)表于 05-01 22:11 ?1128次閱讀

    一種協(xié)作式步進頻域能量檢測算法

    為實現(xiàn)230MHz頻段電力無線通信頻譜的快速可靠認知,提出一種協(xié)作式步進頻域能量檢測算法。該算法在頻域進行2次步進能量檢測,第一次步進能量
    發(fā)表于 03-30 13:47 ?8次下載
    一種協(xié)作式步進<b class='flag-5'>頻域</b>能量<b class='flag-5'>檢測</b>算法

    集成流挖掘和圖挖掘的內(nèi)網(wǎng)異常檢測方法

    內(nèi)網(wǎng)惡意內(nèi)部活動的證據(jù)通常隱藏在大型數(shù)據(jù)流中,例如數(shù)月或年累積的系統(tǒng)日志,然而數(shù)據(jù)流往往是無界的、不斷變化的和未標(biāo)記的。因此,為實現(xiàn)高度準(zhǔn)確的異常檢測,提出集成流挖掘和圖挖掘的內(nèi)網(wǎng)異常
    發(fā)表于 04-12 11:29 ?7次下載
    集成流挖掘和圖挖掘的內(nèi)網(wǎng)<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>方法

    聯(lián)合多流行結(jié)構(gòu)和自表示的監(jiān)督特征選擇方法

    特征選擇是一種通過去除不相關(guān)和冗余的特征來降低數(shù)據(jù)維數(shù)和提高后續(xù)學(xué)習(xí)算法效率的數(shù)據(jù)處理方法。監(jiān)督特征選擇已經(jīng)成為維數(shù)約簡中具有挑戰(zhàn)性的問題之一。首先,通過結(jié)合特征自表示能力和流形結(jié)構(gòu)
    發(fā)表于 04-28 11:39 ?4次下載
    聯(lián)合多流行結(jié)構(gòu)和自表示的<b class='flag-5'>無</b><b class='flag-5'>監(jiān)督</b>特征<b class='flag-5'>選擇</b>方法

    如何選擇異常檢測算法

    異常檢測(也稱為離群點檢測)是檢測異常實例的任務(wù),異常實例與常規(guī)實例非常不同。這些實例稱為
    的頭像 發(fā)表于 10-25 09:15 ?1969次閱讀

    一種新的監(jiān)督時間序列異常檢測方法

    時間序列數(shù)據(jù)是生活中常見的一種數(shù)據(jù),在時間順序上具有一定規(guī)律,且大量存在于金融貿(mào)易、工業(yè)生產(chǎn)、環(huán)境保護、網(wǎng)絡(luò)安全等眾多領(lǐng)域。時間序列異常檢測在生產(chǎn)和生活中有著重要的作用,如在網(wǎng)絡(luò)安全領(lǐng)域中分析網(wǎng)絡(luò)異常行為,在金融領(lǐng)域中識別欺詐交
    的頭像 發(fā)表于 08-10 11:29 ?3226次閱讀

    基于視覺Transformer的監(jiān)督視頻異常檢測架構(gòu)進行腸息肉檢測的研究

    本文提出一種有效的基于視覺Transformer的弱監(jiān)督視頻異常檢測架構(gòu)來實現(xiàn)精準(zhǔn)檢測結(jié)直腸息肉。這也是首篇利用弱
    的頭像 發(fā)表于 09-27 11:15 ?2059次閱讀

    使用MATLAB進行異常檢測(下)

    在使用 MATLAB 進行異常檢測(上)中,我們探討了什么是異常值,簡單的一維數(shù)據(jù)異常檢測問題,針對高維數(shù)據(jù)的有
    的頭像 發(fā)表于 11-24 10:46 ?2846次閱讀

    哈工大提出Myriad:利用視覺專家進行工業(yè)異常檢測的大型多模態(tài)模型

    最近,大型多模態(tài)(即視覺和語言)模型(LMM)在圖像描述、視覺理解、視覺推理等多種視覺任務(wù)上表現(xiàn)出了卓越的感知能力,使其成為更易于理解的異常檢測的有競爭力的潛在選擇。然而,現(xiàn)有的通用 LMM 中缺乏有關(guān)
    的頭像 發(fā)表于 11-21 16:08 ?3214次閱讀
    哈工<b class='flag-5'>大提出</b>Myriad:利用視覺專家進行工業(yè)<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>的大型多模態(tài)模型