99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于學(xué)習(xí)的數(shù)據(jù)增強(qiáng)策略擴(kuò)充你的數(shù)據(jù)集!

nlfO_thejiangme ? 來(lái)源:lq ? 2019-08-02 15:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)對(duì)于深度學(xué)習(xí)來(lái)說(shuō)至關(guān)重要,而數(shù)據(jù)增強(qiáng)策略對(duì)于提升訓(xùn)練樣本數(shù)據(jù)量、改善模型穩(wěn)定性和魯棒性,提高對(duì)于真實(shí)世界的適應(yīng)性和泛化性具有重要的作用。

雖然在圖像分類中數(shù)據(jù)增強(qiáng)有著廣泛的使用,但將數(shù)據(jù)增強(qiáng)用于目標(biāo)檢測(cè)的系統(tǒng)性研究還較少。此外由于目標(biāo)檢測(cè)數(shù)據(jù)的標(biāo)記成本比圖像分類更高,數(shù)據(jù)增強(qiáng)策略在有限數(shù)據(jù)的情況下除了能提高模型表現(xiàn)同時(shí)還能節(jié)省數(shù)據(jù)成本。

來(lái)自谷歌的研究人員針對(duì)目標(biāo)檢測(cè)任務(wù)提出了一種基于學(xué)習(xí)的數(shù)據(jù)增強(qiáng)策略,通過在訓(xùn)練數(shù)據(jù)上進(jìn)行增強(qiáng)策略搜索和驗(yàn)證集的性能測(cè)試來(lái)尋找最優(yōu)的數(shù)據(jù)增強(qiáng)方法,有效地提升了模型的表現(xiàn),同時(shí)學(xué)習(xí)到的數(shù)據(jù)增強(qiáng)策略對(duì)于不同數(shù)據(jù)、基礎(chǔ)網(wǎng)絡(luò)和模型架構(gòu)都具有效的泛化性和適應(yīng)性。值得一提的是,文章的作者來(lái)自提出著名的神經(jīng)架構(gòu)搜索及其相關(guān)方法的研究團(tuán)隊(duì)。

通用高效的目標(biāo)檢測(cè)數(shù)據(jù)增強(qiáng)策略

數(shù)據(jù)增強(qiáng)廣泛是機(jī)器學(xué)習(xí)中常用的數(shù)據(jù)處理手段,不同的數(shù)據(jù)集通常會(huì)利用針對(duì)性的數(shù)據(jù)處理手段來(lái)處理。例如MNIST大多使用尺度、旋轉(zhuǎn)和平移的操作,也有加入顏色、噪聲等變換,而針對(duì)自然圖像,更多采用進(jìn)行和隨機(jī)裁剪的方法來(lái)進(jìn)行。還包括以對(duì)象為中心的裁剪、針對(duì)圖像片的增減和變換等,但這些方法大都針對(duì)特定的數(shù)據(jù)來(lái)處理并集中于圖像分類問題。

但由于數(shù)據(jù)標(biāo)記的成本很高,數(shù)據(jù)增強(qiáng)對(duì)于目標(biāo)檢測(cè)有著更為重要的實(shí)際意義。由于目標(biāo)檢測(cè)的復(fù)雜性使得有效的數(shù)據(jù)增強(qiáng)策略難以獲取。為了得到有效的數(shù)據(jù)增強(qiáng)策略并應(yīng)用于目標(biāo)檢測(cè)任務(wù)中,研究人員希望利用算法搜索到一套新穎的檢測(cè)數(shù)據(jù)增強(qiáng)策略,并能夠有效地應(yīng)用于不同的數(shù)據(jù)集、數(shù)據(jù)尺寸、基礎(chǔ)網(wǎng)絡(luò)和檢測(cè)架構(gòu)上,有效提升算法的性能。

基于離散優(yōu)化增強(qiáng)策略搜索

對(duì)于目標(biāo)檢測(cè)來(lái)說(shuō)通常需要考慮目標(biāo)框(bounding box, bbox)與變換后圖像連續(xù)性,研究人員針對(duì)bbox內(nèi)部的圖像提出了一系列變換,同時(shí)探索了圖像整體變化時(shí)如何調(diào)整bbox的策略。通過定義一系列子策略集和多個(gè)圖像操作變換,最終將這一問題歸結(jié)為離散空間中的優(yōu)化問題來(lái)進(jìn)行求解。首先研究人員將圖像增強(qiáng)策略定義為K個(gè)子策略的無(wú)序集合,在訓(xùn)練時(shí)從中隨機(jī)選取策略對(duì)圖像進(jìn)行數(shù)據(jù)增強(qiáng)。而其中每一個(gè)策略則包含了N個(gè)圖先變換,這些圖像變換將依次作用于被增強(qiáng)的數(shù)據(jù),研究的目的在于從中搜索出最有效的策略。這些變量共同定義了一個(gè)離散優(yōu)化問題的搜索空間,針對(duì)目標(biāo)檢測(cè)任務(wù)的數(shù)據(jù)增強(qiáng),研究人員將設(shè)置K=5,N=2。其中搜索空間總共包含了五個(gè)子策略,每個(gè)子策略包含了2種圖像操作,而每個(gè)操作同時(shí)包含了這個(gè)操作對(duì)應(yīng)的概率p和操作的具體數(shù)值m兩個(gè)參數(shù)。這里的概率定義的增強(qiáng)策略在數(shù)據(jù)樣本上進(jìn)行的隨機(jī)性,而m則定義了增強(qiáng)的幅度。

具體來(lái)說(shuō),研究人員從實(shí)驗(yàn)中總結(jié)了22中有利于檢測(cè)的數(shù)據(jù)增強(qiáng)算法,分別是顏色操作、幾何變換和bbox操作。

顏色操作:針對(duì)圖像的顏色通道進(jìn)行操作,包括直方圖均衡、對(duì)比圖調(diào)整和亮度調(diào)整等;

幾何操作:對(duì)于圖像進(jìn)行幾何變換,包括位置變換,bbox的大小和位置、旋轉(zhuǎn)、剪切變換等,需要指出的是在進(jìn)行幾何變換時(shí)需要對(duì)bbox進(jìn)行調(diào)整;

bbox操作:僅針對(duì)bbox內(nèi)部的內(nèi)容進(jìn)行操作,而不改變外部的背景,可以綜合使用前面的顏色和幾何變換。

在使用過程中,研究人員將每種操作的幅度都?xì)w一化到[0,10],對(duì)應(yīng)L=6等間距的空間,對(duì)應(yīng)概率也是一個(gè)M=6的等間距空間,這一取值平衡了強(qiáng)化學(xué)習(xí)算法計(jì)算的可追溯性和學(xué)習(xí)能力。

針對(duì)這樣的數(shù)值定義可以計(jì)算出每個(gè)策略需要搜索的空間包含(22LM)^2,而五個(gè)策略對(duì)應(yīng)的空間為(22*6*6)^10~9.6*10^18如此大的搜索空間一定需要高效的方法才能進(jìn)行有效的處理。在這篇文章中研究人員采用了基于RNN輸出空間表示離散值,同時(shí)利用RL算法來(lái)更新模型權(quán)重。其中PPO(proximal policy optimization)被用于搜索策略。RNN每次需要進(jìn)行30步來(lái)預(yù)測(cè)輸出,這來(lái)自于5個(gè)子策略,每個(gè)子策略兩個(gè)操作,每個(gè)操作包含概率、幅度和操作本身三個(gè)參數(shù),其乘積即為30。在訓(xùn)練過程中,研究人員為了減小整體計(jì)算量從COCO數(shù)據(jù)集中選取了5K圖像來(lái)訓(xùn)練增強(qiáng)算法。算法利用了ResNet-50作為主干網(wǎng)絡(luò)、RetinaNet檢測(cè)器來(lái)從零開始構(gòu)建目標(biāo)檢測(cè)器,并利用在7392張COCO子驗(yàn)證集上的mAP作為獎(jiǎng)勵(lì)信號(hào)來(lái)更新控制器迭代搜索空間參數(shù)。

這一算法需要消耗巨大的算力,在400個(gè)TPUs上訓(xùn)練了48個(gè)小時(shí)完成了20K增強(qiáng)策略的訓(xùn)練,最終得到的數(shù)據(jù)增強(qiáng)策略使得目標(biāo)檢測(cè)得到了較大的提升,其中最好的幾個(gè)策略能夠廣泛應(yīng)用到不同的數(shù)據(jù)集、大小和架構(gòu)上去。

結(jié)果

訓(xùn)練后的結(jié)果顯示,算法通過驗(yàn)證集的測(cè)試得到最多的圖像增強(qiáng)操作是旋轉(zhuǎn)操作,同時(shí)圖像均衡和bbox在Y方向上的平移操作也是排名較為靠前的操作。研究人員首先將學(xué)習(xí)到的策略進(jìn)行了整體評(píng)測(cè),在Res-Net和RetinaNet檢測(cè)器上都實(shí)現(xiàn)了較大幅度的提升:

為了探索哪些操作對(duì)于目標(biāo)檢測(cè)算法帶來(lái)的優(yōu)勢(shì)較大,研究人員將增強(qiáng)操作拆解成了顏色、幾何與bbox相關(guān)操作,并分別測(cè)試了對(duì)于基準(zhǔn)網(wǎng)絡(luò)的提升,下表顯示了不同操作疊加下對(duì)于目標(biāo)檢測(cè)性能的影響。

此外研究人員還探索了不同模型下數(shù)據(jù)增強(qiáng)策略的有效性,并通過增加圖像分辨率和錨的數(shù)量實(shí)現(xiàn)了50.7mAP!

同時(shí)也在不同的數(shù)據(jù)上驗(yàn)證了這一算法的有效性。研究人員還探索了用于訓(xùn)練數(shù)據(jù)增強(qiáng)策略數(shù)據(jù)集的大小對(duì)于目標(biāo)檢測(cè)算法提升的效果,雖然隨著訓(xùn)練數(shù)據(jù)的增加,數(shù)據(jù)增強(qiáng)的效果逐漸減弱。

但這種方法針對(duì)小數(shù)據(jù)集和小物體的檢測(cè)卻具有明顯的效果。同時(shí)對(duì)于較為困難的AP75任務(wù)也有較好的表現(xiàn),這意味著數(shù)據(jù)增強(qiáng)策略幫助算法學(xué)習(xí)到了bbox位置出更細(xì)粒度的空間細(xì)節(jié)特征,這也同時(shí)改善了小物體的檢測(cè)性能。下表中mAPs顯示了小物體檢測(cè)提升的情況。

在改進(jìn)模型正則化方面,研究人員發(fā)現(xiàn)了訓(xùn)練數(shù)據(jù)大的情況下?lián)p失會(huì)提升,同時(shí)隨著數(shù)據(jù)量的增加L2會(huì)變小,數(shù)據(jù)增強(qiáng)策略進(jìn)一步減少了權(quán)重的衰減。研究人員發(fā)現(xiàn)在使用有效數(shù)據(jù)增強(qiáng)策略的同時(shí),就不需要正則化技術(shù)來(lái)幫助網(wǎng)絡(luò)更好的訓(xùn)練了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4709

    瀏覽量

    95338
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134572
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25438

原文標(biāo)題:目標(biāo)檢測(cè)數(shù)據(jù)不夠用?快來(lái)試試數(shù)據(jù)增強(qiáng)新方法!

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    #硬聲創(chuàng)作季 #深度學(xué)習(xí) 深度學(xué)習(xí)基礎(chǔ)-1.2.1 數(shù)據(jù)及其拆分

    數(shù)據(jù)深度學(xué)習(xí)
    水管工
    發(fā)布于 :2022年10月27日 17:48:02

    計(jì)算機(jī)視覺/深度學(xué)習(xí)領(lǐng)域常用數(shù)據(jù)匯總

    經(jīng)歷總結(jié)的目前深度學(xué)習(xí)視覺領(lǐng)域研究人員常用數(shù)據(jù)。由于個(gè)人學(xué)識(shí)有限,難免有疏漏和不當(dāng)?shù)牡胤剑x者朋友們不吝賜教。如果以上數(shù)據(jù)還不能滿足
    發(fā)表于 08-29 10:36

    深度學(xué)習(xí)中開發(fā)和測(cè)試的定義

    算法性能。換而言之,開發(fā)和測(cè)試的使命就是引導(dǎo)的團(tuán)隊(duì)對(duì)機(jī)器學(xué)習(xí)系統(tǒng)做出最重要的改變?。所以應(yīng)當(dāng)這樣處理:合理地選擇開發(fā)
    發(fā)表于 11-30 16:58

    開發(fā)和測(cè)試應(yīng)該有多大?

    的開發(fā)將無(wú)法檢測(cè)出這 0.1% 的差異。與我所遇到的機(jī)器學(xué)習(xí)問題相比,一個(gè)樣本容量?jī)H為 100 的開發(fā),規(guī)模太小了。通常來(lái)說(shuō),開發(fā)的規(guī)模應(yīng)該在 1,000 到 10,000 個(gè)樣
    發(fā)表于 12-10 10:23

    詳解各種圖像數(shù)據(jù)增強(qiáng)技術(shù)

    機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型的訓(xùn)練的目標(biāo)是成為“通用”模型。這就需要模型沒有過度擬合訓(xùn)練數(shù)據(jù),或者換句話說(shuō),我們的模型對(duì)看不見的數(shù)據(jù)有很好的了解
    發(fā)表于 10-26 16:29

    AI技術(shù)的數(shù)據(jù)科學(xué)將面臨哪些挑戰(zhàn)

    “思考特性而不是算法”,這是在機(jī)器學(xué)習(xí)背景下評(píng)估數(shù)據(jù)的另一個(gè)有用方法。友情提示:數(shù)據(jù)擴(kuò)充可能改善的現(xiàn)有模型,在某些情況下,甚至有助于緩解冷
    發(fā)表于 10-18 13:35 ?1594次閱讀

    Python在音頻(Audio)領(lǐng)域中,如何進(jìn)行數(shù)據(jù)擴(kuò)充呢?

    經(jīng)典的深度學(xué)習(xí)網(wǎng)絡(luò)AlexNet使用數(shù)據(jù)擴(kuò)充(Data Augmentation)的方式擴(kuò)大數(shù)據(jù),取得較好的分類效果。在深度
    的頭像 發(fā)表于 04-15 10:35 ?1.1w次閱讀

    八大機(jī)器學(xué)習(xí)數(shù)據(jù)

    網(wǎng)頁(yè)中也有一個(gè)搜索框來(lái)幫助用戶尋找想要的數(shù)據(jù),還有所有數(shù)據(jù)的描述和使用示例,這些數(shù)據(jù)信息豐
    的頭像 發(fā)表于 01-18 09:52 ?8336次閱讀
    八大機(jī)器<b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>

    機(jī)器學(xué)習(xí)應(yīng)用及數(shù)據(jù)

    本文介紹了包括圖像分類、交易預(yù)測(cè)、情感分類、推薦系統(tǒng)、股票預(yù)測(cè)等在內(nèi)的若干個(gè)機(jī)器學(xué)習(xí)應(yīng)用及數(shù)據(jù)。
    的頭像 發(fā)表于 04-21 11:01 ?4404次閱讀

    研究人員們提出了PBA的方法來(lái)獲取更為有效的數(shù)據(jù)增強(qiáng)策略

    數(shù)據(jù)增強(qiáng)策略通常包括剪切、填充、翻轉(zhuǎn)和旋轉(zhuǎn)等,但這些基本策略對(duì)于深度網(wǎng)絡(luò)的訓(xùn)練還是太簡(jiǎn)單,在對(duì)于數(shù)據(jù)增強(qiáng)
    的頭像 發(fā)表于 08-02 15:56 ?6030次閱讀

    區(qū)塊鏈數(shù)據(jù)有怎樣的機(jī)器學(xué)習(xí)方法

    區(qū)塊鏈數(shù)據(jù)提供了一個(gè)與加密貨幣資產(chǎn)行為相關(guān)的獨(dú)特的數(shù)據(jù)宇宙,因此,為機(jī)器學(xué)習(xí)方法的應(yīng)用提供了獨(dú)特的機(jī)會(huì)。
    發(fā)表于 11-26 09:49 ?1019次閱讀

    如何使用機(jī)器學(xué)習(xí)來(lái)分析區(qū)塊鏈數(shù)據(jù)

    區(qū)塊鏈數(shù)據(jù)提供了一個(gè)與加密貨幣資產(chǎn)行為相關(guān)的獨(dú)特的數(shù)據(jù)宇宙,因此,為機(jī)器學(xué)習(xí)方法的應(yīng)用提供了獨(dú)特的機(jī)會(huì)。然而,區(qū)塊鏈數(shù)據(jù)
    發(fā)表于 11-26 11:38 ?1990次閱讀

    基于圖像的數(shù)據(jù)增強(qiáng)方法發(fā)展現(xiàn)狀綜述

    基于圖像的數(shù)據(jù)增強(qiáng)能夠增加訓(xùn)練樣本的多樣性,如通過翻轉(zhuǎn)、添加噪聲等基礎(chǔ)圖像處理操作或根據(jù)現(xiàn)有數(shù)據(jù)生成新的樣本進(jìn)行數(shù)據(jù)
    發(fā)表于 03-23 17:17 ?2071次閱讀
    基于圖像的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>增強(qiáng)</b>方法發(fā)展現(xiàn)狀綜述

    NLP數(shù)據(jù)增強(qiáng)的最新綜述

    作為一種有效的策略,數(shù)據(jù)增強(qiáng) (data augmentation, DA) 緩解了深度學(xué)習(xí)技術(shù)可能失敗的數(shù)據(jù)稀缺情況。
    的頭像 發(fā)表于 03-16 09:13 ?1114次閱讀

    PyTorch如何訓(xùn)練自己的數(shù)據(jù)

    PyTorch是一個(gè)廣泛使用的深度學(xué)習(xí)框架,它以其靈活性、易用性和強(qiáng)大的動(dòng)態(tài)圖特性而聞名。在訓(xùn)練深度學(xué)習(xí)模型時(shí),數(shù)據(jù)是不可或缺的組成部分。然而,很多時(shí)候,我們可能需要使用自己的
    的頭像 發(fā)表于 07-02 14:09 ?3553次閱讀