基于并行附加特征提取網(wǎng)絡(luò)的SSD地面小目標(biāo)檢測模型
來源:《電子學(xué)報》 ,作者李寶奇等
摘 要: 針對SSD原始附加特征提取網(wǎng)絡(luò)(Original Additional Feature Extraction Network,OAFEN)中stride操作造成圖像小目標(biāo)信息丟失和串聯(lián)結(jié)構(gòu)產(chǎn)生的多尺度特征之間冗余度較大的問題,提出了一種計(jì)算量小、感受野大的深度可分離空洞卷積(Depthwise Separable Dilated Convolution,DSDC),并利用DSDC設(shè)計(jì)了一個包含三個獨(dú)立子網(wǎng)絡(luò)的并行附加特征提取網(wǎng)絡(luò)(Parallel Additional Feature Extraction Network,PAFEN).PAFEN上路用兩個DSDC提取尺寸為19*19和3*3的特征圖;中路用一個DSDC提取尺寸為10*10的特征圖;下路用兩個DSDC提取尺寸為5*5和1*1的特征圖.實(shí)驗(yàn)結(jié)果表明,在SSD框架內(nèi),PAFEN在mAP和檢測時間等方面均優(yōu)于OAFEN,適用于地面小目標(biāo)的檢測任務(wù).
關(guān)鍵詞: 目標(biāo)檢測;SSD;深度可分離卷積;空洞卷積;深度可分離空洞卷積;并行附加特征提取網(wǎng)絡(luò)
1 引言
地面目標(biāo)檢測在無人機(jī)導(dǎo)航、搜索、精確打擊和毀傷后評估中發(fā)揮著重要作用[1~3].考慮飛行安全和飛行距離,無人機(jī)通常會在較遠(yuǎn)距離獲取地面目標(biāo)圖像,由此造成的結(jié)果是圖像內(nèi)目標(biāo)像素比較小,這會進(jìn)一步增加目標(biāo)檢測的難度[4].
通過將深度學(xué)習(xí)[5~7]模型 CNN(Convolutional Neural Networks)[8~10]嵌入到目標(biāo)檢測模型之中,目標(biāo)檢測精度在過去幾年中不斷提高,結(jié)合CNN的目標(biāo)檢測算法可分為基于候選區(qū)域和基于回歸兩類.Girshick等[11]第一個將CNN用于目標(biāo)檢測,并提出R-CNN(Regionbased Convolutional Neural Networks)模型.R-CNN使用區(qū)域建議方法從輸入圖像中生成2000個候選區(qū)域,并將所有的候選區(qū)域縮放到固定尺寸.然后,使用CNN在這些候選區(qū)域上提取特征.在CNN的最后一個特征層加入兩個全連接層(SVM和回歸層).由于SVM和回歸層是分開訓(xùn)練,R-CNN很難優(yōu)化而且占用內(nèi)存空間非常大.Girshick 等[12]又提出 Fast R-CNN 模型.Fast RCNN首先在圖像中提取感興趣區(qū)域 (Regions of Interest,RoI);然后對每幅圖像只做一次卷積處理,在最后一個卷積層輸出的特征圖上對每個RoI進(jìn)行映射,并送入RoI池化層把各尺寸的特征圖統(tǒng)一到相同的大?。?3];最后利用 Softmax Loss和 Smooth L1 Loss對分類概率和邊框回歸聯(lián)合訓(xùn)練.聯(lián)合訓(xùn)練省去了特征存儲,提高了空間和時間利用率.然而,提取感興趣區(qū)域占用了整個檢測過程的大部分時間.Ren等[14]提出了目標(biāo)檢測模型Faster R-CNN.與Fast R-CNN相比,F(xiàn)aster RCNN利用RPN(Region Proposal Network)在CNN最后一個連接層中自行產(chǎn)生建議框,因此建議框生成網(wǎng)絡(luò)和目標(biāo)檢測網(wǎng)絡(luò)共享卷積網(wǎng)絡(luò).同時建議框數(shù)目從原有的約2000個減少為300個,重要的是建議框的質(zhì)量也有本質(zhì)的提高,但Faster R-CNN檢測的速度依然有待提高.
基于區(qū)域建議的目標(biāo)檢測方法不能利用局部目標(biāo)在整幅圖像中的空間信息,所以一些研究者開展了無區(qū)域建議的目標(biāo)檢測研究,主要采用回歸的思想.Redmon等[15]提出了一種無區(qū)域建議的目標(biāo)檢測模型,稱為YOLO(You Only Look Once).YOLO通過采用空間限制,減少了對同一目標(biāo)的重復(fù)檢測,大大提高了效率,能夠達(dá)到實(shí)時的效果.但是YOLO的檢測精度不如Faster R-CNN.針對 YOLO 存在的不足,Liu等[16]提出 SSD(Single Shot Detector)模型.SSD模型主要由四部分組成:基礎(chǔ)網(wǎng)絡(luò)VGG-16(Visual Geometry Group),附加特征提取層部分,default boxes生成部分和卷積預(yù)測部分.SSD通過融合六個尺度的特征來提高目標(biāo)檢測的精度.原始附加特征提取網(wǎng)絡(luò)從基礎(chǔ)網(wǎng)絡(luò)特征層conv4_3(38*38)開始,然后通過在標(biāo)準(zhǔn)卷積層中使用stride操作依次生成 fc7(19*19)、conv6_2(10*10)、conv7_2(5*5)、conv8_2(3*3)和conv9_2(1*1)五個尺度的特征圖.stride操作會造成圖像目標(biāo)信息的丟失[17~19],尤其是圖像中的小目標(biāo).原始附加特征提取網(wǎng)絡(luò)中六個尺度的特征圖采用串聯(lián)結(jié)構(gòu)生成,彼此之間具有很高的冗余度,特征圖之間冗余度較高不利于圖像小目標(biāo)的精準(zhǔn)定位.為了提高SSD對小目標(biāo)的檢測精度,Cao等[20]提出 FFSSD(Feature-Fused SSD)模型.FFSSD 利用Feature Fusion Module對VGG-16中conv5_3進(jìn)行2倍上采樣操作,并與conv4_3融合來提高小尺寸目標(biāo)的檢測精度.Fu等[21]提出 DSSD(Deconvolutional Single Shot Detector)模型.DSSD基礎(chǔ)網(wǎng)絡(luò)為特征提取能力更強(qiáng)的Resnet-101,并利用Deconvolution Module擴(kuò)展低維度信息的上下文信息來提高小尺度目標(biāo)的檢測精度.FFSSD和DSSD都是通過整合更多尺度上的語義特征來提高模型對小目標(biāo)的檢測精度,但是這些方法,在提高對于目標(biāo)物體特別時小物體識別效果的同時由于加入了額外的層,也增大了計(jì)算量,影響了檢測的實(shí)時性.Zhou 等[22]提出了 STDN(Scale-Transferrable Object Detection)模型.STDN基礎(chǔ)網(wǎng)絡(luò)為 DenseNet-169,并通過Scale-Transfer層實(shí)現(xiàn)了在幾乎不增加參數(shù)量和計(jì)算量的前提下生成大尺寸的特征層來提高模型對小目標(biāo)的檢測精度.由于Scale-Transfer層是一個轉(zhuǎn)換操作,因此基本不會引入額外的參數(shù)量和計(jì)算量.為了提高SSD的檢測速度,Howard等[23]提出了輕量化的卷積神經(jīng)網(wǎng)絡(luò)MobileNet.MobileNet用深度可分離卷積(Depthwise Separable Convolution,DSC)替換標(biāo)準(zhǔn)卷積來減少模型的參數(shù)和計(jì)算量,它在不影響目標(biāo)檢測精度的條件下能極大地提高SSD的檢測速度.
除了上述針對SSD的改進(jìn)方法外,還有一些其它提高小目標(biāo)檢測精度的研究工作,例如設(shè)計(jì)專用的目標(biāo)檢測的骨干網(wǎng)絡(luò)[24],優(yōu)化檢測模型訓(xùn)練過程[25],IoU閾值動態(tài)設(shè)計(jì)[26]和生成高分辨率小目標(biāo)特征[27]等.特別是文獻(xiàn)[27],Li等提出了一種基于PGAN(Perceptual Generative Adversarial Networks)的小目標(biāo)檢測方法.PGAN通過訓(xùn)練條件生成網(wǎng)絡(luò)使小目標(biāo)的特征表示與大目標(biāo)特征表示類似,并利用一個新的感知分類器來監(jiān)督小目標(biāo)特征的生成從而更精確地檢測小目標(biāo).
針對上述改進(jìn)方法不能兼顧小目標(biāo)檢測精度和速度的問題,本文提出了一種計(jì)算量小,覆蓋范圍大的卷積單元-深度可分離空洞卷積(Depthwise Separable Dilated Convolution,DSDC),并利用 DSDC設(shè)計(jì)了一種包含三個子網(wǎng)絡(luò)的并行附加特征提取層網(wǎng)絡(luò)(Parallel Additional Feature Extraction Network,PAFEN),同時通過優(yōu)化DSDC空洞率(Dilation Rate)的選取來改善 PAFEN的性能,最后在SSD框架內(nèi)通過結(jié)合MobileNet(基礎(chǔ)網(wǎng)絡(luò))和PAFEN(特征提取網(wǎng)絡(luò))實(shí)現(xiàn)對地面小目標(biāo)的快速、準(zhǔn)確的檢測.
2 基于并行附加特征提取網(wǎng)絡(luò)的SSD小目標(biāo)檢測模型
本文通過改進(jìn)附加特征提取網(wǎng)絡(luò)來提高SSD對地面小目標(biāo)的檢測精度和速度.在新的附加特征提取網(wǎng)絡(luò)中,深度可分離空洞卷積作為網(wǎng)絡(luò)基本單元(深度可分離空洞卷積摒棄了stride操作,它通過通道分解和卷積核空洞化來減少計(jì)算量和增大感受野);三個獨(dú)立子網(wǎng)絡(luò)結(jié)構(gòu)替代原來的單網(wǎng)絡(luò)串聯(lián)結(jié)構(gòu)以增加多尺度特征圖的多樣性,并為與conv4(在MobileNet中與VGG-16中conv4_3對應(yīng)的層為conv4)直接相連的三個多尺度特征fc7、conv6_2和conv7_2設(shè)計(jì)convex空洞率策略來增加上下兩個子網(wǎng)絡(luò)的信息以改善新附加特征提取網(wǎng)絡(luò)的性能.
2.1 深度可分離空洞卷積單元
深度可分離卷積通過將標(biāo)準(zhǔn)卷積分解成深度卷積和點(diǎn)卷積來大幅降低模型的參數(shù),重要的是卷積層的特征提取能力基本不受影響.但為了生成尺寸更小的特征圖,深度可分離卷積只能通過增加卷積核尺寸或stride操作實(shí)現(xiàn),過大尺寸的卷積核會大幅增加模型參數(shù),而stride操作會造成圖像小目標(biāo)信息的丟失.深度可分離空洞卷積是在深度可分離卷積的基礎(chǔ)上,通過對深度卷積空洞化實(shí)現(xiàn).空洞化是向標(biāo)準(zhǔn)卷積中引入了一個稱作空洞率的新參數(shù)[17],并利用擴(kuò)張率控制卷積核處理數(shù)據(jù)時各值的間距,從而在計(jì)算量相當(dāng)?shù)臈l件下實(shí)現(xiàn)卷積層感受野的增大.深度可分離空洞卷積與深度可分離卷積相比具有更大的感受野,與空洞卷積相比具有更小的計(jì)算量.深度可分離空洞卷積(DSDC)、深度可分離卷積(DSC)和標(biāo)準(zhǔn)卷積之間的關(guān)系如圖1所示.
對于M個尺寸為DF*DF的輸入特征圖F,經(jīng)尺寸為DK*DK的卷積核操作后,輸出N個尺寸為DG*DG的特征圖G,其中DF是輸入的特征圖的寬度和高度,M是輸入通道數(shù),DG是輸出特征圖的寬度和高度,N是輸出通道數(shù).標(biāo)準(zhǔn)卷積、深度可分離卷積和深度可分離空洞卷積的計(jì)算分解過程如圖2所示.
圖片
圖片
標(biāo)準(zhǔn)卷積生成特征圖G的計(jì)算成本為:
圖片
深度可分離卷積生成特征圖G的計(jì)算成本為:
圖片
深度可分離空洞卷積生成特征圖G的計(jì)算成本為:
圖片
深度可分離卷積和深度可分離空洞卷積與標(biāo)準(zhǔn)卷積的計(jì)算成本比值均為:
圖片
但在相同計(jì)算量的條件下,深度可分離空洞卷積的覆蓋范圍更大.深度可分離空洞卷積實(shí)際空洞濾波器(RDF)尺寸與空洞率之間的關(guān)系如下:
圖片
其中K rdf為該層RDF尺寸,DK為該層卷積核尺寸,R為該層空洞率大小.例如,一個卷積核尺寸為3*3,空洞率R=2的空洞卷積層,RDF的實(shí)際覆蓋范圍為5*5,即K rdf=5.同時可以通過進(jìn)一步增大空洞率R來擴(kuò)大卷積層的感受野.
2.2 基于并行附加特征提取網(wǎng)絡(luò)的SSD小目標(biāo)檢測模型設(shè)計(jì)
附加特征提取網(wǎng)絡(luò)并行化設(shè)計(jì)是由conv4直接生成剩余的多尺度特征圖,每個子網(wǎng)絡(luò)之間保持獨(dú)立,生成的多尺度特征圖之間的冗余度也相對較小[23].考慮conv7_2(5*5)、conv8_2(3*3)和 conv9_2(1*1)三個尺度的特征圖尺寸比較接近,因此將剩余的五個尺度特征圖設(shè)計(jì)為三個獨(dú)立的子網(wǎng)絡(luò)結(jié)構(gòu),即conv4與fc7、conv6_2和conv7_2直接相連接,同時將 conv8_2和conv9_2分配到上路和下路兩個子網(wǎng)絡(luò)有助于提升fc7和conv7_2特征圖的質(zhì)量,也可以避免與conv7_2特征尺度上的重復(fù).基于MobileNet和PAFEN的SSD地面小目標(biāo)檢測模型結(jié)構(gòu)如圖3所示,記作MPSDD.
圖片
地面小目標(biāo)圖像首先進(jìn)入SSD基礎(chǔ)網(wǎng)絡(luò)部分,其中基礎(chǔ)網(wǎng)絡(luò)為MobileNet被截?cái)嘀羉onv4的部分網(wǎng)絡(luò),并將conv4作為PAFEN的第一個特征層;PAFEN由conv4生成三個獨(dú)立的子網(wǎng)絡(luò):上路子網(wǎng)絡(luò)、中路子網(wǎng)絡(luò)和下路子網(wǎng)絡(luò).上路子網(wǎng)絡(luò)由conv4(38*38)生成fc7(19*19)和conv8_2(3*3)兩個尺度的特征圖;中路子網(wǎng)絡(luò)由 conv4(38*38)生成conv6_2(10*10)一個尺度的特征圖;下路子網(wǎng)絡(luò)由conv4(38*38)生成conv7_2(5*5)和conv9_2(1*1)兩個尺度的特征圖.default boxes生成部分根據(jù)預(yù)先定義的scales和aspect ratios從上述六個尺度的特征層中提取數(shù)量和大小不同的default boxes;卷積預(yù)測部分則是對default boxes內(nèi)目標(biāo)的類型和位置進(jìn)行判斷.
利用深度可分離空洞卷積構(gòu)建PAFEN需要首先解決網(wǎng)格問題[17~19],網(wǎng)格問題就是空洞卷積網(wǎng)絡(luò)每一層實(shí)際感受野疊加操作后無法實(shí)現(xiàn)對輸入圖像的完全覆蓋,因此會造成信息的丟失.文獻(xiàn)[17]和文獻(xiàn)[19]針對并行和串行空洞卷積網(wǎng)絡(luò)分別提出了卷積核尺寸固定下的空洞率選取準(zhǔn)則.考慮PAFEN并非嚴(yán)格意義上的串聯(lián)或并聯(lián)結(jié)構(gòu),同時PAFEN主要是為了提取圖像小目標(biāo)特征,因此文獻(xiàn)[17]和文獻(xiàn)[19]中的空洞率選取策略并不適用PAFEN中深度可分離空洞卷積空洞率的設(shè)計(jì).為了更好地提取圖像小目標(biāo)特征,PAFEN中使用的空洞率數(shù)值整體相對較?。瑫r,由于PAFEN上路和下路子網(wǎng)絡(luò)均包含兩個DSDC,因此fc7和conv7_2使用更小的空洞率有利于提高兩個子網(wǎng)絡(luò)特征圖的質(zhì)量.PAFEN中五個深度可分離空洞卷積層的參數(shù)設(shè)置如表1所示.
為了嚴(yán)格保證PAFEN與OAFEN中多尺度特征圖尺寸完全一致,需要對部分DSDC進(jìn)行填充,例如fc7、conv6_2和 conv9_2.
表1 并行附加特征提取網(wǎng)絡(luò)參數(shù)設(shè)置
圖片
3 仿真試驗(yàn)
為了驗(yàn)證PAFEN的有效性以及特征層組合方式和DSDC空洞率選取對PAFEN性能的影響,實(shí)驗(yàn)以mAP、平均檢測時間和參數(shù)大小作為模型定量評價指標(biāo).設(shè)計(jì)實(shí)驗(yàn) 1,以 MOSSD[23](基礎(chǔ)網(wǎng)絡(luò)為 MobileNet,特征提取網(wǎng)絡(luò)為OAFEN)為參考,比較分析Faster-RCNN[14]、SSD[16]、FFSSD[20]、DSSD[21]與本文地面小目標(biāo)檢測方法MPSSD(基礎(chǔ)網(wǎng)絡(luò)為MobileNet,特征提取網(wǎng)絡(luò)為PAFEN)之間的性能差異.設(shè)計(jì)實(shí)驗(yàn)2,以附加特征提取網(wǎng)絡(luò)中不同尺度的特征圖為研究對象,比較分析特征圖不同的組合方式對PAFEN性能的影響.設(shè)計(jì)實(shí)驗(yàn)3,以深度可分離空洞卷積的空洞率為研究對象,比較分析不同的空洞率選取方式對PAFEN性能的影響.SSD、FFSSD、DSSD、MOSSD 和 MPSSD 由 Caffe工具箱設(shè)計(jì),采用 GPU(Titan X)計(jì)算方式[28],其中檢測時間為模型檢測100幅圖像的平均前向時間,參數(shù)大小指模型(.caffemodel文件)的實(shí)際大小.Faster-RCNN實(shí)驗(yàn)?zāi)P陀?a href="http://www.socialnewsupdate.com/tags/tensorflow/" target="_blank">TensorFlow工具箱設(shè)計(jì),同樣采用GPU(Titan X)計(jì)算方式,平均檢測時間為模型檢測完整測試數(shù)據(jù)集的平均時間,參數(shù)大小指模型(.ckpt文件)的實(shí)際大?。?/p>
3.1 實(shí)驗(yàn)數(shù)據(jù)集
為了更好地檢驗(yàn)基于PAFEN的SSD模型(MPSSD)對圖像小目標(biāo)的檢測性能,我們建立了一個地面小目標(biāo)數(shù)據(jù)集:SGT-DET.SGT-DET包括四種地面目標(biāo):軍用卡車、直升機(jī)、導(dǎo)彈和坦克,共計(jì)3350幅圖像,其中2410幅用于模型訓(xùn)練,940幅圖像用于模型測試,如表2所示.
表2 地面小目標(biāo)數(shù)據(jù)集組成
圖片
地面小目標(biāo)是一個相對的概念,其中“小”指的是圖像中目標(biāo)的像素比值小,SGT-DET圖像中四個地面小目標(biāo)的像素比均小于0.05.
3.2 實(shí)驗(yàn)1:目標(biāo)檢測算法的性能比較
本實(shí)驗(yàn)比較分析 Faster-RCNN、SSD、FFSSD、DSSD、MOSSD與本文地面小目標(biāo)檢測方法MPSSD在數(shù)據(jù)集SGT-DET上的性能差異.Faster-RCNN的基礎(chǔ)網(wǎng)絡(luò)為VGG-16,特征提取網(wǎng)絡(luò)為 RPN;SSD的基礎(chǔ)網(wǎng)絡(luò)為VGG-16,特征提取網(wǎng)絡(luò)為OAFEN;FFSSD的基礎(chǔ)網(wǎng)絡(luò)為VGG-16,特征提取網(wǎng)絡(luò)為 Feature Fusion Module;DSSD的基礎(chǔ)網(wǎng)絡(luò)為ResNet101,特征提取網(wǎng)絡(luò)為Deconvolution Module;MOSSD的基礎(chǔ)網(wǎng)絡(luò)為MobileNet,特征提取網(wǎng)絡(luò)為OAFEN;MPSSD的基礎(chǔ)網(wǎng)絡(luò)為MobileNet,特征提取網(wǎng)絡(luò)為PAFEN,其中PAFEN包含三個獨(dú)立的子網(wǎng)絡(luò),其中fc7,conv6_2和conv7_2三個卷積層的卷積核,空洞率和填充為[8,3,1]、[7,5,1]和[12,3,0].分別記錄檢測模型在迭代30000次時對 SGTDET測試數(shù)據(jù)集的mAP數(shù)值、平均檢測時間和參數(shù)大?。?/p>
從表3可以發(fā)現(xiàn),F(xiàn)aster-RCNN的檢測精度最高為97.6%,MPSSD的檢測時間最短為7.18ms,MPSSD的參數(shù)大小最少為7.9MB.FFSSD、DSSD和SSD的實(shí)驗(yàn)結(jié)果表明增加特征提取網(wǎng)絡(luò)的層數(shù)(增加contextual information)能夠改善SSD對小目標(biāo)檢測的精度,但不可避免地會增加計(jì)算量和模型參數(shù).MOSSD和SSD的實(shí)驗(yàn)結(jié)果表明利用MobileNet替換VGG-16在減少模型參數(shù)和降低檢測時間方面帶來的效果是明顯的,但也存在檢測精度上的下降.MPSSD和MOSSD的實(shí)驗(yàn)結(jié)果表明PAFEN在三種定量評價指標(biāo)中明顯優(yōu)于OAFEN,在地面小目標(biāo)的檢測任務(wù)中,PAFEN比OAFEN精度更高,速度更快.綜合考慮檢測精度(mAP)、平均檢測時間(Times)和參數(shù)大小(Parameters)三個因素,MPSSD優(yōu)于其它檢測模型,更適合無人機(jī)遠(yuǎn)距離地面實(shí)時檢測任務(wù).
為了更直觀的說明MPSSD對地面小目標(biāo)的檢測效果,通過Juyter notebook利用訓(xùn)練30000次的MPSSD模型分別對4種地面小目標(biāo)圖像進(jìn)行檢測,檢測結(jié)果如圖4所示.從圖4可以看出,MPSSD模型對四種地面小目標(biāo)能實(shí)現(xiàn)準(zhǔn)確檢測.
表3 目標(biāo)檢測模型性能比較
圖片
圖片
3.3 實(shí)驗(yàn)2:子網(wǎng)絡(luò)數(shù)量對PAFEN性能的影響
本實(shí)驗(yàn)比較不同數(shù)量子網(wǎng)絡(luò)對PAFEN性能的影響.實(shí)驗(yàn)以包含三個子網(wǎng)絡(luò)的 PAFEN為參考,記PAFEN-3;設(shè)計(jì)包含一個子網(wǎng)絡(luò)的PAFEN-1和包含五個子網(wǎng)絡(luò)的PAFEN-5.PAFEN-1可解釋為OAFEN的深度可分離空洞化,其中 fc7、conv6_2、conv7_2、conv8_2和conv9_2五個卷積層的卷積核、空洞率和填充為[8,3,1]、[4,3,0]、[4,3,2]、[3,2,1]和[3,2,1].PAFEN-5為包含五個獨(dú)立子網(wǎng)絡(luò)的并行附加特征提取網(wǎng)絡(luò),即fc7、conv6_2、conv7_2、conv8_2 和 conv9_2 直接與 conv4相連,其中五個卷積層的卷積核、空洞率和填充為[8,3,1]、[8,4,0]、[8,5,1]、[8,5,0]和[8,6,3].記錄模型迭代30000次時模型對SGT-DET測試數(shù)據(jù)集的mAP數(shù)值、平均檢測時間和參數(shù)大?。?/p>
從表4可以看出,隨著PAFEN子網(wǎng)絡(luò)數(shù)量的增加,模型的檢測時間和參數(shù)都存在一定的增加,其中PAFEN-3比 PAFEN-1時間增加 0.09ms、參數(shù)增加0.4MB,PAFEN-5比PAFEN-1時間增加0.24ms,參數(shù)增加1.4MB.但檢測精度并沒有隨著子網(wǎng)絡(luò)數(shù)量的增加而改善,PAFEN-5的mAP比PAFEN-3低3.3%.綜合考慮檢測精度、平均檢測時間和參數(shù)大小三個評價指標(biāo),將PAFEN設(shè)計(jì)成三個子網(wǎng)絡(luò)效果最好.
***網(wǎng)絡(luò)數(shù)量對PAFEN性能的影響
圖片
3.4 實(shí)驗(yàn)3:空洞率選取對PAFEN性能的影響
fc7、conv6_2、conv7_2 與 conv4 直接相連,這三個卷積層對PAFEN的性能影響最大,因此本實(shí)驗(yàn)主要分析和比較fc7、conv6_2、conv7_2三個卷積層空洞率選取對PAFEN性能的影響.實(shí)驗(yàn)設(shè)計(jì)四種形式的空洞率策略:rise、decline、uniformity和 convex,其中 convex 為 PAFEN采用的策略.rise、decline和uniformity三種策略的空洞率分別為[3,5,7]、[7,5,3]和[5,5,5].記錄模型迭代30000次時對SGT-DET測試數(shù)據(jù)集的mAP數(shù)值、平均檢測時間和參數(shù)大?。?/p>
從表5可以看出,四種空洞率策略下模型的檢測時間和參數(shù)大小基本相同.rise、decline、uniformity三種策略下模型的mAP數(shù)值也保持在同一水平,但convex策略下模型的mAP數(shù)值高于其他三種策略,比rise高2.7%,比decline高2.6%,比uniformity高2.3%.換句話說,為包含更多層的子網(wǎng)絡(luò)的初始層設(shè)置較低的空洞率有助于提升PAFEN的性能.
表5 空洞率選取對PAFEN性能的影響
圖片
3.5 討論
實(shí)驗(yàn)從mAP、平均檢測時間和參數(shù)大小三個方面比較了本文小目標(biāo)檢測方法MPSSD與經(jīng)典算法(Faster-RCNN和SSD)和最新算法(FFSSD和DSSD)性能上的差異,也進(jìn)一步分析了子網(wǎng)絡(luò)的數(shù)量和空洞率的選取如何影響PAFEN的性能.本文地面小目標(biāo)檢測模型MPSSD的基礎(chǔ)網(wǎng)絡(luò)為 MobileNet,特征提取網(wǎng)絡(luò)為PAFEN.PAFEN利用計(jì)算量小、感受野大的深度可分離空洞卷積單元組建附加特征提取網(wǎng)絡(luò)能消除stride操作造成圖像中小目標(biāo)信息丟失的問題.PAFEN采用三個獨(dú)立的子網(wǎng)絡(luò)結(jié)構(gòu),使其能從conv4生成三組尺度獨(dú)立的特征圖,減少多尺度特征圖之間的冗余度,提高目標(biāo)檢測的精度.但并非子網(wǎng)絡(luò)的數(shù)量越多越好,例如PAFEN-5的檢測精度低于 PAFEN-3.在 PAFEN-5中,conv4(38*38)直接生成conv8_2(3*3)或conv9_2(1*1),由于兩個子網(wǎng)絡(luò)尺度之間跨度較大(38-3或38-1),在一定程度上會影響conv8_2(3*3)和conv9_2(1*1)兩個尺度特征圖的質(zhì)量.同時,PAFEN-5用五個獨(dú)立的子網(wǎng)絡(luò)生成五個尺度的特征圖,特征圖之間的獨(dú)立性能為目標(biāo)檢測提供更豐富的選擇,但過于獨(dú)立的特征會影響圖像目標(biāo)的定位.因此,PAFEN需要兼顧特征圖的質(zhì)量和特征圖的多樣性.PAFEN使用convex空洞率策略獲得了最高的檢測精度,事實(shí)上,四種空洞率策略下PAFEN的檢測精度均高于OAFEN.在convex策略中,上路和下路網(wǎng)絡(luò)初始特征層使用較小空洞率能從conv4中獲取更多的信息,增強(qiáng)conv8_2和conv9_2兩個尺度特征圖的質(zhì)量,進(jìn)而提高模型的檢測精度.
Faster-RCNN和SSD是經(jīng)典目標(biāo)檢測算法的代表,F(xiàn)aster-RCN側(cè)重于目標(biāo)檢測精度,而SSD側(cè)重于目標(biāo)檢測速度,實(shí)驗(yàn)1的結(jié)果也驗(yàn)證了這一觀點(diǎn).MOSSD用MobileNet替換基礎(chǔ)網(wǎng)絡(luò)VGG-16來進(jìn)一步提高SSD的檢測速度.對于本文的SGT-DET數(shù)據(jù)集,MOSSD比SSD檢測精度低3.5%,精度下降的幅度還是比較大,這也間接表明MobileNet作為小目標(biāo)檢測模型的基礎(chǔ)網(wǎng)絡(luò)還存在改進(jìn)的空間.FFSSD和DSSD是針對小目標(biāo)檢測任務(wù)提出改進(jìn)模型:FFSSD通過引入conv5_3的信息;DSSD通過融合特征提取網(wǎng)絡(luò)反卷積變化后的特征.雖然FFSSD和DSSD在一定程度上提升了小目標(biāo)檢測的精度,但卻增加了計(jì)算量.對于無人機(jī)遠(yuǎn)距離目標(biāo)檢測任務(wù)而言,除了滿足檢測精度要求外,圖像的實(shí)時檢測是另外一個重要的指標(biāo).MPSSD在減少模型參數(shù)和計(jì)算量的前提下,提升了對地面小目標(biāo)的檢測速度.
4 結(jié)論
地面小目標(biāo)檢測任務(wù)具有重要的理論研究和實(shí)際應(yīng)用價值.在SSD檢測模型框架內(nèi),本文提出了一種并行附加特征提取網(wǎng)絡(luò)PAFEN.PAFEN有效提升SSD對地面小目標(biāo)檢測精度和速度,并經(jīng)理論分析和仿真實(shí)驗(yàn)證明了PAFEN的有效性.
對于基于SSD的地面小目標(biāo)檢測任務(wù),改進(jìn)基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)和default box生成策略同樣能提升SSD模型的性能.下一步的研究重點(diǎn)包括:(1)研究適合小目標(biāo)特征提取的基礎(chǔ)網(wǎng)絡(luò);(2)研究適合捕獲小目標(biāo)特征的default box生成策略.
審核編輯:符乾江
-
目標(biāo)檢測
+關(guān)注
關(guān)注
0文章
227瀏覽量
16029 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8505瀏覽量
134677 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8960瀏覽量
140309
發(fā)布評論請先 登錄
【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】在 VisionFive 2 上為目標(biāo)檢測準(zhǔn)備軟件環(huán)境并運(yùn)行 MobileNet-SSD 模型
基于FPGA的SSD目標(biāo)檢測算法設(shè)計(jì)

基于LockAI視覺識別模塊:C++目標(biāo)檢測
概倫電子標(biāo)準(zhǔn)單元庫特征化解決方案NanoCell介紹

明遠(yuǎn)智睿SSD2351核心板助力智能監(jiān)控系統(tǒng)升級
MVTRF:多視圖特征預(yù)測SSD故障

使用機(jī)器學(xué)習(xí)改善庫特征提取的質(zhì)量和運(yùn)行時間

評論