99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

CNN架構(gòu)創(chuàng)新分為七個不同的類別綜述

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:lq ? 2019-01-28 15:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度卷積神經(jīng)網(wǎng)絡(CNN)是一種特殊類型的神經(jīng)網(wǎng)絡,在各種競賽基準上表現(xiàn)出了當前最優(yōu)結(jié)果。深度 CNN 架構(gòu)在挑戰(zhàn)性基準任務比賽中實現(xiàn)的高性能表明,創(chuàng)新的架構(gòu)理念以及參數(shù)優(yōu)化可以提高 CNN 在各種視覺相關任務上的性能。本綜述將最近的 CNN 架構(gòu)創(chuàng)新分為七個不同的類別,分別基于空間利用、深度、多路徑、寬度、特征圖利用、通道提升和注意力。

引言

通過 1989 年 LeCun 處理網(wǎng)格狀拓撲數(shù)據(jù)(圖像和時間系列數(shù)據(jù))的研究,CNN 首次受到關注。CNN 被視為理解圖像內(nèi)容的最好技術(shù)之一,并且在圖像識別、分割、檢測和檢索相關任務上表現(xiàn)出了當前最佳性能。CNN 的成功引起了學界外的注意。在產(chǎn)業(yè)界,如谷歌、微軟、AT&T、NEC 和 Facebook 這樣的公司都設立了研究團隊來探索 CNN 的新架構(gòu)。目前,圖像處理競賽中的大多數(shù)領跑者都會采用基于深度 CNN 的模型。

自 2012 年以來,關于 CNN 架構(gòu)的不同創(chuàng)新被提出來。這些創(chuàng)新可分為參數(shù)優(yōu)化、正則化、結(jié)構(gòu)重組等。但是據(jù)觀察,CNN 網(wǎng)絡的性能提升應主要歸功于處理單元的重構(gòu)和新模塊的設計。自 AlexNet 在 ImageNet 數(shù)據(jù)集上展現(xiàn)出了非凡的性能后,基于 CNN 的應用變得越來越普及。類似地,Zeiler 和 Fergus 介紹了特征分層可視化的概念,這改變了用深度架構(gòu)(如 VGG)在簡單的低空間分辨率中提取特征的趨勢。如今,大多數(shù)新架構(gòu)都是基于 VGG 引入的簡單原則和同質(zhì)化拓撲構(gòu)建的。

另一方面,谷歌團隊引入了一個非常著名的關于拆分、轉(zhuǎn)換和合并的概念,稱為 Inception 模塊。初始塊第一次使用了層內(nèi)分支的概念,允許在不同空間尺度上提取特征。2015 年,為了訓練深度 CNN,Resnet 引入的殘差連接概念變得很有名,并且,后來的大多數(shù)網(wǎng)絡像 Inception-ResNet,WideResNet,ResNext 等都在使用它。與此類似,一些像 WideResnet、Pyramidal Nets、Xception 這樣的架構(gòu)都引入了多層轉(zhuǎn)換的概念,通過額外的基數(shù)和增加的寬度來實現(xiàn)。因此,研究的重點從參數(shù)優(yōu)化和連接再次調(diào)整,轉(zhuǎn)向了網(wǎng)絡架構(gòu)設計(層結(jié)構(gòu))。這引發(fā)了許多像通道提升、空間和通道利用、基于注意力的信息處理等新的架構(gòu)概念。

本文結(jié)構(gòu)如下:

圖 1:文章結(jié)構(gòu)

圖 2:典型模式識別(OR)系統(tǒng)的基本布局。PR 系統(tǒng)分為三個階段:階段 1 和數(shù)據(jù)挖掘相關,階段 2 執(zhí)行預處理和特征選擇,而階段 3 基于模型選擇、調(diào)參和分析。CNN 有良好的特征提取能力和強大的鑒別能力,因此在一個 PR 系統(tǒng)中,它可以用于特征提取/生成和模型選擇階段。

4 CNN 中的架構(gòu)創(chuàng)新

自 1989 年至今,CNN 架構(gòu)已經(jīng)有了很多不同的改進。CNN 中的所有創(chuàng)新都是通過深度和空間相結(jié)合實現(xiàn)的。根據(jù)架構(gòu)修改的類型,CNN 可以大致分為 7 類:基于空間利用、深度、多路徑、寬度、通道提升、特征圖利用和注意力的 CNN。深度 CNN 架構(gòu)的分類如圖 3 所示。

圖 3:深度 CNN 架構(gòu)分類

4.1 基于空間利用的 CNN

CNN 有大量參數(shù),如處理單元數(shù)量(神經(jīng)元)、層數(shù)、濾波器大小、步幅、學習率和激活函數(shù)等。由于 CNN 考慮輸入像素的鄰域(局部性),可以使用不同大小的濾波器來探索不同級別的相關性。因此,在 2000 年初,研究人員利用空間變換來提升性能,此外,還評估了不同大小的濾波器對網(wǎng)絡學習率的影響。不同大小的濾波器封裝不同級別的粒度;通常,較小的濾波器提取細粒度信息,而較大的濾波器提取粗粒度信息。這樣,通過調(diào)整濾波器大小,CNN 可以在粗粒度和細粒度的細節(jié)上都表現(xiàn)很好。

4.2 基于深度的 CNN

深度 CNN 架構(gòu)基于這樣一種假設:隨著深度的增加,網(wǎng)絡可以通過大量非線性映射和改進的特征表示更好地逼近目標函數(shù)。網(wǎng)絡深度在監(jiān)督學習的成功中起了重要作用。理論研究已表明,深度網(wǎng)絡能夠以指數(shù)方式比淺層網(wǎng)絡更有效地表示特定的 20 個函數(shù)類型。2001 年,Csáji 表示了通用近似定理,指出單個隱藏層足夠逼近任何函數(shù),但這需要指數(shù)級的神經(jīng)元,因而通常導致計算上行不通。在這方面,Bengio 和 elalleau 認為更深的網(wǎng)絡有潛力在更少的成本下保持網(wǎng)絡的表現(xiàn)能力。2013 年,Bengio 等人通過 實證表明,對于復雜的任務,深度網(wǎng)絡在計算和統(tǒng)計上都更有效。在 2014-ILSVR 競賽中表現(xiàn)最佳的 Inception 和 VGG 則進一步說明,深度是調(diào)節(jié)網(wǎng)絡學習能力的重要維度。

一旦特征被提取,只要其相對于其他位置的近似位置被保留,其提取位置就變得沒那么重要了。池化或下采樣(如卷積)是一種有趣的局部操作。它總結(jié)了感受野附近的類似信息,并輸出了該局部區(qū)域內(nèi)的主要反應。作為卷積運算的輸出結(jié)果,特征圖案可能會出現(xiàn)在圖像中的不同位置。

4.3 基于多路徑的 CNN

深度網(wǎng)絡的訓練頗具挑戰(zhàn)性,這也是近來很多深度網(wǎng)絡研究的主題。深度 CNN 為復雜任務提供了高效的計算和統(tǒng)計。但是,更深的網(wǎng)絡可能會遭遇性能下降或梯度消失/爆炸的問題,而這通常是由增加深度而非過擬合造成的。梯度消失問題不僅會導致更高的測試誤差,還會導致更高的訓練誤差。為了訓練更深的網(wǎng)絡,多路徑或跨層連接的概念被提出。多路徑或捷徑連接可以通過跳過一些中間層,系統(tǒng)地將一層連接到另一層,以使特定的信息流跨過層??鐚舆B接將網(wǎng)絡劃分為幾塊。這些路徑也嘗試通過使較低層訪問梯度來解決梯度消失問題。為此,使用了不同類型的捷徑連接,如零填充、基于投影、dropout 和 1x1 連接等。

激活函數(shù)是一種決策函數(shù),有助于學習復雜的模式。選擇適當?shù)募せ詈瘮?shù)可以加速學習過程。卷積特征圖的激活函數(shù)定義為等式(3)。

4.4 基于寬度的多連接 CNN

2012 至 2015 年,網(wǎng)絡架構(gòu)的重點是深度的力量,以及多通道監(jiān)管連接在網(wǎng)絡正則化中的重要性。然而,網(wǎng)絡的寬度和深度一樣重要。通過在一層之內(nèi)并行使用多處理單元,多層感知機獲得了在感知機上映射復雜函數(shù)的優(yōu)勢。這表明寬度和深度一樣是定義學習原則的一個重要參數(shù)。Lu 等人和 Hanin & Sellke 最近表明,帶有線性整流激活函數(shù)的神經(jīng)網(wǎng)絡要足夠?qū)挷拍茈S著深度增加保持通用的近似特性。并且,如果網(wǎng)絡的最大寬度不大于輸入維度,緊致集上的連續(xù)函數(shù)類無法被任意深度的網(wǎng)絡很好地近似。因此,多層堆疊(增加層)可能不會增加神經(jīng)網(wǎng)絡的表征能力。與深度架構(gòu)相關的一個重要問題是,有些層或處理單元可能無法學習有用的特征。為了解決這一問題,研究的重點從深度和較窄的架構(gòu)轉(zhuǎn)移到了較淺和較寬的架構(gòu)上。

4.5 基于特征圖(通道特征圖)開發(fā)的 CNN

CNN 因其分層學習和自動特征提取能力而聞名于 MV 任務中。特征選擇在決定分類、分割和檢測模塊的性能上起著重要作用。傳統(tǒng)特征提取技術(shù)中分類模塊的性能要受限于特征的單一性。相較于傳統(tǒng)技術(shù),CNN 使用多階段特征提取,根據(jù)分配的輸入來提取不同類型的特征(CNN 中稱之為特征圖)。但是,一些特征圖有很少或者幾乎沒有目標鑒別作用。巨大的特征集有噪聲效應,會導致網(wǎng)絡過擬合。這表明,除了網(wǎng)絡工程外,特定類別特征圖的選取對改進網(wǎng)絡的泛化性能至關重要。在這一部分,特征圖和通道會交替使用,因為很多研究者已經(jīng)用通道這個詞代替了特征圖。

4.6. 基于通道(輸入通道)利用的 CNN

圖像表征在決定圖像處理算法的性能方面起著重要作用。圖像的良好表征可以定義來自緊湊代碼的圖像的突出特征。在不同的研究中,不同類型的傳統(tǒng)濾波器被用來提取單一類型圖像的不同級別信息。這些不同的表征被用作模型的輸入,以提高性能。CNN 是一個很好的特征學習器,它能根據(jù)問題自動提取鑒別特征。但是,CNN 的學習依賴于輸入表征。如果輸入中缺乏多樣性和類別定義信息,CNN 作為鑒別器的性能就會受到影響。為此,輔助學習器的概念被引入到 CNN 中來提升網(wǎng)絡的輸入表征。

4.7 基于注意力的 CNN

不同的抽象級別在定義神經(jīng)網(wǎng)絡的鑒別能力方面有著重要的作用。除此之外,選擇與上下文相關的特征對于圖像定位和識別也很重要。在人類的視覺系統(tǒng)中,這種現(xiàn)象叫做注意力。人類在一次又一次的匆匆一瞥中觀察場景并注意與上下文相關的部分。在這個過程中,人類不僅注意選擇的區(qū)域,而且推理出關于那個位置的物體的不同解釋。因此,它有助于人類以更好的方式來抓取視覺結(jié)構(gòu)。類似的解釋能力被添加到像 RNN 和 LSTM 這樣的神經(jīng)網(wǎng)絡中。上述網(wǎng)絡利用注意力模塊來生成序列數(shù)據(jù),并且根據(jù)新樣本在先前迭代中的出現(xiàn)來對其加權(quán)。不同的研究者把注意力概念加入到 CNN 中來改進表征和克服數(shù)據(jù)的計算限制問題。注意力概念有助于讓 CNN 變得更加智能,使其在雜亂的背景和復雜的場景中也能識別物體。

論文:A Survey of the Recent Architectures of Deep Convolutional Neural Networks

論文地址:https://arxiv.org/abs/1901.06032

摘要:深度卷積神經(jīng)網(wǎng)絡(CNN)是一種特殊類型的神經(jīng)網(wǎng)絡,在各種競賽基準上表現(xiàn)出了當前最優(yōu)結(jié)果。深度 CNN 的超強學習能力主要是通過使用多個非線性特征提取階段實現(xiàn)的,這些階段能夠從數(shù)據(jù)中自動學習分層表征。大量數(shù)據(jù)的可用性和硬件處理單元的改進加速了 CNN 的研究,最近也報道了非常有趣的深度 CNN 架構(gòu)。近來,深度 CNN 架構(gòu)在挑戰(zhàn)性基準任務比賽中實現(xiàn)的高性能表明,創(chuàng)新的架構(gòu)理念以及參數(shù)優(yōu)化可以提高 CNN 在各種視覺相關任務上的性能。鑒于此,關于 CNN 設計的不同想法被探索出來,如使用不同的激活函數(shù)和損失函數(shù)、參數(shù)優(yōu)化、正則化以及處理單元的重構(gòu)。然而,在表征能力方面的主要改進是通過重構(gòu)處理單元來實現(xiàn)的。尤其是,使用塊而不是層來作為結(jié)構(gòu)單元的想法獲得了極大的贊賞。本綜述將最近的 CNN 架構(gòu)創(chuàng)新分為七個不同的類別。這七個類別分別基于空間利用、深度、多路徑、寬度、特征圖利用、通道提升和注意力。此外,本文還涵蓋了對 CNN 組成部分的基本理解,并揭示了 CNN 目前面臨的挑戰(zhàn)及其應用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 濾波器
    +關注

    關注

    162

    文章

    8138

    瀏覽量

    182084
  • 可視化
    +關注

    關注

    1

    文章

    1264

    瀏覽量

    21866
  • cnn
    cnn
    +關注

    關注

    3

    文章

    354

    瀏覽量

    22742

原文標題:7大類深度CNN架構(gòu)創(chuàng)新綜述

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    微控制器的七個串行接口

    我們將簡要介紹七個串行接口:SIO、UART、SSP(SPI)、I2C、CAN、USB和EtherMAC。雖然每個接口都有幾個不同的操作模式,但我們只介紹一典型的模式。
    的頭像 發(fā)表于 01-11 09:30 ?3811次閱讀
    微控制器的<b class='flag-5'>七個</b>串行接口

    大家是怎么壓榨CNN模型的

    【技術(shù)綜述】為了壓榨CNN模型,這幾年大家都干了什么
    發(fā)表于 05-29 14:49

    Python數(shù)據(jù)可視化專家的七個秘密

    分享 Python數(shù)據(jù)可視化專家的七個秘密
    發(fā)表于 05-15 06:43

    HACCP七個原理 ppt

    HACCP七個原理分別是哪七個?: 1. 進行危害分析,確定控制措施(HA- PA)2. 確定關鍵控制點(CCP)3. 建立所確定的關鍵控制點極限值(CL)4. 關鍵控制點的監(jiān)視系統(tǒng)(M)5. 偏
    發(fā)表于 02-19 17:47 ?0次下載

    用電池驅(qū)動七個白光LED電路的設計

    用電池驅(qū)動七個白光LED電路的設計     為驅(qū)動一以上的高亮度白光LED,設計工程師需要選擇是串聯(lián)連接LED或是并聯(lián)連接LED?! 〔⒙?lián)連接
    發(fā)表于 12-25 10:25 ?2001次閱讀
    用電池驅(qū)動<b class='flag-5'>七個</b>白光LED電路的設計

    筆記本LCD使用中須關注的七個問題

    筆記本LCD使用中須關注的七個問題 問題一:要避免LCD屏幕工作超負荷     使用LCD屏幕要尤其注意其工作時間。當連續(xù)滿
    發(fā)表于 01-26 11:42 ?417次閱讀

    深度探析7大類深度CNN創(chuàng)新架構(gòu)

    深度卷積神經(jīng)網(wǎng)絡(CNN)是一種特殊類型的神經(jīng)網(wǎng)絡,在各種競賽基準上表現(xiàn)出了當前最優(yōu)結(jié)果。本綜述將最近的 CNN 架構(gòu)創(chuàng)新
    的頭像 發(fā)表于 01-27 11:01 ?4514次閱讀
    深度探析7大類深度<b class='flag-5'>CNN</b><b class='flag-5'>創(chuàng)新</b><b class='flag-5'>架構(gòu)</b>

    成功設計電路板的七個技巧和策略

    本文將討論新手和老手成功設計電路板的七個基本(而且重要的)技巧和策略。只要在設計過程中對這些技巧多加注意,就能減少設計回爐次數(shù)、設計時間和總體診斷難點。
    的頭像 發(fā)表于 09-13 14:17 ?6058次閱讀

    卷積神經(jīng)網(wǎng)絡的七個注意事項

    卷積神經(jīng)網(wǎng)絡的七個注意事項
    的頭像 發(fā)表于 08-24 16:09 ?4204次閱讀

    企業(yè)提升IoT安全性的七個關鍵步驟

     以下是企業(yè)提升IoT安全性以防止數(shù)據(jù)泄露的七個關鍵步驟。
    的頭像 發(fā)表于 10-16 09:58 ?2382次閱讀

    推薦七個好用的、可提高工作效率的網(wǎng)站工具

    推薦七個好用的、可提高工作效率的網(wǎng)站工具
    的頭像 發(fā)表于 05-05 17:04 ?2823次閱讀

    元宇宙構(gòu)造的七個層面是什么

    元宇宙就如同一和現(xiàn)實平行的世界,這個虛擬世界里同樣可以進行工作娛樂,Beamable公司的創(chuàng)始人Jon Radoff認為元宇宙構(gòu)造有七個層面,那元宇宙構(gòu)造的七個層面是什么呢? 元宇宙構(gòu)造的
    的頭像 發(fā)表于 11-05 17:19 ?6198次閱讀

    UnitedSiC提供七個采用引腳設計的新750V SiC FET

    許多人選擇“”這個數(shù)字是因為它的“幸運”屬性,而UnitedSiC選擇它則當然是因為七個引腳非常適合D2PAK半導體封裝。
    的頭像 發(fā)表于 08-01 14:42 ?1269次閱讀

    下次火星之旅前,您需要了解的七個航天器子系統(tǒng)

    下次火星之旅前,您需要了解的七個航天器子系統(tǒng)
    發(fā)表于 11-02 08:16 ?0次下載
    下次火星之旅前,您需要了解的<b class='flag-5'>七個</b>航天器子系統(tǒng)

    藍牙m(xù)esh網(wǎng)絡的七個特點

    藍牙m(xù)esh網(wǎng)絡的七個特點
    的頭像 發(fā)表于 12-21 11:20 ?1669次閱讀
    藍牙m(xù)esh網(wǎng)絡的<b class='flag-5'>七個</b>特點