在 VGG、U-Net、TCN 網(wǎng)絡中... CNN 雖然功能強大,但必須針對特定問題、數(shù)據(jù)類型、長度和分辨率進行定制,才能發(fā)揮其作用。我們不禁會問,可以設計出一個在所有這些網(wǎng)絡中都運行良好的單一 CNN 嗎? 本文中,來自阿姆斯特丹自由大學、阿姆斯特丹大學、斯坦福大學的研究者提出了 CCNN,單個 CNN 就能夠在多個數(shù)據(jù)集(例如 LRA)上實現(xiàn) SOTA !
- 論文地址:https://arxiv.org/pdf/2206.03398.pdf
- 代碼地址:https://github.com/david-knigge/ccnn
- 該研究提出 Continuous CNN(CCNN):一個簡單、通用的 CNN,可以跨數(shù)據(jù)分辨率和維度使用,而不需要結構修改。CCNN 在序列 (1D)、視覺 (2D) 任務、以及不規(guī)則采樣數(shù)據(jù)和測試時間分辨率變化的任務上超過 SOTA;
- 該研究對現(xiàn)有的 CCNN 方法提供了幾種改進,使它們能夠匹配當前 SOTA 方法,例如 S4。主要改進包括核生成器網(wǎng)絡的初始化、卷積層修改以及 CNN 的整體結構。









任意數(shù)據(jù)維度的一般操作。通過改變輸入坐標 c_i 的維數(shù) D,核生成器網(wǎng)絡 G_Kernel 可用于構造任意維數(shù)的卷積核。因此可以使用相同的操作來處理序列 D=1、視覺 D=2 和更高維數(shù)據(jù) D≥3。 不同輸入分辨率的等效響應。如果輸入信號 x 有分辨率變化,例如最初在 8KHz 觀察到的音頻現(xiàn)在在 16KHz 觀察到,則與離散卷積核進行卷積以產(chǎn)生不同的響應,因為核將在每個分辨率下覆蓋不同的輸入子集。另一方面,連續(xù)核是分辨率無關的,因此無論輸入的分辨率如何,它都能夠識別輸入。 當以不同的分辨率(例如更高的分辨率)呈現(xiàn)輸入時,通過核生成器網(wǎng)絡傳遞更精細的坐標網(wǎng)格就足夠了,以便以相應的分辨率構造相同的核。對于以分辨率 r (1) 和 r (2) 采樣的信號 x 和連續(xù)卷積核 K,兩種分辨率下的卷積大約等于與分辨率變化成比例的因子:

正確初始化核生成器網(wǎng)絡 G_Kernel。該研究觀察到,在以前的研究中核生成器網(wǎng)絡沒有正確初始化。在初始化前,人們希望卷積層的輸入和輸出的方差保持相等,以避免梯度爆炸和消失,即 Var (x)=Var (y)。因此,卷積核被初始化為具有方差 Var (K)=gain^2 /(in channels ? kernel size) 的形式,其增益取決于所使用的非線性。 然而,神經(jīng)網(wǎng)絡的初始化使輸入的 unitary 方差保留在輸出。因此,當用作核生成器網(wǎng)絡時,標準初始化方法導致核具有 unitary 方差,即 Var (K)=1。結果,使用神經(jīng)網(wǎng)絡作為核生成器網(wǎng)絡的 CNN 經(jīng)歷了與通道?內(nèi)核大小成比例的特征表示方差的逐層增長。例如,研究者觀察到 CKCNNs 和 FlexNets 在初始化時的 logits 大約為 1e^19。這是不可取的,這可能導致訓練不穩(wěn)定和需要低學習率。 為了解決這個問題,該研究要求 G_Kernel 輸出方差等于 gain^2 /(in_channels?kernel_size)而不是 1。他們通過、

實驗結果 如下表 1-4 所示,CCNN 模型在所有任務中都表現(xiàn)良好。 首先是 1D 圖像分類 CCNN 在多個連續(xù)基準上獲得 SOTA,例如 Long Range Arena、語音識別、1D 圖像分類,所有這些都在單一架構中實現(xiàn)的。CCNN 通常比其他方法模型更小架構更簡單。 然后是 2D 圖像分類:通過單一架構,CCNN 可以匹配并超越更深的 CNN。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
架構
+關注
關注
1文章
528瀏覽量
25980 -
深度學習
+關注
關注
73文章
5561瀏覽量
122792 -
cnn
+關注
關注
3文章
354瀏覽量
22741
原文標題:解決CNN固有缺陷, CCNN憑借單一架構,實現(xiàn)多項SOTA
文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
熱點推薦
東集RFID讀寫器有什么用
,利用RFID讀寫器自動識別和記錄貨物的入庫、出庫和流轉,能夠顯著提高管理的精準度。2. 零售業(yè)RFID技術在零售行業(yè)也展現(xiàn)出極大的潛力。商家可以在商品上貼上RFID標簽,不僅能加快結
發(fā)表于 06-20 10:36
數(shù)據(jù)集下載失敗的原因?
數(shù)據(jù)集下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓練報錯網(wǎng)絡錯誤
大的數(shù)據(jù)集多大?數(shù)據(jù)量有多少?
發(fā)表于 06-18 07:04
【高云GW5AT-LV60 開發(fā)套件試用體驗】基于開發(fā)板進行深度學習實踐,并盡量實現(xiàn)皮膚病理圖片的識別
可以多看看。*附件:fpga_cnn.rar
相關文件都在里面了
探索了一陣子cnn,并且也跟著網(wǎng)上的一些開源的方案學習一些
比如這里的:# 一起學習用Verilog在FPGA上
發(fā)表于 06-11 22:35
如何在FX3和FX10芯片上運行/實現(xiàn)USB 3.0批量流?
我們正在嘗試在 FX3 和 FX10 芯片上運行/實現(xiàn) USB 3.0 批量流(單個 IN 端點上的多個
發(fā)表于 05-09 06:10
STM32H747I DSI模塊采用一個數(shù)據(jù)通道無法顯示圖片怎么解決?
,但是顯示屏黑屏。可以確定的是D0P/D0N有數(shù)據(jù)輸出,但是無法在顯示屏上顯示。
下面是我在官方例程中修改的地方,其實就是把兩個數(shù)據(jù)通道改為
發(fā)表于 03-07 08:11
想選擇一款能夠實現(xiàn)多個通道數(shù)據(jù)采集的ADC,求推薦
各位專家好!這邊想選擇一款能夠實現(xiàn)多個通道數(shù)據(jù)采集的ADC,由于對通道間的幅度和相位一致性要求較高,最好可以嚴格控制各通道之間的同步,要求單個
發(fā)表于 01-24 08:28
Hadoop 生態(tài)系統(tǒng)在大數(shù)據(jù)處理中的應用與實踐
基礎。它將大文件分割成多個數(shù)據(jù)塊,存儲在不同節(jié)點上,實現(xiàn)高容錯性和高擴展性。NameNode 負責管理文件系統(tǒng)命名空間和元數(shù)據(jù),DataNo
Chart FX圖表類型:條形圖(上)
類別(多序列),以便進行更深入的分析。 將數(shù)據(jù)傳輸給條形圖非常簡單,只需傳輸一個或多個數(shù)據(jù)序列以及每個數(shù)據(jù)序列附帶的標記或標簽即可。這些標簽將顯示在分類或時間軸(X 軸)

Looker Studio連接器:一個連接器從多個數(shù)據(jù)庫和云應用獲取數(shù)據(jù)
使用 SQL 查詢,在報表中獲取預處理數(shù)據(jù)。 連接器的工作原理 適用于 Looker Studio 的 Skyvia 連接器使用 Skyvia Connect SQL 端點作為中間層,將 SQL 查詢轉換為用于查詢數(shù)據(jù)的本機

Mamba入局圖像復原,達成新SOTA
MambaIRv2,更高性能、更高效率!另外還有ACM MM 2024上的Freqmamba方法,在圖像去雨任務中取得了SOTA性能! 顯然,這種基于Mamba的方法在圖像復原領域,比

ADS131A04如果想實現(xiàn)多個設備的同步觸發(fā)采樣,應該如何實現(xiàn)呢?
在ADS131A04的使用上,異步模式,目前正常的數(shù)據(jù)采集都沒問題,但是我們希望對多個使用ADS131A04的設備進行同步觸發(fā)采樣,在收到一個觸發(fā)信號之后,
發(fā)表于 12-04 07:13
使用TI霍爾效應傳感器設計單個和多個位置開關
電子發(fā)燒友網(wǎng)站提供《使用TI霍爾效應傳感器設計單個和多個位置開關.pdf》資料免費下載
發(fā)表于 09-23 12:37
?0次下載

在單個C2000?MCU上使用FCL和SFRA進行雙軸電機控制
電子發(fā)燒友網(wǎng)站提供《在單個C2000?MCU上使用FCL和SFRA進行雙軸電機控制.pdf》資料免費下載
發(fā)表于 09-14 09:40
?0次下載

CISC(復雜指令集)與RISC(精簡指令集)的區(qū)別
的例子如果要在RISC架構上實現(xiàn),將ADDRA, ADDRB中的數(shù)據(jù)讀入寄
存器,相乘和將結果寫回內(nèi)存的操作都必須由軟件來實現(xiàn),比如:MOV A, ADDRA; MOV B, ADDR
發(fā)表于 07-30 17:21
在多FPGA集群上實現(xiàn)高級并行編程
今天我們看的這篇論文介紹了在多FPGA集群上實現(xiàn)高級并行編程的研究,其主要目標是為非FPGA專家提供一個成熟且易于使用的環(huán)境,以便在多個并行運行的設備
評論