99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何透徹理解卷積的數(shù)據(jù)原理與機(jī)制

新機(jī)器視覺(jué) ? 來(lái)源:極市平臺(tái) ? 作者:極市平臺(tái) ? 2021-06-16 16:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者以?huà)伹驅(qū)嶒?yàn)為例講解了許多卷積的數(shù)學(xué)原理和機(jī)制,并通過(guò)卷積來(lái)表述卷積神經(jīng)網(wǎng)絡(luò)。文章附有大量圖片解釋?zhuān)瑤椭蠹腋菀桌斫狻?/p>

拋球?qū)嶒?yàn) -- Ball drop experiment

想象一下,我們把一個(gè)球從某個(gè)高度落到地面上,它只有一個(gè)運(yùn)動(dòng)維度。如果你把球落下,然后再?gòu)乃穆潼c(diǎn)上方把它落下,球會(huì)走一段距離 的可能性有多大?

我們來(lái)分析一下: 第一次下落后,它將以概率 落在離起點(diǎn)一個(gè)單位的地方,其中是概率分布?,F(xiàn)在,在第一次落下之后,我們把球撿起來(lái),從它第一次落地點(diǎn)以上的另一個(gè)高度落下。球從新的起點(diǎn)滾動(dòng) 個(gè)單位的概率是 ,如果它是從不同的高度落下的,那么 可能是不同的概率分布。

如果我們把第一次下落的結(jié)果固定下來(lái),使我們知道球走了距離 ,對(duì)于球走的總距離 ,第二次下落時(shí)走的距離也固定為 ,即 。所以這種情況發(fā)生的概率簡(jiǎn)單來(lái)說(shuō)就是 。。

我們用一個(gè)具體的離散例子來(lái)思考這個(gè)問(wèn)題。我們希望總距離 為 3。如果它第一次滾動(dòng),,那么第二次必須滾動(dòng) ,才能達(dá)到我們的總距離 。這個(gè)概率是 。

然而,這并不是我們可以達(dá)到總距離3的唯一方法。球可以第一次滾1個(gè)單位,第二次滾2個(gè)單位。或者第一次滾0個(gè)單位,第二次滾3個(gè)單位。它可以是任何 和 ,只要他們加起來(lái)是 3。

為了求出小球到達(dá)總 的總概率,我們不能只考慮到達(dá) 的一種可能方式,而是考慮將 分成 和 的所有可能方式,并將每種方式的概率相加。

我們已經(jīng)知道, 的每一種情況的概率簡(jiǎn)單來(lái)說(shuō)就是 。所以,將 的每一個(gè)解求和,我們可以將總似然表示為。

和 的卷積,在 處被定義為。

如果我們把代入,我們得到。

為了使這一點(diǎn)更加具體,我們可以從球可能落地的位置來(lái)考慮。在第一次落地后,它將以概率 落在中間位置 。如果它落在 處,它落在 處的概率為 。

為了得到卷積,我們需要考慮所有的中間位置。

可視化卷積 -- Visualizing Convolutions

假設(shè)一個(gè)球落在離原點(diǎn)一定距離 的概率是。那么,它 從 處返回原點(diǎn)的的概率是。

如果我們知道球在第二次落地后落在 處,那么第一次的位置是 的概率是多少?

所以,前一個(gè)位置是 的概率是 。

每個(gè)中間位置球最終落在 處的概率。我們知道第一個(gè)落點(diǎn)把球放到中間位置 的概率是 。我們還知道,如果它落在 處,它在 處的概率是 。

將 的所有可能值相加,我們得到卷積結(jié)果。

通過(guò)移動(dòng)下半部分,當(dāng)分布對(duì)齊時(shí),卷積達(dá)到峰值。

并且隨著分布之間的交點(diǎn)越來(lái)越小而縮小。

下圖,我們能夠直觀地看到三角波與方波函數(shù)的卷積。

759a0278-cab3-11eb-9e57-12bb97331649.jpg

掌握了這個(gè)要點(diǎn),很多概念變得更加直觀。

音頻處理中有時(shí)會(huì)用到卷積。例如,人們可能會(huì)使用一個(gè)有兩個(gè)尖峰,但其他地方都是零的函數(shù)來(lái)創(chuàng)建一個(gè)回聲。當(dāng)我們的雙尖峰函數(shù)滑動(dòng)時(shí),一個(gè)尖峰首先擊中一個(gè)時(shí)間點(diǎn),將該信號(hào)添加到輸出聲音中,之后,另一個(gè)尖峰跟隨,添加第二個(gè)延遲的副本。

高維卷積--Higher Dimensional Convolutions

卷積不僅僅適用于1維看空間,也適用于高維空間。

回顧開(kāi)頭的例子,落下的球。現(xiàn)在,當(dāng)它落下時(shí),它的位置不僅在一維中移動(dòng),而且在二維中移動(dòng)。

和前面的卷積一樣。

只是,現(xiàn)在 , , 和 都是向量。更明確地說(shuō),

標(biāo)準(zhǔn)定義:

就像一維卷積一樣,我們可以把二維卷積看成是把一個(gè)函數(shù)滑動(dòng)到另一個(gè)函數(shù)之上,進(jìn)行乘法和加法。

卷積神經(jīng)網(wǎng)絡(luò)--Convolutional Neural Networks

那么,卷積與卷積神經(jīng)網(wǎng)絡(luò)的關(guān)系如何呢?

在一個(gè)1維卷積層中,輸入 ,輸出 。

從信號(hào)與系統(tǒng)的角度來(lái)描述,

是輸入信號(hào),是輸出信號(hào), 是系統(tǒng),這個(gè)系統(tǒng)由 個(gè)神經(jīng)元組成,可以用輸入來(lái)描述輸出。

也可以用神經(jīng)網(wǎng)絡(luò)的方式來(lái)描述

其中 是輸入, 是權(quán)重。權(quán)重描述了神經(jīng)元與輸入的連接方式。

負(fù)的權(quán)重意味著輸入會(huì)抑制神經(jīng)元發(fā)射,而正的權(quán)重則鼓勵(lì)它發(fā)射。

權(quán)重是神經(jīng)元的心臟,控制著它的行為。如果說(shuō)2個(gè)神經(jīng)元是相同的,即它們的權(quán)重是相同的。

其中一個(gè)常見(jiàn)的應(yīng)用是圖像處理。我們可以把圖像看作是二維函數(shù)。許多重要的圖像變換都是卷積,你用一個(gè)非常小的局部函數(shù)(稱(chēng)為 “內(nèi)核”)對(duì)圖像函數(shù)進(jìn)行卷積。

在上面的演示中,綠色部分類(lèi)似于我們的 5x5x1 輸入圖像 。在卷積層的第一部分進(jìn)行卷積操作的元素被稱(chēng)為Kernel/Filter, 用黃色表示。我們選擇一個(gè)3x3x1矩陣作為Kernel。

Kernel 以一定的步伐向右移動(dòng),直到它解析出整行的寬度。接著,它以相同的步伐值跳到圖像的開(kāi)頭(左邊),并重復(fù)這個(gè)過(guò)程,直到遍歷整個(gè)圖像。

在多通道圖像的情況下( 如RGB ),Kernel 的深度與輸入圖像的深度相同。Kernel 與圖片 進(jìn)行矩陣乘法,然后將所有結(jié)果與偏置相加,得到一個(gè)單通道卷積特征輸出。

卷積操作的目的是從輸入圖像中提取高級(jí)特征,如邊緣。傳統(tǒng)上,卷積層可以捕捉低級(jí)特征,如邊緣、顏色、梯度方向等。隨著層數(shù)的增加,架構(gòu)也可以捕捉高階特征,讓我們的神經(jīng)網(wǎng)絡(luò)對(duì)圖像有更深刻的理解。

該卷積有兩種結(jié)果--一種是卷積特征與輸入相比維度減少,有效填充(Valide Padding)。另一種是維度增加或保持不變,相同填充(Same Padding)。

當(dāng)我們將5x5x1的圖像填充為6x6x1的圖像,然后在其上應(yīng)用3x3x1的核,我們發(fā)現(xiàn)卷積矩陣變成了5x5x1的尺寸。因此,我們將其命名為--相同填充(Same Padding)。

另一方面,如果我們?cè)跊](méi)有填充的情況下執(zhí)行同樣的操作,我們將得到一個(gè)具有內(nèi)核(3x3x1)本身尺寸的矩陣--有效填充(Valide Padding)。

池化層 -- Pooling Layer

與卷積層類(lèi)似,Pooling層負(fù)責(zé)減少卷積特征的空間大小。這是為了通過(guò)降低維度來(lái)降低處理數(shù)據(jù)所需的計(jì)算能力。此外,它還有助于提取旋轉(zhuǎn)和位置不變的主導(dǎo)特征,從而保持模型的有效訓(xùn)練過(guò)程。下圖表示在5x5卷積特征上的3x3池化。

有兩種類(lèi)型的池化。最大池化和平均池化。最大池化(Max Pooling)返回的是Kernel覆蓋的圖像部分的最大值。另一方面,平均池化(Average Pooling)返回Kernel覆蓋的圖像部分的所有值的平均值。

Max Pooling也是一種噪聲抑制器。它完全丟棄了嘈雜的激活,并在降低維度的同時(shí)進(jìn)行去噪。另一方面,Average Pooling只是作為噪聲抑制機(jī)制進(jìn)行維度降低。因此,我們可以說(shuō)Max Pooling的性能比Average Pooling好很多。

卷積層和池化層,共同構(gòu)成了卷積神經(jīng)網(wǎng)絡(luò)的第層。根據(jù)圖像的復(fù)雜程度,可以增加這些層的數(shù)量,以便進(jìn)一步捕捉低層次的細(xì)節(jié),但代價(jià)是增加計(jì)算能力。

在經(jīng)歷了上述過(guò)程后,我們已經(jīng)成功地使模型理解了特征。接下來(lái),我們要將最終的輸出結(jié)果進(jìn)行扁平化處理,并將其饋送到普通的神經(jīng)網(wǎng)絡(luò)中,以達(dá)到分類(lèi)的目的。

全連接層(FC層) —- Fully Connected Layer (FC Layer)

全連接層正在學(xué)習(xí)該空間中可能的非線(xiàn)性函數(shù)。

現(xiàn)在,我們已經(jīng)將輸入圖像轉(zhuǎn)換為適合多級(jí)感知器 (Multi-Level Perceptron) 的形式,我們將把圖像扁平化(Flatten layer)為列向量。扁平化的輸出被送入前饋神經(jīng)網(wǎng)絡(luò),并在每次訓(xùn)練迭代中應(yīng)用反向傳播。在一系列的紀(jì)元中,該模型能夠區(qū)分圖像中的主導(dǎo)特征和某些低級(jí)特征,并使用Softmax分類(lèi)方法對(duì)其進(jìn)行分類(lèi)。

總結(jié) -- Conclusion

我們?cè)谶@篇博文中介紹了很多數(shù)學(xué)機(jī)制,但我們獲得的東西可能并不明顯。卷積顯然是概率論和計(jì)算機(jī)圖形學(xué)中的一個(gè)有用工具,但是用卷積來(lái)表述卷積神經(jīng)網(wǎng)絡(luò),我們獲得了什么?

第一個(gè)好處是,我們有了一些非常強(qiáng)大的語(yǔ)言來(lái)描述神經(jīng)網(wǎng)絡(luò)的層。卷積大大簡(jiǎn)化了繁瑣的計(jì)算工作。

其次,卷積非常容易實(shí)現(xiàn)?,F(xiàn)存的許多庫(kù)都提供了高效的卷積方法。

此外,卷積看起來(lái)是一個(gè) 操作,但使用一些相當(dāng)深刻的數(shù)學(xué)見(jiàn)解,可以創(chuàng)建一個(gè) 的實(shí)現(xiàn)。

Tips:

我們想知道球第一次滾動(dòng) 單位,第二次滾動(dòng) 單位的概率。所以 。

卷積滿(mǎn)足交換律,即 。

卷積滿(mǎn)足結(jié)合律的,即,

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 卷積
    +關(guān)注

    關(guān)注

    0

    文章

    95

    瀏覽量

    18761
  • 離散
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    17901
  • 噪聲抑制器
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    7298

原文標(biāo)題:如何透徹理解卷積的數(shù)據(jù)原理與機(jī)制:從拋球?qū)嶒?yàn)說(shuō)起

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【干貨】數(shù)據(jù)“零處理”,什么是DTU透?jìng)?b class='flag-5'>機(jī)制?

    概述DTU(數(shù)據(jù)傳輸單元)透?jìng)髂J绞枪I(yè)物聯(lián)網(wǎng)的核心技術(shù),它像一條透明的數(shù)據(jù)管道,不做任何解析或修改,直接將終端設(shè)備的原始字節(jié)流(如傳感器數(shù)據(jù)、PLC指令)通過(guò)無(wú)線(xiàn)網(wǎng)絡(luò)原樣轉(zhuǎn)發(fā)至服務(wù)器。通俗
    的頭像 發(fā)表于 07-03 19:32 ?270次閱讀
    【干貨】<b class='flag-5'>數(shù)據(jù)</b>“零處理”,什么是DTU透?jìng)?b class='flag-5'>機(jī)制</b>?

    如何使用MATLAB實(shí)現(xiàn)一維時(shí)間卷積網(wǎng)絡(luò)

    本文對(duì)一維卷積操作進(jìn)行介紹,包括一維擴(kuò)展卷積和一維因果卷積,以及 MATLAB 對(duì)一維卷積的支持情況。在最后通過(guò)一個(gè)實(shí)例演示如何在 MATLAB 中將一維
    的頭像 發(fā)表于 03-07 09:15 ?1086次閱讀
    如何使用MATLAB實(shí)現(xiàn)一維時(shí)間<b class='flag-5'>卷積</b>網(wǎng)絡(luò)

    請(qǐng)問(wèn)OpenVINO?工具套件是否支持使用非對(duì)稱(chēng)卷積的支持模型?

    無(wú)法確定使用非對(duì)稱(chēng)卷積的模型是否受 OpenVINO? Toolkit 的支持
    發(fā)表于 03-06 07:58

    Java的SPI機(jī)制詳解

    接口規(guī)范以及可以發(fā)現(xiàn)接口實(shí)現(xiàn)的機(jī)制,而不需要實(shí)現(xiàn)接口。 SPI機(jī)制在Java中應(yīng)用廣泛。例如:JDBC中的數(shù)據(jù)庫(kù)連接驅(qū)動(dòng)使用SPI機(jī)制,只定義了數(shù)據(jù)
    的頭像 發(fā)表于 03-05 11:35 ?792次閱讀
    Java的SPI<b class='flag-5'>機(jī)制</b>詳解

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的比較

    多層。 每一層都由若干個(gè)神經(jīng)元構(gòu)成,神經(jīng)元之間通過(guò)權(quán)重連接。信號(hào)在神經(jīng)網(wǎng)絡(luò)中是前向傳播的,而誤差是反向傳播的。 卷積神經(jīng)網(wǎng)絡(luò)(CNN) : CNN主要由卷積層、池化層和全連接層組成。 卷積層通過(guò)滑動(dòng)窗口(濾波器)對(duì)輸入
    的頭像 發(fā)表于 02-12 15:53 ?674次閱讀

    FPGA圖像處理基礎(chǔ)----實(shí)現(xiàn)緩存卷積窗口

    素行進(jìn)行緩存與變換。由于在圖像處理過(guò)程中,經(jīng)常會(huì)使用到卷積,因此需要對(duì)圖像進(jìn)行開(kāi)窗,然后將開(kāi)窗得到的局部圖像與卷積核進(jìn)行卷積,從而完成處理。 ??圖像數(shù)據(jù)一般按照一定的格式和時(shí)序進(jìn)行傳
    的頭像 發(fā)表于 02-07 10:43 ?831次閱讀
    FPGA圖像處理基礎(chǔ)----實(shí)現(xiàn)緩存<b class='flag-5'>卷積</b>窗口

    干法蝕刻異向機(jī)制的原理解

    無(wú)偏差的刻蝕過(guò)程,我們稱(chēng)之為各向異性刻蝕。為了更清晰地理解這一過(guò)程,我們可以將其拆解為幾個(gè)基本環(huán)節(jié)。首先,第一個(gè)環(huán)節(jié)是刻蝕氣體的處理,這些氣體在等離子體環(huán)境中會(huì)被分解成離子、自由基等具有刻蝕作用
    的頭像 發(fā)表于 12-17 10:48 ?1136次閱讀
    干法蝕刻異向<b class='flag-5'>機(jī)制</b>的原<b class='flag-5'>理解</b>析

    卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)調(diào)整方法

    卷積神經(jīng)網(wǎng)絡(luò)因其在處理具有空間層次結(jié)構(gòu)的數(shù)據(jù)時(shí)的卓越性能而受到青睞。然而,CNN的成功很大程度上依賴(lài)于其參數(shù)的合理設(shè)置。參數(shù)調(diào)整是一個(gè)復(fù)雜的過(guò)程,涉及到多個(gè)超參數(shù)的選擇和優(yōu)化。 網(wǎng)絡(luò)架構(gòu)參數(shù) 卷積
    的頭像 發(fā)表于 11-15 15:10 ?1215次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理中的應(yīng)用

    自然語(yǔ)言處理是人工智能領(lǐng)域的一個(gè)重要分支,它致力于使計(jì)算機(jī)能夠理解、解釋和生成人類(lèi)語(yǔ)言。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)作為一種強(qiáng)大的模型,在圖像識(shí)別和語(yǔ)音處理等領(lǐng)域取得了顯著成果
    的頭像 發(fā)表于 11-15 14:58 ?807次閱讀

    深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)模型

    卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),其靈感來(lái)源于生物的視覺(jué)皮層機(jī)制。它通過(guò)模擬人類(lèi)視覺(jué)系統(tǒng)的處理方式,能夠自動(dòng)提取圖像特征,從而在圖像識(shí)別和分類(lèi)任務(wù)中表現(xiàn)出色。 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu) 卷積
    的頭像 發(fā)表于 11-15 14:52 ?848次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理與算法

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一類(lèi)包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Networks,F(xiàn)NN
    的頭像 發(fā)表于 11-15 14:47 ?1786次閱讀

    傅里葉變換與卷積定理的關(guān)系

    傅里葉變換與卷積定理之間存在著密切的關(guān)系,這種關(guān)系在信號(hào)處理、圖像處理等領(lǐng)域中具有重要的應(yīng)用價(jià)值。 一、傅里葉變換與卷積的基本概念 傅里葉變換 : 是一種將時(shí)間域(或空間域)信號(hào)轉(zhuǎn)換為頻率域信號(hào)
    的頭像 發(fā)表于 11-14 09:33 ?1921次閱讀

    一種基于因果路徑的層次圖卷積注意力網(wǎng)絡(luò)

    機(jī)電系統(tǒng)中數(shù)據(jù)驅(qū)動(dòng)故障檢測(cè)模型的性能和可解釋性。引入了一種混合因果發(fā)現(xiàn)算法來(lái)發(fā)現(xiàn)監(jiān)測(cè)變量之間的繼承因果關(guān)系。順序連接因果變量的因果路徑用作接收?qǐng)觯褂枚喑叨?b class='flag-5'>卷積來(lái)提取特征?;诜謱幼⒁饬?b class='flag-5'>機(jī)制來(lái)聚合
    的頭像 發(fā)表于 11-12 09:52 ?1074次閱讀
    一種基于因果路徑的層次圖<b class='flag-5'>卷積</b>注意力網(wǎng)絡(luò)

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    取特征的強(qiáng)大工具,例如識(shí)別音頻信號(hào)或圖像信號(hào)中的復(fù)雜模式就是其應(yīng)用之一。 1、什么是卷積神經(jīng)網(wǎng)絡(luò)? 神經(jīng)網(wǎng)絡(luò)是一種由神經(jīng)元組成的系統(tǒng)或結(jié)構(gòu),它使AI能夠更好地理解數(shù)據(jù),進(jìn)而解決復(fù)雜問(wèn)題。雖然神經(jīng)網(wǎng)絡(luò)有
    發(fā)表于 10-24 13:56

    高斯濾波的卷積核怎么確定

    高斯濾波的卷積核確定主要依賴(lài)于高斯函數(shù)的特性以及圖像處理的具體需求。以下是確定高斯濾波卷積核的幾個(gè)關(guān)鍵步驟: 一、確定卷積核的大小 卷積核形狀 :高斯濾波的
    的頭像 發(fā)表于 09-29 09:29 ?1694次閱讀