資料介紹
遞歸神經網絡
在傳統(tǒng)神經網絡中,模型不會關注上一時刻的處理會有什么信息可以用于下一時刻,每一次都只會關注當前時刻的處理。舉個例子來說,我們想對一部影片中每一刻出現(xiàn)的事件進行分類,如果我們知道電影前面的事件信息,那么對當前時刻事件的分類就會非常容易。實際上,傳統(tǒng)神經網絡沒有記憶功能,所以它對每一刻出現(xiàn)的事件進行分類時不會用到影片已經出現(xiàn)的信息,那么有什么方法可以讓神經網絡能夠記住這些信息呢?答案就是Recurrent Neural Networks(RNNs)遞歸神經網絡。
遞歸神經網絡的結果與傳統(tǒng)神經網絡有一些不同,它帶有一個指向自身的環(huán),用來表示它可以傳遞當前時刻處理的信息給下一時刻使用,結構如下:

其中, Xt 為輸入,A 為模型處理部分, ht 為輸出。
為了更容易地說明遞歸神經網絡,我們把上圖展開,得到:

這樣的一條鏈狀神經網絡代表了一個遞歸神經網絡,可以認為它是對相同神經網絡的多重復制,每一時刻的神經網絡會傳遞信息給下一時刻。如何理解它呢?假設有這樣一個語言模型,我們要根據(jù)句子中已出現(xiàn)的詞預測當前詞是什么,遞歸神經網絡的工作原理如下:

其中,W 為各類權重,x 表示輸入,y 表示輸出,h 表示隱層處理狀態(tài)。
遞歸神經網絡因為具有一定的記憶功能,可以被用來解決很多問題,例如:語音識別、語言模型、機器翻譯等。但是它并不能很好地處理長時依賴問題。
長時依賴問題
長時依賴是這樣的一個問題,當預測點與依賴的相關信息距離比較遠的時候,就難以學到該相關信息。例如在句子”我出生在法國,……,我會說法語“中,若要預測末尾”法語“,我們需要用到上下文”法國“。理論上,遞歸神經網絡是可以處理這樣的問題的,但是實際上,常規(guī)的遞歸神經網絡并不能很好地解決長時依賴,好的是LSTMs可以很好地解決這個問題。
LSTM 神經網絡
Long Short Term Mermory network(LSTM)是一種特殊的RNNs,可以很好地解決長時依賴問題。那么它與常規(guī)神經網絡有什么不同?
首先我們來看RNNs具體一點的結構:

所有的遞歸神經網絡都是由重復神經網絡模塊構成的一條鏈,可以看到它的處理層非常簡單,通常是一個單tanh層,通過當前輸入及上一時刻的輸出來得到當前輸出。與神經網絡相比,經過簡單地改造,它已經可以利用上一時刻學習到的信息進行當前時刻的學習了。
LSTM的結構與上面相似,不同的是它的重復模塊會比較復雜一點,它有四層結構:

其中,處理層出現(xiàn)的符號及表示意思如下:

LSTMs的核心思想
理解LSTMs的關鍵就是下面的矩形方框,被稱為memory block(記憶塊),主要包含了三個門(forget gate、input gate、output gate)與一個記憶單元(cell)。方框內上方的那條水平線,被稱為cell state(單元狀態(tài)),它就像一個傳送帶,可以控制信息傳遞給下一時刻。

這個矩形方框還可以表示為:

這兩個圖可以對應起來看,下圖中心的 ct 即cell,從下方輸入( ht?1 , xt )到輸出 ht的一條線即為cell state, ft,it,ot 分別為遺忘門、輸入門、輸出門,用sigmoid層表示。上圖中的兩個tanh層則分別對應cell的輸入與輸出。
LSTM可以通過門控單元可以對cell添加和刪除信息。通過門可以有選擇地決定信息是否通過,它有一個sigmoid神經網絡層和一個成對乘法操作組成,如下:

該層的輸出是一個介于0到1的數(shù),表示允許信息通過的多少,0 表示完全不允許通過,1表示允許完全通過。
逐步解析LSTM
LSTM第一步是用來決定什么信息可以通過cell state。這個決定由“forget gate”層通過 sigmoid 來控制,它會根據(jù)上一時刻的輸出 ht?1 和當前輸入 xt 來產生一個0到1 的 ft 值,來決定是否讓上一時刻學到的信息 Ct?1 通過或部分通過。如下:

舉個例子來說就是,我們在之前的句子中學到了很多東西,一些東西對當前來講是沒用的,可以對它進行選擇性地過濾。
第二步是產生我們需要更新的新信息。這一步包含兩部分,第一個是一個“input gate”層通過sigmoid來決定哪些值用來更新,第二個是一個tanh層用來生成新的候選值,它作為當前層產生的候選值可能會添加到cell state中。我們會把這兩部分產生的值結合來進行更新。

現(xiàn)在我們對老的cell state進行更新,首先,我們將老的cell state乘以 ft 來忘掉我們不需要的信息,然后再與 it ? 相加,得到了候選值。
一二步結合起來就是丟掉不需要的信息,添加新信息的過程:
舉個例子就是,在前面的句子中我們保存的是張三的信息,現(xiàn)在有了新的李四信息,我們需要把張三的信息丟棄掉,然后把李四的信息保存下來。
最后一步是決定模型的輸出,首先是通過sigmoid層來得到一個初始輸出,然后使用tanh將 Ct 值縮放到-1到1間,再與sigmoid得到的輸出逐對相乘,從而得到模型的輸出。
這顯然可以理解,首先sigmoid函數(shù)的輸出是不考慮先前時刻學到的信息的輸出,tanh函數(shù)是對先前學到信息的壓縮處理,起到穩(wěn)定數(shù)值的作用,兩者的結合學習就是遞歸神經網絡的學習思想。至于模型是如何學習的,那就是后向傳播誤差學習權重的一個過程了。
上面是對LSTM一個典型結構的理解,當然,它也會有一些結構上的變形,但思想基本不變,這里也就不多講了。
- 人工神經網絡的原理及仿真實例 0次下載
- 神經網絡基礎問題的整理 11次下載
- 基于進化計算的神經網絡設計與實現(xiàn) 4次下載
- 基于神經網絡的優(yōu)化計算實驗 43次下載
- 人工神經網絡控制 13次下載
- 人工智能-BP神經網絡算法的簡單實現(xiàn) 12次下載
- 基于不同神經網絡的文本分類方法研究對比 49次下載
- 結合小波變換的LSTM循環(huán)神經網絡的稅收預測 10次下載
- 基于PCA和LSTM神經網絡的硬件木馬檢測方法 18次下載
- 基于PCA和LSTM神經網絡的硬件木馬檢測方法 10次下載
- 基于LSTM和CNN融合的深度神經網絡個人信用評分方法 32次下載
- 長短時記憶網絡(LSTM)
- 神經網絡的應用及發(fā)展的詳細資料說明 2次下載
- 神經網絡與神經網絡控制的學習課件免費下載 7次下載
- BP神經網絡的簡單MATLAB實例免費下載 5次下載
- LSTM神經網絡的結構與工作機制 526次閱讀
- BP神經網絡和卷積神經網絡的關系 1677次閱讀
- BP神經網絡和人工神經網絡的區(qū)別 1224次閱讀
- 如何理解RNN與LSTM神經網絡 679次閱讀
- 全連接前饋神經網絡與前饋神經網絡的比較 9641次閱讀
- 前饋神經網絡的工作原理和應用 1861次閱讀
- 深度神經網絡與基本神經網絡的區(qū)別 1006次閱讀
- 用于自然語言處理的神經網絡有哪些 1354次閱讀
- 卷積神經網絡與循環(huán)神經網絡的區(qū)別 3582次閱讀
- 深度神經網絡的實現(xiàn)機理與決策邏輯難以理解 2994次閱讀
- 循環(huán)神經網絡(RNN)和(LSTM)初學者指南 968次閱讀
- 長短時記憶神經網絡的算法 4768次閱讀
- BP神經網絡概述 4.4w次閱讀
- 我們該如何理解卷積神經網絡? 9723次閱讀
- 用TensorFlow寫個簡單的神經網絡 5179次閱讀
下載排行
本周
- 1STM32開發(fā)板教程之STM32開發(fā)指南免費下載
- 24.88 MB | 176次下載 | 3 積分
- 2EN60335-1安規(guī)標準 中文版本
- 1.86 MB | 52次下載 | 1 積分
- 3LT7406FJ N溝道增強型功率MOSFET規(guī)格書
- 1.38 MB | 2次下載 | 免費
- 4STM32系列產品選型-中文
- 1.81 MB | 1次下載 | 免費
- 5LTS6802FJCB N溝道增強型功率MOSFET規(guī)格書
- 1.00 MB | 1次下載 | 免費
- 6運算放大電路入門教程
- 0.70 MB | 1次下載 | 免費
- 7米爾-瑞芯微RK3562核心板開發(fā)板,4核CPU,ARM中量級多面手
- 3.45 MB | 1次下載 | 免費
- 8開源鴻蒙版真4K顯示器廣告機主板AIoT-6780SE彩頁
- 613.79 KB | 1次下載 | 免費
本月
- 1STM32開發(fā)板教程之STM32開發(fā)指南免費下載
- 24.88 MB | 176次下載 | 3 積分
- 2DeepSeek:從入門到精通
- 5.36 MB | 92次下載 | 1 積分
- 3EN60335-1安規(guī)標準 中文版本
- 1.86 MB | 52次下載 | 1 積分
- 4OAH0428最新規(guī)格書(中文)
- 2.52 MB | 27次下載 | 10 積分
- 5UHV系列雷電沖擊電壓發(fā)生器試驗裝置詳細說明使用
- 1.07 MB | 17次下載 | 免費
- 6Altium-常用3D封裝庫(Step)接插件篇
- 4.95 MB | 14次下載 | 免費
- 7介紹一些常用的電子元器件
- 3.20 MB | 7次下載 | 免費
- 8麻將機升降電路
- 0.12 MB | 6次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935124次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420063次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191371次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183336次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81583次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73814次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論