99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

首個(gè)在ImageNet上精度超過80%的二值神經(jīng)網(wǎng)絡(luò)BNext問世

OpenCV學(xué)堂 ? 來源:機(jī)器之心 ? 作者:機(jī)器之心 ? 2022-12-06 15:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

兩年前,當(dāng) MeliusNet 問世時(shí),機(jī)器之心曾發(fā)表過一篇技術(shù)文章《第一次勝過 MobileNet 的二值神經(jīng)網(wǎng)絡(luò),-1 與 + 1 的三年艱苦跋涉》,回顧了 BNN 的發(fā)展歷程。彼時(shí),依靠早期 BNN 工作 XNOR-Net 起家的 XNOR.AI 被蘋果公司收購,大家曾暢想過這種低功耗、高效能的二值神經(jīng)網(wǎng)絡(luò)技術(shù)會(huì)不會(huì)即將開啟廣闊的應(yīng)用前景。

然而,過去的兩年時(shí)間,我們很難從對(duì)技術(shù)嚴(yán)格保密的蘋果公司獲得關(guān)于 BNN 技術(shù)應(yīng)用的更多信息,而不論是學(xué)界和業(yè)界也未出現(xiàn)其他特別亮眼的應(yīng)用案例。另一方面,隨著終端設(shè)備數(shù)量的暴漲,邊緣 AI 應(yīng)用和市場(chǎng)正在迅速增長: 預(yù)計(jì)到 2030 年將產(chǎn)生 500 到 1250 億臺(tái)邊緣設(shè)備,邊緣計(jì)算市場(chǎng)將暴漲到 600 億美元規(guī)模。這其中有幾個(gè)目前熱門的應(yīng)用領(lǐng)域:AIoT、元宇宙和機(jī)器人終端設(shè)備。相關(guān)業(yè)界正在加速發(fā)力技術(shù)落地,與此同時(shí) AI 能力已經(jīng)嵌入到以上領(lǐng)域的諸多核心技術(shù)環(huán)節(jié)中,如 AI 技術(shù)在三維重建、視頻壓縮以及機(jī)器人實(shí)時(shí)感知場(chǎng)景中的廣泛應(yīng)用。在這樣的背景下,業(yè)界對(duì)基于邊緣的高能效、低功耗 AI 技術(shù)、軟件工具以及硬件加速的需求變的日益迫切。

目前,制約 BNN 應(yīng)用的瓶頸主要有兩方面:首先,無法有效縮小和傳統(tǒng) 32-bit 深度學(xué)習(xí)模型的精度差距;第二則是缺乏在不同硬件上的高性能算法實(shí)現(xiàn)。機(jī)器學(xué)習(xí)論文上的加速比通常無法體現(xiàn)在你正在使用的 GPUCPU 上。第二個(gè)原因的產(chǎn)生可能正是來自于第一個(gè)原因,BNN 無法達(dá)到令人滿意的精度,因此無法吸引來自系統(tǒng)和硬件加速、優(yōu)化領(lǐng)域的從業(yè)者的廣泛關(guān)注。而機(jī)器學(xué)習(xí)算法社區(qū)通常無法自己開發(fā)高性能的硬件代碼。因此,想要同時(shí)獲得高精度和強(qiáng)加速效果,BNN 應(yīng)用或加速器無疑需要來自這兩個(gè)不同領(lǐng)域的開發(fā)者進(jìn)行協(xié)作。

BNN 為什么對(duì)于計(jì)算和內(nèi)存高效

舉個(gè)例子,Meta 推薦系統(tǒng)模型 DLRM 使用 32-bit 浮點(diǎn)數(shù)來儲(chǔ)存權(quán)重和激活參數(shù),它的模型大小約為 2.2GB。而一個(gè)少量精度下降 (<4%) 的二值版本模型的大小僅為 67.5MB,由此可見二值神經(jīng)網(wǎng)絡(luò)可以節(jié)省 32 倍的模型大小。這對(duì)于儲(chǔ)存受限的邊緣設(shè)備來說具備了非常強(qiáng)的優(yōu)勢(shì)。此外,BNN 也非常適合應(yīng)用在分布式 AI 場(chǎng)景中,例如聯(lián)邦學(xué)習(xí)常常對(duì)模型權(quán)重進(jìn)行傳輸和聚合操作,因此模型大小和帶寬受限往往成為整個(gè)系統(tǒng)的瓶頸。常用的手段是通過增加模型本地優(yōu)化迭代次數(shù)來換取權(quán)重傳輸頻率的降低,用這種折中的方法來提升整體效率,如著名的谷歌 FedAvg 算法。但增大本地計(jì)算量的策略對(duì)端側(cè)用戶并不友好,這里,如果采用 BNN 就可以很輕易的降低幾十倍的數(shù)據(jù)傳輸量。

BNN 的第二個(gè)顯著的優(yōu)勢(shì)是計(jì)算方式極度高效。它只用 1bit 也就是兩種 state 來表示變量。這意味著所有運(yùn)算只靠位運(yùn)算就能完成,借助與門、異或門等運(yùn)算,可以替代傳統(tǒng)乘加運(yùn)算。位運(yùn)算是電路中的基礎(chǔ)單元,熟悉電路設(shè)計(jì)的同學(xué)應(yīng)該明白,有效減小乘加計(jì)算單元的面積以及減少片外訪存是降低功耗的最有效手段,而 BNN 從內(nèi)存和計(jì)算兩個(gè)方面都具備得天獨(dú)厚的優(yōu)勢(shì),WRPN[1]展示了在定制化 FPGAASIC 上,BNN 對(duì)比全精度可獲得 1000 倍的功耗節(jié)省。更近期的工作 BoolNet [2]展示了一種 BNN 結(jié)構(gòu)設(shè)計(jì)可以幾乎不使用浮點(diǎn)運(yùn)算并保持純 binary 的信息流,它在 ASIC 仿真中獲得極佳的功耗、精度權(quán)衡。

第一個(gè)精度上 80% 的 BNN 是什么樣子的?

來自德國 Hasso Plattner 計(jì)算機(jī)系統(tǒng)工程研究院的 Nianhui Guo 和 Haojin Yang 等研究者提出了 BNext 模型,成為第一個(gè)在 ImageNet 數(shù)據(jù)集上 top1 分類準(zhǔn)確率突破 80% 的 BNN:

906c3094-74ad-11ed-8abf-dac502259ad0.png

圖 1 基于 ImageNet 的 SOTA BNN 性能對(duì)比

90a63bfe-74ad-11ed-8abf-dac502259ad0.jpg

論文地址:https://arxiv.org/pdf/2211.12933.pdf

作者首先基于 Loss Landscape 可視化的形式深入對(duì)比了當(dāng)前主流 BNN 模型同 32-bit 模型在優(yōu)化友好度方面的巨大差異 (圖 2),提出 BNN 的粗糙 Loss Landscape 是阻礙當(dāng)前研究社區(qū)進(jìn)一步探索 BNN 性能邊界的的主要原因之一?;谶@一假設(shè),作者嘗試?yán)眯路f的結(jié)構(gòu)設(shè)計(jì)對(duì) BNN 模型優(yōu)化友好度進(jìn)行提升,通過構(gòu)造具備更平滑 Loss Landscape 的二值神經(jīng)網(wǎng)絡(luò)架構(gòu)以降低對(duì)高精度 BNN 模型的優(yōu)化難度。具體而言,作者強(qiáng)調(diào)模型二值化大幅度限制了可用于前向傳播的特征模式,促使二值卷積僅能在有限的特征空間進(jìn)行信息提取與處理,而這種受限前饋傳播模式帶來的優(yōu)化困難可以通過兩個(gè)層面的結(jié)構(gòu)設(shè)計(jì)得到有效緩解:(1) 構(gòu)造靈活的鄰接卷積特征校準(zhǔn)模塊以提高模型對(duì)二值表征的適應(yīng)性;(2) 探索高效的旁路結(jié)構(gòu)以緩解前饋傳播中由于特征二值化帶來的信息瓶頸問題。

90c0b8bc-74ad-11ed-8abf-dac502259ad0.png

圖 2 針對(duì)流行 BNN 架構(gòu)的 Loss Landscape 可視化對(duì)比(2D 等高線視角)

基于上述分析,作者提出了 BNext,首個(gè)在 ImageNe 圖像分類任務(wù)達(dá)到 > 80% 準(zhǔn)確率的二值神經(jīng)網(wǎng)絡(luò)架構(gòu),具體的網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)如圖 4 所示。作者首先設(shè)計(jì)了基于 Info-Recoupling (Info-RCP) 模塊的基礎(chǔ)二值處理單元。針對(duì)鄰接卷積間的信息瓶頸問題,通過引入額外的 Batch Normalization 層與 PReLU 層完成對(duì)二值卷積輸出分布的初步校準(zhǔn)設(shè)計(jì)。接著作者構(gòu)造了基于逆向殘差結(jié)構(gòu)與 Squeeze-And-Expand 分支結(jié)構(gòu)的二次動(dòng)態(tài)分布校準(zhǔn)設(shè)計(jì)。如圖 3 所示,相比傳統(tǒng)的 Real2Binary 校準(zhǔn)結(jié)構(gòu),額外的逆向殘差結(jié)構(gòu)充分考慮了二值單元輸入與輸出間的特征差距,避免了完全基于輸入信息的次優(yōu)分布校準(zhǔn)。這種雙階段的動(dòng)態(tài)分布校準(zhǔn)可以有效降低后續(xù)鄰接二值卷積層的特征提取難度。

90df00e2-74ad-11ed-8abf-dac502259ad0.png

圖 3 卷積模塊設(shè)計(jì)對(duì)比圖

其次,作者提出結(jié)合 Element-wise Attention (ELM-Attention) 的增強(qiáng)二值 Basic Block 模塊。作者通過堆疊多個(gè) Info-RCP 模塊完成 Basic Block 的基礎(chǔ)搭建,并對(duì)每個(gè) Info-RCP 模塊引入額外的 Batch Normalization 和連續(xù)的殘差連接以進(jìn)一步緩解不同 Info-RCP 模塊間的信息瓶頸問題?;谂月方Y(jié)構(gòu)對(duì)二值模型優(yōu)化影響的分析, 作者提出使用 Element-wise 矩陣乘法分支對(duì)每個(gè) Basic Block 的首個(gè) 3x3 Info-RCP 模塊輸出進(jìn)行分布校準(zhǔn)。額外的空域注意力加權(quán)機(jī)制可以幫助 Basic Block 以更靈活的機(jī)制進(jìn)行前向信息融合與分發(fā),改善模型 Loss Landscape 平滑度。如圖 2.e 和圖 2.f 所示,所提出的模塊設(shè)計(jì)可以顯著改善模型 Loss Landscape 平滑度。

90faf842-74ad-11ed-8abf-dac502259ad0.png

圖 4 BNext 架構(gòu)設(shè)計(jì)。"Processor 代表 Info-RCP 模塊,"BN "代表 Batch Normalization 層,"C "表示模型基本寬度,"N "和"M " 表示模型不同階段的深度比例參數(shù)。

9122217e-74ad-11ed-8abf-dac502259ad0.png

Table 1 BNext 系列。“Q”表示輸入層、SEbranch以及輸出層量化設(shè)置。

作者將以上結(jié)構(gòu)設(shè)計(jì)同流行的MoboleNetv1基準(zhǔn)模型結(jié)合,并通過改變模型深度與寬度的比例系數(shù)構(gòu)建了四種不同復(fù)雜度的 BNext 模型系列 (Table 1):BNex-Tiny,BNext-Small,BNext-Middle,BNext-Large。

由于相對(duì)粗糙的 Loss Landscape,當(dāng)前二值模型優(yōu)化普遍依賴于 knowledge distillation 等方法提供的更精細(xì)監(jiān)督信息,以此擺脫廣泛存在的次優(yōu)收斂。BNext作者首次考慮了優(yōu)化過程中teache模型與二值student模型預(yù)測(cè)分布巨大差距可能帶來的影響,,指出單純基于模型精度進(jìn)行的 teacher 選擇會(huì)帶來反直覺的 student 過擬合結(jié)果。為解決這一問題,作者提出了 knowledge-complexity (KC) 作為新的 teacher-selection 度量標(biāo)準(zhǔn),同時(shí)考慮 teacher 模型的輸出軟標(biāo)簽有效性與 teacher 模型參數(shù)復(fù)雜度之間的關(guān)聯(lián)性。

9134ace0-74ad-11ed-8abf-dac502259ad0.png

如圖 5 所示,基于 knowledge complexity,作者對(duì)流行全精度模型系列如 ResNet、EfficientNet、ConvNext 進(jìn)行了復(fù)雜度度量與排序,結(jié)合 BNext-T 作為 student 模型初步驗(yàn)證了該度量標(biāo)準(zhǔn)的有效性,并基于排序結(jié)果用于后續(xù)實(shí)驗(yàn)中的 knowledge distillation 模型選擇。

914bcd76-74ad-11ed-8abf-dac502259ad0.png

圖 5 反直覺的過擬合效應(yīng)和不同教師選擇下的知識(shí)復(fù)雜性影響

在此基礎(chǔ)上,論文作者進(jìn)一步考慮了強(qiáng) teacher 優(yōu)化過程中由于早期預(yù)測(cè)分布差距造成的優(yōu)化問題,提出 Diversified Consecutive KD。如下所示,作者通過強(qiáng)弱 teachers 組合的知識(shí)集成方法對(duì)優(yōu)化過程中的目標(biāo)函數(shù)進(jìn)行調(diào)制。在此基礎(chǔ)上,進(jìn)一步引入 knowledge-boosting 策略,利用多個(gè)預(yù)定義候選 teachers 在訓(xùn)練過程中對(duì)弱 teacher 進(jìn)行均勻切換,將組合知識(shí)復(fù)雜度按照從弱到強(qiáng)的順序進(jìn)行課程式引導(dǎo),降低預(yù)測(cè)分布差異性帶來的優(yōu)化干擾。

9166ef48-74ad-11ed-8abf-dac502259ad0.png

在優(yōu)化技巧方面,BNext 作者充分考慮了現(xiàn)代高精度模型優(yōu)化中數(shù)據(jù)增強(qiáng)可能帶來的增益,并提供了首個(gè)針對(duì)現(xiàn)有流行數(shù)據(jù)增強(qiáng)策略在二值模型優(yōu)化中可能帶來影響的分析結(jié)果,實(shí)驗(yàn)結(jié)果表明,現(xiàn)有數(shù)據(jù)增強(qiáng)方法并不完全適用于二值模型優(yōu)化,這為后續(xù)研究中特定于二值模型優(yōu)化的數(shù)據(jù)增強(qiáng)策略設(shè)計(jì)提供了思路。

基于所提出架構(gòu)設(shè)計(jì)與優(yōu)化方法,作者在大規(guī)模圖像分類任務(wù) ImageNet-1k 進(jìn)行方法驗(yàn)證。實(shí)驗(yàn)結(jié)果如圖 6 所示。

917f216c-74ad-11ed-8abf-dac502259ad0.png

圖 6 基于 ImageNet-1k 的 SOTA BNN 方法比較。

相比于現(xiàn)有方法,BNext-L 在 ImageNet-1k 上首次將二值模型的性能邊界推動(dòng)至 80.57%,對(duì)大多數(shù)現(xiàn)有方法實(shí)現(xiàn)了 10%+ 的精度超越。相比于來自 Google 的 PokeBNN, BNext-M 在相近參數(shù)量前提下要高出 0.7%,作者同時(shí)強(qiáng)調(diào),PokeBNN 的優(yōu)化依賴于更高的計(jì)算資源,如高達(dá) 8192 的 Bacth Size 以及 720 個(gè) Epoch 的 TPU 計(jì)算優(yōu)化,而 BNext-L 僅僅以常規(guī) Batch Size 512 迭代了 512 個(gè) Epoch,這反映了 BNext 結(jié)構(gòu)設(shè)計(jì)與優(yōu)化方法的有效性。在基于相同基準(zhǔn)模型的比較中,BNext-T 與 BNext-18 都有著大幅度的精度提升。在同全精度模型如 RegNetY-4G (80.0%)等的對(duì)比中,BNext-L 在展現(xiàn)相匹配的視覺表征學(xué)習(xí)能力同時(shí),僅僅使用了有限的參數(shù)空間與計(jì)算復(fù)雜度,這為在邊緣端部署基于二值模型特征提取器的下游視覺任務(wù)模型提供了豐富想象空間。

What next?

BNext 作者在論文中提到的,他們和合作者們正積極在 GPU 硬件上實(shí)現(xiàn)并驗(yàn)證這個(gè)高精度 BNN 架構(gòu)的運(yùn)行效率,未來計(jì)劃擴(kuò)展到其他更廣泛的硬件平臺(tái)上。然而在編者看來,讓社區(qū)對(duì) BNN 重拾信心,被更多系統(tǒng)和硬件領(lǐng)域的極客關(guān)注到,也許這個(gè)工作更重要的意義在于重塑了 BNN 應(yīng)用潛力的想象空間。從長遠(yuǎn)來看,隨著越來越多的應(yīng)用從以云為中心的計(jì)算范式向去中心化的邊緣計(jì)算遷移,未來海量的邊緣設(shè)備需要更加高效的 AI 技術(shù)、軟件框架和硬件計(jì)算平臺(tái)。而目前最主流的 AI 模型和計(jì)算架構(gòu)都不是為邊緣場(chǎng)景設(shè)計(jì)、優(yōu)化的。因此,在找到邊緣 AI 的答案之前,相信 BNN 始終都會(huì)是一個(gè)充滿技術(shù)挑戰(zhàn)又蘊(yùn)涵巨大潛力的重要選項(xiàng)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29739

    瀏覽量

    212862
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103606
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35141

    瀏覽量

    279810

原文標(biāo)題:首個(gè)在ImageNet上精度超過80%的二值神經(jīng)網(wǎng)絡(luò)BNext問世,-1與+1的五年辛路歷程

文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)電機(jī)故障診斷中的應(yīng)用

    摘要:針對(duì)傳統(tǒng)專家系統(tǒng)不能進(jìn)行自學(xué)習(xí)、自適應(yīng)的問題,本文提出了基于種經(jīng)網(wǎng)絡(luò)專家系統(tǒng)的并步電機(jī)故障診斷方法。本文將小波神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng)相結(jié)合,充分發(fā)揮了者故障診斷的優(yōu)點(diǎn),很大程度上降低了對(duì)電機(jī)
    發(fā)表于 06-16 22:09

    神經(jīng)網(wǎng)絡(luò)RAS異步電機(jī)轉(zhuǎn)速估計(jì)中的仿真研究

    眾多方法中,由于其結(jié)構(gòu)簡單,穩(wěn)定性好廣泛受到人們的重視,且已被用于產(chǎn)品開發(fā)。但是MRAS仍存在在低速區(qū)速度估計(jì)精度下降和對(duì)電動(dòng)機(jī)參數(shù)變化非常敏感的問題。本文利用神經(jīng)網(wǎng)絡(luò)的特點(diǎn),使估計(jì)更為簡單、快速
    發(fā)表于 06-16 21:54

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的比較

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)多個(gè)方面存在顯著差異,以下是對(duì)兩者的比較: 一、結(jié)構(gòu)特點(diǎn) BP神經(jīng)網(wǎng)絡(luò) : BP神經(jīng)網(wǎng)絡(luò)是一種多層的前饋
    的頭像 發(fā)表于 02-12 15:53 ?665次閱讀

    什么是BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法

    神經(jīng)網(wǎng)絡(luò)(即反向傳播神經(jīng)網(wǎng)絡(luò))的核心,它建立梯度下降法的基礎(chǔ),是一種適合于多層神經(jīng)元網(wǎng)絡(luò)的學(xué)習(xí)算法。該算法通過計(jì)算每層
    的頭像 發(fā)表于 02-12 15:18 ?766次閱讀

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的關(guān)系

    ),是一種多層前饋神經(jīng)網(wǎng)絡(luò),它通過反向傳播算法進(jìn)行訓(xùn)練。BP神經(jīng)網(wǎng)絡(luò)由輸入層、一個(gè)或多個(gè)隱藏層和輸出層組成,通過逐層遞減的方式調(diào)整網(wǎng)絡(luò)權(quán)重,目的是最小化網(wǎng)絡(luò)的輸出誤差。
    的頭像 發(fā)表于 02-12 15:15 ?855次閱讀

    BP神經(jīng)網(wǎng)絡(luò)圖像識(shí)別中的應(yīng)用

    BP神經(jīng)網(wǎng)絡(luò)圖像識(shí)別中發(fā)揮著重要作用,其多層結(jié)構(gòu)使得網(wǎng)絡(luò)能夠?qū)W習(xí)到復(fù)雜的特征表達(dá),適用于處理非線性問題。以下是對(duì)BP神經(jīng)網(wǎng)絡(luò)圖像識(shí)別中應(yīng)
    的頭像 發(fā)表于 02-12 15:12 ?677次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

    在上一篇文章中,我們介紹了傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)和多種算法。本文中,我們會(huì)介紹人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法,供各位老師選擇。 01 人工神經(jīng)網(wǎng)絡(luò) ? 人工
    的頭像 發(fā)表于 01-09 10:24 ?1189次閱讀
    人工<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的原理和多種<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>架構(gòu)方法

    卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的比較

    深度學(xué)習(xí)領(lǐng)域,神經(jīng)網(wǎng)絡(luò)模型被廣泛應(yīng)用于各種任務(wù),如圖像識(shí)別、自然語言處理和游戲智能等。其中,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)是兩種常見的模型。 1. 結(jié)構(gòu)差異 1.1 傳統(tǒng)
    的頭像 發(fā)表于 11-15 14:53 ?1869次閱讀

    RNN模型與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的區(qū)別

    神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)領(lǐng)域中的一種強(qiáng)大工具,它們能夠模擬人腦處理信息的方式。隨著技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)的類型也不斷增加,其中循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和傳統(tǒng)
    的頭像 發(fā)表于 11-15 09:42 ?1126次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與工作機(jī)制

    LSTM(Long Short-Term Memory,長短期記憶)神經(jīng)網(wǎng)絡(luò)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),設(shè)計(jì)用于解決長期依賴問題,特別是處理時(shí)間序列數(shù)據(jù)時(shí)表現(xiàn)出色。以下是LSTM神經(jīng)
    的頭像 發(fā)表于 11-13 10:05 ?1631次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)時(shí)間序列預(yù)測(cè)中的應(yīng)用

    時(shí)間序列預(yù)測(cè)是數(shù)據(jù)分析中的一個(gè)重要領(lǐng)域,它涉及到基于歷史數(shù)據(jù)預(yù)測(cè)未來。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)因其處理序列數(shù)據(jù)方面的優(yōu)勢(shì)而受到廣泛關(guān)注。 LSTM神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-13 09:54 ?2051次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)的基本原理 如何實(shí)現(xiàn)LSTM神經(jīng)網(wǎng)絡(luò)

    LSTM(長短期記憶)神經(jīng)網(wǎng)絡(luò)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),它能夠?qū)W習(xí)長期依賴信息。處理序列數(shù)據(jù)時(shí),如時(shí)間序列分析、自然語言處理等,LSTM因其能夠有效地捕捉時(shí)間序列中的長期依賴關(guān)系而受到
    的頭像 發(fā)表于 11-13 09:53 ?1583次閱讀

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中非常有效。卷積層使用一種被稱為卷積的數(shù)學(xué)運(yùn)算來識(shí)別像素數(shù)組的模式。卷積發(fā)生在隱藏層中,如圖3所示。卷積會(huì)重復(fù)多次直至達(dá)到所需的精度水平。如果要比較的兩個(gè)輸入(本例是
    發(fā)表于 10-24 13:56

    matlab 神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析

    matlab神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析 精通的可以討論下
    發(fā)表于 09-18 15:14

    FPGA深度神經(jīng)網(wǎng)絡(luò)中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network, DNN)作為其核心算法之一,圖像識(shí)別、語音識(shí)別、自然語言處理等領(lǐng)域取得了顯著成果。然而,傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)模型
    的頭像 發(fā)表于 07-24 10:42 ?1202次閱讀