99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

師法自然 淺談深度學(xué)習(xí)的多重角度

mK5P_AItists ? 來源:電子發(fā)燒友網(wǎng) ? 作者:工程師譚軍 ? 2018-07-10 08:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學(xué)習(xí)已經(jīng)成熟到可以教給高中生了么?

我思考的這個(gè)問題,源于不久前我收到的?封來自某大公司產(chǎn)品經(jīng)理的郵件。

我喜歡將私人通訊郵件公開于眾,所以我將郵件內(nèi)容摘在下面:

來自:M.

你好 Ali, ...

你如何訓(xùn)練團(tuán)隊(duì)里的年輕成員,使得他們有更好的直覺和預(yù)判?我團(tuán)隊(duì)里的工程師經(jīng)常從其他科研員那「借鑒」超參數(shù)的值,但他們太擔(dān)心要自己去調(diào)整參數(shù)了。...

我對(duì)著這封郵件思考了數(shù)日,卻沒有辦法找到?個(gè)有條理的答案。

如果說應(yīng)該有正確答案的話,我想回復(fù)說:也許她的工程師應(yīng)該要有這種擔(dān)心。

如果你是個(gè)工程師,你拿到了這個(gè)神經(jīng)網(wǎng)絡(luò),然后你被要求去改進(jìn)這個(gè)網(wǎng)絡(luò)在某個(gè)數(shù)據(jù)集上的表現(xiàn)。你也許會(huì)假設(shè)這每層都是有它自己的作用和功能,但在深度學(xué)習(xí)領(lǐng)域,我們目前還沒有統(tǒng)的語言和詞匯去描述這些功效。我們教授深度學(xué)習(xí)的方法和我們教授其他科學(xué)學(xué)科的方法很不同。

幾年前我迷上了光學(xué)。在光學(xué)領(lǐng)域,你會(huì)堆疊好幾層不同的組件以處理輸?shù)墓庠础@缦聢D,就是相機(jī)的鏡頭:

師法自然 淺談深度學(xué)習(xí)的多重角度

要設(shè)計(jì)這樣的系統(tǒng),你從最簡(jiǎn)單的組件開始堆疊,這些組件往往以知名的發(fā)明者命名。然后通過仿真,你可 以判斷你的設(shè)計(jì)是否符合你的要求,然后再添加不同的組件去修正先前設(shè)計(jì)的缺陷。

緊接著你會(huì)各種數(shù)學(xué)優(yōu)化過程去調(diào)整這些組件的參數(shù),例如鏡面的形狀、位置和傾斜角度等等,去最大程度實(shí)現(xiàn)你的設(shè)計(jì)目標(biāo)。你就重復(fù)如此仿真、修改、調(diào)優(yōu)的過程。

這很像我們?cè)O(shè)計(jì)深度網(wǎng)絡(luò)的過程。

上圖里所有的 36 個(gè)元素都是故意加?這個(gè)堆疊的系統(tǒng),以用于修正某項(xiàng)具體的偏差的。這樣的設(shè)計(jì)需要非常精確的解釋模型去描述什么樣的元素能夠?qū)ν高^它的光有什么樣的效應(yīng)。這個(gè)模型往往是關(guān)于這個(gè)元素的作用的,例如說折射、反射、衍射、散射和波前校正。

師法自然 淺談深度學(xué)習(xí)的多重角度

?們不害怕這樣的設(shè)計(jì)過程。每年,美國(guó)培養(yǎng)的許多?程師都能設(shè)計(jì)出有的鏡頭,他們并不為這樣的作感到擔(dān)心害怕。

這并不是因?yàn)楣鈱W(xué)很容易,而是因?yàn)槲覀儗?duì)光學(xué)的模型了然在心。

現(xiàn)代光學(xué)是通過抽象出不同層級(jí)的知識(shí)內(nèi)容去教授的。

師法自然 淺談深度學(xué)習(xí)的多重角度

在最頂級(jí),也是最容易的層級(jí),是幾何光學(xué)。幾何光學(xué)是對(duì)波光學(xué)的抽象,光射線于于表達(dá)簡(jiǎn)單的矢量波光 學(xué)的波前矢量。而波光學(xué)?是對(duì)麥克斯韋方程的進(jìn)?步簡(jiǎn)化。麥克斯韋方程 由能由量子力學(xué)推導(dǎo)而出,量子力學(xué)則超出了我的理解范圍。

每?個(gè)層級(jí)都是通過作出?些簡(jiǎn)化的假定由緊鄰的下?個(gè)層級(jí)推導(dǎo)?出,所以每?個(gè)層級(jí)能夠比上?個(gè)層級(jí)解釋更為復(fù)雜的現(xiàn)象。

師法自然 淺談深度學(xué)習(xí)的多重角度

我花了不少時(shí)間在頂四層抽象里設(shè)計(jì)系統(tǒng)。

這就是當(dāng)今我們教授光學(xué)的方法。但相關(guān)理論并非總是如此按層級(jí)來組織。在百年前,這些理論還是在?個(gè) 相互矛盾的狀態(tài)中共存。實(shí)踐家們只能依賴于近乎道聽途說的光學(xué)理論。

但這并沒有阻止伽利略打造性能不錯(cuò)的望遠(yuǎn)鏡,而且是在牛頓形式化幾何光學(xué)前近?個(gè)世紀(jì)的時(shí)間點(diǎn)上。因 為伽利略對(duì)于如何造出能夠放大數(shù)?倍的望遠(yuǎn)鏡有足夠好的解釋模型。但他對(duì)光學(xué)的理解,卻不足以讓他的望遠(yuǎn)鏡能夠修正色差或者獲得廣視角。

在這些光學(xué)理論被抽象總結(jié)出來之前,每?項(xiàng)理論都需要從光的最基本概念出發(fā)。這就牽涉到要作出?套涵蓋許多也許不切實(shí)際的假設(shè)。牛頓的幾何光學(xué)把光假定作?束束可以被吸引、排斥的固體粒??;莞箘t? 由「以太」作為介質(zhì)的縱波去描述光,也就是說用類似聲波的方式去構(gòu)建光。麥克斯韋也假設(shè)光經(jīng)由以太傳播。你從麥克斯韋方程的系數(shù)的名字也能窺得這種思路的??。

愚蠢的模型,確實(shí)。但它們可量化且有預(yù)測(cè)的能力。

這些假設(shè),我們今天聽來也許覺得很愚蠢,但它們可量化而且有預(yù)測(cè)的能力。你可以隨意代入數(shù)字于其中并得到精準(zhǔn)的量化預(yù)測(cè)。這對(duì)于工程師而言極其有用。

尋找用于描述每層深度學(xué)習(xí)網(wǎng)絡(luò)作用的模塊化語言

如果我們能夠像討論光纖穿越每?層鏡頭元素的作用那樣去討論神經(jīng)網(wǎng)絡(luò)每?層的作用,那么設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)將會(huì)變得更容易。

我們說卷積層就像在輸?上滑動(dòng)相應(yīng)濾波器,然后說池化是處理了對(duì)應(yīng)的非線性。但這只是非常低層次的描述,就像用麥克斯韋方程去解釋鏡頭的作用。

也許我們應(yīng)該依賴于更高級(jí)抽象描述,具體表達(dá)某個(gè)量被神經(jīng)網(wǎng)絡(luò)的層級(jí)如何改變了,好比我們用鏡頭的具 體作用去解釋它如何彎曲光線那樣。

如果這種抽象也能夠量化,使得你只需要代?具體數(shù)值到某個(gè)公式里,它就能告訴你?個(gè)大概的量化分析,這樣你就能更好地設(shè)計(jì)你的網(wǎng)絡(luò)了。

我們離這樣的語言還很遠(yuǎn)。我們先從簡(jiǎn)單點(diǎn)的開始

上?也許只是我被自己的幻想帶跑了。

我們從簡(jiǎn)單點(diǎn)的開始。我們對(duì)深度學(xué)習(xí)的運(yùn)作方式有很多解釋模型。下?我會(huì)羅列?系列值得解釋的現(xiàn)象,然后我們看看?些現(xiàn)有的模型對(duì)這些現(xiàn)象解釋的能力有多強(qiáng)。

在開始之前,我得承認(rèn)這種努力也許最后是徒勞的。光學(xué)花了 300 年在打磨自己的模型之上,而我只花了? 個(gè)周六下午,所以這只能算是博客上的?些個(gè)?觀點(diǎn)和想法。

現(xiàn)象:隨機(jī)梯度下降 (SGD) 的隨機(jī)初始化足夠好了。但細(xì)微的數(shù)字錯(cuò)誤或者步長(zhǎng)會(huì)使 SGD 失效。

很多?在實(shí)踐中發(fā)現(xiàn),對(duì)于如何累積梯度的細(xì)微調(diào)整,可以導(dǎo)致對(duì)整個(gè)測(cè)試集表現(xiàn)的巨大變化。例如說你只用GPU而不是 CPU 去訓(xùn)練,結(jié)果可能會(huì)截然不同。

現(xiàn)象:淺的局部最優(yōu)值意味著比深的局部最優(yōu)值更好的泛化能力。

這種說法很時(shí)髦。有些?認(rèn)為它是真的。有些?則用實(shí)際數(shù)據(jù)反駁。另外也有?給出了這個(gè)現(xiàn)象的變種 。眾說紛紜,爭(zhēng)議目前不斷。

這個(gè)現(xiàn)象也許有爭(zhēng)議性,但我還是先放在這里。

現(xiàn)象:批標(biāo)準(zhǔn)化層 (Batch Norm) 可以給 SGD 提速。

這個(gè)基本無爭(zhēng)議,我只能提供?個(gè)小例外。

現(xiàn)象:即使有很多局部最優(yōu)和鞍點(diǎn),SGD 也表現(xiàn)卓越。

這個(gè)說法也包含了幾個(gè)小的點(diǎn)。經(jīng)常有人聲稱深度學(xué)習(xí)的損失表面充斥著鞍點(diǎn)和局部最優(yōu)。也有不同的 說法,要不就認(rèn)為梯度下降可以遍歷這些區(qū)域,要不就認(rèn)為梯度下降可以不遍歷這些區(qū)域,但都能給出泛化能力不錯(cuò)的答案。也有說損失表面其實(shí)也沒那么不堪。

現(xiàn)象:Dropout 勝于其他隨機(jī)化策略。

我不知道如何正確分類類似 Dropout 的做法,所以我就稱之為「隨機(jī)化策略」了。

現(xiàn)象:深度網(wǎng)絡(luò)能夠記憶隨機(jī)標(biāo)簽,但它們能泛化。

證據(jù)很直白,我的朋友們親自見證并主張這種說法。

對(duì)這些現(xiàn)象的解釋

對(duì)應(yīng)上面列舉的這些現(xiàn)象,我在下面列舉我覺得最能解釋這些現(xiàn)象的理論,這些理論均來自我上面引用的論文。

師法自然 淺談深度學(xué)習(xí)的多重角度

先別激動(dòng),原因如下:

1. 我們嘗試解釋的這些現(xiàn)象部分有爭(zhēng)議。

2. 我沒辦法把這些解釋按照抽象層級(jí)組織好。光學(xué)好教學(xué)的特性也沒辦法在這?重現(xiàn)。

3. 我懷疑部分我引用的理論不正確。

我想說的是

有很多人正在加?這個(gè)領(lǐng)域,然而我們能夠給他們傳授的不過是近乎道聽途說的經(jīng)驗(yàn)和?些預(yù)訓(xùn)練好的深度網(wǎng)絡(luò),然后就叫他們?nèi)ダ^續(xù)創(chuàng)新。我們甚?都不能認(rèn)同我們要解釋的這些現(xiàn)象。所以我認(rèn)為我們離能夠在高中教授這些內(nèi)容還有很遠(yuǎn)的距離。

那我們?nèi)绾尾拍茈x這?步近點(diǎn)?

最好的不過是我們能夠就每?層深度網(wǎng)絡(luò)的功能作用,按照不同層級(jí)的抽象,給出對(duì)應(yīng)的解釋模型。例如 說,神經(jīng)網(wǎng)絡(luò)里的折射、散射和衍射會(huì)是怎么樣的?也許你早就用具體的功能去思考神經(jīng)網(wǎng)絡(luò),但我們就這些概念還沒有統(tǒng)?的語言。

我們應(yīng)該把?系列確認(rèn)的現(xiàn)象組織起來,然后才來進(jìn)行理論上的解釋。例如說神經(jīng)網(wǎng)絡(luò)里的牛頓環(huán)、磁光克 爾效應(yīng)和法拉第現(xiàn)象會(huì)是怎樣的?

我和一小批同事已經(jīng)開始了?項(xiàng)重大的實(shí)踐工作,嘗試去分類構(gòu)建適合我們領(lǐng)域的解釋模型,去形式化它 們,并且用實(shí)驗(yàn)去驗(yàn)證它們。這項(xiàng)工作是巨大的,我認(rèn)為第?步應(yīng)該是構(gòu)建?個(gè)分層級(jí)的深度學(xué)習(xí)解釋模 型,以用于高中的教學(xué)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103685
  • 牛頓
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    6431
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122806

原文標(biāo)題:解釋深度學(xué)習(xí)的新角度,來自光學(xué)的啟發(fā)

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    當(dāng)深度學(xué)習(xí)遇上嵌入式資源困境,特征空間如何破局?

    近年來,隨著人工智能(AI)技術(shù)的迅猛發(fā)展,深度學(xué)習(xí)(Deep Learning)成為最熱門的研究領(lǐng)域之一。在語音識(shí)別、圖像識(shí)別、自然語言處理等領(lǐng)域,深度
    發(fā)表于 07-14 14:50 ?707次閱讀
    當(dāng)<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>遇上嵌入式資源困境,特征空間如何破局?

    軍事應(yīng)用中深度學(xué)習(xí)的挑戰(zhàn)與機(jī)遇

    人工智能尤其是深度學(xué)習(xí)技術(shù)的最新進(jìn)展,加速了不同應(yīng)用領(lǐng)域的創(chuàng)新與發(fā)展。深度學(xué)習(xí)技術(shù)的發(fā)展深刻影響了軍事發(fā)展趨勢(shì),導(dǎo)致戰(zhàn)爭(zhēng)形式和模式發(fā)生重大變化。本文將概述
    的頭像 發(fā)表于 02-14 11:15 ?540次閱讀

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的關(guān)系

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)之間存在著密切的關(guān)系,以下是對(duì)它們之間關(guān)系的介紹: 一、BP神經(jīng)網(wǎng)絡(luò)的基本概念 BP神經(jīng)網(wǎng)絡(luò),即反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network
    的頭像 發(fā)表于 02-12 15:15 ?866次閱讀

    深度自然匿名化:隱私保護(hù)與視覺完整性并存的未來!

    在科技快速發(fā)展的當(dāng)下,個(gè)人隱私保護(hù)的需求日益凸顯。如何能在隱私保護(hù)的基礎(chǔ)上,保持視覺完整性,從而推動(dòng)企業(yè)開發(fā)與創(chuàng)新? 深度自然匿名化(DNAT)已被證明是傳統(tǒng)模糊化方法的更優(yōu)替代方案,其復(fù)雜的算法和深度
    的頭像 發(fā)表于 01-15 15:57 ?4501次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>自然</b>匿名化:隱私保護(hù)與視覺完整性并存的未來!

    自然語言處理與機(jī)器學(xué)習(xí)的關(guān)系 自然語言處理的基本概念及步驟

    自然語言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能和語言學(xué)領(lǐng)域的一個(gè)分支,它致力于研究如何讓計(jì)算機(jī)能夠理解、解釋和生成人類語言。機(jī)器學(xué)習(xí)(Machine
    的頭像 發(fā)表于 12-05 15:21 ?1989次閱讀

    NPU在深度學(xué)習(xí)中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其核心驅(qū)動(dòng)力之一,已經(jīng)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和價(jià)值。NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元)是專門為深度學(xué)習(xí)
    的頭像 發(fā)表于 11-14 15:17 ?1924次閱讀

    自然語言處理與機(jī)器學(xué)習(xí)的區(qū)別

    在人工智能的快速發(fā)展中,自然語言處理(NLP)和機(jī)器學(xué)習(xí)(ML)成為了兩個(gè)核心的研究領(lǐng)域。它們都致力于解決復(fù)雜的問題,但側(cè)重點(diǎn)和應(yīng)用場(chǎng)景有所不同。 1. 自然語言處理(NLP) 定義: 自然
    的頭像 發(fā)表于 11-11 10:35 ?1558次閱讀

    Pytorch深度學(xué)習(xí)訓(xùn)練的方法

    掌握這 17 種方法,用最省力的方式,加速你的 Pytorch 深度學(xué)習(xí)訓(xùn)練。
    的頭像 發(fā)表于 10-28 14:05 ?662次閱讀
    Pytorch<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>訓(xùn)練的方法

    GPU深度學(xué)習(xí)應(yīng)用案例

    能力,可以顯著提高圖像識(shí)別模型的訓(xùn)練速度和準(zhǔn)確性。例如,在人臉識(shí)別、自動(dòng)駕駛等領(lǐng)域,GPU被廣泛應(yīng)用于加速深度學(xué)習(xí)模型的訓(xùn)練和推理過程。 二、自然語言處理 自然語言處理(NLP)是
    的頭像 發(fā)表于 10-27 11:13 ?1384次閱讀

    激光雷達(dá)技術(shù)的基于深度學(xué)習(xí)的進(jìn)步

    信息。這使得激光雷達(dá)在自動(dòng)駕駛、無人機(jī)、機(jī)器人等領(lǐng)域具有廣泛的應(yīng)用前景。 二、深度學(xué)習(xí)技術(shù)的發(fā)展 深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,它通過模擬人
    的頭像 發(fā)表于 10-27 10:57 ?1073次閱讀

    FPGA加速深度學(xué)習(xí)模型的案例

    FPGA(現(xiàn)場(chǎng)可編程門陣列)加速深度學(xué)習(xí)模型是當(dāng)前硬件加速領(lǐng)域的一個(gè)熱門研究方向。以下是一些FPGA加速深度學(xué)習(xí)模型的案例: 一、基于FPGA的AlexNet卷積運(yùn)算加速 項(xiàng)目名稱
    的頭像 發(fā)表于 10-25 09:22 ?1240次閱讀

    AI大模型與深度學(xué)習(xí)的關(guān)系

    AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對(duì)兩者關(guān)系的介紹: 一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐 :深度
    的頭像 發(fā)表于 10-23 15:25 ?2901次閱讀

    深度學(xué)習(xí)GPU加速效果如何

    圖形處理器(GPU)憑借其強(qiáng)大的并行計(jì)算能力,成為加速深度學(xué)習(xí)任務(wù)的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?617次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    ,共同進(jìn)步。 歡迎加入FPGA技術(shù)微信交流群14群! 交流問題(一) Q:FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?現(xiàn)在用FPGA做深度學(xué)習(xí)加速成為一個(gè)熱門,深鑒科技,商湯,曠視科技等都有基于FPG
    發(fā)表于 09-27 20:53

    AI入門之深度學(xué)習(xí):基本概念篇

    1、什么是深度學(xué)習(xí) 1.1、機(jī)器學(xué)習(xí) ?? ? 圖1:計(jì)算機(jī)有效工作的常用方法:程序員編寫規(guī)則(程序),計(jì)算機(jī)遵循這些規(guī)則將輸入數(shù)據(jù)轉(zhuǎn)換為適當(dāng)?shù)拇鸢?。這一方法被稱為符號(hào)主義人工智能,適合用來解決定
    的頭像 發(fā)表于 08-08 11:24 ?2435次閱讀
    AI入門之<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>:基本概念篇