99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習又是從哪個層面深刻影響了NLP呢?

倩倩 ? 來源:機器之心 ? 2020-04-17 15:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學習正在給自然語言處理帶來巨大的變革。但是,作為一個初學者,要從哪里起步才好呢?深度學習和自然語言處理都是很寬泛的領域。哪些方面才是最重要的,還有,深度學習又是從哪個層面深刻影響了 NLP 呢?

1. 關于這篇論文

這篇論文的標題是「基于神經網絡模型的自然語言處理入門」(A Primer on Neural Network Models for Natural Language Processing)。

對應的論文 2015 年發(fā)表在 ArXiv 上。與其說是論文,不如說是一篇技術報告或者說是教程,面向研究員和學生,對基于深度學習方法的自然語言處理(NLP)作了綜合性的介紹。

這篇教程審視了針對自然語言處理的研究的幾個深度學習模型,以求自然語言的研究能加快神經網絡技術的發(fā)展。

入門教程由曾是 Google Research 科學家和 NLP 研究員的 Yoav Goldberg (https://www.cs.bgu.ac.il/~yoavg/uni/) 編寫。這是一篇技術報告,有大約 62 頁以及 13 頁的參考文獻。

這對于初學者來說是很理想的教材,因為:

它對讀者的基礎要求不高,不需要對先了解機器學習和語言處理的相關知識;

涉及領域寬泛,包括了很多深度學習方法和自然語言處理的問題。

在這篇教程中,我希望能為 NLP 開發(fā)者和新手介紹一些基礎背景知識,術語,實用工具以及方法論,從而明白其背后的神經網絡模型的理論,應用到他們自己的工作中。.. 面向的是那些有志于利用已有的,有價值的技術,并創(chuàng)造新方法去解決他們最感興趣的 NLP 的人。

通常情況下,在語言學和自然語言處理中,關鍵的深度學習方法需要翻模(重命名)以建立有用的溝通橋梁。

最后,這篇 2015 年的入門教程在 2017 年出書了,書名為「Neural Network Methods for Natural Language Processing (http://amzn.to/2tXn2dZ)」。

2. 神經網絡結構

這一小節(jié)將介紹神經網絡結構的不同類型,作為后面章節(jié)的參照。

全連接前饋神經網絡是非線性學習器,因此在極大程度上可以隨意取代線性學習器。

這里介紹 4 種類型的神經網絡結構,這里著重介紹其應用案例和參考文獻:

全連接前饋神經網絡,例如多層感知網絡;

帶有卷積和池化層的網絡,例如卷積神經網絡;

循環(huán)神經網絡,例如長短時記憶網絡;

遞歸神經網絡。

如果你只對應用感興趣,以上內容將為你提供直接尋找更多資源的線索。

3. 特征表示

這一節(jié)著重介紹深度學習模型訓練稀疏或者密集型表示的各種方法。

也許,從稀疏輸入(sparse-input)線性模型到神經網絡模型最大的飛躍,就是放棄將每一個特征作為一個維度的表示方式(所謂的 one-hot 表示),而使用密集型向量的表示方式。

NLP 分類系統(tǒng)的一般結構總結如下:

提取核心語言特征的集合;

為每一個向量檢索關聯(lián)向量;

組合特征向量;

將組合向量反饋給非線性分類器。

這個結構的關鍵在于使用密集型特征向量而不是稀疏特征向量,使用核心特征而不是特征組合。

需要注意在特征提取階段中,神經網絡只有提取核心特征。這和傳統(tǒng)的基于線性模型的 NLP 不同,傳統(tǒng)的 NLP 的特征設計必須手動設置以明確規(guī)定核心特征和其中的相互作用。

4. 前饋神經網絡

這一節(jié)將提供前饋人工神經網絡的速成課程。

以「A Primer on Neural Network Models for Natural Language Processing」中含兩個隱藏層的前饋神經網絡為例。這些神經網絡都是使用數(shù)學概念和腦啟發(fā)的形式而表示出來的。通常神經網絡的研究論題包括如下幾個:

表示能力(e.g. 一般近似);

一般非線性特征(e.g. 變換函數(shù));

輸出的變換(e.g. softmax);

詞匯嵌入(e.g. 嵌入式學習的密集型表征);

損失函數(shù)(e.g. 折葉(ReLU)和對數(shù)損失函數(shù))。

5. 詞嵌入

對于自然語言處理的神經網絡方法來說,詞嵌入表征是很重要的論題。這一節(jié)將展開這一論題并舉幾個關鍵方法的例子。神經網絡在 NLP 中的流行一個重要原因是嵌入方法的使用,在低維空間中將每一個特征表征為一個向量。我們將回顧以下幾個關于嵌入的論題:

隨機初始化(e.g. 以統(tǒng)一的隨機向量啟動);

有監(jiān)督特定任務的預訓練(e.g. 遷移學習);

無監(jiān)督預訓練(e.g. 統(tǒng)計方法,如 word2vec 和 GloVe);

訓練目標(e.g. 目標對輸出向量的影響);

上下文的選擇(e.g. 每一個詞受到的周圍的詞的影響)。

神經詞嵌入方法源于語言模型化方法,即訓練網絡以通過上文序列預測下一個詞。

6. 神經網絡訓練

這一節(jié)篇幅較大,著重介紹神經網絡的訓練方式,面向對神經網絡范式不熟悉的讀者。神經網絡的訓練是通過梯度方法,嘗試在一個訓練數(shù)據(jù)集內最小化損失函數(shù)的過程。

這一節(jié)重點關注隨機梯度下降(以及類似的 mini-batch)以及訓練過程中的正則化方法。

有趣的是,神經網絡的計算圖觀點的提出為一些實現(xiàn)深度學習模型的符號化數(shù)值程序庫(symbolic numerical libraries),如 Theano 和 TensorFlow 提供了很好的入門方法。

只要圖被建立起來,就能很直觀的理解前向計算(計算輸出結果)或者方向計算(計算梯度)。

7. 級聯(lián)(Cascading)和多任務學習

這一節(jié)將在前一節(jié)的基礎上,我們將總結級聯(lián) NLP 模型和多語言任務的學習模型。

級聯(lián)模型:利用神經網絡模型的計算圖定義加入中間表征(編碼)以建立更加復雜的模型。例如,我們可以通過近鄰詞匯,以及/或者其組成特征建立一個前饋網絡來預測詞匯。

多任務學習:各種相關的語言預測任務,并不互相反饋,但會在任務中分享信息。

預測命名實體的邊界,以及語句的下一個詞匯,都依賴于一些潛在的句法-語義表征上。這些高級概念都是在神經網絡語境中描述的,以在模型之間建立關聯(lián)的理解,或者在訓練過程(誤差反向傳播)和預測過程中,共享信息。

8. 結構化輸出的預測

這一節(jié)關注使用深度學習方法進行結構化預測的幾個自然語言處理任務的例子,比如,序列、決策樹和計算圖。

典型例子有序列標注(e.g. 詞性標注)的序列分割(分組,NER(命名實體識別)),以及句法分析。本節(jié)內容包括基于貪婪算法的和以搜索為核心的結構化預測,而主要集中討論后者。

以搜索為核心是自然語言結構化預測的一般方法。

9. 卷積層

這一節(jié)提供了卷積神經網絡的速成課程,以及討論卷積網絡對自然語言處理研究帶來的變革。CNN 被證明在自然語言處理的分類任務上表現(xiàn)出色,比如情緒分析,e.g. 在文中尋找特定的子序列或者結構進行預測。

卷積神經網絡一般被設計成在大型結構中用以識別 indicative local predictors,并將其組合以生成結構的固定大小的向量表征,捕捉這些 local aspects 對于預測任務來說是很有用的。

10. 循環(huán)神經網絡

正如前一節(jié)一樣,這一節(jié)也將介紹一種特定的網絡和其在 NLP 中的應用。比如,應用 RNN 的序列建模。

循環(huán)神經網絡允許在一個固定大小的向量中表示任意大小的結構化輸入,而只關心輸入的結構化性質。

由于 RNNs 在 NLP 中很受歡迎,尤其是 LSTM,這一節(jié)將討論如下幾個關于循環(huán)的論題和模型:

RNN 抽象概念(e.g. 網絡圖中的循環(huán)連接);

RNN 訓練過程(e.g. 沿時間的反向傳播);

多層(堆疊)RNN(e.g. 深度學習的「深」的解釋);

BI-RNN(e.g. 前向和反向序列作為輸入);

用于表示的 RNN 堆疊。

我們將集中討論 RNN 模型結構或者結構元素中,特別是:

接收器(acceptor):在完整輸入序列之后的輸出的損失計算;

編碼器(encoder):最后的向量作為輸入序列的編碼器;

變換器(transducer):在輸入序列中,每一次觀測生成一個輸出;

編碼器-譯碼器(encoder-decoder):輸入序列在被譯碼成輸出序列之前,編碼成一個固定長度的向量。

11. 具體的 RNN 結構

這一節(jié)將在上一節(jié)的基礎上討論特定的 RNN 算法。比如:

簡單 RNN(SRNN);

長短時記憶(LSTM);

門控循環(huán)單元(GRU)。

12. 模型建模

最后一節(jié)著重討論一種更加復雜的網絡,學習樹型建模的遞歸神經網絡。所謂的樹包括了句法樹,話語樹,甚至是表示(由一句話的幾個部分表達的)情緒的樹。我們希望在特定的樹節(jié)點上預測價值,價值預測以根節(jié)點為基礎,或者為整棵樹或者部分樹指定一個預測值。

正如循環(huán)神經網絡保持輸入序列的狀態(tài),遞歸神經網絡保持樹節(jié)點的狀態(tài)。

這里有一個遞歸神經網絡的例子,取自「A Primer on Neural Network Models for Natural Language Processing.」

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122805
  • 自然語言處理

    關注

    1

    文章

    628

    瀏覽量

    14165
  • nlp
    nlp
    +關注

    關注

    1

    文章

    490

    瀏覽量

    22627
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    人工智能技術的現(xiàn)狀與未來發(fā)展趨勢

    人工智能技術的現(xiàn)狀與未來發(fā)展趨勢 ? ? 近年來,人工智能(AI)技術迅猛發(fā)展,深刻影響著各行各業(yè)。計算機視覺到自然語言處理,自動駕駛到醫(yī)療診斷,AI的應用場景不斷擴展,推動社會向智能化方向邁進
    的頭像 發(fā)表于 07-16 15:01 ?214次閱讀

    東芝24TB超大容量CMR硬盤評測

    大模型的橫空出世不僅改變了計算行業(yè),也深刻影響了存儲行業(yè)。
    的頭像 發(fā)表于 07-10 09:46 ?684次閱讀
    東芝24TB超大容量CMR硬盤評測

    嵌入式AI技術之深度學習:數(shù)據(jù)樣本預處理過程中使用合適的特征變換對深度學習的意義

    ? 作者:蘇勇Andrew 使用神經網絡實現(xiàn)機器學習,網絡的每個層都將對輸入的數(shù)據(jù)做一次抽象,多層神經網絡構成深度學習的框架,可以深度理解數(shù)據(jù)中所要表示的規(guī)律。
    的頭像 發(fā)表于 04-02 18:21 ?890次閱讀

    軍事應用中深度學習的挑戰(zhàn)與機遇

    人工智能尤其是深度學習技術的最新進展,加速了不同應用領域的創(chuàng)新與發(fā)展。深度學習技術的發(fā)展深刻影響了軍事發(fā)展趨勢,導致戰(zhàn)爭形式和模式發(fā)生重大變
    的頭像 發(fā)表于 02-14 11:15 ?540次閱讀

    BP神經網絡與深度學習的關系

    BP神經網絡與深度學習之間存在著密切的關系,以下是對它們之間關系的介紹: 一、BP神經網絡的基本概念 BP神經網絡,即反向傳播神經網絡(Backpropagation Neural Network
    的頭像 發(fā)表于 02-12 15:15 ?863次閱讀

    深度學習中RNN的優(yōu)勢與挑戰(zhàn)

    循環(huán)神經網絡(RNN)是深度學習領域中處理序列數(shù)據(jù)的基石。它們通過在每個時間步長上循環(huán)傳遞信息,使得網絡能夠捕捉時間序列數(shù)據(jù)中的長期依賴關系。然而,盡管RNN在某些任務上表現(xiàn)出色,它們也面臨著一些
    的頭像 發(fā)表于 11-15 09:55 ?1332次閱讀

    NPU在深度學習中的應用

    隨著人工智能技術的飛速發(fā)展,深度學習作為其核心驅動力之一,已經在眾多領域展現(xiàn)出了巨大的潛力和價值。NPU(Neural Processing Unit,神經網絡處理單元)是專門為深度學習
    的頭像 發(fā)表于 11-14 15:17 ?1923次閱讀

    Pytorch深度學習訓練的方法

    掌握這 17 種方法,用最省力的方式,加速你的 Pytorch 深度學習訓練。
    的頭像 發(fā)表于 10-28 14:05 ?661次閱讀
    Pytorch<b class='flag-5'>深度</b><b class='flag-5'>學習</b>訓練的方法

    GPU深度學習應用案例

    能力,可以顯著提高圖像識別模型的訓練速度和準確性。例如,在人臉識別、自動駕駛等領域,GPU被廣泛應用于加速深度學習模型的訓練和推理過程。 二、自然語言處理 自然語言處理(NLP)是深度
    的頭像 發(fā)表于 10-27 11:13 ?1384次閱讀

    激光雷達技術的基于深度學習的進步

    信息。這使得激光雷達在自動駕駛、無人機、機器人等領域具有廣泛的應用前景。 二、深度學習技術的發(fā)展 深度學習是機器學習的一個分支,它通過模擬人
    的頭像 發(fā)表于 10-27 10:57 ?1073次閱讀

    FPGA加速深度學習模型的案例

    FPGA(現(xiàn)場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速深度學習模型的案例: 一、基于FPGA的AlexNet卷積運算加速 項目名稱
    的頭像 發(fā)表于 10-25 09:22 ?1238次閱讀

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度
    的頭像 發(fā)表于 10-23 15:25 ?2900次閱讀

    深度學習GPU加速效果如何

    圖形處理器(GPU)憑借其強大的并行計算能力,成為加速深度學習任務的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?617次閱讀

    FPGA做深度學習能走多遠?

    并行計算的能力,可以在硬件層面并行處理大量數(shù)據(jù)。這種并行處理能力使得 FPGA 在執(zhí)行深度學習算法時速度遠超傳統(tǒng)處理器,能夠提供更低的延遲和更高的吞吐量,從而加速模型訓練和推理過程,滿足實時性要求較高
    發(fā)表于 09-27 20:53

    射頻天線的發(fā)展歷史

    射頻天線,作為無線通信系統(tǒng)的關鍵組成部分,其發(fā)展歷程充滿了探索與創(chuàng)新。最初的簡單形態(tài)到如今的復雜多樣,天線技術不僅見證了無線通信技術的飛速發(fā)展,也深刻影響了人類社會的方方面面。以下是對射頻天線發(fā)展歷史的詳細回顧。
    的頭像 發(fā)表于 08-13 10:50 ?1864次閱讀