99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三種LM任務(wù)形式:單向LM,雙向LM,序列到序列LM

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:深度學(xué)習(xí)自然語言 ? 2021-01-03 09:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天分享一個論文UniLM[1],核心點是掌握三種LM任務(wù)形式:單向LM,雙向LM,序列到序列LM;

1. 生成任務(wù)

NLP任務(wù)大致可以分為NLU和NLG兩種;Bert在NLU任務(wù)上效果很好,但是天生不適合處理生成任務(wù)。

原因在于Bert的預(yù)訓(xùn)練過程是使用的MLM,和生成任務(wù)的目標并不一致。

生成任務(wù)目標是每次蹦出來一個詞,只能看到當前位置之前的詞匯。

而Bert采用的是雙向的語言模型,除了mask的單詞,兩個方向的詞匯都可以被看到。

所以對Bert的一個改進思路就是讓它在具有NLU能力的時候,同時兼?zhèn)銷LG能力。

2. 三種LM任務(wù)

UniLM做的就是這樣一個事情。

具體的實現(xiàn)方式是設(shè)計了一系列的完形填空任務(wù),這些完形填空任務(wù)的不同之處在于對上下文的定義。

從左到右的LM:使用mask單詞的左側(cè)單詞來預(yù)測被遮掩的單詞

從右到左的LM:和上面第一個相比就是方向的變化,使用mask單詞的右側(cè)單詞來預(yù)測遮掩的單詞

雙向LM:就是當前mask的左右詞匯都可以看到

sequence-to-sequence LM:這個就是UniLM能夠具有生成能力的關(guān)鍵。我們的輸入是source句子和target句子,mask單詞在target上,那么當前mask的上下文就是source句子的所有單詞和target句子中mask單詞左側(cè)的詞匯可以被看到

我們把從左到右LM和從右到左LM我們歸為一種任務(wù)叫單向LM;

有個點需要注意,三個任務(wù)是一起優(yōu)化的,具體來講是這樣做的:

在訓(xùn)練的時候,1/3的時候使用雙向LM,1/3的時候使用序列到序列 LM,1/6的時候使用從左到右的LM,1/6的時間使用從右到做的LM。

我們是使用不同的Mask矩陣來對應(yīng)不同任務(wù)輸入數(shù)據(jù)形式。

文中使用的是這樣一張圖來展示:

f1836372-4690-11eb-8b86-12bb97331649.jpg

UniLM不同mask

3. 其他細枝末節(jié)

Gelu 激勵函數(shù)

24層TRM,最大長度512,1024Hidden Size,16Heads,340M參數(shù)量

初始化使用Bert Large

15%被mask,其中80%真正替換mask,10%隨機替換,10%不動。替換的時候,80% 的時候替換單個token,20%的時候替換bigram 或者 trigram

第四個步驟類似中文實體詞的mask,也算是一點改進。

有個細節(jié)點需要注意的是,作者強調(diào),不同的segment embedding用來區(qū)分不同LM任務(wù)。

Bert的時候,區(qū)分上下句子,我們使用0和1,在這里,我們使用這個segment embedding用來區(qū)分任務(wù):

比如說,雙向?qū)?yīng)0和1;單向left-right對應(yīng)2;單向right-left對應(yīng)3;序列對應(yīng)4和5;

4. 總結(jié)

掌握以下幾個細節(jié)點就可以:

聯(lián)合訓(xùn)練三種任務(wù):單向LM,雙向LM,序列LM

使用不同的attention矩陣控制三種任務(wù)形式的參與

segment embedding可以區(qū)分不同的任務(wù)形式

mask的時候15% 的有被替換的概率,其中80% 被真正替換。在這80%真正替換的里面有80%單個token被替換,20%的二元或者三元tokens被替換

參考資料

[1]

Unified Language Model Pre-training for Natural Language Understanding and Generation: https://arxiv.org/pdf/1905.03197.pdf,

責任編輯:xj

原文標題:如何讓BERT具有文本生成能力

文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    13657
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22629

原文標題:如何讓BERT具有文本生成能力

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    LM5171 80V 雙通道雙向降壓-升壓控制器數(shù)據(jù)手冊

    LM5171 控制器提供雙通道雙向轉(zhuǎn)換器的高電壓和精密元件。示例包括雙電池系統(tǒng)。LM5171 支持多相并聯(lián)運行,每相均流平衡。LM5171 還支持獨立通道
    的頭像 發(fā)表于 03-19 15:38 ?474次閱讀
    <b class='flag-5'>LM</b>5171 80V 雙通道<b class='flag-5'>雙向</b>降壓-升壓控制器數(shù)據(jù)手冊

    LM73605/LM73606 EVM用戶指南

    電子發(fā)燒友網(wǎng)站提供《LM73605/LM73606 EVM用戶指南.pdf》資料免費下載
    發(fā)表于 01-03 15:33 ?0次下載
    <b class='flag-5'>LM</b>73605/<b class='flag-5'>LM</b>73606 EVM用戶指南

    LM74810評估模塊:LM74810EVM

    電子發(fā)燒友網(wǎng)站提供《LM74810評估模塊:LM74810EVM.pdf》資料免費下載
    發(fā)表于 11-29 16:28 ?1次下載
    <b class='flag-5'>LM</b>74810評估模塊:<b class='flag-5'>LM</b>74810EVM

    LM74800評估模塊:LM74800EVM-CD

    電子發(fā)燒友網(wǎng)站提供《LM74800評估模塊:LM74800EVM-CD.pdf》資料免費下載
    發(fā)表于 11-29 16:27 ?1次下載
    <b class='flag-5'>LM</b>74800評估模塊:<b class='flag-5'>LM</b>74800EVM-CD

    LM74700DDFEVM:適用于LM74700-Q1的評估模塊

    電子發(fā)燒友網(wǎng)站提供《LM74700DDFEVM:適用于LM74700-Q1的評估模塊.pdf》資料免費下載
    發(fā)表于 11-29 14:42 ?1次下載
    <b class='flag-5'>LM</b>74700DDFEVM:適用于<b class='flag-5'>LM</b>74700-Q1的評估模塊

    LM74502EVM:LM74502和LM74502H理想二極管控制器評估模塊

    電子發(fā)燒友網(wǎng)站提供《LM74502EVM:LM74502和LM74502H理想二極管控制器評估模塊.pdf》資料免費下載
    發(fā)表于 11-25 15:29 ?0次下載
    <b class='flag-5'>LM</b>74502EVM:<b class='flag-5'>LM</b>74502和<b class='flag-5'>LM</b>74502H理想二極管控制器評估模塊

    LM2745和LM2748降壓控制器評估模塊用戶指南

    電子發(fā)燒友網(wǎng)站提供《LM2745和LM2748降壓控制器評估模塊用戶指南.pdf》資料免費下載
    發(fā)表于 11-21 15:18 ?0次下載
    <b class='flag-5'>LM</b>2745和<b class='flag-5'>LM</b>2748降壓控制器評估模塊用戶指南

    LM74502Q1EVM:適用于LM74502-Q1和LM74502H-Q1理想二極管的評估模塊

    電子發(fā)燒友網(wǎng)站提供《LM74502Q1EVM:適用于LM74502-Q1和LM74502H-Q1理想二極管的評估模塊.pdf》資料免費下載
    發(fā)表于 11-20 15:07 ?0次下載
    <b class='flag-5'>LM</b>74502Q1EVM:適用于<b class='flag-5'>LM</b>74502-Q1和<b class='flag-5'>LM</b>74502H-Q1理想二極管的評估模塊

    LM74704Q1EVM、LM74703-Q1、LM74704-Q1理想二極管控制器評估模塊

    電子發(fā)燒友網(wǎng)站提供《LM74704Q1EVM、LM74703-Q1、LM74704-Q1理想二極管控制器評估模塊.pdf》資料免費下載
    發(fā)表于 11-12 15:18 ?1次下載
    <b class='flag-5'>LM</b>74704Q1EVM、<b class='flag-5'>LM</b>74703-Q1、<b class='flag-5'>LM</b>74704-Q1理想二極管控制器評估模塊

    LM6144AIM和LM6144BIM有什么不同?

    LM6144AIM 和LM6144BIM有什么不同?
    發(fā)表于 09-24 06:46

    LM2904-N和LM2904的區(qū)別是什么?

    關(guān)于LM2904-N和LM2904區(qū)別
    發(fā)表于 09-10 08:26

    如何使用LM5157x/LM5158x設(shè)計隔離型反激式轉(zhuǎn)換器

    電子發(fā)燒友網(wǎng)站提供《如何使用LM5157x/LM5158x設(shè)計隔離型反激式轉(zhuǎn)換器.pdf》資料免費下載
    發(fā)表于 09-07 10:38 ?0次下載
    如何使用<b class='flag-5'>LM</b>5157x/<b class='flag-5'>LM</b>5158x設(shè)計隔離型反激式轉(zhuǎn)換器

    LM324和LM358器件應(yīng)用設(shè)計指南

    電子發(fā)燒友網(wǎng)站提供《LM324和LM358器件應(yīng)用設(shè)計指南.pdf》資料免費下載
    發(fā)表于 09-04 10:58 ?11次下載
    <b class='flag-5'>LM</b>324和<b class='flag-5'>LM</b>358器件應(yīng)用設(shè)計指南

    LM339能用LM324代替嗎

    LM339簡介 LM339是一款四路比較器集成電路,由美國國家半導(dǎo)體公司(National Semiconductor)生產(chǎn)。它具有以下特點: 1.1. 四路比較器:LM339包含四個獨立的比較器
    的頭像 發(fā)表于 08-26 17:07 ?3104次閱讀

    LM324D和LM324KADR有什么不同?

    LM324D和LM324KADR除了包裝類型不一樣,LM324D是管裝50,LM324KADR是編帶2500以外,其他的有什么不同的嗎 ?是否可以直接替換的,謝謝
    發(fā)表于 08-06 06:46