99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

對(duì)話機(jī)器人之LaMDA

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:NLP日志 ? 2023-01-04 14:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來(lái)自:NLP日志

提綱1 簡(jiǎn)介 2 LaMDA 3 總結(jié)

1 簡(jiǎn)介

LaMDA是在DeepMind的Sparrow跟openai的instructGPT之前由谷歌提出的對(duì)話機(jī)器人,全稱Language Models for Dialog Applications,是一個(gè)在海量對(duì)話跟web數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練再在人工標(biāo)注數(shù)據(jù)上做進(jìn)一步微調(diào)后得到的參數(shù)量高達(dá)137B的大模型。LaMDA除了在生成文本質(zhì)量有所提升外,通過(guò)在人工標(biāo)注數(shù)據(jù)上做進(jìn)一步finetune以及讓模型學(xué)會(huì)檢索利用外部知識(shí)源的能力,使得模型在安全性以及事實(shí)性這兩個(gè)關(guān)鍵問(wèn)題上獲得明顯提升。

安全性指的是模型的回復(fù)應(yīng)該滿足一系列人為價(jià)值觀,例如沒有歧視跟偏見,不會(huì)生成傷害性建議。事實(shí)性指的模型的回復(fù)應(yīng)該符合事實(shí),跟外部知識(shí)源保持一致,而不是一本正經(jīng)的胡說(shuō)八道。???????

83dd799a-884f-11ed-bfe3-dac502259ad0.png

圖1: LaMDA在生成文本在多個(gè)指標(biāo)下有明顯提升

2 LaMDA

Pre-training

LaMDA采用的是純decoder的結(jié)構(gòu),類似于GPT,使用了46層Transformer,模型參數(shù)量高達(dá)130B,是Meena的50倍。預(yù)訓(xùn)練的任務(wù)是預(yù)測(cè)文本中的下一個(gè)token,解碼策略跟Meenay一致,都是從top-40結(jié)果采樣得到16個(gè)候選回復(fù),再基于候選回復(fù)的對(duì)數(shù)似然得分跟長(zhǎng)度選擇最優(yōu)的回復(fù)。不同于此前的對(duì)話模型只在對(duì)話數(shù)據(jù)上訓(xùn)練,LaMDA的預(yù)訓(xùn)練數(shù)據(jù)集包括對(duì)話數(shù)據(jù)(1.12B)和其他web文檔數(shù)據(jù)(2.97B)。

83ffe962-884f-11ed-bfe3-dac502259ad0.png

圖2: LaMDA預(yù)訓(xùn)練任務(wù)????

Finetune

LaMDA的finetune包括兩部分,一部分是針對(duì)生成文本質(zhì)量跟安全性,另一部分則是學(xué)習(xí)如何利用外部的信息檢索系統(tǒng)。其中質(zhì)量(SS I)可以從三方面評(píng)估,分別是sensibleness(文本是否合理,跟歷史對(duì)話是否有沖突),Specificity(對(duì)于前文是否有針對(duì)性,避免籠統(tǒng)回復(fù),例如用戶提問(wèn)“I love Eurovision”,模型生成一個(gè)籠統(tǒng)回復(fù)“Me too”就不符合預(yù)期),Interestingness(文本是否能引起某人注意或者好奇,是否是超出期待的巧妙回復(fù))。而安全性(Safety)的目標(biāo)則是要符合谷歌AI的基本原則,避免生成會(huì)造成傷害的不符合預(yù)期的結(jié)果,或者帶有偏見跟歧視。

a)Finetuning for quality and safety

這部分的finetune既包括給定上文生成回復(fù)的生成任務(wù),也包括評(píng)估回復(fù)質(zhì)量跟安全性的判別式任務(wù)。對(duì)于生成任務(wù),訓(xùn)練樣本格式由“”(上文,哨兵,回復(fù))三部分拼接而成,損失只計(jì)算其中response相關(guān)那部分,也就是在給定歷史上文條件下,只計(jì)算模型生成回復(fù)跟期望回復(fù)之間的損失。而對(duì)于判別任務(wù),訓(xùn)練樣本則是“” (上文,哨兵,回復(fù),屬性,得分)五部分拼接得到,損失只計(jì)算屬性對(duì)應(yīng)的rating得分損失,也就是在給定歷史上文跟模型回復(fù)條件下,計(jì)算特定屬性下的模型得分跟人工標(biāo)注結(jié)果之間的損失。這種LaMDA同時(shí)用于生成跟判別的設(shè)計(jì)能夠?qū)崿F(xiàn)一個(gè)更佳高效的流程,在生成回復(fù)后,使用判別模型打分時(shí)需要對(duì)應(yīng)指標(biāo)的概率P(|),而生成模型已經(jīng)處理過(guò)了,所以只需要在額外處理少量的跟attribute-name相關(guān)的token即可。

Finetune過(guò)程先對(duì)LaMDA的判別任務(wù)進(jìn)行優(yōu)化,使得模型可以預(yù)測(cè)候選回復(fù)的質(zhì)量得分跟安全性得分,然后過(guò)濾掉安全性得分低于閾值的候選回復(fù),再根據(jù)質(zhì)量得分對(duì)候選回復(fù)進(jìn)行排序(3*P(sensibleness)+P(specificity)+P(interestingness)),選擇其中得分最高的回復(fù)作為模型生成的結(jié)果。再利用已經(jīng)訓(xùn)練后LaMDA的打分模型,篩選出高質(zhì)量的訓(xùn)練數(shù)據(jù),用于LaMDA的生成任務(wù)的finetune,使得模型可以生成高質(zhì)量的回復(fù)。根據(jù)下圖也可以看到利用高質(zhì)量數(shù)據(jù)進(jìn)行的finetune讓模型在各方面都有了明顯的提升。

841e2864-884f-11ed-bfe3-dac502259ad0.png

圖3: finetune模型在多個(gè)指標(biāo)上的提升

b)Finetuning to learn to call an external information retrieval system

這部分也稱為Groundedness,針對(duì)語(yǔ)言模型的可能生成看起來(lái)可信,但是違背事實(shí)的幻視問(wèn)題,LaMDA通過(guò)學(xué)習(xí)使用利用外部知識(shí)源去緩解這個(gè)問(wèn)題。LaMDA構(gòu)建一個(gè)包含信息檢索系統(tǒng),計(jì)算模塊,翻譯模塊的工具(簡(jiǎn)稱TS),這部分的finetune也包括兩個(gè)子任務(wù),第一個(gè)是將歷史上文跟模型回復(fù)一起輸入到模型中,生成對(duì)應(yīng)的檢索query。第二個(gè)子任務(wù)是將歷史上文+模型回復(fù)+檢索結(jié)果一同輸入到模型中,讓模型決定是生成新的檢索query或者生成最終回復(fù)(根據(jù)生成的第一個(gè)字符串決定,如果是TS,則繼續(xù)檢索,如果是User則返回對(duì)應(yīng)結(jié)果)

8461f1d4-884f-11ed-bfe3-dac502259ad0.png

圖4: LaMDA Search流程?

在具體推理流程中,只用一個(gè)LaMDA模型,但是做了多個(gè)子任務(wù),具體過(guò)程中該執(zhí)行哪個(gè)子任務(wù),則由當(dāng)前輸入的prompt決定,例如當(dāng)前輸入prompt是LaMDA to user就對(duì)應(yīng)自動(dòng)生成回復(fù),如果當(dāng)前prompt是LaMDA-Base to LaMDA-Research就對(duì)應(yīng)生成檢索query。

3 總結(jié)

從LaMDA跟后續(xù)的Sparrow,我們也可以看到一些共同點(diǎn)。1)可以使用一個(gè)強(qiáng)大的模型同時(shí)處理多個(gè)不同任務(wù)。????2)finetune階段高質(zhì)量數(shù)據(jù)對(duì)于模型的最終性能影響頗大,為了得到這些高質(zhì)量的數(shù)據(jù),LaMDA跟Sparrow在搜集finetune數(shù)據(jù)有一套嚴(yán)格的方法論。3) 讓模型學(xué)習(xí)檢索利用外部知識(shí)源,可以緩解模型幻視的問(wèn)題,讓模型生成結(jié)果更佳有理可依,也讓模型可以回答與時(shí)俱進(jìn)的問(wèn)題。?????????????4)為生成文本的安全性設(shè)計(jì)額外的子任務(wù),從而緩解敏感性的問(wèn)題。LaMDA的成功,依舊貫徹著大力出奇跡的思路,不僅模型的參數(shù)量龐大,預(yù)訓(xùn)練的語(yǔ)料龐大,連finetune階段的人工標(biāo)注數(shù)據(jù)也不是一般人可以承受的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29748

    瀏覽量

    212987
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50445

原文標(biāo)題:對(duì)話機(jī)器人之LaMDA

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    對(duì)話:人形機(jī)器人連接器與線纜有何攻關(guān)點(diǎn)?

    與線纜技術(shù)突破成為破局關(guān)鍵。然而,機(jī)器人高頻傳輸與空間壓縮的技術(shù)矛盾、百萬(wàn)次彎折壽命的可靠性挑戰(zhàn),以及行業(yè)標(biāo)準(zhǔn)缺失引發(fā)的產(chǎn)業(yè)鏈協(xié)同困境,正成為制約機(jī)器人產(chǎn)業(yè)發(fā)展的核心瓶頸。 《國(guó)際線纜與連接》通過(guò)深度對(duì)話TE Connectiv
    的頭像 發(fā)表于 07-11 15:13 ?177次閱讀
    <b class='flag-5'>對(duì)話</b>:人形<b class='flag-5'>機(jī)器人</b>連接器與線纜有何攻關(guān)點(diǎn)?

    明遠(yuǎn)智睿SSD2351開發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    連續(xù)的長(zhǎng)句語(yǔ)音識(shí)別,還是復(fù)雜口音的處理,都能快速響應(yīng),保證語(yǔ)音機(jī)器人與用戶之間流暢的對(duì)話體驗(yàn)。 其豐富的接口為語(yǔ)音機(jī)器人的功能拓展提供了可能。USB接口可以連接高靈敏度的麥克風(fēng)陣列,實(shí)現(xiàn)精準(zhǔn)的語(yǔ)音采集
    發(fā)表于 05-28 11:36

    盤點(diǎn)#機(jī)器人開發(fā)平臺(tái)

    地瓜機(jī)器人RDK X5開發(fā)套件地瓜機(jī)器人RDK X5開發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機(jī)器人開發(fā)套件 Kria KR260機(jī)器人開發(fā)套件 Kria KR260-
    發(fā)表于 05-13 15:02

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門的引路書

    ROS的全稱:Robot Operating System 機(jī)器人操作系統(tǒng) ROS的 目的 :ROS支持通用庫(kù),是通信總線,協(xié)調(diào)多個(gè)傳感器 為了解決機(jī)器人里各廠商模塊不通用的問(wèn)題,讓機(jī)器人快速開發(fā)
    發(fā)表于 04-30 01:05

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】+內(nèi)容初識(shí)

    《ROS 2智能機(jī)器人開發(fā)實(shí)踐》內(nèi)容閱讀初體驗(yàn) 《ROS 2 智能機(jī)器人開發(fā)實(shí)踐》是一本針對(duì) ROS 2(Robot Operating System 2)這一先進(jìn)機(jī)器人開發(fā)框架的實(shí)用指南。隨著
    發(fā)表于 04-27 11:24

    什么是機(jī)器人?追蹤機(jī)器人技術(shù)的發(fā)展和未來(lái)

    什么是機(jī)器人? 我們都知道“機(jī)器人”這個(gè)詞,并在日常對(duì)話中隨意使用它。但我們知道它真正的含義嗎?讓我們花點(diǎn)時(shí)間來(lái)深入研究機(jī)器人的定義。它是像看起來(lái)那么簡(jiǎn)單,還是挑戰(zhàn)了我們的理解? 在其
    的頭像 發(fā)表于 04-24 19:21 ?1132次閱讀

    ???b class='flag-5'>機(jī)器人布局關(guān)節(jié)機(jī)器人業(yè)務(wù)

    關(guān)節(jié)機(jī)器人領(lǐng)域迎來(lái)一位實(shí)力選手。繼布局移動(dòng)機(jī)器人、機(jī)器視覺業(yè)務(wù)后,???b class='flag-5'>機(jī)器人正在拓展新的產(chǎn)品線。
    的頭像 發(fā)表于 03-20 10:47 ?734次閱讀

    AI智能電話機(jī)器人對(duì)電子行業(yè)的影響是什么

    一、AI 智能電話機(jī)器人的基本概念 AI 智能電話機(jī)器人是融合人工智能技術(shù),模擬人類與客戶進(jìn)行電話溝通交流的自動(dòng)化程序系統(tǒng)。它借助先進(jìn)的語(yǔ)音識(shí)別、自然語(yǔ)言處理和對(duì)話管理等技術(shù),能夠自動(dòng)撥打
    的頭像 發(fā)表于 01-23 09:45 ?485次閱讀

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊

    具身智能機(jī)器人的基礎(chǔ)模塊,這個(gè)是本書的第二部分內(nèi)容,主要分為四個(gè)部分:機(jī)器人計(jì)算系統(tǒng),自主機(jī)器人的感知系統(tǒng),自主機(jī)器人的定位系統(tǒng),自主機(jī)器人
    發(fā)表于 01-04 19:22

    《具身智能機(jī)器人系統(tǒng)》第10-13章閱讀心得具身智能機(jī)器人計(jì)算挑戰(zhàn)

    閱讀《具身智能機(jī)器人系統(tǒng)》第10-13章,我對(duì)具身智能機(jī)器人的工程實(shí)踐有了全新認(rèn)識(shí)。第10章從實(shí)時(shí)性角度剖析了機(jī)器人計(jì)算加速問(wèn)題。機(jī)器人定位中的SLAM算法需要處理兩個(gè)計(jì)算密集型任務(wù):
    發(fā)表于 01-04 01:15

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+兩本互為支持的書

    最近在閱讀《具身智能機(jī)器人系統(tǒng)》這本書的同時(shí),還讀了 《計(jì)算機(jī)視覺PyTorch數(shù)字圖像處理》一書,這兩本書完全可以視為是互為依托的姊妹篇?!队?jì)算機(jī)視覺PyTorch數(shù)字圖像處理》是介紹
    發(fā)表于 01-01 15:50

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型

    近年來(lái),人工智能領(lǐng)域的大模型技術(shù)在多個(gè)方向上取得了突破性的進(jìn)展,特別是在機(jī)器人控制領(lǐng)域展現(xiàn)出了巨大的潛力。在“具身智能機(jī)器人大模型”部分,作者研究并探討了大模型如何提升機(jī)器人的能力,大模型存在
    發(fā)表于 12-29 23:04

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    感謝 感謝電子發(fā)燒友網(wǎng)社區(qū)給予《具身智能機(jī)器人系統(tǒng)》試讀機(jī)會(huì)。在這知識(shí)的盛宴中,我感受到社區(qū)的關(guān)懷與支持。定不負(fù)期望,認(rèn)真研讀,分享所學(xué),回饋社區(qū)。 一、本書大綱 《具身智能機(jī)器人系統(tǒng)》是一本
    發(fā)表于 12-28 21:12

    《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

    要給AI這個(gè)聰明的“頭腦”裝上一副“身體”。這個(gè)“身體”可以是一部手機(jī),可以是一臺(tái)自動(dòng)駕駛汽車。而人形機(jī)器人則是集各類核心尖端技術(shù)于一體的載體,是具身智能的代表產(chǎn)品。與傳統(tǒng)的軟件智能體不同,具身智能
    發(fā)表于 12-19 22:26

    鴻蒙機(jī)器人與鴻蒙開發(fā)板聯(lián)動(dòng)演示

    鴻蒙機(jī)器人與鴻蒙開發(fā)板聯(lián)動(dòng)演示,機(jī)器人的角色為迎賓機(jī)器人,開發(fā)板負(fù)責(zé)人賓客出現(xiàn)監(jiān)聽
    發(fā)表于 12-02 14:55