99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在檢索任務(wù)中訓(xùn)練數(shù)據(jù)在推理時(shí)也大有用處

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:NewBeeNLP ? 作者:h1654155273.8628 ? 2022-06-15 10:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從大規(guī)模數(shù)據(jù)中檢索通常比較耗時(shí),僅從訓(xùn)練數(shù)據(jù)中也能有巨大收益。具體做法是檢索與輸入文本最相似的訓(xùn)練樣例,拼接后作為輸入喂入模型,然后生成結(jié)果。結(jié)果在摘要、翻譯、語(yǔ)言模型和QA上都取得了不錯(cuò)的效果。

論文:Training Data is More Valuable than You Think: A Simple and Effective Method by Retrieving from Training Data[1]

Code:microsoft/REINA[2]

一句話(huà)概述:在檢索任務(wù)中訓(xùn)練數(shù)據(jù)在推理時(shí)也大有用處。

文章上來(lái)就給我們呈現(xiàn)了整體的結(jié)構(gòu):

b2e83ada-ebed-11ec-ba43-dac502259ad0.jpg

有點(diǎn)類(lèi)似 Prompt 學(xué)習(xí),但本文主要關(guān)注有監(jiān)督學(xué)習(xí)的設(shè)置。結(jié)果不僅效果很好,而且很容易擴(kuò)展(只要增加有標(biāo)注訓(xùn)練數(shù)據(jù)就行),計(jì)算代價(jià)也小。我覺(jué)得本文相對(duì)最有意思的一個(gè)發(fā)現(xiàn)是文中所寫(xiě):即便有成噸的參數(shù),一個(gè)模型也不能記住訓(xùn)練數(shù)據(jù)中的所有模式。所以,重新捕獲相關(guān)的訓(xùn)練數(shù)據(jù)作為一個(gè)手拉手提示器,就可以提供明確的信息來(lái)提高模型(推理)的性能。

整體架構(gòu)如下圖所示(REINA):

b316d20a-ebed-11ec-ba43-dac502259ad0.jpg

一張圖其實(shí)已經(jīng)很清楚地表達(dá)出意思了:對(duì)不同的任務(wù)構(gòu)造不同的輸入,但都會(huì)將訓(xùn)練數(shù)據(jù)拼接上后再喂入模型,得到最后的答案,這里的答案是通過(guò)語(yǔ)言模型生成的。檢索算法使用 BM25。

形式化模型為:

其中,M 表示生成模型,x 是輸入,大括號(hào)里的就是 top K 個(gè)檢索到的最相似的訓(xùn)練數(shù)據(jù)。

對(duì) QA 任務(wù),將輸入文本和每個(gè)選項(xiàng)拼接后作為 query,然后獲取相關(guān)的訓(xùn)練數(shù)據(jù)。如果需要加入外部知識(shí),則調(diào)整為:

其中,C 表示選項(xiàng)。拼接實(shí)體字典定義和關(guān)系 R,用來(lái)為一個(gè) Q 構(gòu)造知識(shí) K。

Ex 表示與 Q 相關(guān)的實(shí)體,Ec 表示與 A 相關(guān)的實(shí)體。本文的相關(guān)指:在句子中出現(xiàn)。

用人話(huà)簡(jiǎn)單描述一下就是:給定 Q,在訓(xùn)練數(shù)據(jù)中找到相似的 QA 對(duì),對(duì)每個(gè) QA 對(duì),找到其中所涉及的實(shí)體和關(guān)系,然后將實(shí)體的定義和關(guān)系也拼接進(jìn)去,最后組成一長(zhǎng)串文本作為模型輸入。

相似檢索使用 Lucene Index,模型訓(xùn)練使用 Transformers。實(shí)驗(yàn)結(jié)果(以文本摘要為例)如下:

b3394fe2-ebed-11ec-ba43-dac502259ad0.jpg

結(jié)果顯示,REINA 可以顯著提升(幾乎所有數(shù)據(jù)集)使用不同預(yù)訓(xùn)練模型初始化的基線(xiàn)。在 case 分析時(shí),作者發(fā)現(xiàn) REINA 的數(shù)據(jù)和真實(shí)標(biāo)簽之間有很強(qiáng)的相關(guān)性。

總之,本文的思路非常簡(jiǎn)單,但效果卻不錯(cuò),在工業(yè)上可以一試,尤其是生成式文本摘要和 QA 任務(wù)。不過(guò),感覺(jué)這好像也算是一種 prompt 吧,使用訓(xùn)練數(shù)據(jù)來(lái)「拉近」輸入和真實(shí)標(biāo)簽之間的距離。

本文參考資料

[1]

Training Data is More Valuable than You Think: A Simple and Effective Method by Retrieving from Training Data: https://arxiv.org/abs/2203.08773

[2]

microsoft/REINA: https://github.com/microsoft/REINA

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91883
  • 檢索
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    13295

原文標(biāo)題:ACL2022 | 微軟:永遠(yuǎn)不要低估你的訓(xùn)練數(shù)據(jù)!

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Aux-Think打破視覺(jué)語(yǔ)言導(dǎo)航任務(wù)的常規(guī)推理范式

    視覺(jué)語(yǔ)言導(dǎo)航(VLN)任務(wù)的核心挑戰(zhàn),是讓機(jī)器人在復(fù)雜環(huán)境中聽(tīng)懂指令、看懂世界,并果斷行動(dòng)。我們系統(tǒng)性地引入推理任務(wù),探索其導(dǎo)航策略學(xué)習(xí)
    的頭像 發(fā)表于 07-08 10:00 ?129次閱讀
    Aux-Think打破視覺(jué)語(yǔ)言導(dǎo)航<b class='flag-5'>任務(wù)</b>的常規(guī)<b class='flag-5'>推理</b>范式

    使用MicroPython部署的ocrrec_image.py推理得到的輸出結(jié)果很差,如何解決呢?

    使用在線(xiàn)平臺(tái)訓(xùn)練OCR識(shí)別任務(wù),測(cè)試結(jié)果表現(xiàn)很好。 期待結(jié)果和實(shí)際結(jié)果 實(shí)際的推理結(jié)果很差,推理不出任何信息。
    發(fā)表于 04-29 06:54

    陣列云從訓(xùn)練推理

    云場(chǎng)景下,陣列云(分布式計(jì)算集群)從模型訓(xùn)練推理的完整技術(shù)流程可結(jié)構(gòu)化分解如下: 一、訓(xùn)練階段技術(shù)實(shí)現(xiàn) 1,資源動(dòng)態(tài)編排? 基于Kubernetes集群或云廠(chǎng)商彈性計(jì)算服務(wù)(如AW
    的頭像 發(fā)表于 03-28 08:32 ?329次閱讀

    YOLOv5類(lèi)rgb888p_size這個(gè)參數(shù)要與模型推理訓(xùn)練的尺寸一致嗎?一致會(huì)達(dá)到更好的效果?

    YOLOv5類(lèi)rgb888p_size這個(gè)參數(shù)要與模型推理訓(xùn)練的尺寸一致嗎,一致會(huì)達(dá)到更好的效果
    發(fā)表于 03-11 08:12

    壁仞科技支持DeepSeek-V3滿(mǎn)血版訓(xùn)練推理

    DeepSeek開(kāi)源周開(kāi)源了部分關(guān)鍵模塊的代碼及推理系統(tǒng)參考架構(gòu),再次引發(fā)行業(yè)震動(dòng),但目前尚未開(kāi)源DeepSeek-V3 滿(mǎn)血版完整訓(xùn)練代碼。壁仞科技憑借八大自主創(chuàng)新技術(shù),實(shí)現(xiàn)
    的頭像 發(fā)表于 03-04 14:01 ?1006次閱讀

    DeepSeek推出NSA機(jī)制,加速長(zhǎng)上下文訓(xùn)練推理

    的特性,專(zhuān)為超快速的長(zhǎng)上下文訓(xùn)練推理而設(shè)計(jì)。 NSA通過(guò)針對(duì)現(xiàn)代硬件的優(yōu)化設(shè)計(jì),顯著加快了推理速度,并大幅度降低了預(yù)訓(xùn)練成本,同時(shí)保持了卓越的性能表現(xiàn)。這一機(jī)制
    的頭像 發(fā)表于 02-19 14:01 ?640次閱讀

    AI大模型汽車(chē)應(yīng)用推理、降本與可解釋性研究

    ,加強(qiáng)大模型對(duì)復(fù)雜任務(wù)處理能力和自主決策能力。 部分大模型公司的推理模型發(fā)布情況 來(lái)源:佐思汽研《2024-2025年AI大模型及其汽車(chē)領(lǐng)域的應(yīng)用研究報(bào)告》 推理模型的密集上線(xiàn),是為
    的頭像 發(fā)表于 02-18 15:02 ?1238次閱讀
    AI大模型<b class='flag-5'>在</b>汽車(chē)應(yīng)用<b class='flag-5'>中</b>的<b class='flag-5'>推理</b>、降本與可解釋性研究

    FP8大模型訓(xùn)練的應(yīng)用

    。如果在訓(xùn)練時(shí)使用 FP8 精度,可以更方便快速的將 FP8 部署到推理側(cè),使 FP8 訓(xùn)練可以更容易順暢地與低精度推理相結(jié)合等。
    的頭像 發(fā)表于 01-23 09:39 ?1183次閱讀
    FP8<b class='flag-5'>在</b>大模型<b class='flag-5'>訓(xùn)練</b><b class='flag-5'>中</b>的應(yīng)用

    FP8數(shù)據(jù)格式大型模型訓(xùn)練的應(yīng)用

    本文主要介紹了 FP8 數(shù)據(jù)格式大型模型訓(xùn)練的應(yīng)用、挑戰(zhàn)及最佳實(shí)踐,展示了 FP8 提升訓(xùn)練
    的頭像 發(fā)表于 11-19 14:54 ?1687次閱讀
    FP8<b class='flag-5'>數(shù)據(jù)</b>格式<b class='flag-5'>在</b>大型模型<b class='flag-5'>訓(xùn)練</b><b class='flag-5'>中</b>的應(yīng)用

    FPGA和ASIC大模型推理加速的應(yīng)用

    隨著現(xiàn)在A(yíng)I的快速發(fā)展,使用FPGA和ASIC進(jìn)行推理加速的研究越來(lái)越多,從目前的市場(chǎng)來(lái)說(shuō),有些公司已經(jīng)有了專(zhuān)門(mén)做推理的ASIC,像Groq的LPU,專(zhuān)門(mén)針對(duì)大語(yǔ)言模型的推理做了優(yōu)化
    的頭像 發(fā)表于 10-29 14:12 ?2030次閱讀
    FPGA和ASIC<b class='flag-5'>在</b>大模型<b class='flag-5'>推理</b>加速<b class='flag-5'>中</b>的應(yīng)用

    NVIDIA助力麗蟾科技打造AI訓(xùn)練推理加速解決方案

    麗蟾科技通過(guò) Leaper 資源管理平臺(tái)集成 NVIDIA AI Enterprise,為企業(yè)和科研機(jī)構(gòu)提供了一套高效、靈活的 AI 訓(xùn)練推理加速解決方案。無(wú)論是復(fù)雜的 AI 開(kāi)發(fā)任務(wù)
    的頭像 發(fā)表于 10-27 10:03 ?831次閱讀
    NVIDIA助力麗蟾科技打造AI<b class='flag-5'>訓(xùn)練</b>與<b class='flag-5'>推理</b>加速解決方案

    GPU服務(wù)器AI訓(xùn)練的優(yōu)勢(shì)具體體現(xiàn)在哪些方面?

    GPU服務(wù)器AI訓(xùn)練的優(yōu)勢(shì)主要體現(xiàn)在以下幾個(gè)方面: 1、并行處理能力:GPU服務(wù)器擁有大量的并行處理核心,這使得它們能夠同時(shí)處理成千上萬(wàn)個(gè)計(jì)算任務(wù),極大地加速了AI模型的
    的頭像 發(fā)表于 09-11 13:24 ?1010次閱讀

    軟件系統(tǒng)的數(shù)據(jù)檢索設(shè)計(jì)

    軟件系統(tǒng)的數(shù)據(jù)檢索設(shè)計(jì) 隨著業(yè)務(wù)量加大,數(shù)據(jù)檢索會(huì)日益增多,為了減輕數(shù)據(jù)庫(kù)壓力,本系統(tǒng)采用ElasticSearch來(lái)實(shí)現(xiàn)數(shù)據(jù)檢索功能。
    的頭像 發(fā)表于 08-22 14:08 ?492次閱讀
    軟件系統(tǒng)的<b class='flag-5'>數(shù)據(jù)檢索</b>設(shè)計(jì)

    【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識(shí)學(xué)習(xí)

    與匹配 模型可能結(jié)合高效檢索技術(shù)來(lái)快速定位與問(wèn)題相關(guān)的信息源。通過(guò)匹配算法和索引技術(shù),模型可以從海量數(shù)據(jù)篩選出最相關(guān)的文本片段作為候選答案。 3. 推理與生成
    發(fā)表于 08-02 11:03

    FPGA人工智能的應(yīng)用有哪些?

    FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練推理過(guò)程加速:FPGA可以用來(lái)加速深度學(xué)習(xí)的訓(xùn)練
    發(fā)表于 07-29 17:05