谷歌發(fā)布ASPIRE訓(xùn)練框架，提升AI選擇性預(yù)測(cè)能力

近期，谷歌公布新版ASPIRE訓(xùn)練架構(gòu)，該架構(gòu)主要用于改進(jìn)大型語(yǔ)言模型的選擇性預(yù)測(cè)情況。谷歌表示，盡管大語(yǔ)言模型在自然語(yǔ)言理解與生成領(lǐng)域發(fā)展迅速，應(yīng)用廣泛，然而在涉及到高風(fēng)險(xiǎn)決策時(shí)，其預(yù)測(cè)能力仍待加強(qiáng)。為此，谷歌推出ASPIRE訓(xùn)練框架，通過(guò)向模型引入“可信度”機(jī)制，提升預(yù)測(cè)準(zhǔn)確率。

該框架分為三步驟：“特定任務(wù)調(diào)整”、“答案采樣”以及“自我評(píng)估學(xué)習(xí)”。首先，“特定任務(wù)調(diào)整”階段針對(duì)基本訓(xùn)練的大型語(yǔ)言模型進(jìn)一步深化訓(xùn)練，重點(diǎn)提高預(yù)測(cè)能力。其次，“答案采樣”階段模型會(huì)根據(jù)調(diào)整的參數(shù)，生成多個(gè)答案，同時(shí)建立自我評(píng)估學(xué)習(xí)數(shù)據(jù)集，產(chǎn)生較高信度的選項(xiàng)。最后，“自我評(píng)估學(xué)習(xí)”階段則設(shè)定參數(shù)以提升機(jī)模自我評(píng)估能力，使之能檢測(cè)答案準(zhǔn)確性，以便在回答問(wèn)題時(shí)附加可信度評(píng)分。

據(jù)悉該架構(gòu)取得顯著成效。在CoQA、TriviaQA和SQuAD三個(gè)問(wèn)答數(shù)據(jù)集測(cè)試中，經(jīng)由ASPIRE調(diào)整的OPT-2.7B小模型表現(xiàn)全面優(yōu)于更大規(guī)模的OPT-30B模型。此成果證實(shí)，經(jīng)適配調(diào)整，小型語(yǔ)言模型亦有潛力超越大型語(yǔ)言模型。

研究人員總結(jié)指出，ASPIRE訓(xùn)練框架有效改善了大型語(yǔ)言模型的輸出精度，使小型模型經(jīng)微調(diào)后可以實(shí)現(xiàn)“恰當(dāng)且自信”的預(yù)測(cè)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6231

瀏覽量
108188
AI

AI

+關(guān)注

關(guān)注
88

文章
35168

瀏覽量
280183
語(yǔ)言模型

語(yǔ)言模型

+關(guān)注

關(guān)注
0

文章
561

瀏覽量
10799

評(píng)論

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁(yè)

Hot 對(duì)比各家主流MCU指標(biāo)，國(guó)產(chǎn)MCU真的品質(zhì)不佳？
Hot 模擬信號(hào)和數(shù)字信號(hào)的區(qū)別和特點(diǎn)

New 方正電機(jī)成為小鵬汽車驅(qū)動(dòng)電機(jī)供應(yīng)商，總需求量預(yù)計(jì)達(dá)35萬(wàn)臺(tái)
New 雷諾-吉利動(dòng)力總成合資企業(yè)HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

基于睿擎派輕松玩轉(zhuǎn)CANopen電機(jī)控制

RT-Thread官方賬號(hào)
1天前

303 閱讀

RK3568開發(fā)板暗藏32位兼容開關(guān)？飛凌嵌入式帶你一鍵解鎖！

飛凌嵌入式
1天前

307 閱讀

AI通話的N種新玩法，讓科幻照進(jìn)現(xiàn)實(shí)

腦極體
2天前

932 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（2）

三菱電機(jī)半導(dǎo)體
1天前

1131 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（1）

三菱電機(jī)半導(dǎo)體
1天前

921 閱讀

三星I900詳細(xì)刷機(jī)教程圖解

h1654155272.9717
531

10積分

94下載

如何AutoTune?調(diào)節(jié)步進(jìn)電機(jī)電流_英版

cchcz
1.86 MB

1積分

0下載

Flocker Docker容器管理工具

呂鋼格
10.84 MB

2積分

3下載

livewire-blog博客系統(tǒng)

微風(fēng)挽雨
11.82 MB

2積分

4下載

Mandrel GraalVM下游發(fā)行版

ah此生不換
0.04 MB

免費(fèi)

0下載

【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】第三章：探索 DeepSeek - V3 技術(shù)架構(gòu)的奧秘

jf_83922529
1天前

152 閱讀

【EASY EAI Orin Nano開發(fā)板試用體驗(yàn)】EASY-EAI-Toolkit人臉識(shí)別

1653149838.791300
1天前

127 閱讀

【Banana Pi BPI-RV2開發(fā)板試用體驗(yàn)】從零編譯Banana Pi BPI-RV2開發(fā)板的openWRT

大菠蘿Alpha
1天前

153 閱讀

【RA-Eco-RA6M4開發(fā)板評(píng)測(cè)】基于SHELL進(jìn)行ADC測(cè)試

jf_1137202360
1天前

238 閱讀

【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】3、開源大語(yǔ)言模型部署

左岸cpx
2天前

494 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

谷歌發(fā)布ASPIRE訓(xùn)練框架，提升AI選擇性預(yù)測(cè)能力

評(píng)論

谷歌發(fā)布ASPIRE訓(xùn)練框架，提升AI選擇性預(yù)測(cè)能力