近期,谷歌公布新版ASPIRE訓(xùn)練架構(gòu),該架構(gòu)主要用于改進(jìn)大型語(yǔ)言模型的選擇性預(yù)測(cè)情況。谷歌表示,盡管大語(yǔ)言模型在自然語(yǔ)言理解與生成領(lǐng)域發(fā)展迅速,應(yīng)用廣泛,然而在涉及到高風(fēng)險(xiǎn)決策時(shí),其預(yù)測(cè)能力仍待加強(qiáng)。為此,谷歌推出ASPIRE訓(xùn)練框架,通過(guò)向模型引入“可信度”機(jī)制,提升預(yù)測(cè)準(zhǔn)確率。
該框架分為三步驟:“特定任務(wù)調(diào)整”、“答案采樣”以及“自我評(píng)估學(xué)習(xí)”。首先,“特定任務(wù)調(diào)整”階段針對(duì)基本訓(xùn)練的大型語(yǔ)言模型進(jìn)一步深化訓(xùn)練,重點(diǎn)提高預(yù)測(cè)能力。其次,“答案采樣”階段模型會(huì)根據(jù)調(diào)整的參數(shù),生成多個(gè)答案,同時(shí)建立自我評(píng)估學(xué)習(xí)數(shù)據(jù)集,產(chǎn)生較高信度的選項(xiàng)。最后,“自我評(píng)估學(xué)習(xí)”階段則設(shè)定參數(shù)以提升機(jī)模自我評(píng)估能力,使之能檢測(cè)答案準(zhǔn)確性,以便在回答問(wèn)題時(shí)附加可信度評(píng)分。
據(jù)悉該架構(gòu)取得顯著成效。在CoQA、TriviaQA和SQuAD三個(gè)問(wèn)答數(shù)據(jù)集測(cè)試中,經(jīng)由ASPIRE調(diào)整的OPT-2.7B小模型表現(xiàn)全面優(yōu)于更大規(guī)模的OPT-30B模型。此成果證實(shí),經(jīng)適配調(diào)整,小型語(yǔ)言模型亦有潛力超越大型語(yǔ)言模型。
研究人員總結(jié)指出,ASPIRE訓(xùn)練框架有效改善了大型語(yǔ)言模型的輸出精度,使小型模型經(jīng)微調(diào)后可以實(shí)現(xiàn)“恰當(dāng)且自信”的預(yù)測(cè)。
-
谷歌
+關(guān)注
關(guān)注
27文章
6231瀏覽量
108188 -
AI
+關(guān)注
關(guān)注
88文章
35168瀏覽量
280183 -
語(yǔ)言模型
+關(guān)注
關(guān)注
0文章
561瀏覽量
10799
發(fā)布評(píng)論請(qǐng)先 登錄
任正非說(shuō) AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進(jìn)來(lái)呢?
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)
什么是高選擇性蝕刻
FPGA+AI王炸組合如何重塑未來(lái)世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......
《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀心得2——客服機(jī)器人、AutoGen框架 、生成式代理
谷歌AI智能體執(zhí)行復(fù)雜任務(wù)能力大幅提升
選擇性沉積技術(shù)介紹

訓(xùn)練AI大模型需要什么樣的gpu
過(guò)電流保護(hù)的選擇性是靠什么來(lái)實(shí)現(xiàn)的
選擇性喚醒如何實(shí)現(xiàn)局部聯(lián)網(wǎng)

評(píng)論