清華權(quán)威報(bào)告公布，文心一言多項(xiàng)指標(biāo)“遙遙領(lǐng)先”

最近，由清華大學(xué)基礎(chǔ)模型研究中心聯(lián)合中關(guān)村實(shí)驗(yàn)室研制的SuperBench大模型綜合能力評(píng)測(cè)框架，正式對(duì)外發(fā)布2024年3月版《SuperBench大模型綜合能力評(píng)測(cè)報(bào)告》。評(píng)測(cè)共包含了14個(gè)海內(nèi)外具有代表性的模型，結(jié)果顯示：文心4.0表現(xiàn)亮眼，與國(guó)際一流模型水平接近，且差距已經(jīng)逐漸縮小，名副其實(shí)為國(guó)內(nèi)頭部模型。

例如在人類對(duì)齊能力評(píng)測(cè)中，文心4.0表現(xiàn)優(yōu)異，位居國(guó)內(nèi)第一，其中在中文推理、中文語(yǔ)言等評(píng)測(cè)上，文心遙遙領(lǐng)先，和其他模型拉開明顯差距，中文理解上，文心4.0領(lǐng)先優(yōu)勢(shì)明顯，領(lǐng)先第二名GLM-4 0.41分，GPT-4系列模型表現(xiàn)較差，排在中下游，并且和第一名文心4.0分差超過(guò)1分。

在語(yǔ)義理解中的數(shù)學(xué)能力上，文心4.0與Claude-3并列全球第一；GPT-4系列模型位列第四五，其他模型得分在55分附近較為集中，明顯落后第一梯隊(duì)；而在語(yǔ)義理解中的閱讀理解能力上，文心4.0超過(guò)GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。

而在企業(yè)選擇大模型最看重的安全性評(píng)測(cè)上，國(guó)內(nèi)模型文心4.0表現(xiàn)亮眼，力壓國(guó)際一流模型GPT-4系列模型和Claude-3拿下最高分（89.1分），Claude-3僅列第四。

值得注意的是，文心一言不僅在技術(shù)能力上過(guò)硬，在應(yīng)用落地上也是一路領(lǐng)先。自去年3月16日文心一言首發(fā)至今，用戶數(shù)已突破2億，每天API調(diào)用量也突破了2億。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

百度

百度

+關(guān)注

關(guān)注
9

文章
2335

瀏覽量
92230
文心一言

文心一言

+關(guān)注

關(guān)注
0

文章
133

瀏覽量
1862
大模型

大模型

+關(guān)注

關(guān)注
2

文章
3146

瀏覽量
4071

原文標(biāo)題：文心一言多項(xiàng)指標(biāo)“遙遙領(lǐng)先” 清華權(quán)威報(bào)告公布

文章出處：【微信號(hào)：baidu_2000，微信公眾號(hào)：百度】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

百度
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁(yè)

Hot 文心一言什么時(shí)候推出百度官宣文心一言3月16日見
Hot 百度文心一言背后的大模型實(shí)力如何？文心一言背后的它全面領(lǐng)先

New 沈陽(yáng)人工智能產(chǎn)業(yè)園正式開園
New 百度亮相2025人工智能向善全球峰會(huì)

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進(jìn)現(xiàn)實(shí)

腦極體
12小時(shí)前

350 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（2）

三菱電機(jī)半導(dǎo)體
59分鐘前

106 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（1）

三菱電機(jī)半導(dǎo)體
1小時(shí)前

111 閱讀

英飛凌TLD7002-16 OTP PRG的常見問(wèn)題解析

駿龍電子
1小時(shí)前

113 閱讀

DC/DC轉(zhuǎn)換器電路板安裝過(guò)程中的焊接技巧與導(dǎo)通檢查要點(diǎn)

駿龍電子
1小時(shí)前

123 閱讀

電子報(bào)2011第9期

szmalthus
10.7 MB

免費(fèi)

0下載

太陽(yáng)能電池充電應(yīng)用電路圖集

yezi888
196 KB

免費(fèi)

2790下載

接地抗干擾技術(shù)分析探討

lanlanw
425 KB

免費(fèi)

145下載

現(xiàn)代傳感器原理及應(yīng)用免費(fèi)下載

o_dream
5.19 MB

免費(fèi)

35下載

fansky第三方飯否客戶端

張秀蘭
0.37 MB

2積分

1下載

省錢+環(huán)保+個(gè)性：打造一臺(tái)永不“過(guò)時(shí)”的自定義電腦！

早知
1天前

256 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗(yàn)】+溫度大氣壓檢測(cè)及顯示

jinglixixi
1天前

488 閱讀

【RA-Eco-RA6M4開發(fā)板評(píng)測(cè)】+01+開箱測(cè)評(píng)+UART+PWM+LED

jf_18702540
2天前

454 閱讀

【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】2、打造復(fù)古游戲機(jī)（Batocera鏡像+FBNeo虛擬機(jī)，多款游戲ROM分享）

左岸cpx
2天前

474 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗(yàn)】+兩種開發(fā)板間的比較

jinglixixi
2天前

423 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

清華權(quán)威報(bào)告公布，文心一言多項(xiàng)指標(biāo)“遙遙領(lǐng)先”

評(píng)論