商湯日日新·商量大模型位列國內(nèi)大模型第一梯隊(duì)

模型表現(xiàn)好，金牌少不了。

剛剛，中文大模型測評基準(zhǔn)SuperCLUE發(fā)布《中文大模型基準(zhǔn)測評2024年10月報(bào)告》：

商湯日日新·商量大模型(SenseChat5.5)憑借出色的能力表現(xiàn)，總得分位列國內(nèi)大模型第一梯隊(duì)，獲得金牌。

本次SuperCLUE10月報(bào)告覆蓋23個(gè)國內(nèi)模型，聚焦語言大模型的通用能力評估，分為三大維度：除了考察“文科”、“理科”基礎(chǔ)能力外，還有考察模型更高階能力的“Hard”附加任務(wù)，總共2900+道題：

【理科任務(wù)】分為計(jì)算、邏輯推理、代碼、工具使用測評集;

【文科任務(wù)】分為知識百科、語言理解、長文本、角色扮演、生成與創(chuàng)作、安全六大測評集;

【Hard任務(wù)】分為精確指令遵循測評集，復(fù)雜任務(wù)高階推理測評集。

商湯SenseChat5.5在多項(xiàng)評測任務(wù)中均位列第一梯隊(duì)，文科中語言理解、安全等維度表現(xiàn)突出，也是理科中邏輯推理、代碼學(xué)科的“尖子生”。

值得注意的是，在【Hard】的兩項(xiàng)任務(wù)——精準(zhǔn)指令遵循和高階推理中，商湯SenseChat5.5是唯一兩項(xiàng)任務(wù)均位于國內(nèi)第一梯隊(duì)的大模型，體現(xiàn)了模型優(yōu)秀的復(fù)雜推理智能。

未來，商湯將繼續(xù)堅(jiān)持基礎(chǔ)大模型的持續(xù)研發(fā)與投入，不斷提升真正高階推理及“慢思考”能力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

商湯科技

商湯科技

+關(guān)注

關(guān)注
8

文章
563

瀏覽量
36792
大模型

大模型

+關(guān)注

關(guān)注
2

文章
3138

瀏覽量
4059

原文標(biāo)題：近3000道題，商湯大模型拿了金牌

文章出處：【微信號：SenseTime2017，微信公眾號：商湯科技SenseTime】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

商湯科技SenseTime
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁

Hot SenseCare胸部X線輔助診斷軟件通過歐盟CE認(rèn)證
Hot 基于單目圖像的深度估計(jì)算法，大幅度提升基于單目圖像深度估計(jì)的精度

New 韓國高規(guī)格代表團(tuán)到訪商湯科技
New 商湯大裝置實(shí)現(xiàn)大規(guī)模產(chǎn)業(yè)化應(yīng)用

精選推薦
更多

文章

資料

帖子

CMOS工藝中方塊電阻的主要類型和測試方法

芯長征科技
9小時(shí)前

300 閱讀

用于電動汽車供電網(wǎng)絡(luò)的高壓母線轉(zhuǎn)換器48V電源模塊

Vicor
9小時(shí)前

358 閱讀

Copilot操作指南（一）：使用圖片生成原理圖符號、PCB封裝

KiCad
12小時(shí)前

206 閱讀

如何構(gòu)建帶有VGA輸出的低分辨率熱成像

FPGA研究院
12小時(shí)前

397 閱讀

如何為EMC設(shè)計(jì)選擇PCB疊層結(jié)構(gòu)

Altium
13小時(shí)前

410 閱讀

直流數(shù)控可調(diào)穩(wěn)壓電源的設(shè)計(jì)

李明
624

10積分

792下載

簡單的openharmony視圖可輕松繪制三角形

姚小熊27
0.09 MB

免費(fèi)

1下載

Bytom多元比特資產(chǎn)的交互協(xié)議

李麗
18.50 MB

免費(fèi)

0下載

HostDB數(shù)據(jù)中心庫存管理

gvxiaot
2.85 MB

免費(fèi)

0下載

5G+工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展白皮書

香香技術(shù)員
1.83 MB

免費(fèi)

19下載

匠芯創(chuàng)D133CBS RISC-V KunLun Pi V1.0開發(fā)板開發(fā)資料

ElecFans小喇叭
23小時(shí)前

163 閱讀

HarmonyOS AI輔助編程工具（CodeGenie）代碼續(xù)寫

李洋水蛟龍
23小時(shí)前

178 閱讀

【沁恒CH585開發(fā)板免費(fèi)試用體驗(yàn)】手機(jī)控制小臺燈亮度與小風(fēng)扇轉(zhuǎn)速

yinwuqing
23小時(shí)前

170 閱讀

【嘉楠堪智K230開發(fā)板試用體驗(yàn)】K230 AI 功能體驗(yàn)

杯pp
23小時(shí)前

176 閱讀

【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】ISP功能AE測試

jf_1137202360
23小時(shí)前

265 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

商湯日日新·商量大模型位列國內(nèi)大模型第一梯隊(duì)

評論