天數(shù)智芯天垓100率先完成百億級參數(shù)大模型訓(xùn)練

6月，在第五屆智源大會AI系統(tǒng)分論壇上，上海天數(shù)智芯半導(dǎo)體有限公司（以下簡稱“天數(shù)智芯”）對外宣布，在天垓100加速卡的算力集群，基于北京智源人工智能研究院（以下簡稱“智源研究院”）70億參數(shù)的Aquila語言基礎(chǔ)模型，使用代碼數(shù)據(jù)進(jìn)行繼續(xù)訓(xùn)練，穩(wěn)定運(yùn)行19天，模型收斂效果符合預(yù)期，證明天數(shù)智芯有支持百億級參數(shù)大模型訓(xùn)練的能力。

在北京市海淀區(qū)的大力支持下，智源研究院、天數(shù)智芯與愛特云翔共同合作，聯(lián)手開展基于自主通用GPU的大模型CodeGen（高效編碼）項(xiàng)目，通過中文描述來生成可用的C、Java、Python代碼以實(shí)現(xiàn)高效編碼。智源研究院負(fù)責(zé)算法設(shè)計、訓(xùn)練框架開發(fā)、大模型的訓(xùn)練與調(diào)優(yōu)，天數(shù)智芯負(fù)責(zé)提供天垓100加速卡、構(gòu)建算力集群及全程技術(shù)支持，愛特云翔負(fù)責(zé)提供算存網(wǎng)基礎(chǔ)硬件及智能化運(yùn)維服務(wù)。

在三方的共同努力下，在基于天垓100加速卡的算力集群上，100B Tokens編程語料、70億參數(shù)量的AquilaCode大模型參數(shù)優(yōu)化工作結(jié)果顯示，1個Epoch后loss下降到0.8，訓(xùn)練速度達(dá)到87K Tokens/s，線性加速比高達(dá)95%以上。與國際主流的A100加速卡集群相比，天垓100加速卡集群的收斂效果、訓(xùn)練速度、線性加速比相當(dāng)，穩(wěn)定性更優(yōu)。在HumanEval基準(zhǔn)數(shù)據(jù)集上，以Pass@1作為評估指標(biāo)，自主算力集群訓(xùn)練出來的模型測試結(jié)果達(dá)到相近參數(shù)級別大模型的SOAT水平，在AI編程能力與國際主流GPU產(chǎn)品訓(xùn)練結(jié)果相近。

圖基于天垓100算力集群的AquilaCode大模型訓(xùn)練性能采樣

天垓100率先完成百億級參數(shù)大模型訓(xùn)練，邁出了自主通用GPU大模型應(yīng)用的重要的一步。這一成果充分證明了天垓產(chǎn)品可以支持大模型訓(xùn)練，打通了國內(nèi)大模型創(chuàng)新發(fā)展的關(guān)鍵“堵點(diǎn)”，對于我國大模型自主生態(tài)建設(shè)、產(chǎn)業(yè)鏈安全保障具有十分重大的意義。

接下來，天數(shù)智芯將與合作伙伴們繼續(xù)深入合作，建設(shè)更大規(guī)模的天垓100算力集群，完成更大參數(shù)規(guī)模的大模型訓(xùn)練，以自主通用GPU產(chǎn)品更好支持國內(nèi)大模型創(chuàng)新應(yīng)用，進(jìn)一步夯實(shí)我國算力基礎(chǔ)，助力人工智能產(chǎn)業(yè)自主生態(tài)建設(shè)。
責(zé)任編輯：彭菁

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

編程

編程

+關(guān)注

關(guān)注
88

文章
3689

瀏覽量
95237
模型

模型

+關(guān)注

關(guān)注
1

文章
3519

瀏覽量
50409
天數(shù)智芯

天數(shù)智芯

+關(guān)注

關(guān)注
0

文章
99

瀏覽量
6174

原文標(biāo)題：天垓100率先完成百億級參數(shù)大模型訓(xùn)練，天數(shù)智芯迎來新的里程碑

文章出處：【微信號：IluvatarCoreX，微信公眾號：天數(shù)智芯】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

天數(shù)智芯
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個人主頁

Hot 國內(nèi)唯一真正擁有GPU架構(gòu)實(shí)際芯片產(chǎn)品的公司
Hot 天數(shù)智芯副董事長刁石京一行赴河南省鄭州航空港經(jīng)濟(jì)綜合試驗(yàn)區(qū)拜訪交流

New 天數(shù)智芯亮相2024世界人工智能大會
New 天數(shù)智芯參與建設(shè)的中國移動智算中心(呼和浩特)項(xiàng)目圓滿完成

精選推薦
更多

文章

資料

帖子

瑞芯微全新AI視覺芯片RV1126B：多場景智能終端方案介紹

大大通
1小時前

158 閱讀

定義IO初始化結(jié)構(gòu)體

瑞薩MCU小百科
2小時前

134 閱讀

使用瑞薩R-T系列芯片實(shí)現(xiàn)相電流實(shí)時采樣

瑞薩MCU小百科
2小時前

127 閱讀

地平線征程6B成功點(diǎn)亮！18TOPS，助推高性價比一體機(jī)征戰(zhàn)全球市場

章鷹觀察
3小時前

1432 閱讀

基于FPGA的數(shù)字識別系統(tǒng)設(shè)計

FPGA技術(shù)江湖
4小時前

231 閱讀

硬件測試方法步驟和經(jīng)驗(yàn)免費(fèi)下載

ElecFans小喇叭
0.16 MB

免費(fèi)

93下載

適用于鴻蒙的自定義組件框架Carbon案例教程

姚小熊27
13.55 MB

免費(fèi)

5下載

TableView截圖:類似于高德地圖路線截取tableView完整長圖的功能

遠(yuǎn)風(fēng)
0.12 MB

2積分

2下載

卡哇伊PANDACORN PCB徽章開源項(xiàng)目

李娓侖
0.05 MB

免費(fèi)

0下載

3通道數(shù)字溫度計及欠溫/過溫報警評估板ADT7481EBZEVB數(shù)據(jù)手冊

6.38 MB

免費(fèi)

0下載

【RA-Eco-RA6M4開發(fā)板評測】——3.RA6M4的coremark跑分測試

jf_43382582
18小時前

174 閱讀

差分輸出 × 超低抖動：打造高速穩(wěn)定的大型數(shù)據(jù)同步時脈

五三一
18小時前

158 閱讀

PWM相移問題：下面是我的代碼，請問各位大佬是什么原因?qū)е碌模?/span>

jf_08053489
18小時前

305 閱讀

【RA-Eco-RA6M4開發(fā)板評測】開箱+Keil環(huán)境搭建+點(diǎn)燈

gtbestom
18小時前

252 閱讀

【HZ-RK3568開發(fā)板免費(fèi)體驗(yàn)】合眾HZ-RK3568開發(fā)環(huán)境搭建

ouxiaolong
1天前

203 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

天數(shù)智芯天垓100率先完成百億級參數(shù)大模型訓(xùn)練

評論