11月29日,北京智源人工智能研究院副院長兼總工程師林詠華在2023人工智能計算大會上宣布,正式開源700億參數(shù)大模型Aquila2-70B-Expr(異構先驅版),這是首個基于英偉達混合資源及天數(shù)智芯混合資源完成訓練的大模型,也是智源研究院與天數(shù)智芯合作取得的最新成果,再次證明了天數(shù)智芯通用GPU產(chǎn)品支持大模型訓練的能力,以及與主流產(chǎn)品的兼容能力。
據(jù)林詠華副院長介紹,為了解決異構算力混合訓練難題,智源研究院開發(fā)了高效并行訓練框架FlagScale,支持異構算力混合訓練,并在10月開源了FlagScale v0.1版本。此次基于FlagScale v0.2分別在英偉達混合資源(A100集群+A800集群)、天數(shù)智芯混合資源(BI-V100集群+BI-V150集群)完成了Aquila2-70B-Expr大模型訓練工作。
天數(shù)智芯在今年上半年搭建了天垓100(BI-V100)算力集群支持智源研究院開展70億參數(shù)大模型訓練。在此基礎上,雙方進一步深化合作。天數(shù)智芯首先搭建了128節(jié)點的BI-V100集群環(huán)境,支持智源研究院開展Aquila2-70B-Expr完整訓練。訓練到20萬步,導出模型并完成總計11項性能指標的評估,涉及常識推斷、多任務語言理解、真實性回答等場景,將基線實驗和對比實驗送到真實數(shù)據(jù)集上進行評測,計算差異在0.28%,在精度上與國際主流集群訓練的權重文件水平相當。同時,天數(shù)智芯基于新一代產(chǎn)品天垓150(BI-V150)搭建了16節(jié)點集群環(huán)境,用于智源研究院混合并行訓練研究。智源研究院利用120節(jié)點BI-V100集群加上8節(jié)點BI-V150集群進行Aquila2-70B-Expr大模型混合訓練,混合集群性能達到上界(理想合池理論峰值)的85.3%。測試結果顯示,在天數(shù)智芯產(chǎn)品上異構訓練,對模型性能影響甚微。
END


這一成果極具商業(yè)價值和應用前景,有助于解決智算中心換代升級、增容后新舊計算卡并用難題,為智算中心高效運行提供了新方案。

原文標題:天數(shù)智芯支持智源研究院首次完成大模型異構算力混合訓練,突破異構算力束縛
文章出處:【微信公眾號:天數(shù)智芯】歡迎添加關注!文章轉載請注明出處。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
天數(shù)智芯
+關注
關注
0文章
99瀏覽量
6174
原文標題:天數(shù)智芯支持智源研究院首次完成大模型異構算力混合訓練,突破異構算力束縛
文章出處:【微信號:IluvatarCoreX,微信公眾號:天數(shù)智芯】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
熱點推薦
RAKsmart智能算力架構:異構計算+低時延網(wǎng)絡驅動企業(yè)AI訓練范式升級
在AI大模型參數(shù)量突破萬億、多模態(tài)應用爆發(fā)的今天,企業(yè)AI訓練正面臨算力效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能
弘信電子旗下燧弘華創(chuàng)與聯(lián)想發(fā)布多元異構算力調度平臺
近日,燧弘華創(chuàng)慶陽綠色智算中心迎來里程碑時刻——由燧弘華創(chuàng)與聯(lián)想合作共建的多元異構算力調度平臺正式發(fā)布。

科技云報到:要算力更要“算利”,“精裝算力”觸發(fā)大模型產(chǎn)業(yè)新變局?
科技云報到:要算力更要“算利”,“精裝算力”觸發(fā)大模型產(chǎn)業(yè)新變局?
浪潮信息與智源研究院攜手共建大模型多元算力生態(tài)
近日,浪潮信息與北京智源人工智能研究院正式簽署戰(zhàn)略合作協(xié)議,雙方將緊密合作,共同構建大模型多元算力開源創(chuàng)新生態(tài)。 此次合作旨在提升大
浪潮信息與智源研究院達成戰(zhàn)略合作協(xié)議
近日,浪潮信息與智源研究院達成戰(zhàn)略合作協(xié)議,雙方將緊密協(xié)作共建大模型多元算力開源創(chuàng)新生態(tài),提升大模型
“芯合”異構混合并行訓練系統(tǒng)1.0發(fā)布
近日,中國移動研究院副院長段曉東攜手天數(shù)智芯、壁仞科技、中興、海光、瀚博等一眾產(chǎn)業(yè)合作伙伴,共同推出了“芯合”異構
壁仞科技聯(lián)合中國電信等合作伙伴共同發(fā)布智算異構四芯混訓解決方案
工智能實驗室等發(fā)布了“智算異構四芯混訓解決方案”,打造算力、網(wǎng)絡、平臺、通信庫、框架全棧異構方案
芯啟源成為算力產(chǎn)業(yè)發(fā)展方陣會員單位
近日,由中國信息通信研究院(以下簡稱“信通院”)牽頭成立的算力產(chǎn)業(yè)發(fā)展方陣在合肥市成功召開第一次工作組全會,芯啟
大模型時代的算力需求
現(xiàn)在AI已進入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型的算力,以及相關的穩(wěn)定性和性能,是一個極為重要的問題,帶著這個極為重要的問
發(fā)表于 08-20 09:04
安謀科技異構算力組合,破局生成式AI算力挑戰(zhàn)
,“此芯P1”不僅異構集成了Armv9 CPU核心與Arm Immortalis GPU,還搭載了安謀科技(中國)有限公司(以下簡稱“安謀科技”)“周易”NPU等自研業(yè)務產(chǎn)品。憑借高能效的異構
安謀科技異構算力賦能AI計算,此芯科技首款AI PC芯片發(fā)布
底座,“此芯P1”不僅異構集成了Arm?v9 CPU核心與Arm Immortalis? GPU,還搭載了安謀科技(中國)有限公司(以下簡稱“安謀科技”)“周易”NPU等自研業(yè)務產(chǎn)品。憑借高能效的異構
發(fā)表于 07-31 14:36
?1320次閱讀

異構混訓整合不同架構芯片資源,提高算力利用率
電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著AI技術的飛速發(fā)展,大模型的訓練和推理任務對算力的需求日益增長。然而,單一品牌的芯片往往難以滿足所有需求,且可能存在供應鏈風險。因此,
評論