99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

浪潮信息發(fā)布源2.0-M32開源大模型,模算效率大幅提升

浪潮AIHPC ? 來源:浪潮AIHPC ? 2024-05-29 09:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

5月28日,浪潮信息發(fā)布“源2.0-M32”開源大模型?!霸?.0-M32”在基于”源2.0”系列大模型已有工作基礎上,創(chuàng)新性地提出和采用了“基于注意力機制的門控網(wǎng)絡”技術,構建包含32個專家(Expert)的混合專家模型(MoE),并大幅提升了模型算力效率,模型運行時激活參數(shù)為37億,在業(yè)界主流基準評測中性能全面對標700億參數(shù)的LLaMA3開源大模型。

算法層面,源2.0-M32提出并采用了一種新型的算法結構:基于注意力機制的門控網(wǎng)絡(Attention Router),針對MoE模型核心的專家調度策略,這種新的算法結構關注專家模型之間的協(xié)同性度量,有效解決傳統(tǒng)門控網(wǎng)絡下,選擇兩個或多個專家參與計算時關聯(lián)性缺失的問題,使得專家之間協(xié)同處理數(shù)據(jù)的水平大為提升。源2.0-M32采用源2.0-2B為基礎模型設計,沿用并融合局部過濾增強的注意力機制(LFA, Localized Filtering-based Attention),通過先學習相鄰詞之間的關聯(lián)性,然后再計算全局關聯(lián)性的方法,能夠更好地學習到自然語言的局部和全局的語言特征,對于自然語言的關聯(lián)語義理解更準確,進而提升了模型精度。

9ad71f44-1cea-11ef-b74b-92fbcf53809c.png

Figure1基于注意力機制的門控網(wǎng)絡(Attention Router)

■ 數(shù)據(jù)層面,源2.0-M32基于2萬億的token進行訓練、覆蓋萬億量級的代碼、中英文書籍、百科、論文及合成數(shù)據(jù)。大幅擴展代碼數(shù)據(jù)占比至47.5%,從6類最流行的代碼擴充至619類,并通過對代碼中英文注釋的翻譯,將中文代碼數(shù)據(jù)量增大至1800億token。結合高效的數(shù)據(jù)清洗流程,滿足大模型訓練“豐富性、全面性、高質量”的數(shù)據(jù)集需求?;谶@些數(shù)據(jù)的整合和擴展,源2.0-M32在代碼生成、代碼理解、代碼推理、數(shù)學求解等方面有著出色的表現(xiàn)。

■ 算力層面,源2.0-M32采用了非均勻流水并行的方法,綜合運用流水線并行+數(shù)據(jù)并行的策略,顯著降低了大模型對芯片間P2P帶寬的需求,為硬件差異較大訓練環(huán)境提供了一種高性能的訓練方法。針對MoE模型的稀疏專家計算,采用合并矩陣乘法的方法,模算效率得到大幅提升。

基于在算法、數(shù)據(jù)和算力方面全面創(chuàng)新,源2.0-M32的性能得以大幅提升,在多個業(yè)界主流的評測任務中,展示出了較為先進的能力表現(xiàn),在MATH(數(shù)學競賽)、ARC-C(科學推理)榜單上超越了擁有700億參數(shù)的LLaMA3大模型。

9b0363c4-1cea-11ef-b74b-92fbcf53809c.jpg

Figure2 源2.0-M32業(yè)界主流評測任務表現(xiàn)

源2.0-M32大幅提升了模型算力效率,在實現(xiàn)與業(yè)界領先開源大模型性能相當?shù)耐瑫r,顯著降低了在模型訓練、微調和推理所需的算力開銷。在模型推理運行階段,M32處理每token所需算力為7.4GFLOPs,而LLaMA3-70B所需算力為140GFLOPs。在模型微調訓練階段,對1萬條平均長度為1024 token的樣本進行全量微調,M32消耗算力約0.0026PD(PetaFLOPs/s-day),而LLaMA3消耗算力約為0.05PD。M32憑借特別優(yōu)化設計的模型架構,在僅激活37億參數(shù)的情況下,取得了和700億參數(shù)LLaMA3相當?shù)男阅芩剑乃懔H為LLaMA3的1/19,從而實現(xiàn)了更高的模算效率。

浪潮信息人工智能首席科學家吳韶華表示:當前業(yè)界大模型在性能不斷提升的同時,也面臨著所消耗算力大幅攀升的問題,對企業(yè)落地應用大模型帶來了極大的困難和挑戰(zhàn)。源2.0-M32是浪潮信息在大模型領域持續(xù)耕耘的最新探索成果,通過在算法、數(shù)據(jù)、算力等方面的全面創(chuàng)新,M32不僅可以提供與業(yè)界領先開源大模型相當?shù)男阅埽梢源蠓档痛竽P退杷懔ο摹?strong>大幅提升的模算效率將為企業(yè)開發(fā)應用生成式AI提供模型高性能、算力低門檻的高效路徑。M32開源大模型配合企業(yè)大模型開發(fā)平臺EPAI(Enterprise Platform of AI),將助力企業(yè)實現(xiàn)更快的技術迭代與高效的應用落地,為人工智能產(chǎn)業(yè)的發(fā)展提供堅實的底座和成長的土壤,加速產(chǎn)業(yè)智能化進程。


審核編輯:劉清
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1807

    文章

    49029

    瀏覽量

    249577
  • 大模型
    +關注

    關注

    2

    文章

    3146

    瀏覽量

    4074
  • 生成式AI
    +關注

    關注

    0

    文章

    531

    瀏覽量

    817

原文標題:浪潮信息發(fā)布源2.0-M32開源大模型,模算效率大幅提升,37億激活參數(shù)性能對標LLaMA3-700億

文章出處:【微信號:浪潮AIHPC,微信公眾號:浪潮AIHPC】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    浪潮信息:元腦EPAI已接入DeepSeek,大幅提升DeepSeek企業(yè)應用準確率

    北京2025年2月21日?/美通社/ -- 浪潮信息宣布元腦企智EPAI企業(yè)大模型開發(fā)平臺已全面接入支持DeepSeek大模型。通過元腦企智EPAI,企業(yè)用戶能夠將業(yè)務數(shù)據(jù)與DeepSeek大
    的頭像 發(fā)表于 02-23 07:32 ?602次閱讀
    <b class='flag-5'>浪潮信息</b>:元腦EPAI已接入DeepSeek,<b class='flag-5'>大幅</b><b class='flag-5'>提升</b>DeepSeek企業(yè)應用準確率

    浪潮信息與實驗室合作部署42kW風冷力倉

    近日,浪潮信息與某知名實驗室攜手簽署了合作協(xié)議,共同推進AI for Science領域的科研創(chuàng)新。根據(jù)協(xié)議內容,雙方將采用先進的42kW智風冷力倉,致力于打造一個效能效雙
    的頭像 發(fā)表于 01-09 14:18 ?473次閱讀

    浪潮信息與智研究院攜手共建大模型多元力生態(tài)

    近日,浪潮信息與北京智人工智能研究院正式簽署戰(zhàn)略合作協(xié)議,雙方將緊密合作,共同構建大模型多元開源創(chuàng)新生態(tài)。 此次合作旨在
    的頭像 發(fā)表于 12-31 11:49 ?604次閱讀

    浪潮信息與智研究院達成戰(zhàn)略合作協(xié)議

    近日,浪潮信息與智研究院達成戰(zhàn)略合作協(xié)議,雙方將緊密協(xié)作共建大模型多元開源創(chuàng)新生態(tài),提升
    的頭像 發(fā)表于 12-26 10:25 ?588次閱讀

    浪潮信息發(fā)布&quot;&quot;Yuan-EB,刷新RAG檢索最高成績

    近日,浪潮信息在AI領域取得了重大突破,成功發(fā)布了其嵌入模型""Yuan-EB(Yuan-embedding-1.0)。在備受矚目的C-MTEB榜單中,"
    的頭像 發(fā)表于 12-25 15:54 ?539次閱讀

    捷通達攜手浪潮信息,ERP系統(tǒng)性能大幅提升

    的共同努力,捷通達成功將原有的SAP HANA系統(tǒng)升級為浪潮信息新一代SAP HANA數(shù)據(jù)庫一體機解決方案。這一升級不僅大幅提升了系統(tǒng)的運行效率,更使得ERP系統(tǒng)的數(shù)據(jù)查詢時間
    的頭像 發(fā)表于 12-24 14:36 ?633次閱讀

    借助浪潮信息元腦企智EPAI高效創(chuàng)建大模型RAG

    生成能力,提高生成質量和可靠性。但企業(yè)構建知識檢索系統(tǒng)并非易事,通常面臨開發(fā)門檻高、生成內容差等難題。而借助浪潮信息元腦企智EPAI企業(yè)大模型開發(fā)平臺,企業(yè)僅需三步即可高效創(chuàng)建大模型RAG,讓企業(yè)內部積累的大量數(shù)據(jù)得到有效利用,
    的頭像 發(fā)表于 12-19 14:32 ?725次閱讀
    借助<b class='flag-5'>浪潮信息</b>元腦企智EPAI高效創(chuàng)建大<b class='flag-5'>模型</b>RAG

    浪潮信息發(fā)布”Yuan-EB助力RAG檢索精度新高

    近日,浪潮信息發(fā)布”Yuan-EB(Yuan-embedding-1.0,嵌入模型),在C-MTEB榜單中斬獲檢索任務第一名,以78.41的平均精度刷新大
    的頭像 發(fā)表于 11-26 13:54 ?685次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>“<b class='flag-5'>源</b>”Yuan-EB助力RAG檢索精度新高

    浪潮信息發(fā)布KOS AI定制版,大幅提升模型訓練效率

    浪潮信息近期推出了“元腦服務器操作系統(tǒng)KOS AI定制版”,為人工智能領域帶來了革命性的變化。這款定制版操作系統(tǒng)通過簡單的兩步操作,即可實現(xiàn)大模型訓練環(huán)境的快速部署。
    的頭像 發(fā)表于 10-30 17:23 ?970次閱讀

    浪潮信息AI存儲性能測試的領先之道

    MLCommons,一個致力于推動全球 AI系統(tǒng)發(fā)展的頂級工程聯(lián)盟,匯聚了包括谷歌、斯坦福大學在內的眾多頂尖企業(yè)和研究機構。作為該聯(lián)盟的創(chuàng)始成員之一,浪潮信息自2020年起便積極參與其中,共同探索
    的頭像 發(fā)表于 10-29 16:30 ?659次閱讀
    <b class='flag-5'>浪潮信息</b>AI存儲性能測試的領先之道

    浪潮信息源2.0模型與百度PaddleNLP全面適配

    近日,浪潮信息宣布其開源模型2.0已全面適配百度PaddleNLP。這一舉措標志著大模型開發(fā)
    的頭像 發(fā)表于 10-17 18:15 ?980次閱讀

    浪潮信息發(fā)布元腦企智一體機

    在2024中國力大會上,浪潮信息正式發(fā)布了其創(chuàng)新的元腦企智一體機。這款一體機融合了元腦企智EPAI企業(yè)大模型開放平臺和元腦服務器,通過軟硬件協(xié)同的一體化設計,實現(xiàn)了快速交付、開箱即用
    的頭像 發(fā)表于 09-30 16:50 ?1946次閱讀

    浪潮信息:元腦企智EPAI助力金融大模型快速落地

    浪潮信息在AI力底座建設、大模型開發(fā)領域積累的成熟、成功經(jīng)驗工具化,助力金融機構又快、又穩(wěn)地部署生成式AI應用,助力金融數(shù)智化跨越式發(fā)展。
    的頭像 發(fā)表于 09-20 16:07 ?706次閱讀
    <b class='flag-5'>浪潮信息</b>:元腦企智EPAI助力金融大<b class='flag-5'>模型</b>快速落地

    2.0-M32模型發(fā)布量化版 運行顯存僅需23GB 性能可媲美LLaMA3

    北京2024年8月23日?/美通社/ -- 近日,浪潮信息發(fā)布2.0-M32模型4bit和8bit量化版,性能比肩700億參數(shù)的LLaM
    的頭像 發(fā)表于 08-25 22:06 ?680次閱讀
    <b class='flag-5'>源</b><b class='flag-5'>2.0-M32</b>大<b class='flag-5'>模型</b><b class='flag-5'>發(fā)布</b>量化版 運行顯存僅需23GB 性能可媲美LLaMA3

    浪潮信息趙帥:開放計算創(chuàng)新 應對Scaling Law挑戰(zhàn)

    北京2024年8月15日?/美通社/ -- 日前在2024開放計算中國峰會上,浪潮信息服務器產(chǎn)品線總經(jīng)理趙帥表示,智能時代,開源模型和開放計算激發(fā)了人工智能產(chǎn)業(yè)生態(tài)的創(chuàng)新活力,面對大模型
    的頭像 發(fā)表于 08-15 16:02 ?505次閱讀
    <b class='flag-5'>浪潮信息</b>趙帥:開放計算創(chuàng)新 應對Scaling Law挑戰(zhàn)