99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

摩爾線程預(yù)訓(xùn)練語言模型MusaBert榮登CLUE榜單TOP10

摩爾線程 ? 來源:摩爾線程 ? 作者:摩爾線程 ? 2022-12-19 10:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摩爾線程聯(lián)合潞晨科技研發(fā)的預(yù)訓(xùn)練語言模型MusaBert(MUSA為摩爾線程提出的通用元計(jì)算架構(gòu)),在12月16日的中文語言理解領(lǐng)域權(quán)威CLUE榜單上進(jìn)入TOP 10,最終以82.889得分在CLUE1.1總排行榜中排名(除人類成績以外)第9,并在AFQMC任務(wù)中以86.92分取得排名第一的成績,這意味著摩爾線程AI在語義理解與匹配能力上超越了人類水平。同時(shí),這也是潞晨科技的AI大模型開發(fā)系統(tǒng)Colossal-AI在自然語言處理領(lǐng)域應(yīng)用的重要進(jìn)展。

eafabd56-7f42-11ed-8abf-dac502259ad0.png

(2022年12月16日CLUE1.1總排行榜最新成績)

相較于CLUE總排行榜TOP 10的其他中文預(yù)訓(xùn)練模型,MusaBert僅包含3億參數(shù)量,是前十名中規(guī)模最小的模型,并且為單模型(single model),沒有進(jìn)行任何集成。此外,摩爾線程基于MusaBert的語義嵌入模型MusaSim在AFQMC任務(wù)上擊敗一眾大規(guī)模模型,取得第一名,不僅為檢索系統(tǒng)、分類對話等更深度語義理解研究打下堅(jiān)固基石,也證明了摩爾線程在中文自然語言處理領(lǐng)域和低資源大模型訓(xùn)練方面的強(qiáng)大能力。

一直以來,語義理解都是NLP(自然語言處理)技術(shù)的重要目標(biāo),通過一系列AI算法,可將文本解析為結(jié)構(gòu)化的、機(jī)器可讀的意圖與詞槽信息。通常來說,訓(xùn)練數(shù)據(jù)的獲取與處理、模型的迭代和訓(xùn)練等都是NLP技術(shù)的落地難點(diǎn)。MusaBert僅使用了極少的參數(shù)量便取得了比肩甚至超越百億參數(shù)大模型的成績,主要是得益于多方面獲得的突破性進(jìn)展:

▼技術(shù)層面:摩爾線程擁有“軟硬一體”的技術(shù)能力,使得MusaBert能夠從底到上進(jìn)行優(yōu)化;摩爾線程多功能GPU內(nèi)置AI加速和并行計(jì)算等硬件模塊,能夠提供AI和科學(xué)計(jì)算在內(nèi)的全棧功能,能夠?yàn)锳I推理計(jì)算加速、低資源大模型訓(xùn)練等應(yīng)用場景提供通用、高性價(jià)比、節(jié)能環(huán)保的AI能力。

▼算法層面:MusaBert使用了潞晨科技的AI大模型開發(fā)系統(tǒng)Colossal-AI,在上游訓(xùn)練方面,充分發(fā)揮了該系統(tǒng)的易用性及強(qiáng)大的并行訓(xùn)練性能,同時(shí)MusaBert針對模型數(shù)據(jù)預(yù)處理使用的DataLoader進(jìn)行了優(yōu)化,可以在低資源的條件下快速處理大規(guī)模數(shù)據(jù);在下游任務(wù)方面,摩爾線程通過采用合適的優(yōu)化建模、在領(lǐng)域內(nèi)進(jìn)行數(shù)據(jù)增強(qiáng)以及在模型的訓(xùn)練優(yōu)化中采用了先進(jìn)的Adan優(yōu)化器等方式,盡可能發(fā)掘和展現(xiàn)出預(yù)訓(xùn)練語言模型強(qiáng)大的語義理解能力。摩爾線程自研的語義嵌入模型MusaSim以MusaBert為基座模型,使用對比學(xué)習(xí)方法進(jìn)行精調(diào),并利用了摩爾線程收集的百萬對有監(jiān)督數(shù)據(jù)。得益于MusaBert和高質(zhì)量的數(shù)據(jù)集,MusaSim不僅在語義相似度任務(wù)上超越了眾多更大規(guī)模的模型,在意圖識別、情緒分析等分類任務(wù)上,也能得到較好的效果。

▼數(shù)據(jù)層面:MusaBert除使用了摩爾線程自身收集的高質(zhì)量語義相似數(shù)據(jù)以外,還使用了200GB悟道開源數(shù)據(jù)和80GB的CLUE社區(qū)數(shù)據(jù),以及浪潮電子信息產(chǎn)業(yè)股份有限公司提供的1T高質(zhì)量數(shù)據(jù)集。大規(guī)模高質(zhì)量的數(shù)據(jù)使得模型在相對小的規(guī)模下仍然保持了較高的性能。

目前,MusaBert作為基座模型,已經(jīng)應(yīng)用于摩爾線程研發(fā)的智能客服與數(shù)字人等項(xiàng)目,并相繼在下游語義相似度、情緒識別、閱讀理解、聲韻識別等領(lǐng)域落地。

為了更進(jìn)一步降低大模型開發(fā)和應(yīng)用的門檻,MusaBert代碼現(xiàn)已開源到Colossal-AI倉庫(https://github.com/hpcaitech/ColossalAI/tree/main/examples/language/roberta),使用該腳本,可在短時(shí)間內(nèi)訓(xùn)練出高質(zhì)量的中文Bert模型。包括MusaBert和MusaSim在內(nèi)的一系列高質(zhì)量模型也將在近期開源以貢獻(xiàn)中文NLP社區(qū)。此外,經(jīng)摩爾線程與潞晨科技的嚴(yán)格測試,僅通過摩爾線程多功能GPU單卡,即可進(jìn)行MusaBert甚至是更大規(guī)模的GPT2的訓(xùn)練,大大降低了預(yù)訓(xùn)練成本,這也為雙方實(shí)現(xiàn)低資源大模型訓(xùn)練的共同愿景,邁出了堅(jiān)實(shí)一步。

作為中文語言理解領(lǐng)域最具權(quán)威性的測評基準(zhǔn)之一,CLUE 涵蓋文本相似度、分類、自然語言推理、閱讀理解等眾多語義分析和理解類子任務(wù),工業(yè)界和學(xué)術(shù)界紛紛用 CLUE 作為預(yù)訓(xùn)練算法能力的驗(yàn)證和衡量標(biāo)準(zhǔn)。此次進(jìn)入CLUE榜單TOP 10,代表了摩爾線程與潞晨科技聯(lián)合研發(fā)團(tuán)隊(duì)在中文預(yù)訓(xùn)練研究領(lǐng)域已達(dá)到業(yè)內(nèi)領(lǐng)先水平。

展望未來,摩爾線程還將與潞晨科技緊密合作,著手更適當(dāng)規(guī)模的自然語言大模型研究,充分利用上游數(shù)據(jù),產(chǎn)出能力更強(qiáng)的模型并且開源。同時(shí),保持算法和系統(tǒng)兩個層面并行,持續(xù)優(yōu)化大模型在摩爾線程多功能GPU上的訓(xùn)練能力,尤其在單張消費(fèi)級顯卡等低資源場景下的訓(xùn)練能力,可以大大降低使用大模型訓(xùn)練的門檻和成本,進(jìn)一步促進(jìn)AI民主化。

▼ 關(guān)于潞晨科技

潞晨科技是一家致力于“解放AI生產(chǎn)力”的全球性公司,核心產(chǎn)品面向大模型時(shí)代的通用深度學(xué)習(xí)系統(tǒng) Colossal-AI,可實(shí)現(xiàn)高效快速部署AI大模型訓(xùn)練和推理,降低AI大模型應(yīng)用成本。自開源以來,Colossal-AI已經(jīng)多次在GitHub熱榜位列世界第一,獲得GitHub Star約七千顆,并成功入選SC、AAAI、PPoPP等國際AI與HPC頂級會議的官方教程。相關(guān)解決方案已成功在自動駕駛、云計(jì)算、零售、醫(yī)藥、芯片等行業(yè)知名廠商落地應(yīng)用、廣受好評。

▼ 關(guān)于摩爾線程

摩爾線程是一家以 GPU 芯片設(shè)計(jì)為主的集成電路高科技公司,專注于研發(fā)設(shè)計(jì)全功能 GPU 芯片及相關(guān)產(chǎn)品,能夠?yàn)橹袊萍忌鷳B(tài)合作伙伴提供強(qiáng)大的計(jì)算加速能力。公司成立于 2020年10月,致力于創(chuàng)新面向元計(jì)算應(yīng)用的新一代 GPU,構(gòu)建融合視覺計(jì)算、3D 圖形計(jì)算、科學(xué)計(jì)算及人工智能計(jì)算的綜合計(jì)算平臺,建立基于云原生 GPU計(jì)算的生態(tài)系統(tǒng),助力驅(qū)動數(shù)字經(jīng)濟(jì)發(fā)展。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI算法
    +關(guān)注

    關(guān)注

    0

    文章

    263

    瀏覽量

    12691
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    628

    瀏覽量

    14154
  • 摩爾線程
    +關(guān)注

    關(guān)注

    2

    文章

    235

    瀏覽量

    5355

原文標(biāo)題:Colossal-AI助力,摩爾線程預(yù)訓(xùn)練語言模型MusaBert榮登CLUE榜單TOP10

文章出處:【微信號:moorethreads,微信公眾號:摩爾線程】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    天合儲能榮獲自產(chǎn)電池系統(tǒng)TOP10榜單

    近日,在2025高工儲能產(chǎn)業(yè)TOP50企業(yè)的頒獎典禮上,天合儲能憑借深厚的全棧自研能力、卓越的系統(tǒng)集成優(yōu)勢和強(qiáng)大的全球化交付實(shí)力,榮膺 “自產(chǎn)電池·系統(tǒng)” TOP10榜單。這一獎項(xiàng)不僅是對天合儲能技術(shù)實(shí)力與市場地位的認(rèn)可,更是對
    的頭像 發(fā)表于 07-11 17:44 ?566次閱讀

    中國固態(tài)電池綜合競爭力企業(yè)TOP10榜單發(fā)布,寧德時(shí)代、太藍(lán)新能源領(lǐng)跑

    近日,中國最強(qiáng)固態(tài)電池TOP10榜單《中國固態(tài)電池綜合競爭力企業(yè)TOP10》正式發(fā)布。該榜單由OFweek產(chǎn)業(yè)研究中心以技術(shù)、產(chǎn)能、市場及生態(tài)四維評價(jià)體系,深度剖析電池廠商在固態(tài)電池賽
    的頭像 發(fā)表于 04-19 13:44 ?880次閱讀

    兆芯榮登2025中國IC設(shè)計(jì)處理器公司TOP10榜單

    的自主CPU產(chǎn)品體系、以及顯著的行業(yè)信創(chuàng)成果等多項(xiàng)優(yōu)勢,兆芯成功入圍中國IC設(shè)計(jì)處理器公司TOP10榜單,再度收獲業(yè)界高度贊許。 ? ? 2025中國IC設(shè)計(jì)Fabless100榜單覆蓋MCU、AI芯片
    的頭像 發(fā)表于 04-07 11:59 ?817次閱讀
    兆芯<b class='flag-5'>榮登</b>2025中國IC設(shè)計(jì)處理器公司<b class='flag-5'>TOP10</b><b class='flag-5'>榜單</b>

    銳成芯微榮登2025中國IC設(shè)計(jì)Fabless100排行榜之TOP10 IP公司

    近日,國際電子技術(shù)領(lǐng)域頭部媒體AspenCore發(fā)布了《2025中國IC設(shè)計(jì)Fabless100排行榜》,銳成芯微憑借自主創(chuàng)新實(shí)力、技術(shù)生態(tài)布局及行業(yè)貢獻(xiàn),再度榮登TOP10 IP公司”榜單!
    的頭像 發(fā)表于 03-31 17:49 ?799次閱讀

    敏芯股份榮登2025中國IC設(shè)計(jì)Fabless100排行榜之TOP10傳感器公司

    近日,AspenCore發(fā)布了“2025中國IC設(shè)計(jì)Fabless100”排行榜,向社會展示了一批優(yōu)秀企業(yè)以及各類TOP10榜單,這也是AspenCore第六年發(fā)布產(chǎn)業(yè)榜單。敏芯股份入選“TO
    的頭像 發(fā)表于 03-31 14:45 ?555次閱讀

    用PaddleNLP為GPT-2模型制作FineWeb二進(jìn)制預(yù)訓(xùn)練數(shù)據(jù)集

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 《用PaddleNLP在4060單卡上實(shí)踐大模型預(yù)訓(xùn)練技術(shù)》發(fā)布后收到讀者熱烈反響,很多讀者要求進(jìn)一步講解更多的技術(shù)細(xì)節(jié)。本文主要針對大語言
    的頭像 發(fā)表于 03-21 18:24 ?1656次閱讀
    用PaddleNLP為GPT-2<b class='flag-5'>模型</b>制作FineWeb二進(jìn)制<b class='flag-5'>預(yù)</b><b class='flag-5'>訓(xùn)練</b>數(shù)據(jù)集

    摩爾線程GPU原生FP8計(jì)算助力AI訓(xùn)練

    并行訓(xùn)練和推理,顯著提升了訓(xùn)練效率與穩(wěn)定性。摩爾線程是國內(nèi)率先原生支持FP8計(jì)算精度的國產(chǎn)GPU企業(yè),此次開源不僅為AI訓(xùn)練和推理提供了全新
    的頭像 發(fā)表于 03-17 17:05 ?601次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>GPU原生FP8計(jì)算助力AI<b class='flag-5'>訓(xùn)練</b>

    天合儲能榮登2024全球及中國儲能系統(tǒng)出貨量TOP10榜單

    近日,儲能領(lǐng)域知名研究機(jī)構(gòu)GGII正式發(fā)布“2024中國儲能系統(tǒng)企業(yè)出貨量分析及排名”榜單。天合儲能憑借卓越的系統(tǒng)集成能力與全球化交付能力,強(qiáng)勢入圍“全球儲能系統(tǒng)出貨量Top10”及“中國儲能系統(tǒng)
    的頭像 發(fā)表于 03-05 15:28 ?629次閱讀

    摩爾線程宣布成功部署DeepSeek蒸餾模型推理服務(wù)

    。 據(jù)悉,DeepSeek開源模型在多語言理解與復(fù)雜推理任務(wù)中一直表現(xiàn)出卓越的性能,其V3、R1等系列模型更是備受業(yè)界關(guān)注。而此次摩爾線程
    的頭像 發(fā)表于 02-06 13:49 ?807次閱讀

    云知聲榮登2024數(shù)字技術(shù)創(chuàng)新企業(yè)TOP20榜單

    近日,朋湖網(wǎng)聯(lián)合機(jī)器人開放社區(qū)發(fā)布了“2024年度科技產(chǎn)業(yè)系列榜單”, 云知聲憑借其在AI技術(shù)創(chuàng)新與產(chǎn)業(yè)化應(yīng)用領(lǐng)域的卓越成就,榮登 “2024數(shù)字技術(shù)創(chuàng)新企業(yè)TOP20”榜單。
    的頭像 發(fā)表于 01-23 09:11 ?529次閱讀

    四維圖新入選2024中國AIEV產(chǎn)業(yè)智駕創(chuàng)新企業(yè)TOP10榜單

    近日,由億歐汽車主辦的GTM2024第七屆科技出行大會暨《科技出行產(chǎn)業(yè)創(chuàng)新榜單》發(fā)布會在上海舉行。憑借對智駕領(lǐng)域的前瞻理解和全面布局與運(yùn)用,四維圖新成功入選“2024中國AIEV產(chǎn)業(yè)智駕創(chuàng)新企業(yè)TOP10榜單。
    的頭像 發(fā)表于 12-24 09:26 ?852次閱讀

    云知聲榮登2024大模型企業(yè)TOP50榜單

    近日,智領(lǐng)未來·向新而行—2024人工智能大模型產(chǎn)業(yè)大會在京召開,會上揭曉2024大模型企業(yè)TOP50榜單,云知聲榮登
    的頭像 發(fā)表于 11-29 17:52 ?931次閱讀

    云知學(xué)院榮登2024中國企培業(yè)模式創(chuàng)新TOP10榜單

    近日,第13屆國際培訓(xùn)產(chǎn)品博覽會(簡稱“培博會”)在江蘇昆山舉行,展會期間公布2024培博會?培英獎評選結(jié)果,云知聲旗下人工智能教育培訓(xùn)品牌——云知學(xué)院入選“2024中國企培業(yè)模式創(chuàng)新TOP10榜單,商業(yè)價(jià)值獲行業(yè)認(rèn)可。
    的頭像 發(fā)表于 11-21 14:12 ?623次閱讀

    摩爾線程與羽人科技完成大語言模型訓(xùn)練測試

    (YuRen-7b)大語言模型訓(xùn)練測試。測試結(jié)果顯示,訓(xùn)練效率達(dá)到預(yù)期,夸娥千卡智算集群展現(xiàn)出了高度的兼容性和穩(wěn)定性,為羽人科技未來的零代碼訓(xùn)練
    的頭像 發(fā)表于 08-27 16:19 ?821次閱讀

    摩爾線程攜手東華軟件完成AI大模型推理測試與適配

    Agent平臺。該平臺集成了摩爾線程提供了軟硬一體化、從訓(xùn)練到部署的系統(tǒng)級解決方案,涵蓋自研大語言模型MUSAChat、推理引擎MT Tr
    的頭像 發(fā)表于 07-31 10:51 ?1951次閱讀