99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

參天生長大模型:昇騰AI如何強(qiáng)壯模型開發(fā)與創(chuàng)新之根?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2022-08-11 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自2018年谷歌發(fā)布BERT以來,預(yù)訓(xùn)練大模型經(jīng)過幾年的發(fā)展,以強(qiáng)大的算法效果,席卷了以NLP為代表的各大AI榜單與測試數(shù)據(jù)集。2020年OpenAI發(fā)布的NLP大模型GPT-3,實(shí)現(xiàn)了千億級參數(shù)。BERT、GPT的強(qiáng)大能力成為AI領(lǐng)域里程碑式的存在,大模型的顯著優(yōu)勢,也讓產(chǎn)業(yè)界巨頭與機(jī)構(gòu)紛紛參與其中。

大模型優(yōu)秀的泛化能力、通用AI的能力、高精度、覆蓋多業(yè)務(wù)場景等優(yōu)勢,降低了AI開發(fā)與應(yīng)用的門檻,也讓“煉大模型”也成為AI產(chǎn)業(yè)的潮流。但有了算力、有了大模型,AI產(chǎn)業(yè)創(chuàng)新與落地應(yīng)用就無憂無慮了嗎?答案并沒有這么簡單,很多產(chǎn)業(yè)需求是無法用通用模型來處理的,技術(shù)理論與應(yīng)用場景之間仍然存在著代溝;一些超大規(guī)模模型在部署時也會面臨一系列問題,如算力、調(diào)參難度、硬件兼容性等。

如何讓大模型走出實(shí)驗室,走向產(chǎn)業(yè),推動行業(yè)的創(chuàng)新,成為橫亙在AI廠商面前的難題。那么,大模型該如何完成自身的進(jìn)化,去適配使用場景、進(jìn)一步推動AI產(chǎn)業(yè)的發(fā)展呢?在這方面,華為有一些方法與路徑值得借鑒與思考。

從刷分轉(zhuǎn)向全面可用

預(yù)訓(xùn)練大模型是AI持續(xù)變革的動力與核心發(fā)展方向之一,隨著AI不斷深入產(chǎn)業(yè)與各學(xué)科領(lǐng)域的過程中,科研院所及各大企業(yè)間開始了大模型軍備battle,模型的類型朝著多樣化、參數(shù)規(guī)模朝著極致化的方向發(fā)展。

百家爭鳴中,我們看到模型參數(shù)規(guī)模越來越大,數(shù)據(jù)集紀(jì)錄不斷被刷新。但在真正的產(chǎn)業(yè)空間里,卻很難看到大模型規(guī)模化的應(yīng)用。拼模型參數(shù),拼下游任務(wù)打榜成績,是廠商推出大模型后標(biāo)榜實(shí)力的慣常操作。然而到拼落地應(yīng)用的時候,許多廠商的大模型卻緘默了。

從高分到高能,大模型距離現(xiàn)實(shí)中的產(chǎn)業(yè)場景還有不短的路程要走。讓大模型從“刷分”走向千行百業(yè),需要一場全面的轉(zhuǎn)型。

為了更好地推動大模型的發(fā)展,華為推出了人工智能大模型全流程使能體系,該體系包含從大模型規(guī)劃、開發(fā)到產(chǎn)業(yè)化全流程,加速大模型產(chǎn)業(yè)化進(jìn)程。

在產(chǎn)業(yè)界基于昇騰AI先后推出鵬程.盤古、鵬程.神農(nóng)、紫東.太初、武漢.LuoJia、華為云盤古系列等有影響力的大模型后,為進(jìn)一步鼓勵大模型的研究與創(chuàng)新,華為推出了昇騰科研創(chuàng)新使能計劃,通過資金、算力、技術(shù)和社區(qū)的扶持,鼓勵高校及科研院所基于昇騰大模型沙盤,開展大模型的研究和創(chuàng)新,在前沿領(lǐng)域和熱點(diǎn)行業(yè)打造出世界級領(lǐng)先的大模型。

為了讓大模型易開發(fā)、易適配、易部署,針對基礎(chǔ)模型開發(fā),華為推出基于昇思MindSpore的大模型開發(fā)套件,通過算法開發(fā)、并行計算、存儲優(yōu)化、斷點(diǎn)續(xù)訓(xùn)等技術(shù),實(shí)現(xiàn)大模型的高效開發(fā)與部署。

從科研創(chuàng)新到行業(yè)落地,華為與產(chǎn)業(yè)伙伴一起成立了智能遙感開源生態(tài)聯(lián)盟和多模態(tài)人工智能產(chǎn)業(yè)聯(lián)盟等,目前已經(jīng)有70余家合作伙伴陸續(xù)孵化出多個行業(yè)解決方案,未來華為還會聯(lián)合伙伴成立AI流體力學(xué)、AI生物醫(yī)藥及智慧生物育種等產(chǎn)業(yè)聯(lián)盟,助力相關(guān)領(lǐng)域的大模型創(chuàng)新和產(chǎn)業(yè)化發(fā)展。

大模型全流程使能體系不僅為大模型的研發(fā)與創(chuàng)新帶來生長的土壤,也促進(jìn)著生態(tài)伙伴基于已有大模型孵化更多行業(yè)應(yīng)用,同時,大模型也會得到行業(yè)更豐富的數(shù)據(jù)和更泛化應(yīng)用場景的反哺。在良性循環(huán)的過程中,大模型從而生長得更加茁壯,能夠真正枝繁葉茂地賦能產(chǎn)業(yè)。

從宏觀的使能體系中,我們能夠感知到大模型賦能千行百業(yè)的實(shí)力與價值;在微觀個體中,透過大模型的代表紫東.太初,我們也能夠看到其帶來的產(chǎn)業(yè)之變。

紫東.太初的開發(fā)之根

現(xiàn)階段,產(chǎn)學(xué)研界的大模型主要集中在NLP和CV領(lǐng)域。行業(yè)內(nèi)傳統(tǒng)的以文本、圖像為主的單模態(tài)或雙模態(tài)預(yù)訓(xùn)練模型,覆蓋的范圍與滿足的需求有限,不能充分發(fā)揮數(shù)據(jù)生產(chǎn)力,限制了下一階段AI 的應(yīng)用創(chuàng)新。多模態(tài)大模型應(yīng)運(yùn)而生,打通圖像、文本、語音等不同模態(tài)數(shù)據(jù)的協(xié)同轉(zhuǎn)化,進(jìn)而使AI應(yīng)用更貼合人類行為習(xí)慣與現(xiàn)實(shí)需求,成為當(dāng)前人工智能行業(yè)攻堅點(diǎn)之一。

紫東.太初是全球首個三模態(tài)千億參數(shù)大模型,作為多模態(tài)模型的代表,正在全力助推AI研發(fā)規(guī)則和產(chǎn)業(yè)應(yīng)用模式變革,加速各行業(yè)智能化轉(zhuǎn)型實(shí)踐。在7月29日-31日的首屆中國算力大會上,“紫東.太初”大模型榮獲“DC Tech創(chuàng)新先鋒”優(yōu)秀成果獎。

創(chuàng)新先鋒優(yōu)秀成果獎評選大模型的維度嚴(yán)謹(jǐn)并全面,無論是技術(shù)、系統(tǒng),還是應(yīng)用賦能等方面,都是重點(diǎn)考量的因素。紫東.太初大模型被業(yè)界認(rèn)可,成為標(biāo)桿引領(lǐng)多模態(tài)大模型,能夠保持優(yōu)秀并持續(xù)創(chuàng)新的前提,源于其強(qiáng)壯的AI根技術(shù),在AI框架、AI算力等層面滿足大模型的“創(chuàng)新”需求。

紫東.太初是中科院自動化所以昇騰AI基礎(chǔ)軟硬件為基礎(chǔ),基于全場景AI框架昇思MindSpore打造的三模態(tài)模型,紫東.太初兼具跨模態(tài)理解和生成能力,與單模態(tài)和圖文兩模態(tài)相比,其采用一個大模型就可以靈活支撐圖-文-音全場景AI應(yīng)用,具有在無監(jiān)督情況下多任務(wù)聯(lián)合學(xué)習(xí)、并快速遷移到不同領(lǐng)域數(shù)據(jù)的強(qiáng)大能力。

紫東.太初目前已經(jīng)具備領(lǐng)先的圖文音跨模態(tài)理解與生成能力,可輕松完成智能問答、圖片生成、視頻理解與等任務(wù),這些能力將在工業(yè)質(zhì)檢、影視創(chuàng)作、互聯(lián)網(wǎng)推薦、智能駕駛等領(lǐng)域廣泛應(yīng)用。例如在紡織工業(yè)生產(chǎn)線中的應(yīng)用案例中,紫東.太初融合多模態(tài)信息,可以通過聲音識別來判斷紡織機(jī)運(yùn)轉(zhuǎn)過程中斷經(jīng)和斷緯的情形,同時通過視覺識別來判斷布匹的缺陷,展示出綜合研判的能力和廣闊的應(yīng)用前景。

由于三模態(tài)大模型非常接近人類的信息處理方式,其對信息數(shù)據(jù)有非常好的協(xié)同掌握能力,因此可以非常廣泛地應(yīng)用于產(chǎn)學(xué)各領(lǐng)域,孵化出更多新應(yīng)用。新華社技術(shù)局、長安汽車、中國移動、千博手語等企業(yè)通過加盟多模態(tài)人工智能產(chǎn)業(yè)聯(lián)盟,將開源的多模態(tài)大模型與自身業(yè)務(wù)融合創(chuàng)新,基于紫東.太初陸續(xù)孵化出新媒體內(nèi)容檢索平臺、智能座艙、南宋御街?jǐn)?shù)字人、手語教考一體機(jī)等場景化行業(yè)應(yīng)用,充分展現(xiàn)了大模型的潛力與產(chǎn)業(yè)價值。

從大模型技術(shù)深處挖掘,我們會發(fā)現(xiàn)紫東.太初的打造,得益于昇騰AI的產(chǎn)業(yè)底座,尤其是昇思對大模型的原生支持,讓大模型具備了快速開發(fā)、極簡訓(xùn)練的“開發(fā)之根”。

澆灌創(chuàng)新之花

從昇思AI框架中汲取“創(chuàng)新”的營養(yǎng)澆灌大模型,是使能其發(fā)展的關(guān)鍵。昇思 MindSpore 在進(jìn)行架構(gòu)設(shè)計時就考慮了大模型開發(fā)時遇到的內(nèi)存占用、通信瓶頸、調(diào)試復(fù)雜、部署難等問題,針對性進(jìn)行技術(shù)研究與創(chuàng)新。

在大模型支持方面,昇思實(shí)現(xiàn)了原生支持大模型,能夠在業(yè)界率先支持全自動并行計算。在大模型訓(xùn)練中,可以同時使用數(shù)據(jù)并行、算子級模型并行、Pipeline 模型并行、優(yōu)化器模型并行、異構(gòu)并行、重計算、高效內(nèi)存復(fù)用多維度、全種類的分布式并行策略;原創(chuàng)集群拓?fù)涓兄亩嗑S度自動混合并行,實(shí)現(xiàn)超大模型自動切分、并行計算,顯著提升集群加速能力;新的 DNN分布式并行編程范式,可以實(shí)現(xiàn)低代碼算法切換,大幅節(jié)省開發(fā)時間。

在科研創(chuàng)新和應(yīng)用領(lǐng)域,昇思面向 8 大科學(xué)計算場景推出 MindSpore Science 系列套件,其包含業(yè)界領(lǐng)先的數(shù)據(jù)集、基礎(chǔ)模型、預(yù)置高精度模型和前后處理工具,可以加速科學(xué)行業(yè)應(yīng)用開發(fā)。

面向產(chǎn)業(yè)生態(tài)的開放,昇思正在與產(chǎn)學(xué)研各界一同推進(jìn)開源開放,昇思 MindSpore AI 框架已經(jīng)成為大模型開發(fā)的技術(shù)支撐,開源開放更使得產(chǎn)學(xué)界可以基于它研發(fā)自己的大模型。昇騰社區(qū)和昇思MindSpore社區(qū)一直在加強(qiáng)對大模型開源開放的支持。截至7月,昇思社區(qū)下載量已經(jīng)突破200萬,社區(qū)貢獻(xiàn)者超過5900人。

目前,華為聯(lián)合科研機(jī)構(gòu)和產(chǎn)業(yè)界,基于昇思 MindSpore AI 框架與昇騰 AI 強(qiáng)大算力,不斷發(fā)展基礎(chǔ)大模型和行業(yè)大模型的產(chǎn)業(yè)生態(tài),賦能千行百業(yè)數(shù)字化、智能化。

例如,鵬城實(shí)驗室基于昇思 MindSpore 先后推出了業(yè)界首個 2000 億參數(shù)中文預(yù)訓(xùn)練語言模型鵬程.盤古和面向生物醫(yī)學(xué)領(lǐng)域的鵬程.神農(nóng)大模型,深度賦能文本生成領(lǐng)域與生物制藥;武漢大學(xué)在嵌入昇思MindSpore先進(jìn)技術(shù)特性后打造了全球首個遙感影像智能解譯專用框架武漢.LuoJiaNet和業(yè)界最大遙感樣本庫武漢.LuoJiaSET,為遙感應(yīng)用開發(fā)提供便利。

從根技術(shù)創(chuàng)新提升大模型的性能,到賦能不同科學(xué)計算行業(yè)應(yīng)用的加速開發(fā),大模型全流程使能體系的構(gòu)建,產(chǎn)業(yè)生態(tài)的開源開放與架橋連接,基于昇騰AI軟硬協(xié)同的技術(shù)創(chuàng)新與產(chǎn)業(yè)服務(wù)助力,大模型的創(chuàng)新與產(chǎn)業(yè)落地之路越來越寬敞,加速各行業(yè)智能化轉(zhuǎn)型實(shí)踐,未來會有更多不同領(lǐng)域的原創(chuàng)技術(shù)成果誕生。

華為為大模型確立了從研致用的范式,推動大模型走向服務(wù)產(chǎn)業(yè)的新階段,不同的行業(yè)在各類應(yīng)用場景中驗證著大模型的能力。遍地花開的成果,離不開昇騰 AI 提供的強(qiáng)大算力底座與昇思 MindSpore AI 框架的賦能,澆灌著大模型的研發(fā)與創(chuàng)新,為其注入活力與生命力,大模型的產(chǎn)業(yè)之花得以在數(shù)智時代的原野中爭奇斗艷,盎然生機(jī),一幅智慧生活的圖景正在徐徐展開。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 華為
    +關(guān)注

    關(guān)注

    216

    文章

    35212

    瀏覽量

    255964
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4710

    瀏覽量

    95419
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35168

    瀏覽量

    280152
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22629
  • 昇騰
    +關(guān)注

    關(guān)注

    1

    文章

    158

    瀏覽量

    7017
  • 昇騰AI
    +關(guān)注

    關(guān)注

    0

    文章

    85

    瀏覽量

    778
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3147

    瀏覽量

    4079
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為開發(fā)者大會2025(HDC 2025)亮點(diǎn):華為云發(fā)布盤古大模型5.5 宣布新一代AI云服務(wù)上線

    HarmonyOS、AI云服務(wù)、盤古大模型等最新科技創(chuàng)新成果。 在主題演講中,華為常務(wù)董事、華為云計算CEO張平安宣布基于CloudMa
    的頭像 發(fā)表于 06-20 20:19 ?2237次閱讀
    華為<b class='flag-5'>開發(fā)</b>者大會2025(HDC 2025)亮點(diǎn):華為云發(fā)布盤古大<b class='flag-5'>模型</b>5.5 宣布新一代<b class='flag-5'>昇</b><b class='flag-5'>騰</b><b class='flag-5'>AI</b>云服務(wù)上線

    中軟國際推出金融AI解決方案和一體機(jī)v1.0

    近日,中軟國際重磅推出金融AI解決方案和一體機(jī)v1.0,該方案基于AI基礎(chǔ)軟硬件平臺,完
    的頭像 發(fā)表于 03-28 17:05 ?615次閱讀

    大華股份亮相華為中國合作伙伴大會2025 星漢×推動行業(yè)創(chuàng)新發(fā)展

    。 ? 星漢× 推動行業(yè)創(chuàng)新發(fā)展 數(shù)字化浪潮下,大模型正迅速融入各行各業(yè),市場需求呈現(xiàn)爆發(fā)式增長。此次發(fā)布的大模型應(yīng)用一體機(jī)等系列產(chǎn)品,
    的頭像 發(fā)表于 03-25 17:43 ?1430次閱讀
    大華股份亮相華為中國合作伙伴大會2025 星漢×<b class='flag-5'>昇</b><b class='flag-5'>騰</b>推動行業(yè)<b class='flag-5'>創(chuàng)新</b>發(fā)展

    DeepSeek在上的模型部署的常見問題及解決方案

    2024年12月26日,DeepSeek-V3橫空出世,以其卓越性能備受矚目。該模型發(fā)布即支持,用戶可在硬件和MindIE推理引擎上
    的頭像 發(fā)表于 03-25 16:53 ?884次閱讀
    DeepSeek在<b class='flag-5'>昇</b><b class='flag-5'>騰</b>上的<b class='flag-5'>模型</b>部署的常見問題及解決方案

    創(chuàng)思遠(yuǎn)達(dá)與合作推動AI PC應(yīng)用創(chuàng)新

    近日,端側(cè)智能領(lǐng)域創(chuàng)新者創(chuàng)思遠(yuǎn)達(dá)攜手,基于算力平臺正式發(fā)布一系列AIPC應(yīng)用。雙方深度融合了
    的頭像 發(fā)表于 03-25 10:22 ?637次閱讀

    2025AI開發(fā)者創(chuàng)享日浙江站成功舉辦,現(xiàn)場演示OrangePi AIpro(20T)部署DeepSeek模型開發(fā)全流程

    3月7日,2025年生態(tài)首場旗艦活動——AI開發(fā)者創(chuàng)享日·浙江站成功舉辦?;顒油ㄟ^“1場
    的頭像 發(fā)表于 03-12 14:44 ?631次閱讀
    2025<b class='flag-5'>昇</b><b class='flag-5'>騰</b><b class='flag-5'>AI</b><b class='flag-5'>開發(fā)</b>者創(chuàng)享日浙江站成功舉辦,現(xiàn)場演示OrangePi AIpro(20T)部署DeepSeek<b class='flag-5'>模型</b><b class='flag-5'>開發(fā)</b>全流程

    潤和軟件將持續(xù)深化“+DeepSeek”技術(shù)路線

    (以下簡稱“潤和軟件”)作為生態(tài)核心伙伴受邀出席,人工智能研究院AI總工朱凱分享了基于“ + openEuler + OpenHar
    的頭像 發(fā)表于 03-08 09:39 ?760次閱讀

    推理服務(wù)器+DeepSeek大模型 技術(shù)培訓(xùn)在圖為科技成功舉辦

    2月17日,華為政企業(yè)務(wù)團(tuán)隊受邀蒞臨圖為科技深圳總部,并成功舉辦了一場聚焦于《推理服務(wù)器+DeepSeek大模型》的專業(yè)知識培訓(xùn)。 此次培訓(xùn)活動不僅深化了雙方的技術(shù)交流,更標(biāo)志著
    的頭像 發(fā)表于 02-26 17:38 ?605次閱讀
    <b class='flag-5'>昇</b><b class='flag-5'>騰</b>推理服務(wù)器+DeepSeek大<b class='flag-5'>模型</b> 技術(shù)培訓(xùn)在圖為科技成功舉辦

    研華發(fā)布AI Box及Deepseek R1模型部署流程

    近日,隨著深度求索(DeepSeek)大模型的發(fā)布在行業(yè)內(nèi)掀起熱議,研華科技正式推出了基于Atlas平臺的邊緣AI Box MIC-ATL3S,并同步發(fā)布了與Deepseek R1
    的頭像 發(fā)表于 02-19 10:41 ?771次閱讀

    云軸科技ZStack智塔攜手AI實(shí)現(xiàn)DeepSeek模型部署

    DeepSeek為人工智能AI產(chǎn)業(yè)帶來一場革命,為企業(yè)級AI應(yīng)用私有化部署場景(Private AI)注入強(qiáng)勁動力。作為企業(yè)級私有化AI Infra平臺,云軸科技ZStack智塔攜手
    的頭像 發(fā)表于 02-18 09:59 ?745次閱讀
    云軸科技ZStack智塔攜手<b class='flag-5'>昇</b><b class='flag-5'>騰</b><b class='flag-5'>AI</b>實(shí)現(xiàn)DeepSeek<b class='flag-5'>模型</b>部署

    華為推出DeepSeek大模型一體機(jī)

    DeepSeek大模型的橫空出世,讓AI正以前所未有的速度重塑各行各業(yè)的發(fā)展格局。DeepSeek一體機(jī)深度融合騰高性能算力底座與De
    的頭像 發(fā)表于 02-18 09:56 ?2066次閱讀

    研華邊緣AI Box MIC-ATL3S部署Deepseek R1模型

    隨著深度求索(DeepSeek)大模型的發(fā)布引發(fā)行業(yè)熱議,研華科技基于Atlas平臺邊緣AI Box MIC-ATL3S正式發(fā)布與Deepseek R1
    的頭像 發(fā)表于 02-14 16:08 ?1394次閱讀
    研華邊緣<b class='flag-5'>AI</b> Box MIC-ATL3S部署Deepseek R1<b class='flag-5'>模型</b>

    中軟國際科創(chuàng)中心上線DeepSeek模型

    DeepSeek的遷移、模型部署、模型蒸餾、模型精調(diào)、SAAS應(yīng)用、Agent開發(fā)等多樣化
    的頭像 發(fā)表于 02-08 18:02 ?1363次閱讀

    谷東科技民航維修智能決策大模型榮獲華為技術(shù)認(rèn)證

    經(jīng)過華為專業(yè)評測,谷東科技民航維修智能決策大模型1.0成功與華為Atlas 800T A2訓(xùn)練服務(wù)器完成并通過了相互兼容性測試認(rèn)證,正式榮獲華為技術(shù)認(rèn)證,被授予Ascend Compatible認(rèn)證證書及認(rèn)證徽標(biāo)的使用權(quán),成
    的頭像 發(fā)表于 09-30 15:22 ?847次閱讀

    思原生,助力智譜打造自主創(chuàng)新模型體系!

    自從全面啟動原生開發(fā),越來越多的生態(tài)伙伴選擇,大模型生態(tài)從“應(yīng)用遷移”走向“原生
    的頭像 發(fā)表于 08-20 18:29 ?782次閱讀
    <b class='flag-5'>昇</b><b class='flag-5'>騰</b>與<b class='flag-5'>昇</b>思原生,助力智譜打造自主<b class='flag-5'>創(chuàng)新</b>大<b class='flag-5'>模型</b>體系!