99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

橫空出世!容芯致遠(yuǎn)創(chuàng)新“智算整機架構(gòu)”融合DeepSeek應(yīng)用

yyx2013 ? 來源:yyx2013 ? 作者:yyx2013 ? 2025-02-28 13:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

DeepSeek火爆全球,并引發(fā)算力行業(yè)鏈?zhǔn)椒磻?yīng)。借助混合專家模型(MOE)架構(gòu)、多頭潛在注意力機制(MLA)等算法創(chuàng)新,DeepSeek顯著降低大模型計算成本,打破了業(yè)界對高算力GPU的路徑依賴,全面激活了各行業(yè)部署大模型應(yīng)用的需求。長期受先進(jìn)制程工藝制約的國產(chǎn)GPU陣營正在迎來新的發(fā)展機遇。

2月27日,在北京2025中國RISC-V生態(tài)大會上,容芯致遠(yuǎn),一家2024年剛成立,致力于創(chuàng)新計算機體系結(jié)構(gòu)的初創(chuàng)企業(yè),推出了全新的AGC智算架構(gòu)及其整機設(shè)計方案,并率先與百度AI技術(shù)生態(tài)達(dá)成合作,這或?qū)㈤_啟AI計算機系統(tǒng)架構(gòu)創(chuàng)新的范式變革。

這是容芯致遠(yuǎn)首次在全國性頂級行業(yè)技術(shù)大會上正式亮相,CTO石旭在主題演講中披露了他對MOE架構(gòu)下AI計算機體系結(jié)構(gòu)創(chuàng)新和變革方向的思考。在石旭看來,影響AI發(fā)展有三個關(guān)鍵要素:芯片、系統(tǒng)和算法。DeepSeek已成功證明中國在算法領(lǐng)域的領(lǐng)先優(yōu)勢,GPU芯片迭代周期長,短期難以一蹴而就,系統(tǒng)結(jié)構(gòu)作為介于芯片與算法之間的重要環(huán)節(jié),對于進(jìn)一步發(fā)揮國產(chǎn)芯片有效算力,提升運營效率,降低運營成本,延長設(shè)備壽命等,都具有極大的創(chuàng)新空間。

wKgZPGfBTjaAUTW5AAN1Uvt9ydY324.png

幾十年來,計算機系統(tǒng)一直是以CPU為核心進(jìn)行構(gòu)建,GPU顯卡、存儲等設(shè)備作為外設(shè)存在,所有外設(shè)之間的數(shù)據(jù)交換需要通過中央處理器即CPU來處理,使得CPU越來越成為AI時代的計算機系統(tǒng)瓶頸所在。對此,容芯致遠(yuǎn)的創(chuàng)業(yè)團(tuán)隊選擇了計算機體系結(jié)構(gòu)這一長期被產(chǎn)業(yè)界忽視的方向,率先提出AGC(以GPU為核心)的AI計算機體系結(jié)構(gòu)。在石旭和他的技術(shù)團(tuán)隊看來,為更高效地支撐AI時代MOE模型訓(xùn)練推理,需要對計算機體系結(jié)構(gòu)進(jìn)行一次徹底的變革,即從傳統(tǒng)的ACC架構(gòu)(AI computer system with the CPU at its Core)轉(zhuǎn)向AGC架構(gòu)(AI computer system with the GPU at its Core),實現(xiàn)以GPU為核心設(shè)計AI計算機系統(tǒng)。只有在體系結(jié)構(gòu)層面進(jìn)行高維度的創(chuàng)新,才能打破成本、效率、靈活性“不可能三角”的魔咒,讓GPU與模型服務(wù)發(fā)揮更大算力效率,同時更具成本優(yōu)勢和靈活的適應(yīng)性。

wKgZO2fBTjaAKfddAAPZixn6C2o328.png

RISC-V生態(tài)大會的展示區(qū),容芯致遠(yuǎn)在現(xiàn)場展出了多款基于AGC架構(gòu)設(shè)計的AI服務(wù)器與AI Station整機方案。

與傳統(tǒng)服務(wù)器不同,采用AGC架構(gòu)的8卡GPU服務(wù)器,在一個4U機箱內(nèi)部署2顆國產(chǎn)CPU和8張國產(chǎn)GPU卡,且能支持不同廠商的GPU卡異構(gòu)混插,整機算力有效值(MFU)可從40%平均值提高到60%以上,并支持DeepSeek的高效推理。

wKgZPGfBTjeAEpTcAANeXQUm3NI20.jpeg

圖:全國產(chǎn)AGC架構(gòu)MOE智算整機(8卡)

現(xiàn)場展出的AI Station適用于ToB辦公場景,也是基于AGC架構(gòu)設(shè)計,模塊化、免主板、超靜音、內(nèi)置AIOS系統(tǒng),可插2塊全尺寸GPU卡,輕松跑通32B模型,可用于在辦公室環(huán)境搭建輕量便捷、低成本的DeepSeek推理平臺。

wKgZO2fBTjeAObd_AALZjIcSAr044.jpeg

圖:基于AGC架構(gòu)的AI Station

值得關(guān)注的是,容芯致遠(yuǎn)預(yù)發(fā)布了一款20卡全信創(chuàng)AGC架構(gòu)服務(wù)器設(shè)計方案,更充分地體現(xiàn)“以GPU為核心構(gòu)建計算機系統(tǒng)”的設(shè)計理念,一些重要特征包括:20卡超高密度,使其不用量化即可完美兼容全尺寸DeepSeek大模型;支持“GPU暴力熱插拔”,當(dāng)某個GPU卡出現(xiàn)故障時,無須將整個設(shè)備斷電即可更換GPU,使得維護(hù)周期從小時級直接降到分鐘級;支持針對每顆GPU而不是整機進(jìn)行卡級精準(zhǔn)能耗控制,可根據(jù)負(fù)載需要開啟或關(guān)閉目標(biāo)GPU卡;全新的高速互聯(lián)特性支持在5秒內(nèi)喚醒加載大模型等。該款產(chǎn)品實現(xiàn)了業(yè)界首創(chuàng)、全球首創(chuàng)!

wKgZPGfBTjiATs9gAAMAD2Xf9k431.jpeg

圖:已預(yù)發(fā)布的全國產(chǎn)AGC架構(gòu)MOE智算整機(20卡)關(guān)鍵特性

容芯致遠(yuǎn)COO王成江表示,盡管目前國內(nèi)已經(jīng)有很多整機廠商,但鮮有企業(yè)去做計算機體系結(jié)構(gòu)層面的創(chuàng)新,這在國內(nèi)是一個新的賽道,容芯致遠(yuǎn)將專注于研發(fā)推廣更加符合AI時代需要的新型計算機系統(tǒng)架構(gòu)方案,做智算體系結(jié)構(gòu)的領(lǐng)頭羊。目前,AGC智算架構(gòu)整機已適配幾乎所有國產(chǎn)GPU卡,包括天數(shù)智芯、寒武紀(jì)、燧原、登臨科技、墨芯、沐曦、希姆、海光DCU、摩爾線程等,同時也適配了DeepSeek、文心一言、Llama、Qwen、ChatGLM等主流大模型。而且,公司秉承開源開放策略,將相關(guān)AGC架構(gòu)知識產(chǎn)權(quán)通過RISC-V生態(tài)聯(lián)盟向內(nèi)部成員開放共享。

wKgZO2fBTjiAIAJBAAOBs7hlCoo021.png

AGC智算架構(gòu)創(chuàng)新成果獲得了互聯(lián)網(wǎng)AI大廠的關(guān)注與重視。容芯致遠(yuǎn)已與百度AI技術(shù)團(tuán)隊達(dá)成生態(tài)合作,雙方將攜手推動計算機體系結(jié)構(gòu)創(chuàng)新,優(yōu)化基于飛槳、文心大模型、AI生態(tài)應(yīng)用等系統(tǒng),降低AI應(yīng)用門檻,加速AI最后一公里落地。

容芯致遠(yuǎn),是一家致力于創(chuàng)新計算機體系結(jié)構(gòu)的高科技企業(yè)。公司擁有微電子、光子學(xué)、AI加速與體系結(jié)構(gòu)等眾多領(lǐng)域的專家團(tuán)隊,構(gòu)建了一支跨學(xué)科、技術(shù)實力強大的技術(shù)團(tuán)隊,為公司持續(xù)創(chuàng)新及產(chǎn)品開發(fā)奠定了堅實而穩(wěn)固的基礎(chǔ)。憑借在底層技術(shù)創(chuàng)新領(lǐng)域的卓越實力,實現(xiàn)了對CPU/GPU的全面賦能加速,并推出了通算/智算加速單元及智算服務(wù)器等一系列產(chǎn)品?,F(xiàn)場許多專家和客戶都表示很期待看到一個創(chuàng)新的技術(shù)公司加速崛起。


審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35109

    瀏覽量

    279631
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    797

    瀏覽量

    1737
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    DeepSeek橫空出世,存儲產(chǎn)業(yè)的寒武紀(jì)大爆發(fā)來了

    ? 電子發(fā)燒友網(wǎng)報道(文/黃晶晶)DeepSeek-R1是幻方量化旗下深度求索(DeepSeek)公司研發(fā)的推理模型。DeepSeek-R1于2025年1月20日正式發(fā)布。該模型采用強化學(xué)習(xí)進(jìn)行后
    的頭像 發(fā)表于 02-10 07:35 ?4558次閱讀
    <b class='flag-5'>DeepSeek</b><b class='flag-5'>橫空出世</b>,存儲產(chǎn)業(yè)的寒武紀(jì)大爆發(fā)來了

    東芝24TB超大容量CMR硬盤評測

    大模型的橫空出世不僅改變了計算行業(yè),也深刻影響了存儲行業(yè)。
    的頭像 發(fā)表于 07-10 09:46 ?541次閱讀
    東芝24TB超大容量CMR硬盤評測

    維諦技術(shù):AI普惠浪潮下,如何打造新一代力中樞?

    DeepSeek橫空出世,為AI行業(yè)注入了新的變量。它憑借開源可用、低成本調(diào)用的特性,大幅降低了大模型技術(shù)的使用門檻,加速了AI能力向各行各業(yè)的滲透。在這場力“民主化”運動中,成千上萬的微型智
    的頭像 發(fā)表于 05-12 14:42 ?391次閱讀
    維諦技術(shù):AI普惠浪潮下,如何打造新一代<b class='flag-5'>算</b>力中樞?

    Deepseek橫空出世!中美AI之間的差距逆轉(zhuǎn)了嗎?

    DeepSeek橫空出世確實在中美AI競爭中引起了巨大反響,但要判斷中美AI之間的差距是否因此逆轉(zhuǎn),還需從多個維度進(jìn)行深入分析。 一、技術(shù)性能與成本 DeepSeek以其卓越的性能和低廉的成本
    的頭像 發(fā)表于 04-15 18:14 ?386次閱讀

    思爾與玄鐵合作IP評測,加速RISC-V生態(tài)發(fā)展

    引言隨著近來Deepseek橫空出世,降低力需求,為RISC-V帶來了更多的創(chuàng)新機遇。RISC-V計算架構(gòu)搭乘上AI時代的快車,成為新一
    的頭像 發(fā)表于 04-09 09:24 ?479次閱讀
    思爾<b class='flag-5'>芯</b>與玄鐵合作IP評測,加速RISC-V生態(tài)發(fā)展

    DeepSeek在昇騰上的模型部署的常見問題及解決方案

    2024年12月26日,DeepSeek-V3橫空出世,以其卓越性能備受矚目。該模型發(fā)布即支持昇騰,用戶可在昇騰硬件和MindIE推理引擎上實現(xiàn)高效推理,但在實際操作中,部署流程與常見問題困擾著不少
    的頭像 發(fā)表于 03-25 16:53 ?869次閱讀
    <b class='flag-5'>DeepSeek</b>在昇騰上的模型部署的常見問題及解決方案

    人工智能與物聯(lián)網(wǎng)深度融合重新詮釋“萬物互聯(lián)”

    ChatGPT的橫空出世,到DeepSeek在全球范圍引發(fā)轟動,再到如今Manus的爆火,這些大型模型猶如巨石投入平靜湖面,激起層層漣漪,持續(xù)攪動著人工智能領(lǐng)域的“一池春水”。
    的頭像 發(fā)表于 03-21 14:28 ?608次閱讀

    DeepSeek大模型如何推動“AI+物流”融合創(chuàng)新

    在人工智能技術(shù)的迭代浪潮中,大模型(Large Language Models, LLM)正從文本生成、圖像創(chuàng)作走向垂直行業(yè)賦能。2025年新年,國產(chǎn) AI 大模型 DeepSeek 橫空出世,憑借其低成本、高精度和多模態(tài)能力,迅速成為“新晉網(wǎng)紅”,并在各行各業(yè)引發(fā)廣泛討
    的頭像 發(fā)表于 02-28 16:36 ?680次閱讀

    研華邊緣AI平臺測試DeepSeek蒸餾版模型的最新數(shù)據(jù)

    隨著Deepseek大模型的橫空出世,預(yù)計對整個工業(yè)領(lǐng)域會產(chǎn)生顛覆性的影響力,尤其針對邊緣部署部分獨創(chuàng)動態(tài)剪枝與量化技術(shù),DeepSeek大模型支持在邊緣設(shè)備低功耗運行(最低適配5 TOPS
    的頭像 發(fā)表于 02-24 10:40 ?850次閱讀
    研華邊緣AI平臺測試<b class='flag-5'>DeepSeek</b>蒸餾版模型的最新數(shù)據(jù)

    華為推出昇騰DeepSeek大模型一體機

    DeepSeek大模型的橫空出世,讓AI正以前所未有的速度重塑各行各業(yè)的發(fā)展格局。昇騰DeepSeek一體機深度融合昇騰高性能力底座與
    的頭像 發(fā)表于 02-18 09:56 ?2051次閱讀

    【實測】用全志A733平板搭建一個端側(cè)Deepseek力平臺

    ? 隨著DeepSeek 的蒸餾技術(shù)的橫空出世,端側(cè) SoC 芯片上運行大模型成為可能。那么端側(cè)芯片跑大模型的效果如何呢?本文將在全志 A733 芯片平臺上部署一個 DeepSeek-R1:1.5B
    發(fā)表于 02-13 10:19

    利用全志A733平板構(gòu)建端側(cè)DeepSeek力平臺

    隨著DeepSeek 的蒸餾技術(shù)的橫空出世,端側(cè) SoC 芯片上運行大模型成為可能。那么端側(cè)芯片跑大模型的效果如何呢?本文將在全志 A733 芯片平臺上部署一個 DeepSeek-R1:1.5B
    的頭像 發(fā)表于 02-13 10:18 ?861次閱讀
    利用全志A733平板構(gòu)建端側(cè)<b class='flag-5'>DeepSeek</b><b class='flag-5'>算</b>力平臺

    如何在MATLAB中使用DeepSeek模型

    DeepSeek-R1(https://github.com/deepseek-ai/DeepSeek-R1) AI 模型橫空出世后,人們幾乎就立馬開始詢問如何在 MATLAB 中
    的頭像 發(fā)表于 02-13 09:20 ?3384次閱讀
    如何在MATLAB中使用<b class='flag-5'>DeepSeek</b>模型

    DeepSeek如何成為黑馬,打造國產(chǎn)力閉環(huán)

    在 2025 年春節(jié)期間,科技圈殺出一匹黑馬“DeepSeek”,其迅速火爆全網(wǎng),成為眾人熱議的焦點;回溯過往,人工智能領(lǐng)域能引發(fā)如此廣泛關(guān)注與熱議的現(xiàn)象,或?qū)⒆匪葜?ChatGPT 橫空出世之際
    的頭像 發(fā)表于 02-08 11:12 ?708次閱讀
    <b class='flag-5'>DeepSeek</b>如何成為黑馬,打造國產(chǎn)<b class='flag-5'>算</b>力閉環(huán)

    動力神速適配DeepSeek-R1大模型,AI芯片設(shè)計邁入“快車道”!

    近期,國產(chǎn)大模型 DeepSeek-R1橫空出世,迅速成為AI領(lǐng)域的焦點。 動力在24小時內(nèi)完成了與DeepSeek-R1大模型的適配。 Deep
    的頭像 發(fā)表于 02-07 16:55 ?633次閱讀
    <b class='flag-5'>芯</b>動力神速適配<b class='flag-5'>DeepSeek</b>-R1大模型,AI芯片設(shè)計邁入“快車道”!