99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

鄭緯民院士:內(nèi)存型長(zhǎng)記憶存儲(chǔ)以存換算是AI推理新趨勢(shì)

要長(zhǎng)高 ? 2024-11-01 16:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在10月29日由中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)舉辦的數(shù)據(jù)存儲(chǔ)專業(yè)委員會(huì)(簡(jiǎn)稱“數(shù)據(jù)存儲(chǔ)專委會(huì)”)成立大會(huì)上,匯聚了產(chǎn)業(yè)界代表、專委會(huì)成員及多位院士專家,共逾百人,共同探討了數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)的發(fā)展,并見(jiàn)證了數(shù)據(jù)存儲(chǔ)專業(yè)委員會(huì)的正式成立。會(huì)上,中國(guó)工程院院士、數(shù)據(jù)存儲(chǔ)專委會(huì)名譽(yù)會(huì)長(zhǎng)鄭緯民發(fā)表了題為“AI存儲(chǔ):人工智能大模型的基石”的主旨演講。

鄭緯民院士指出,人工智能進(jìn)入大模型時(shí)代展現(xiàn)出兩大特征:一是基礎(chǔ)大模型邁入多模態(tài)時(shí)代,實(shí)現(xiàn)了從單一文本到圖片、視頻等多模態(tài)信息的綜合應(yīng)用;二是大模型已在金融、醫(yī)療、智能制造等多個(gè)領(lǐng)域得到實(shí)際應(yīng)用。

針對(duì)大模型的四個(gè)關(guān)鍵環(huán)節(jié),鄭緯民院士詳細(xì)闡述了存儲(chǔ)在大模型訓(xùn)練和推理應(yīng)用中所面臨的挑戰(zhàn)及相關(guān)技術(shù):

首先,數(shù)據(jù)獲取階段,大模型訓(xùn)練需要海量的原始數(shù)據(jù),這些數(shù)據(jù)需被存儲(chǔ)設(shè)備妥善保存。隨著大模型從單模態(tài)向多模態(tài)發(fā)展,產(chǎn)生了數(shù)以百億計(jì)的小文件,這對(duì)文件系統(tǒng)的目錄擴(kuò)展性、讀寫(xiě)速度以及存儲(chǔ)的低延遲和高可擴(kuò)展性提出了更高要求。

其次,數(shù)據(jù)預(yù)處理階段,由于原始數(shù)據(jù)質(zhì)量參差不齊,存在大量重復(fù)和低質(zhì)量數(shù)據(jù),因此需要進(jìn)行預(yù)處理以提升數(shù)據(jù)質(zhì)量。以ChatGPT4級(jí)別的大模型為例,其訓(xùn)練過(guò)程可能需要1萬(wàn)塊A100顯卡耗時(shí)11個(gè)月,其中數(shù)據(jù)預(yù)處理可能占據(jù)一半以上的時(shí)間,這與數(shù)據(jù)存儲(chǔ)的性能密切相關(guān)。

再次,模型訓(xùn)練階段,大規(guī)模訓(xùn)練系統(tǒng)(如10萬(wàn)塊顯卡組成的系統(tǒng))的可靠性難以保證,頻繁出現(xiàn)故障,導(dǎo)致集群可用度低下。為了快速恢復(fù)訓(xùn)練,需要依賴高性能的存儲(chǔ)系統(tǒng)來(lái)快速讀取CheckPoint數(shù)據(jù)。華為與清華大學(xué)MADSys實(shí)驗(yàn)室聯(lián)合開(kāi)發(fā)的高性能AI存儲(chǔ)系統(tǒng)在此方面表現(xiàn)出色,曾在國(guó)際權(quán)威機(jī)構(gòu)MLPerf Storage基準(zhǔn)評(píng)測(cè)中獲得第一名,性能密度是第二名的兩倍。

最后,模型推理階段,這是與AI應(yīng)用最直接相關(guān)的環(huán)節(jié)。更高效的人工智能需要處理更多數(shù)據(jù)、使用更大模型以及更長(zhǎng)的上下文窗口,但這同時(shí)也帶來(lái)了極重的推理負(fù)載。模型參數(shù)以及推理過(guò)程中產(chǎn)生的KV-Cache需要巨大的存儲(chǔ)空間。為此,國(guó)內(nèi)優(yōu)秀的大模型應(yīng)用Kimi與清華大學(xué)MADSys實(shí)驗(yàn)室共同推出了Mooncake分離式推理架構(gòu),通過(guò)保存共享的KV-Cache,采用以存換算的策略大幅提升系統(tǒng)吞吐。

鄭緯民院士強(qiáng)調(diào),模型推理過(guò)程是一個(gè)復(fù)雜的存儲(chǔ)系統(tǒng)工程,關(guān)鍵在于存儲(chǔ)容量大、傳輸速度快以及性價(jià)比高。清華大學(xué)MADSys實(shí)驗(yàn)室聯(lián)合華為數(shù)據(jù)存儲(chǔ)、9#AISoft、阿里云、面壁、趨境等公司共同開(kāi)發(fā)的高性能內(nèi)存型長(zhǎng)記憶存儲(chǔ)系統(tǒng)即將開(kāi)源發(fā)布,該系統(tǒng)能夠?qū)崿F(xiàn)大范圍全局共享與持久化KV-Cache,以存換算,共同構(gòu)建大模型時(shí)代下的高性能內(nèi)存型長(zhǎng)記憶存儲(chǔ)系統(tǒng)生態(tài)。

最后,鄭緯民院士總結(jié)指出,AI存儲(chǔ)是人工智能大模型的基石,貫穿于大模型生命周期的每一個(gè)環(huán)節(jié)。通過(guò)以存強(qiáng)算、以存換算,先進(jìn)的AI存儲(chǔ)能夠提升訓(xùn)練集群的可用度,降低推理成本,提升用戶體驗(yàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4531

    瀏覽量

    87441
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35109

    瀏覽量

    279600
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49011

    瀏覽量

    249356
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI推理存儲(chǔ),看好SRAM?

    看到了其前景并提前布局。AI推理也使得存儲(chǔ)HBM不再是唯一熱門,更多存儲(chǔ)芯片與AI推理芯片結(jié)合,
    的頭像 發(fā)表于 03-03 08:51 ?1677次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>的<b class='flag-5'>存儲(chǔ)</b>,看好SRAM?

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    ,“全流量采集 + AI根因診斷 + 預(yù)測(cè)性運(yùn)維”為核心支柱,推動(dòng)企業(yè)網(wǎng)絡(luò)運(yùn)維模式從傳統(tǒng)的“被動(dòng)響應(yīng)”向“主動(dòng)防御”和“故障自愈”的智能化方向躍遷。 三大核心能力:AI推理引擎重塑網(wǎng)
    發(fā)表于 07-16 15:29

    【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+ 入門篇學(xué)習(xí)

    ,展現(xiàn)出高度的個(gè)性化 7.AI Agent具備4大能力:規(guī)劃、記憶、使用工具、行動(dòng) 8.短期記憶主要用于處理當(dāng)前任務(wù)與上下文;長(zhǎng)期記憶主要用于存儲(chǔ)
    發(fā)表于 05-02 09:26

    華為加速AI時(shí)代數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)發(fā)展

    近日,在華為中國(guó)合作伙伴大會(huì)2025上,華為數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰發(fā)表“共筑數(shù)智解決方案,共享數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)大發(fā)展”主題演講,深入探討如何加速AI行業(yè)化落地,并分享AI時(shí)代數(shù)據(jù)
    的頭像 發(fā)表于 04-01 15:35 ?366次閱讀

    曙光存儲(chǔ)全新升級(jí)AI存儲(chǔ)方案

    近日,曙光存儲(chǔ)全新升級(jí)AI存儲(chǔ)方案,秉持“AI加速”理念,面向AI訓(xùn)練、AI
    的頭像 發(fā)表于 03-31 11:27 ?494次閱讀

    力接棒算力,慧榮科技主控技術(shù)突破AI存儲(chǔ)極限

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)在AI的高速增長(zhǎng)下,尤其是以DeepSeek為代表的AI大模型推動(dòng)存儲(chǔ)需求激增,算力增長(zhǎng)倒逼力升級(jí)。而存儲(chǔ)
    的頭像 發(fā)表于 03-19 01:29 ?1781次閱讀
    <b class='flag-5'>存</b>力接棒算力,慧榮科技<b class='flag-5'>以</b>主控技術(shù)突破<b class='flag-5'>AI</b><b class='flag-5'>存儲(chǔ)</b>極限

    曙光存儲(chǔ)先進(jìn)力引領(lǐng)存儲(chǔ)產(chǎn)業(yè)發(fā)展

    這些觀點(diǎn)折射出存儲(chǔ)技術(shù)對(duì)國(guó)家培育新質(zhì)生產(chǎn)力的核心價(jià)值。作為國(guó)產(chǎn)存儲(chǔ)的實(shí)力代表,曙光存儲(chǔ)始終堅(jiān)持自研,先進(jìn)力引領(lǐng)
    的頭像 發(fā)表于 03-17 09:24 ?677次閱讀

    使用OpenVINO?進(jìn)行推理時(shí)的內(nèi)存泄漏怎么解決?

    使用 OpenVINO? 進(jìn)行推理時(shí),內(nèi)存會(huì)隨著時(shí)間的推移而增加,并導(dǎo)致程序崩潰。
    發(fā)表于 03-06 08:29

    使用NVIDIA推理平臺(tái)提高AI推理性能

    NVIDIA推理平臺(tái)提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬(wàn)美元。
    的頭像 發(fā)表于 02-08 09:59 ?713次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺(tái)提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    生成式AI推理技術(shù)、市場(chǎng)與未來(lái)

    OpenAI o1、QwQ-32B-Preview、DeepSeek R1-Lite-Preview的相繼發(fā)布,預(yù)示著生成式AI研究正從預(yù)訓(xùn)練轉(zhuǎn)向推理(Inference),提升AI
    的頭像 發(fā)表于 01-20 11:16 ?832次閱讀
    生成式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>技術(shù)、市場(chǎng)與未來(lái)

    科技啟動(dòng)首屆內(nèi)計(jì)算創(chuàng)新大賽

    內(nèi)計(jì)算作為一項(xiàng)打破“內(nèi)存墻”“功耗墻”的顛覆性技術(shù),消除了與算的界限,相比CPU或GPU能夠?qū)崿F(xiàn)更高計(jì)算并行度、更大專用算力,達(dá)成數(shù)量級(jí)的能效提升。在AI加速落地的
    的頭像 發(fā)表于 11-21 10:44 ?645次閱讀

    華為發(fā)布數(shù)據(jù)通信未來(lái)技術(shù)趨勢(shì)報(bào)告

    近日,CCF中國(guó)網(wǎng)絡(luò)大會(huì)(CCF ChinaNet 2024)期間,由中國(guó)計(jì)算機(jī)學(xué)會(huì)主辦的“算網(wǎng)融合·數(shù)智賦能·發(fā)展新質(zhì)生產(chǎn)力”主題論壇成功舉辦。論壇邀請(qǐng)了鄔江興、吳建平、、張宏科多位
    的頭像 發(fā)表于 11-18 11:28 ?977次閱讀

    王耀南院士AI大模型賦能人形機(jī)器人及未來(lái)趨勢(shì)

    研究現(xiàn)狀,關(guān)鍵技術(shù)賦能具身智能人形機(jī)器人,以及未來(lái)的發(fā)展趨勢(shì)與展望四個(gè)方面進(jìn)行匯報(bào)。 王院士認(rèn)為人工智能大模型推動(dòng)人形機(jī)器人在感知、認(rèn)知、思考、分析、判斷、推理、交互的智能自主作業(yè)方向發(fā)展。隨后
    的頭像 發(fā)表于 11-08 11:03 ?1617次閱讀
    王耀南<b class='flag-5'>院士</b>:<b class='flag-5'>AI</b>大模型賦能人形機(jī)器人及未來(lái)<b class='flag-5'>趨勢(shì)</b>

    面向未來(lái)數(shù)據(jù)中心的存儲(chǔ)平臺(tái)技術(shù)挑戰(zhàn)與探索

    近日,中國(guó)計(jì)算機(jī)學(xué)會(huì)第十三期CCF秀湖會(huì)議在蘇州CCF業(yè)務(wù)總部&學(xué)術(shù)交流中心正式拉開(kāi)帷幕。本次會(huì)議就“新應(yīng)用與硬件驅(qū)動(dòng)下的存儲(chǔ)技術(shù)創(chuàng)新”主題進(jìn)行深入交流和探討。中國(guó)工程院院士、清華大學(xué)
    的頭像 發(fā)表于 11-06 10:43 ?596次閱讀

    AMD助力HyperAccel開(kāi)發(fā)全新AI推理服務(wù)器

    HyperAccel 是一家成立于 2023 年 1 月的韓國(guó)初創(chuàng)企業(yè),致力于開(kāi)發(fā) AI 推理專用半導(dǎo)體器件和硬件,最大限度提升推理工作負(fù)載的存儲(chǔ)
    的頭像 發(fā)表于 09-18 09:37 ?876次閱讀
    AMD助力HyperAccel開(kāi)發(fā)全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b>服務(wù)器