99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

不只是GPU,內(nèi)存廠商們的AI野望

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2023-09-01 00:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在諸多云服務(wù)廠商或互聯(lián)網(wǎng)廠商一頭扎進(jìn)GPU的瘋搶潮后,不少公司也發(fā)現(xiàn)了限制AI大模型性能或是成本消耗的除了GPU以外,還有內(nèi)存。內(nèi)存墻作為橫亙?cè)贏I計(jì)算和HPC更進(jìn)一步的阻礙之一,在計(jì)算量井噴的今天,已經(jīng)變得愈發(fā)難以忽視。所以,在今年的HotChips大會(huì)上,內(nèi)存廠商們也競(jìng)相展示自己的內(nèi)存技術(shù)在AI計(jì)算上的優(yōu)勢(shì)。

三星

三星作為最早一批開始跟進(jìn)存內(nèi)計(jì)算的公司,早在兩年前的HotChips33上,就展示了HBM2-PIM的技術(shù)Aquabolt-XL。三星在去年底展示了用PIM內(nèi)存和96個(gè)AMD Instinct MI100 GPU組建的大規(guī)模計(jì)算系統(tǒng),并宣稱這一配置將AI訓(xùn)練的速度提高了近2.5倍。

而今年的HotChips上,三星也著重點(diǎn)明了PIM和PNM技術(shù)在生成式AI這類熱門應(yīng)用上的優(yōu)勢(shì)。三星認(rèn)為在ChatGPT、GPT-3之類的應(yīng)用中,主要瓶頸出現(xiàn)在生成階段的線性層上,這是因?yàn)镚PU受到了內(nèi)存限制且整個(gè)過程是線性順序進(jìn)行的。

在三星對(duì)GPT的分析中,其主要由概括和生成兩大負(fù)載組成,其中概括考驗(yàn)的是計(jì)算單元的性能,而生成則考驗(yàn)的是內(nèi)存的性能。而生成占據(jù)了絕大多數(shù)的運(yùn)算次數(shù)和耗時(shí),其中占據(jù)了60%到80%延遲的GEMV(矩陣向量操作)也就成了三星試圖用PIM和PNM攻克的目標(biāo)。

根據(jù)三星的說法,像GPT這類Transformer架構(gòu)的模型,都可以將多頭注意力(MHA)和前饋神經(jīng)網(wǎng)絡(luò)(FFN)完全交給PIM或PNM,完全利用他們的所有帶寬,從而減少在推理上所花費(fèi)的時(shí)間和能耗。三星也在單個(gè)AMD MI100-PIM的GPU上進(jìn)行了試驗(yàn),得出運(yùn)行GPT模型時(shí),在HBM-PIM的輔助下,能效是GPU搭配傳統(tǒng)HBM的兩倍,性能同樣提升至兩倍以上。

wKgZomTwaRqAN2Y0AAEQ1l7kLeE723.jpg
LPDDR-PIM概念 / 三星

除了HBM-PIM外,這次三星還展示了最新的LPPDR-PIM概念。除了云端生成式AI需要存內(nèi)計(jì)算的輔助外,諸如智能手機(jī)這樣的端側(cè)生成式AI概念也被炒起來,所以LPPDR-PIM這樣的存內(nèi)計(jì)算技術(shù),可以進(jìn)一步保證續(xù)航的同時(shí),也不會(huì)出現(xiàn)為了帶寬內(nèi)存使用超量的情況。

SK海力士

另一大韓國(guó)內(nèi)存巨頭SK海力士也沒有閑著,在本次HotChips大會(huì)上,他們展示了自己的AiM存內(nèi)加速器方案。相較三星而言,他們?yōu)樯墒紸I的推理負(fù)載準(zhǔn)備的是基于GDDR6的存內(nèi)計(jì)算方案。

GDDR6-AiM采用了1y的制造工藝,具備512GB/s內(nèi)部帶寬的同時(shí),也具備32GB/s的外部帶寬。且GDDR6-AiM具備頻率高達(dá)1GHz的處理單元,算力可達(dá)512GFLOPS。GDDR6-AiM的出現(xiàn),為存內(nèi)進(jìn)行GEMV計(jì)算提供了端到端的加速方案,比如乘法累加和激活函數(shù)等操作都可以在內(nèi)存bank內(nèi)同時(shí)進(jìn)行,單條指令實(shí)現(xiàn)全bank操作提供更高的計(jì)算效率。

同時(shí),SK海力士也已經(jīng)考慮到了AiM的擴(kuò)展性問題,比如單個(gè)AiM卡中集成了8個(gè)AiM封裝,也就是8GB的容量和256個(gè)處理單元。但這類擴(kuò)展方案最大的問題還是在軟件映射、硬件架構(gòu)和接口上,這也是絕大多數(shù)集成存內(nèi)計(jì)算的新式內(nèi)存面臨的問題。

wKgaomTwaSaAfbrEAAGKrRvOuwQ093.jpg
AiM系統(tǒng)擴(kuò)展性驗(yàn)證Demo / SK海力士


而SK海力士已經(jīng)給出了這方面的解決方案,比如專門針對(duì)AiM的Tiling、基于AiM架構(gòu)的控制器、路由和ALU等等。他們還展示了在兩個(gè)FPGA上結(jié)合GDDR6-AiM的Demo,以及用于LLM推理的軟件棧。與此同時(shí),他們也還在探索AiM的下一代設(shè)計(jì),比如如何實(shí)現(xiàn)更高的內(nèi)存容量,用于應(yīng)對(duì)更加龐大的模型。

寫在最后

無論是三星還是SK海力士都已經(jīng)在存內(nèi)計(jì)算領(lǐng)域耕耘多年,此次AI熱來勢(shì)洶洶,也令他們研發(fā)速度進(jìn)一步提快。畢竟如今能夠解決大模型訓(xùn)練與推理的耗時(shí)與TCO的硬件持續(xù)大賣,如果存內(nèi)計(jì)算產(chǎn)品商業(yè)化量產(chǎn)落地進(jìn)展順利,且確實(shí)能為AI計(jì)算帶來助力的話,很可能會(huì)小幅提振如今略微萎縮的內(nèi)存市場(chǎng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4938

    瀏覽量

    131193
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    CPU\GPU引領(lǐng),國(guó)產(chǎn)AI PC進(jìn)階

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)當(dāng)前AI PC已經(jīng)成為PC產(chǎn)業(yè)的下一個(gè)浪潮,國(guó)產(chǎn)CPU、GPU廠商在PC市場(chǎng)一直處于追趕態(tài)勢(shì),AI PC給了大家新的機(jī)遇,在這個(gè)賽道國(guó)產(chǎn)
    的頭像 發(fā)表于 09-01 02:15 ?5656次閱讀
    CPU\<b class='flag-5'>GPU</b>引領(lǐng),國(guó)產(chǎn)<b class='flag-5'>AI</b> PC進(jìn)階

    既是工具人也是情緒搭子,INDEMIND助力打造陪伴機(jī)器人新范式!

    陪伴機(jī)器人,不只是玩具!
    的頭像 發(fā)表于 06-20 16:39 ?152次閱讀

    安全地毯不只是地毯,它是你的第二道保險(xiǎn)

    保護(hù)裝置
    jf_18500570
    發(fā)布于 :2025年02月15日 10:42:13

    AI“神助攻”!又一家國(guó)產(chǎn)GPU廠商啟動(dòng)IPO,數(shù)量增至5家

    電子發(fā)燒友網(wǎng)綜合報(bào)道,前段時(shí)間已有三家GPU廠商相繼辦理備案登記,啟動(dòng)A股IPO進(jìn)程,包括壁仞科技、摩爾線程、沐曦,還有AI算力芯片廠商燧原科技。如今又有一家
    發(fā)表于 02-12 01:21 ?996次閱讀
    <b class='flag-5'>AI</b>“神助攻”!又一家國(guó)產(chǎn)<b class='flag-5'>GPU</b><b class='flag-5'>廠商</b>啟動(dòng)IPO,數(shù)量增至5家

    NVIDIA和GeForce RTX GPU專為AI時(shí)代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時(shí)代打造。
    的頭像 發(fā)表于 01-06 10:45 ?656次閱讀

    GPU是如何訓(xùn)練AI大模型的

    AI模型的訓(xùn)練過程中,大量的計(jì)算工作集中在矩陣乘法、向量加法和激活函數(shù)等運(yùn)算上。這些運(yùn)算正是GPU所擅長(zhǎng)的。接下來,AI部落小編帶您了解GPU是如何訓(xùn)練
    的頭像 發(fā)表于 12-19 17:54 ?731次閱讀

    PON不只是破網(wǎng)那么簡(jiǎn)單

    大家有沒有在網(wǎng)絡(luò)卡頓的時(shí)候,心里默默吐槽“這破網(wǎng)”?今天要聊的PON(Passive Optical Network,無源光網(wǎng)絡(luò)),可不是你心里那個(gè)“破”網(wǎng),而是網(wǎng)絡(luò)世界中的超級(jí)英雄家族——PON。 ? 別急,我知道你在想什么,這聽起來可能有點(diǎn)枯燥,但相信我,這絕對(duì)比你想象的要有趣得多! 1 PON,網(wǎng)絡(luò)界的“超級(jí)英雄” PON,是指利用點(diǎn)對(duì)多點(diǎn)拓?fù)浜头止馄鲗?shù)據(jù)從單個(gè)傳輸點(diǎn)傳送到多個(gè)用戶端點(diǎn)的光纖網(wǎng)絡(luò),由OLT(Optical Line Terminal,光線路終端),ONU(Optical Net
    的頭像 發(fā)表于 12-04 09:08 ?890次閱讀
    PON<b class='flag-5'>不只是</b>破網(wǎng)那么簡(jiǎn)單

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    對(duì)卷積核優(yōu)化的思考。 GPU的存儲(chǔ)體系采用了獨(dú)特的倒金字塔結(jié)構(gòu),在我看來這是其計(jì)算性能的關(guān)鍵。大容量寄存器設(shè)計(jì)破解了傳統(tǒng)馮諾依曼架構(gòu)的內(nèi)存瓶頸,合并訪存機(jī)制巧妙解決了內(nèi)存帶寬限制。NVIDIA
    發(fā)表于 11-24 17:12

    為什么ai模型訓(xùn)練要用gpu

    GPU憑借其強(qiáng)大的并行處理能力和高效的內(nèi)存系統(tǒng),已成為AI模型訓(xùn)練不可或缺的重要工具。
    的頭像 發(fā)表于 10-24 09:39 ?954次閱讀

    科技云報(bào)到:大模型時(shí)代下,向量數(shù)據(jù)庫的野望

    科技云報(bào)到:大模型時(shí)代下,向量數(shù)據(jù)庫的野望
    的頭像 發(fā)表于 10-14 17:18 ?536次閱讀

    三星電子HBM3E內(nèi)存獲英偉達(dá)認(rèn)證,加速AI GPU市場(chǎng)布局

    為英偉達(dá)H200系列AI GPU的首選內(nèi)存解決方案,同時(shí),針對(duì)英偉達(dá)Blackwell系列的驗(yàn)證工作也在緊鑼密鼓地進(jìn)行中,預(yù)示著雙方合作的進(jìn)一步深化。
    的頭像 發(fā)表于 09-05 17:15 ?1036次閱讀

    精密空調(diào)—不只是溫度和濕度,精密空調(diào)的空氣過濾也很硬核#精密空調(diào)

    精密空調(diào)
    北京匯智天源
    發(fā)布于 :2024年08月12日 19:35:31

    不只是前端,后端、產(chǎn)品和測(cè)試也需要了解的瀏覽器知識(shí)(二)

    繼上篇《 不只是前端,后端、產(chǎn)品和測(cè)試也需要了解的瀏覽器知識(shí)(一)》介紹了瀏覽器的基本情況、發(fā)展歷史以及市場(chǎng)占有率。 本篇文章將介紹瀏覽器基本原理。 在掌握基本原理后,通過技術(shù)深入,在研發(fā)
    的頭像 發(fā)表于 08-12 14:32 ?661次閱讀
    <b class='flag-5'>不只是</b>前端,后端、產(chǎn)品和測(cè)試也需要了解的瀏覽器知識(shí)(二)

    AI戰(zhàn)略構(gòu)建與商業(yè)落地:Andreas Weigend大師課在上海圓滿落幕!

    的專業(yè)人士深入探討了人工智能(AI)的前沿科技和商業(yè)應(yīng)用。 Weigend博士在交流會(huì)上指出,社交數(shù)據(jù)革命與AI的結(jié)合正在重塑我們的數(shù)字化生活,他強(qiáng)調(diào)了數(shù)據(jù)作為AI基礎(chǔ)的重要性,并提出了數(shù)據(jù)安全和隱私保護(hù)的緊迫性。他提到:“數(shù)據(jù)
    的頭像 發(fā)表于 07-18 11:18 ?2092次閱讀
    <b class='flag-5'>AI</b>戰(zhàn)略構(gòu)建與商業(yè)落地:Andreas Weigend大師課在上海圓滿落幕!