99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD與Nvidia的人工智能芯片之戰(zhàn)

SSDFans ? 來(lái)源:hpcwire ? 2024-01-16 11:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AMD和Nvidia陷入了一場(chǎng)人工智能性能之戰(zhàn)——就像兩家公司幾十年來(lái)在游戲GPU性能上的競(jìng)爭(zhēng)一樣。

AMD聲稱其新的Instinct MI300X GPU是世界上最快的人工智能芯片,擊敗了Nvidia炙手可熱的H100和即將推出的H200 GPU。AMDCEO Lisa Su最近在一個(gè)人工智能活動(dòng)上發(fā)表演講時(shí)表示:“這是世界上性能最高的生成式人工智能加速器?!?/p>

這標(biāo)志著MI300X的正式推出,它是MI300A的一個(gè)更強(qiáng)大的版本,將用于Lawrence Livermore國(guó)家實(shí)驗(yàn)室建造的代號(hào)為El Capitan的200億次超級(jí)計(jì)算機(jī)。

MI300X基于CDNA3架構(gòu),可為FP16和BFLoat16等關(guān)鍵AI數(shù)據(jù)類型提供三倍以上的性能。該芯片有1530億個(gè)晶體管,采用3D封裝;內(nèi)部使用了5納米和6納米工藝制造的芯片模塊。該芯片擁有304個(gè)GPU計(jì)算單元,192GB HBM3內(nèi)存,5.3 TB/s內(nèi)存帶寬。

MI300X的峰值FP32性能為163.4 teraflops,峰值FP64性能為81.7 teraflops。上一代MI250X的峰值單精度(FP32)矢量和雙精度(FP64)矢量性能為47.9 teraflops。AMD還將其芯片與H100的SXM版本進(jìn)行了比較,Nvidia H100 SXM可提供68 teraflops的峰值FP32性能和34 teraflops的FP64性能。H100 NVL模型在性能上縮小了差距,可提供134teraflops的FP32性能和68teraflops的FP64性能。

Nvidia即將推出的H200是H100的內(nèi)存升級(jí)版本,但內(nèi)存和帶寬仍然比MI300X少。H200的GPU內(nèi)存為141GB,帶寬為4.8TB/s。

“對(duì)于MI300X,我們?cè)黾恿烁蟮撵`活性、更大的內(nèi)存容量和更大的帶寬。這意味著它的內(nèi)存容量是競(jìng)爭(zhēng)對(duì)手的2.4倍,內(nèi)存帶寬是1.6倍?!盨u將MI300X與Nvidia的H100 SXM型號(hào)進(jìn)行了比較,后者具有80GB的HBM內(nèi)存和3.35TB/s的內(nèi)存帶寬。two-pieceH100 NVL型號(hào)的HBM3內(nèi)存為188GB,但內(nèi)存帶寬為7.8TB/s,超過(guò)了MI300X。

AMD能保持這個(gè)頭銜多久還有待觀察。Nvidia正計(jì)劃對(duì)其芯片進(jìn)行年度升級(jí),新的B100 GPU將于2024年推出,X100 GPU將于2025年推出。

AMD在短短一年的時(shí)間里取得了長(zhǎng)足的進(jìn)步。一年前,當(dāng)ChatGPT出現(xiàn)時(shí),AMD措手不及。聊天機(jī)器人推動(dòng)Nvidia成長(zhǎng)為一家價(jià)值數(shù)萬(wàn)億美元的公司,A100和H100 GPU成為最熱門(mén)的科技資產(chǎn)。

GPT-4背后的Nvidia硬件憑借一己之力推動(dòng)了人工智能的采用,并且仍然是無(wú)可爭(zhēng)議的人工智能冠軍。但Nvidia的硬件短缺促使客戶尋找替代品,并為AMD提供了一個(gè)展示其最新GPU和系統(tǒng)的機(jī)會(huì),成為一個(gè)可行的替代品。除了Nvidia,AMD在市場(chǎng)上也有很多機(jī)會(huì)。

Su表示:“我們現(xiàn)在預(yù)計(jì),數(shù)據(jù)中心加速器TAM在未來(lái)四年中將以每年超過(guò)70%的速度增長(zhǎng),到2027年將超過(guò)4000億美元?!?/p>

MI300X芯片有1530億個(gè)晶體管,有12個(gè)5納米和6納米芯片。“它使用了世界上最先進(jìn)的封裝?!盡I300X在基礎(chǔ)層有四個(gè)IO芯片。每個(gè)IO芯片都有256兆字節(jié)的 Infinity Cache 和下一代IO,如128通道HBM3接口,支持PCIe Gen5,以及連接多個(gè)MI300X的第四代Infinity Fabric。該芯片在IO芯片上堆疊了8個(gè)CDNA3加速器小芯片。304個(gè)計(jì)算單元通過(guò)密集的TSV連接。支持高達(dá)每秒17TB的帶寬。該芯片連接了8層HBM3,總共有192GB的內(nèi)存和5.3 TB/s的帶寬。

云供應(yīng)商微軟、甲骨文和Meta已經(jīng)在他們的云基礎(chǔ)設(shè)施中部署了MI300X GPU,盡管這些公司的人工智能能力主要還是來(lái)自Nvidia的芯片。提供人工智能替代方案的云供應(yīng)商是很普遍的,如亞馬遜提供了各種選擇,包括其新發(fā)布的Trainium2芯片和英特爾的Gaudi處理器。其意圖也很明確:讓客戶有更多的選擇,不必屈服于NvidiaH100芯片的天價(jià)。

微軟CEO Kevin Scott在AMD活動(dòng)臺(tái)上表示:“現(xiàn)在看到GPT-4在MI300X上的應(yīng)用,看到Llama的表現(xiàn),并讓它投入生產(chǎn),令人非常興奮。”甲骨文云也將MI300X放入其云服務(wù)中。它還與Naveen Rao等早期采用者合作,后者的人工智能服務(wù)公司MosaicML最近被Databricks以13億美元收購(gòu)。

據(jù)HPCwire報(bào)道,一家新的云服務(wù)公司TensorWave將在2024年推出一種新的可擴(kuò)展和適應(yīng)性強(qiáng)的GPU架構(gòu)。基于GigaIO FabreX可組合PCIe技術(shù),TensorNODE系統(tǒng)將支持多達(dá)5,760個(gè)Instinct MI300X GPU,并為所有GPU提供單個(gè)FabreX內(nèi)存結(jié)構(gòu)域。

AMD緊隨Nvidia的腳步,也宣布了自己的服務(wù)器架構(gòu),展示了一個(gè)兼容開(kāi)放計(jì)算項(xiàng)目的服務(wù)器設(shè)計(jì),其中包含8個(gè)MI300X GPU,這些GPU通過(guò)Infinity Fabric相互連接。該板可以放入任何兼容OCP的開(kāi)放藍(lán)圖中,客戶可以在其上構(gòu)建服務(wù)器。

“我們這么做是經(jīng)過(guò)深思熟慮的。我們想讓客戶盡可能容易地采用它,這樣你就可以把主板拿出來(lái),放入MI300X Instinct平臺(tái)。”這樣的系統(tǒng)建造起來(lái)會(huì)更便宜,讓客戶可以靈活地以最優(yōu)惠的價(jià)格購(gòu)買硬件。與Nvidia相比,這是一種截然不同的方法,Nvidia的HGX系統(tǒng)基于專有架構(gòu),成本很高。

AMD讓MI300X兼容OCP的計(jì)劃已經(jīng)取得了成效,Meta快速部署了帶有該GPU的服務(wù)器。Meta高級(jí)工程總監(jiān)Ajit Mathews表示:“MI300X利用了OCP模塊、標(biāo)準(zhǔn)和平臺(tái),這有助于我們極短的時(shí)間內(nèi)采用它。事實(shí)上,MI300X是Meta歷史上最快的部署解決方案之一?!?/p>

AMD對(duì)硬件的關(guān)注破壞了該公司的人工智能軟件戰(zhàn)略,該戰(zhàn)略落后于提供CUDA開(kāi)發(fā)框架的Nvidia。CUDA的支持幫助推動(dòng)了NvidiaGPU的廣泛采用。

該公司即將發(fā)布下一代ROCm 6,并聲稱具有新的功能和性能優(yōu)勢(shì)。開(kāi)發(fā)者George Hotz曾批評(píng)AMD缺乏軟件支持、文檔以及對(duì)GPU開(kāi)發(fā)者的支持回應(yīng)。AMD總裁彭于平表示,與上一代版本相比,ROCm 6的MI300X性能提高了8倍。

對(duì)于具有700億個(gè)參數(shù)的大型語(yǔ)言模型,ROCm6比MI300X快8倍,比MI250快8倍。ROCm 6框架將支持新的數(shù)據(jù)類型,包括FP16,這將提高性能并開(kāi)放內(nèi)存資源和帶寬。該框架還將進(jìn)行許多低層次優(yōu)化,以獲得更好的AI性能。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5587

    瀏覽量

    136352
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106373
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4945

    瀏覽量

    131228
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49014

    瀏覽量

    249416
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1589

    瀏覽量

    9099

原文標(biāo)題:AMD MI300X GPU能否擊敗Nvidia H200?

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    開(kāi)售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴(kuò)展/重力感應(yīng)/RS232/RS485/IO 擴(kuò)展/I2C 擴(kuò)展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個(gè)全新八核擁有超強(qiáng)性能的人工智能
    發(fā)表于 04-23 10:55

    Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺(tái),加速企業(yè)人工智能應(yīng)用

    -Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺(tái),加速企業(yè)人工智能應(yīng)用 Cognizant將在關(guān)鍵增長(zhǎng)領(lǐng)域提供解決方案,包括企業(yè)級(jí)AI智能體、定制化行業(yè)大型語(yǔ)言模型及搭載
    的頭像 發(fā)表于 03-26 14:42 ?314次閱讀
    Cognizant將與<b class='flag-5'>NVIDIA</b>合作部署神經(jīng)<b class='flag-5'>人工智能</b>平臺(tái),加速企業(yè)<b class='flag-5'>人工智能</b>應(yīng)用

    荷蘭與英偉達(dá)、AMD商討共建人工智能設(shè)施

    荷蘭政府正在積極尋求與全球領(lǐng)先的科技公司英偉達(dá)和AMD的合作,共同推動(dòng)荷蘭人工智能設(shè)施的建設(shè)與發(fā)展。 據(jù)荷蘭政府官方網(wǎng)站的消息,荷蘭經(jīng)濟(jì)事務(wù)大臣迪爾克·貝爾亞爾茨于近日對(duì)美國(guó)硅谷進(jìn)行了訪問(wèn),期間
    的頭像 發(fā)表于 01-10 13:36 ?740次閱讀

    蘋(píng)果或與博通攜手研發(fā)人工智能芯片

    據(jù)消息人士透露,蘋(píng)果公司正在與博通公司攜手研發(fā)一款人工智能芯片,并計(jì)劃于2026年啟動(dòng)生產(chǎn)。蘋(píng)果的高級(jí)機(jī)器學(xué)習(xí)和人工智能總監(jiān)Benoit Dupin最近表示,該公司正在考慮使用亞馬遜最新的人工
    的頭像 發(fā)表于 12-12 14:01 ?565次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    嵌入式和人工智能究竟是什么關(guān)系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設(shè)備或機(jī)器中,以實(shí)現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強(qiáng)的適應(yīng)性和靈活性,能夠根據(jù)用戶需求進(jìn)行定制化設(shè)計(jì)。它廣泛應(yīng)用于各種
    發(fā)表于 11-14 16:39

    Untether發(fā)布人工智能(AI)芯片

    初創(chuàng)企業(yè)Untether發(fā)布了一款專為汽車、農(nóng)業(yè)裝備及極端環(huán)境AI應(yīng)用設(shè)計(jì)的人工智能(AI)芯片。   相較于英偉達(dá)和AMD的旗艦AI芯片,它們主要服務(wù)于需要數(shù)千乃至數(shù)萬(wàn)個(gè)
    的頭像 發(fā)表于 10-29 13:59 ?831次閱讀

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書(shū),特此來(lái)分享。感謝平臺(tái),感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細(xì)
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個(gè)閱讀此書(shū)的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和深遠(yuǎn)影響。在
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    周末收到一本新書(shū),非常高興,也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。 這是一本挺好的書(shū),包裝精美,內(nèi)容詳實(shí),干活滿滿。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》這本書(shū)的第一章,作為整個(gè)著作的開(kāi)篇
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    長(zhǎng)時(shí)間運(yùn)行或電池供電的設(shè)備尤為重要。 高性能 : 盡管RISC-V架構(gòu)以低功耗著稱,但其高性能也不容忽視。通過(guò)優(yōu)化指令集和處理器設(shè)計(jì),RISC-V可以在處理復(fù)雜的人工智能圖像處理任務(wù)時(shí)表現(xiàn)出色。 三
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問(wèn)下哪些比較容易學(xué) 不過(guò)好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    人工智能ai4s試讀申請(qǐng)

    目前人工智能在繪畫(huà)對(duì)話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題,本書(shū)對(duì)ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會(huì)材料??茨芊裼兄谌腴T(mén)和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    芯片設(shè)計(jì)的自動(dòng)化水平、優(yōu)化半導(dǎo)體制造和封測(cè)的工藝和水平、尋找新一代半導(dǎo)體材料等方面提供幫助。 第6章介紹了人工智能在化石能源科學(xué)研究、可再生能源科學(xué)研究、能源轉(zhuǎn)型三個(gè)方面的落地應(yīng)用。 第7章從環(huán)境監(jiān)測(cè)
    發(fā)表于 09-09 13:54

    報(bào)名開(kāi)啟!深圳(國(guó)際)通用人工智能大會(huì)將啟幕,國(guó)內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國(guó)際)通用人工智能大會(huì)暨深圳(國(guó)際)通用人工智能產(chǎn)業(yè)博覽會(huì)將在深圳國(guó)際會(huì)展中心(寶安)舉辦。大會(huì)以“魅力AI·無(wú)限未來(lái)”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過(guò)程加速:FPGA可以用來(lái)加速深度學(xué)習(xí)的訓(xùn)練和推理過(guò)程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05