99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)發(fā)布采用NVLink-C2C技術(shù)的Grace Superchip芯片

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:電子發(fā)燒友網(wǎng) ? 2022-03-26 11:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))英偉達(dá)在GTC22上發(fā)布了全新的Grace Superchip,該芯片中用到了NVLink-C2C技術(shù),而去年公開的Grace Hopper Superchip同樣用到了這一技術(shù)。根據(jù)英偉達(dá)超大規(guī)模計(jì)算部門副總裁Ian Buck的說法,Chiplet和異構(gòu)計(jì)算已經(jīng)成了解決摩爾定律緩慢進(jìn)展的兩大有效手段。而NVLink-C2C這一面向die和chip的互聯(lián)技術(shù),成了英偉達(dá)對(duì)愈發(fā)普及的Chiplet設(shè)計(jì)的回應(yīng)。

Superchip的互聯(lián)

也許在不少人看來的印象中,提到NVLink會(huì)想到下圖這個(gè)橋接多個(gè)高端顯卡或?qū)I(yè)顯卡的RTX NVLink Bridge,其實(shí)NVLink這一技術(shù)在服務(wù)器級(jí)別的GPU中反倒更為普遍。從P100的第一代NVLink,到V100的第二代NVLink,A100的第三代NVLink,最后再到如今H100的第四代NVLink。NVLink可以說是跟著GPU架構(gòu)一路推陳出新了,如今享受第四代NVLink性能的成了Hopper架構(gòu)的GPU。而在英偉達(dá)的SERDES和LINK技術(shù)發(fā)展下,NVLink也從PCB、MCM走向了硅中介層和晶圓,也因此有了NVLink-C2C。

Grace Superchip顯然用的是ARM Neoverse N2這一基于Arm v9架構(gòu)的設(shè)計(jì),但從芯片圖可以看出,單個(gè)Grace Superchip芯片由兩個(gè)Grace CPU組成,才讓總核心數(shù)達(dá)到了144。而這兩個(gè)CPU組成的方式,正是NVLink-C2C這一互聯(lián)技術(shù)。我們?cè)陂_頭已經(jīng)提到,去年公開的Grace Hopper Superchip同樣使用了這一互聯(lián)技術(shù),只不過當(dāng)時(shí)單個(gè)Grace Hopper Superchip芯片中互聯(lián)的,是一個(gè)Grace CPU和一個(gè)Hopper GPU。

NVLink-C2C為英偉達(dá)帶來的遠(yuǎn)不止這樣一對(duì)一的互聯(lián)方案,而是一整套系統(tǒng)架構(gòu)上的創(chuàng)新。在NVLink-C2C的支持下,英偉達(dá)可以選擇一個(gè)Grace CPU,兩個(gè)Hopper GPU的設(shè)計(jì),或是兩個(gè)2個(gè)Grace CPU+2個(gè)Hopper GPU,甚至是2個(gè)Grace CPU+8個(gè)Hopper GPU??梢钥闯觯琋VLink-C2C為Grace和Hopper在數(shù)據(jù)中心和HPC應(yīng)用提供了極大的擴(kuò)展性。

遠(yuǎn)超PCIe 5.0的性能

英偉達(dá)強(qiáng)調(diào),NVLink-C2C具有前所未有的性能,比如處理器與加速器之間900GB/s的高帶寬數(shù)據(jù)傳輸,以及快速同步和高頻率更新下的超低延遲,以及在先進(jìn)封裝英偉達(dá)芯片下,能效比可以做到PCIe 5.0的25倍,面積效率更是達(dá)到90倍。

NVLink-C2C 900GB/s的帶寬確實(shí)優(yōu)秀,也與第四代NVLink的性能一致,但這并不代表只要用上NVLink就能獲得,我們從Hopper架構(gòu)的GPU H100的參數(shù)上也能窺見一二。要想獲得900GB/s的帶寬性能,必須用到SXM5的大功率卡,而不是PCIe 5.0的卡,雖然前者的功耗是后者的兩倍,達(dá)到了可怕的700W,但PCIe 5.0的H100在總體性能和帶寬上確實(shí)差SXM5一截。

兩者在PCIe 5.0上的帶寬一致,都是128GB/s,但如果用上NVLink,PCIe 5.0版本的H100只能達(dá)到600GB/s的帶寬,與第三代NVLink性能一致,只有SXM5版本下的NVLink才能達(dá)到滿血的900GB/s。

另外在第四代NVLink和第三代NVSwitch技術(shù)的組合下,英偉達(dá)推出了NVLink Switch這一方案,該系統(tǒng)最多支持到256個(gè)GPU,可實(shí)現(xiàn)57.6TB/s的總帶寬。NVLink Switch也是英偉達(dá)DGX H100 SuperPOD系統(tǒng)的關(guān)鍵技術(shù),英偉達(dá)甚至把自己收購的Mellanox旗下的InfiniBand節(jié)點(diǎn)互聯(lián)技術(shù)拿來對(duì)比。從上圖可以看出與基于A100+InfiniBand的SuperPOD系統(tǒng)相比,基于H100+NVLink Switch的SuperPOD系統(tǒng)在對(duì)分帶寬上是前者的9倍。

開放而不是獨(dú)占

其實(shí)NVLink的存在最初讓不少人覺得有些一家獨(dú)大的意思,畢竟最早NVLink僅僅只是用于多個(gè)英偉達(dá)GPU之間的互聯(lián),僅僅只是為自家的產(chǎn)品提供更多優(yōu)勢(shì)而已。而去年發(fā)布的Grace Hopper Superchip同樣用到了這一技術(shù),但這顆芯片卻是英偉達(dá)設(shè)計(jì)的Arm CPU和GPU的互聯(lián)。

這讓人不禁擔(dān)心,如果英偉達(dá)真的成功收購了Arm,會(huì)不會(huì)利用這一優(yōu)勢(shì)來全面壟斷數(shù)據(jù)中心和HPC市場(chǎng)。畢竟Arm自己給出的互聯(lián)方案CMN-700支持的是CCIX 2.0和CXL 2.0這兩大標(biāo)準(zhǔn)互聯(lián)協(xié)議,同時(shí)為第三方加速器提供PCIe 5.0的連接。但就紙面參數(shù)給到的性能看來,NVLink這種專用方案似乎更加吃香一些。

不過Arm作為一家IP公司,目標(biāo)自然是支持到多樣化的加速器,從而全面發(fā)展Arm的生態(tài)。此前Arm在接受電子發(fā)燒友網(wǎng)采訪時(shí)也表示,Arm期待給市場(chǎng)帶來更多的靈活性,支持更多像Grace這樣的系統(tǒng)。

好在英偉達(dá)似乎也不打算將NVLink-C2C獨(dú)占,而是宣布開放這一技術(shù),支持集成英偉達(dá)技術(shù)的芯片半定制,通過Chiplet技術(shù)充分利用自家的GPU、DPU、NIC、CPU和SoC產(chǎn)品,與客戶的IP進(jìn)行NVLink-C2C互聯(lián)。

盡管收購失敗,英偉達(dá)與Arm的合作并沒有就此停止,英偉達(dá)也在GTC22上宣布繼續(xù)與Arm緊密合作,以支持并在未來改進(jìn)Arm的AMBA CHI協(xié)議,加上對(duì)CXL的支持,從而與更多加速器和處理器做到互聯(lián)。

與此同時(shí),在全行業(yè)群策群力,試圖打通生態(tài)的情況下,英偉達(dá)也并不打算將NVLink-C2C作為唯一的可選方案。所以除了NVLink-C2C外,集成了英偉達(dá)芯片的定制SoC也可選用前段時(shí)日公布的UCIe通用Chiplet互聯(lián)標(biāo)準(zhǔn),所以不必將數(shù)據(jù)中心上的CPU、DPU和GPU一整套都換成英偉達(dá)旗下的產(chǎn)品,給到第三方服務(wù)器芯片、DPU和加速器一個(gè)機(jī)會(huì)。不過,考慮到這兩種互聯(lián)方式只能選其一,英偉達(dá)也強(qiáng)調(diào)了NVLink-C2C經(jīng)過優(yōu)化,擁有更低的延遲、更高的帶寬和更高的能效比,該如何選擇還是看廠商自己的考量了。

原文標(biāo)題:900GB/s,NVLink才是英偉達(dá)的互聯(lián)殺手锏

文章出處:【微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52383

    瀏覽量

    439115
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4930

    瀏覽量

    130990
  • 顯卡
    +關(guān)注

    關(guān)注

    16

    文章

    2505

    瀏覽量

    69377
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3935

    瀏覽量

    93428

原文標(biāo)題:900GB/s,NVLink才是英偉達(dá)的互聯(lián)殺手锏

文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    英偉達(dá)黃仁勛:我們要做巨型芯片!最強(qiáng)顯卡RTX 5090發(fā)布,汽車芯片Thor算力翻20倍

    50 系列、AI大模型、AI機(jī)器人、超小型AI超級(jí)計(jì)算機(jī),以及英偉達(dá)的終極目標(biāo):名為Grace Blackwell NVLink72的巨型芯片
    的頭像 發(fā)表于 01-08 08:59 ?3577次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>黃仁勛:我們要做巨型<b class='flag-5'>芯片</b>!最強(qiáng)顯卡RTX 5090<b class='flag-5'>發(fā)布</b>,汽車<b class='flag-5'>芯片</b>Thor算力翻20倍

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    NVlink1.0——初代的堆疊技術(shù) 英偉達(dá)2014發(fā)布NVLink的首個(gè)版本——
    發(fā)表于 06-18 19:31

    NVIDIA Grace CPU C1獲得廣泛支持

    NVIDIA 在本周 COMPUTEX 上重點(diǎn)展示了其全新的 Grace CPU C1,并獲得多家主要原始設(shè)計(jì)制造商合作伙伴的大力支持。
    的頭像 發(fā)表于 05-22 10:01 ?243次閱讀

    NVIDIA推出NVLink Fusion技術(shù)

    NVIDIA 發(fā)布 NVIDIA NVLink Fusion,這款全新芯片將助力行業(yè)用戶通過全球領(lǐng)先且廣泛采用的計(jì)算互連架構(gòu) —— NVIDIA N
    的頭像 發(fā)表于 05-22 09:59 ?287次閱讀

    新思科技攜手英偉達(dá)加速芯片設(shè)計(jì),提升芯片電子設(shè)計(jì)自動(dòng)化效率

    解決方案在英偉達(dá) GPU和英偉達(dá) CUDA-X庫上所實(shí)現(xiàn)的加速 基于英偉達(dá) GB200
    發(fā)表于 03-19 17:59 ?262次閱讀

    新思科技亮相英偉達(dá)GTC 2025大會(huì)

    為了實(shí)現(xiàn)這一速度提升,新思科技在GTC全球AI大會(huì)上宣布,正在使用英偉達(dá) CUDA-X庫優(yōu)化其下一代半導(dǎo)體開發(fā)解決方案。公司還在擴(kuò)大對(duì)英偉達(dá)Grac
    的頭像 發(fā)表于 03-19 17:53 ?782次閱讀

    英偉達(dá)市值一夜蒸發(fā)近2萬億 英偉達(dá)股價(jià)下跌超8%

    財(cái)年第四財(cái)季和全財(cái)年業(yè)績(jī)數(shù)據(jù)上看,2025財(cái)年第四財(cái)季及全年的營收和利潤都實(shí)現(xiàn)了大幅增長,大家特別關(guān)注的數(shù)據(jù)中心業(yè)務(wù)也是業(yè)績(jī)?cè)鲩L的核心動(dòng)力,展現(xiàn)出英偉達(dá)在AI領(lǐng)域的強(qiáng)大實(shí)力。而且英偉達(dá)
    的頭像 發(fā)表于 03-04 10:19 ?553次閱讀

    英偉達(dá)帶來Reflex 2低延遲技術(shù)

    在 2025 年國際消費(fèi)電子展(CES 2025)上,英偉達(dá)不僅推出了備受矚目的 RTX 50 系列顯卡,還帶來了一項(xiàng)名為 Reflex 2 的低延遲技術(shù),引發(fā)行業(yè)廣泛關(guān)注。 Refl
    的頭像 發(fā)表于 02-05 15:15 ?909次閱讀

    英偉達(dá)CEO確認(rèn):液冷Grace Blackwell服務(wù)器無過熱問題

    近日,英偉達(dá)公司的首席執(zhí)行官(CEO)針對(duì)外界關(guān)注的液冷Grace Blackwell服務(wù)器過熱問題,發(fā)表了明確的看法。他強(qiáng)調(diào),采用液冷技術(shù)
    的頭像 發(fā)表于 11-21 11:45 ?600次閱讀

    英偉達(dá)Blackwell芯片量產(chǎn)加速,Q4預(yù)計(jì)出貨達(dá)45萬片

    摩根士丹利最新發(fā)布的報(bào)告揭示了英偉達(dá)在AI芯片領(lǐng)域的重大進(jìn)展,其最新力作Blackwell芯片已成功步入量產(chǎn)階段,預(yù)示著
    的頭像 發(fā)表于 09-27 15:02 ?1234次閱讀

    英偉達(dá)Blackwell可支持10萬億參數(shù)模型AI訓(xùn)練,實(shí)時(shí)大語言模型推理

    。 ????????????????????? 英偉達(dá)Blackwell是通用計(jì)算全棧矩陣的終極解決方案,由多個(gè)英偉達(dá)芯片組成,包括Blac
    的頭像 發(fā)表于 09-04 09:10 ?3665次閱讀

    英偉達(dá)高管解讀Q2財(cái)報(bào) 但是英偉達(dá)市值暴跌1.4萬億元

    英偉達(dá)正式發(fā)布了2025財(cái)年第二季度報(bào)告,英偉達(dá)公司在Q2營收達(dá)到了300.4億美元,這個(gè)營收超
    的頭像 發(fā)表于 08-30 13:03 ?1074次閱讀

    3萬-4萬美元/顆,英偉達(dá)最新AI芯片曝設(shè)計(jì)缺陷、延遲出貨

    Q1。 隨后,SemiAnalysis在最新研報(bào)中剖析了英偉達(dá)Blackwell B200芯片技術(shù)挑戰(zhàn),主要在合封方面。一顆Blackwell B200
    的頭像 發(fā)表于 08-06 00:19 ?4568次閱讀

    英偉達(dá)回應(yīng)AI芯片推遲發(fā)布傳聞

    近日,英偉達(dá)就外界廣泛關(guān)注的AI芯片Blackwell推遲發(fā)布傳聞作出正式回應(yīng)。8月4日,英偉達(dá)
    的頭像 發(fā)表于 08-05 17:34 ?895次閱讀