99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVLink的演進(jìn)

sakobpqhz ? 來源:算力基建 ? 2023-10-11 15:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVLink是Nvidia開發(fā)的一項(xiàng)用于GPU之間點(diǎn)對(duì)點(diǎn)高速互聯(lián)的技術(shù),其旨在突破PCIe互聯(lián)帶寬的限制,實(shí)現(xiàn)GPU芯片間低延遲、高帶寬的數(shù)據(jù)互聯(lián),使得GPU間更加高效地協(xié)同工作。在NVLink技術(shù)問世之前(2014年前),GPU之間的互聯(lián)需要通過PCIe switch來實(shí)現(xiàn),如下圖所示。GPU發(fā)出的信號(hào)需要先傳遞到PCIe switch, PCIe switch中涉及到數(shù)據(jù)的處理,CPU會(huì)對(duì)數(shù)據(jù)進(jìn)行分發(fā)調(diào)度,這些都會(huì)引入額外的網(wǎng)絡(luò)延遲,限制了系統(tǒng)性能。彼時(shí),PCIe協(xié)議已經(jīng)發(fā)展到Gen 3, 單通道的速率為8Gb/s, 16通道的總帶寬為16GB/s (128Gbps,1 Byte= 8 bits ),隨著GPU芯片性能的不斷提升,其互聯(lián)帶寬成為瓶頸。

9b8b6bce-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://en.wikichip.org/wiki/nvidia/nvlink)

2014年,NVLink 1.0發(fā)布,并應(yīng)用在P100芯片上,如下圖所示。兩顆GPU之間有4條NVlink, 每個(gè)link中包含8個(gè)lane, 每條lane的速率是20Gb/s, 因此整個(gè)系統(tǒng)的雙向帶寬為160GB/s,是PCIe3 x16帶寬的5倍。

9b95d640-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://en.wikichip.org/wiki/nvidia/nvlink)

單個(gè)NVLink內(nèi)部含有16對(duì)差分線,對(duì)應(yīng)兩個(gè)方向各8條lane的信道,如下圖所示,差分對(duì)的兩端為PHY,內(nèi)部包含SerDes。

9b9e0c0c-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://www.nextplatform.com/2016/05/04/nvlink-takes-gpu-acceleration-next-level/)

基于NVLink 1.0,可以形成4個(gè)GPU的平面mesh結(jié)構(gòu),兩兩之間形成點(diǎn)對(duì)點(diǎn)直連,而8個(gè)GPU則對(duì)應(yīng)cube-mesh,進(jìn)而可以組成DGX-1服務(wù)器,這也對(duì)應(yīng)常見的8卡配置,如下圖所示,需要注意的是,此時(shí)8個(gè)GPU并沒有形成all-to-all連接。

9bb9340a-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://developer.nvidia.com/blog/dgx-1-fastest-deep-learning-system/)

2017年,Nvidia推出了第二代NVLink技術(shù)。兩顆GPU V100之間含6條NVLink, 每個(gè)link中包含8個(gè)lane, 每條lane的速率提升到25Gb/s, 整個(gè)系統(tǒng)的雙向帶寬變?yōu)?00GB/s,帶寬是NVLink 1.0的近2倍。與此同時(shí),為了實(shí)現(xiàn)8顆GPU之間的all-to-all互聯(lián),Nvidia推出了NVSwitch技術(shù)。NVSwitch 1.0含有18個(gè)port, 每個(gè)port的帶寬為50GB/s, 整體帶寬為900GB/s。每個(gè)NVSwitch預(yù)留了兩個(gè)port, 用于連接CPU。使用6個(gè)NVSwitch即可實(shí)現(xiàn)8顆GPU V100的all-to-all連接,如下圖所示。

9bc5bac2-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://en.wikichip.org/wiki/nvidia/nvswitch)

DGX-2系統(tǒng)則采用兩個(gè)上圖中的板子構(gòu)建而成,如下圖所示,實(shí)現(xiàn)了16顆GPU芯片的all-to-all連接。

9be3b6c6-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://en.wikichip.org/wiki/nvidia/nvswitch)

2020年,NVLink 3.0技術(shù)誕生,兩顆GPU A100芯片之間存在12條NVLink, 每條NVLink含有4條lane, 單條lane的速率為50Gb/s, 因此整個(gè)系統(tǒng)的雙向帶寬提升到600GB/s,總帶寬相比NVLink 2.0提升了1倍。由于NVLink的數(shù)目增加了,NVSwitch的port數(shù)目也相應(yīng)增加到36個(gè),每個(gè)port的速率為50GB/s。由8顆GPU A100與4個(gè)NVSwitch組成了DGX A100, 如下圖所示。

9bf1ad8a-67c9-11ee-939d-92fbcf53809c.png

(圖片來自http://www.eventdrive.co.kr/2020/azwell/DGX_A100_Azwellplus.pdf)

2022年,NVLink技術(shù)升級(jí)到第四代,兩個(gè)GPU H100芯片間通過18條NVLink互聯(lián),每條link中含2條lane, 每條lane支持100Gb/s PAM4的速率,因此雙向總帶寬提升到900GB/s。NVSwitch也升級(jí)到第三代,每個(gè)NVSwitch支持64個(gè)port,每個(gè)port的速率為50GB/s。DGX H100由8顆H100芯片與4顆NVSwitch芯片構(gòu)成,如下圖所示。圖中每個(gè)NVSwitch的另一側(cè)與多個(gè)800G OSFP光模塊相連。以左側(cè)第一個(gè)NVSwitch為例,其與GPU相連側(cè)的單向總帶寬為4Tbps (20NVLink*200Gbps),與光模塊相連側(cè)的總帶寬為也為4Tbps (5*800Gbps),兩者大小相等, 是非阻塞(non-blocking)網(wǎng)絡(luò)。需要注意的是,光模塊中的帶寬是單向帶寬,而在AI芯片中一般習(xí)慣使用雙向帶寬。

9bfc58a2-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://blog.apnic.net/2023/08/10/large-language-models-the-hardware-connection/)

下表整理了每一代NVLink的指標(biāo)參數(shù)。

9c11e384-67c9-11ee-939d-92fbcf53809c.png

而PCIe每一代的參數(shù)如下表所示,

9c1af848-67c9-11ee-939d-92fbcf53809c.png

從單條lane的速率來看,NVLink整體比同一時(shí)期的PCIe的指標(biāo)高1倍左右,而總帶寬的優(yōu)勢更是明顯,NVLink是PCIe總帶寬的5倍左右。一直在超越,從未停止。

NVLink經(jīng)過近十年的發(fā)展,已經(jīng)成為Nvidia GPU芯片中的一個(gè)核心技術(shù),是其生態(tài)系統(tǒng)中的重要一環(huán),有效解決了GPU芯片之間高帶寬、低延遲的數(shù)據(jù)互聯(lián)難題,改變了傳統(tǒng)的計(jì)算架構(gòu)。但由于該技術(shù)是Nvidia獨(dú)有,其它AI芯片公司只能采用PCIe或者其它互聯(lián)協(xié)議。與此同時(shí),Nvidia正在探索利用光互連實(shí)現(xiàn)GPU之間的連接,如下圖所示,硅光芯片與GPU共封裝在一起,兩顆GPU芯片間通過光纖連接。

9c31b772-67c9-11ee-939d-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4930

    瀏覽量

    130990
  • PCIe
    +關(guān)注

    關(guān)注

    16

    文章

    1333

    瀏覽量

    84940
  • PHY
    PHY
    +關(guān)注

    關(guān)注

    2

    文章

    318

    瀏覽量

    52684

原文標(biāo)題:NVLink的演進(jìn)

文章出處:【微信號(hào):算力基建,微信公眾號(hào):算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA NVLink 深度解析

    引言 NVIDIA NVLink 是一種關(guān)鍵的高速互連技術(shù),專為加速計(jì)算而設(shè)計(jì),尤其是在多 GPU 系統(tǒng)以及 GPU 和支持 CPU 之間 ^1^。NVLink 的出現(xiàn)標(biāo)志著傳統(tǒng)互連瓶頸的突破,凸顯
    的頭像 發(fā)表于 05-06 18:14 ?1329次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    帶寬和1.8TB/s的NVLink帶寬,使處理能力翻倍,大幅增加內(nèi)存容量和帶寬,為處理大規(guī)模人工智能模型和復(fù)雜計(jì)算提供必要資源。 針對(duì)大規(guī)模模型如GPT-MoE-1.8T,HGX B200的推理性
    發(fā)表于 05-13 17:16

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    的應(yīng)用層面的工作,對(duì)于芯片底層基本原理興趣缺缺,本帖結(jié)合自己實(shí)際生活與工作中對(duì)GPU新品的應(yīng)用實(shí)例和書中內(nèi)容分享下相關(guān)見解。 NVlink的初應(yīng)用 **NVlink(SLI)**是NVIDIA公司針對(duì)
    發(fā)表于 06-18 19:31

    特斯拉V100 Nvlink是否支持v100卡的nvlink變種的GPU直通?

    /4029/SYS-4029GP-TVRT.cfm)我們正試圖做pci將GPU直接傳輸?shù)絍M中但是當(dāng)我們通過pci設(shè)備并安裝驅(qū)動(dòng)程序時(shí),我們會(huì)從nvidia-nvlink模塊中獲得錯(cuò)誤。是否支持v100卡的nvlink
    發(fā)表于 09-12 16:25

    英偉達(dá)GPU卡多卡互聯(lián)NVLink,系統(tǒng)累積的公差,是怎么解決的?是連接器吸收的?

    英偉達(dá)不斷推出GPU卡,并且實(shí)現(xiàn)多卡互聯(lián)NVLink,實(shí)際整個(gè)系統(tǒng)會(huì)累積到一個(gè)較大的公差,而目前市面上已有的連接器只能吸收較少的公差,這個(gè)是怎么做到匹配的呢?
    發(fā)表于 03-05 16:17

    技嘉發(fā)布的NVLink連接器支持RGB燈光

    10月3日消息 隨著RTX 2080和RTX 2080 Ti顯卡的推出,各家廠商也推出了自家的NVLink連接器,已提供給發(fā)燒友使用,讓他們享受到最為強(qiáng)大的顯卡性能。之前華碩就公布了自家
    發(fā)表于 10-10 17:07 ?962次閱讀

    技嘉發(fā)布全新NVLink連接器:擁有RGB燈光

    【大比特導(dǎo)讀】10月3日消息 隨著RTX 2080和RTX 2080 Ti顯卡的推出,各家廠商也推出了自家的NVLink連接器,已提供給發(fā)燒友使用,讓他們享受到最為強(qiáng)大的顯卡性能。之前華碩就公布了
    發(fā)表于 12-24 16:46 ?426次閱讀

    GTC2022大會(huì)亮點(diǎn):NVIDIA宣布推出NVIDIA NVLink Switch系統(tǒng)

    GTC2022大會(huì)亮點(diǎn):NVIDIA宣布推出NVIDIA NVLink Switch系統(tǒng),借助NVLink Switch系統(tǒng),可以將其擴(kuò)展為一個(gè)巨大的擁有32個(gè)節(jié)點(diǎn)、256個(gè)GPU的DGX POD,都可借助4個(gè)端口光學(xué)收發(fā)器連接到NVL
    的頭像 發(fā)表于 03-24 15:15 ?3332次閱讀
    GTC2022大會(huì)亮點(diǎn):NVIDIA宣布推出NVIDIA <b class='flag-5'>NVLink</b> Switch系統(tǒng)

    什么是 NVLink?

    NVLink 是加速系統(tǒng)中 GPU 和 CPU 處理器的高速互連技術(shù),推動(dòng)數(shù)據(jù)和計(jì)算加速得出可執(zhí)行結(jié)果。 加速計(jì)算是一項(xiàng)曾經(jīng)只有政府研究實(shí)驗(yàn)室中才有的高性能計(jì)算能力。如今,它已成為主流技術(shù)。 銀行
    的頭像 發(fā)表于 04-19 04:05 ?3563次閱讀
    什么是 <b class='flag-5'>NVLink</b>?

    一文解析Nvlink的誕生和技術(shù)演進(jìn)歷程

    Nvlink-C2C是個(gè)錯(cuò)誤的技術(shù)路徑。 我仿佛記得Nvlink-C2C的主架構(gòu)師Wei wei是我大學(xué)同學(xué) ?有這么個(gè)模糊印象。 如果單純從技術(shù)的角度,Nvlink-C2C真的是一個(gè)恰到好處的設(shè)計(jì),挺佩服的。增之一分則太長,減
    發(fā)表于 07-03 11:50 ?5727次閱讀
    一文解析<b class='flag-5'>Nvlink</b>的誕生和技術(shù)<b class='flag-5'>演進(jìn)</b>歷程

    什么是 NVLink?

    什么是 NVLink?
    的頭像 發(fā)表于 10-27 16:10 ?1132次閱讀
    什么是 <b class='flag-5'>NVLink</b>?

    NVLink演進(jìn):從內(nèi)部互聯(lián)到超級(jí)網(wǎng)絡(luò)

    NVLink是NVIDIA開發(fā)的一種高速、低延遲的互聯(lián)技術(shù),旨在連接多個(gè)GPU以實(shí)現(xiàn)高性能并行計(jì)算。與傳統(tǒng)的PCIe總線相比,NVLink提供了更高的帶寬和更低的延遲,使得GPU之間可以更加高效地共享數(shù)據(jù)和通信。
    的頭像 發(fā)表于 04-13 11:22 ?1733次閱讀
    <b class='flag-5'>NVLink</b>的<b class='flag-5'>演進(jìn)</b>:從內(nèi)部互聯(lián)到超級(jí)網(wǎng)絡(luò)

    全面解讀英偉達(dá)NVLink技術(shù)

    NVLink是一種解決服務(wù)器內(nèi)GPU之間通信限制的協(xié)議。與傳統(tǒng)的PCIe交換機(jī)不同,NVLink帶寬有限,可以在服務(wù)器內(nèi)的GPU之間實(shí)現(xiàn)高速直接互連。第四代NVLink提供更高的帶寬,每條通道達(dá)到112Gbps,比PCIe Ge
    發(fā)表于 04-22 11:01 ?2038次閱讀
    全面解讀英偉達(dá)<b class='flag-5'>NVLink</b>技術(shù)

    分布式通信的原理和實(shí)現(xiàn)高效分布式通信背后的技術(shù)NVLink演進(jìn)

    大型模型的大小已經(jīng)超出了單個(gè) GPU 的范圍。所以就需要實(shí)現(xiàn)跨多個(gè) GPU 的模型訓(xùn)練,這種訓(xùn)練方式就涉及到了分布式通信和 NVLink。 當(dāng)談及分布式通信和 NVLink 時(shí),我們進(jìn)入了一個(gè)引人入勝且不斷演進(jìn)的技術(shù)領(lǐng)域,下面我
    的頭像 發(fā)表于 11-18 09:39 ?1234次閱讀
    分布式通信的原理和實(shí)現(xiàn)高效分布式通信背后的技術(shù)<b class='flag-5'>NVLink</b>的<b class='flag-5'>演進(jìn)</b>

    NVIDIA推出NVLink Fusion技術(shù)

    NVIDIA 發(fā)布 NVIDIA NVLink Fusion,這款全新芯片將助力行業(yè)用戶通過全球領(lǐng)先且廣泛采用的計(jì)算互連架構(gòu) —— NVIDIA NVLink 打造的強(qiáng)健合作伙伴生態(tài)系統(tǒng),構(gòu)建半定制 AI 基礎(chǔ)設(shè)施。
    的頭像 發(fā)表于 05-22 09:59 ?287次閱讀