99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPU網絡中光互連的市場和產業(yè)趨勢、策略和計劃

沐曦MetaX ? 來源:沐曦MetaX ? 作者:韓佳巍 ? 2022-08-30 10:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要

GPU加速的計算系統(tǒng)可為諸多科學應用提供強大的計算能力支撐,亦是業(yè)界推動人工智能革命的重要手段。為了滿足大規(guī)模數(shù)據(jù)中心和高性能計算場景的帶寬拓展需求,光通信和光互連技術正在迅速而廣泛地滲入此類系統(tǒng)的各個網絡或鏈路層級。作為系列文章的第三篇,本文針對GPU網絡中光互連的市場和產業(yè)趨勢、策略和計劃做出分析。

在前兩篇大略地介紹了GPU網絡中光互連的歷史趨勢、短長期需求權衡、光通信技術手段之后,本篇將為讀者簡要分析其市場動向以及業(yè)界正在開展的進一步探索。

01

市場和產業(yè)動向:展望2025

與過去電信應用推進光互連的演變相類似,當前光互連的產業(yè)驅動力已經由數(shù)據(jù)通信應用(即數(shù)據(jù)中心)所主導。近幾年,隨著社交媒體、視頻數(shù)據(jù)流、智能手機的用戶數(shù)量不斷增長,人們對數(shù)據(jù)中心內部更高的網絡帶寬需求愈發(fā)迫切。為了應對諸如5G、云服務、物聯(lián)網、4K視頻等新興應用技術,全球數(shù)據(jù)中心的數(shù)量、占地面積、帶寬容量均有顯著增加。

上述現(xiàn)象在2016年最為明顯。彼時,全球數(shù)據(jù)中心的傳輸鏈路迎來了由40 Gbit/s到100 Gbit/s的大規(guī)模鏈路升級。自此以降,受到新數(shù)據(jù)中心的擴張建設、已有數(shù)據(jù)中心的翻新改裝、企業(yè)級數(shù)據(jù)中心的實際部署等因素的推動,光收發(fā)器的收益便以39%的復合年均增長率大幅增長[1]。而為了滿足數(shù)據(jù)中心應用對100 Gbit/s光模組的大批量需求,光收發(fā)器供應商的制造能力也得到了大幅提升。

110968b2-2809-11ed-ba43-dac502259ad0.jpg

圖1. 100 G,200 G,400 G光收發(fā)器的總收益

(來源于參考資料[1])

占據(jù)設備連接總數(shù)目的最大一部分便是數(shù)據(jù)中心內部的服務器互連,而帶寬消耗的顯著增長則使得人們需要更多地去考慮光互連的成本效益問題。為了適應近期PAM4的廣泛使用和服務器速率由10 Gbit/s向著25 Gbit/s轉化,網絡的上行鏈路亦需增速。事實上,人們對容量提升的初始目標是引入400 Gbit/s的解決方案;而從成本和性能優(yōu)化的角度考慮,業(yè)界在中途又加入了200 Gbit/s方案,以試圖為后續(xù)400 Gbit/s方案尋求一個更加適宜的遷移路徑。自2016年至2021年,光收發(fā)器總體(包括100 G,200 G,400 G)的復合年均增長率為63%;而僅就100 G光收發(fā)器而言,其復合年均增長率高達53%[2]。這主要是因為自2019年以來,200 G和400 G光收發(fā)器被商業(yè)化部署并開始小幅占據(jù)100 G光收發(fā)器的市場份額(見圖1)。

對于數(shù)據(jù)中心內部的短距離光互連來說,多模光纖鏈路仍要比單模光纖鏈路占據(jù)更為主要的地位。與傳統(tǒng)的串行傳輸有所不同,并行光路傳輸使用一個光模塊接口,數(shù)據(jù)在多根光纖中同時得以發(fā)送和接收:40 GbE傳輸由4根光纖之上的單方向4×10 G實現(xiàn);100 GbE傳輸由10根光纖之上的單方向10×10 G實現(xiàn)。這類標準引領了對高質量、低損耗的多模多路并行光學(Multi-Parallel Optics, MPO)接口的需求。

人們對數(shù)據(jù)中心帶寬增長的不斷需求繼續(xù)驅動著業(yè)界的更多革新。以往,數(shù)據(jù)中心互連僅要求在多模或單模光纖中傳輸單個波長,而近期的技術驅動則聚焦在單模光纖中傳輸多個波長。2016年,與100 Gbit/s光收發(fā)器相符合的粗波分復用(Coarse Wavelength Division Multiplexing 4, CWDM4)技術已可以和并行單模(Parallel Single Mode 4, PSM4)在市場份額方面平分秋色。而隨著200 Gbit/s和400 Gbit/s自2019年開始的實際部署,市場容量的增長已經由并行光路技術和多波長技術共同驅動。

在2016年早期,眾多業(yè)界領軍者在多源協(xié)議方面合作開發(fā)了一種高速的雙密度四通道小型可插拔(Quad Small Form Factor Pluggable- Double Density, QSFP-DD)接口。作為可插拔收發(fā)器,QSFP-DD在保持占用空間以實現(xiàn)與標準QSFP的反向兼容之外,可為8通路的電接口附加提供的一排觸點。QSFP-DD 8個通路中的任意一個都可以在25 Gbit/s NRZ調制或50 Gbit/s PAM4調制下工作,從而可以為200 Gbit/s或400 Gbit/s的聚合帶寬提供支持;而QSFP-DD的反向兼容特點也可支撐新興模塊類型的使用、加速總體網絡遷移。

當前,標準的QSFP收發(fā)器模塊連接均已采用LC 雙工連接器(尤其是在基于波分復用的雙工模塊情形下)。盡管LC雙工連接器仍可在QSFP-DD收發(fā)器模塊中使用,但是傳輸帶寬還受限在單獨的波分復用引擎設計上。該引擎使用一個1:4復用/解復用器來達到200 GbE,或是使用一個1:8復用/解復用器來達到400 GbE。這無疑增加了收發(fā)器的成本,并且提高了對收發(fā)器的冷卻要求。

112ccac8-2809-11ed-ba43-dac502259ad0.jpg

圖2. CS連接器和LC雙工連接器的比較

在保持連接器占用空間不變的前提下,人們期待能夠實現(xiàn)一種可將連接器與QSFP-DD之間的連接性提升一倍的新型連接器類型。于是,作為一種雙套管連接器,CS連接器應運而生。如圖2所示,和LC雙工連接器相比較,CS連接器的占用空間相對更小。于是,人們可在一個QSFP-DD模塊的前接口部署兩個CS連接器。這使得雙波分復用引擎具有了較好的可行性:該雙引擎可使用一個1:4復用/解復用器來達到2×100 GbE,或是在一個單獨的QSFP-DD收發(fā)器上實現(xiàn)2×200 GbE。除了QSFP-DD收發(fā)器之外,CS連接器亦可與八通道小型可插拔模塊和板中光學模塊相適配。

在眾多供應商采用QSDP-DD作為收發(fā)器接口的時候,網絡交換面板密度也在成倍增加。自2012年以來,數(shù)據(jù)中心交換機的最大網絡交換面板密度是128個單通道(信道)端口或32個4通道端口。近期,網絡交換機ASIC供應商已能夠將單個交換ASIC的信道數(shù)目提升到256個乃至512個。在保持單個機架單位交換機面板形狀系數(shù)的同時,為了有效管理不斷增長的帶寬密度,人們在若干類多源協(xié)議(包括QSFP-DD,OSFP,SFP-DD)中采用了雙倍密度的光收發(fā)器。由此,光纖數(shù)目也已經由4通道增長到了8通道、乃至于提升至8對光纖。而為了保持和已安裝的光纖和網絡交換機基礎設備的兼容性,在上述收發(fā)器的實際部署中,人們可將8通道分開為2個獨立的四路接口。當新型交換器得以實際部署時,數(shù)據(jù)中心的短期需求便是在同樣物理空間之內的光纖對終端數(shù)量的增加。

11443302-2809-11ed-ba43-dac502259ad0.jpg

圖3. SN、CS、LC雙工和MPO的比較

上述需求又反過來促使業(yè)界人士去探尋進一步的革新:如圖3所示,與CS連接器將LC連接器的密度增加一倍相類似,SN連接器又將CS連接器的密度增加了一倍。

116caee0-2809-11ed-ba43-dac502259ad0.jpg

圖4. 在葉和脊結構中使用SN接口實現(xiàn)光纖分線

如圖4所示,SN連接器是一種面向400 G數(shù)據(jù)中心優(yōu)化方案的新型雙工光纖連接器,其設計初衷是為四路方式收發(fā)器(QSFP,QSFP-DD,OSFP)提供獨立的雙工光纖分線。與MPO連接器相比較,SN連接器的效率和可靠性較高、成本較低。

118b2f50-2809-11ed-ba43-dac502259ad0.jpg

圖5. 未來光互連技術的演進

自2018年的Optical Fiber Communication Conference開始,市場分析師和技術專家便對將光互連部件移動到距離ASIC更近位置的必要性開展了廣泛討論。而早在2017年,the Consortium for On-Board Optics已針對板上光學發(fā)布了第一部工業(yè)指標規(guī)范[3]。這些技術布局的關鍵推動力就是高數(shù)據(jù)速率條件下銅線互連的固有限制。隨著數(shù)據(jù)速率的上升,銅線的衰減大幅增加且其絕對傳輸限制被限定在100 Gbp/s/m[4]。而對高于這一限制的速率來說,使用光學信道便成了無法避免的技術手段。因此,光互連產業(yè)的演進并不僅限于板上光學,也包括了用于替代傳統(tǒng)集成電路的光子集成光路(Photonic Integrated Circuits, PIC)。如圖5所示,光互連下一步的演進既要滿足前面板互連器件的需求,又要更多考慮PIC、板中和背板的互連器需求。

02

策略和計劃:跨越成本和功耗之墻

在節(jié)點性能借助多芯片組件和GPU加速器等特殊計算單元來實現(xiàn)提升的同時,人們不僅對數(shù)據(jù)中心網絡的帶寬需求仍在持續(xù),而且對人工智能和高性能計算的工作負載需求也呈現(xiàn)出激增態(tài)勢。而通過增加單通道數(shù)據(jù)速率的傳統(tǒng)方式已不再是獲取效益的唯一辦法。這是因為功效增益已有平緩化趨勢,且低成本的電學鏈路已無法覆蓋當前的互連傳輸距離。舉例來說,在12.8 Tbit/s(2016)和102.4 Tbit/s(~2025)這兩代交換芯片之間,光互連占據(jù)網絡功率的比例將從約30%增長為超過50% [5];而對數(shù)據(jù)中心整體而言,光網絡占比將會從10 Gbit/s以太網代際(2015)中的幾個百分比增長為800 Gbit/s代際(~2025)中的20%以上[6]。此外,光學成本在不久的將來便會超越交換機端口的成本[5]。為了應對這不斷逼近的成本和功耗之墻,人們需要從新型網絡結構、共封裝光學等角度來尋求一系列解決方案。在下文中,筆者將對這些方案逐一做出簡短分析。

2.1

更加扁平化的網絡

更加扁平化的網絡意味著具備高通道數(shù)目的交換機得以使用,從而減少了交換層級。由此,人們可大幅減少交換機部件的數(shù)量并改進系統(tǒng)的總體吞吐量和延遲性能。而更高的端口數(shù)目可以通過使用尖端的單芯片交換機(已接近50 Tbit/s及以上)或者復合芯片配置實現(xiàn)。因為未來的交換芯片可具有超越單個機架所需的交換能力,所以拓撲結構應包括使用行間(End of Row)交換機來替代機架頂端(Top of Rack)交換機。

11a8bebc-2809-11ed-ba43-dac502259ad0.jpg

圖6. 由36端口交換芯片所構成的基準網絡

(來源于參考資料[7])

11cebaae-2809-11ed-ba43-dac502259ad0.jpg

圖7. 使用162端口交換芯片的扁平化網絡

(來源于參考資料[7])

近期,IBM公司的P. Maniotis等[7]對使用高通道數(shù)目交換機(借助低功率的共封裝光學)實現(xiàn)更加扁平化網絡的優(yōu)勢做出了詳細討論。圖6展示了一個由“當今的”36端口單芯片交換機所構成的高性能計算規(guī)模網絡(包含11600個終端);而圖7展示了一個由152端口交換芯片所構成的類似規(guī)模網絡。相較而言,更加扁平化的網絡可令交換芯片的數(shù)量減少85%,可大幅降低功耗和成本。

2.2

專門的硬件和網絡

盡管多樣化的工作負載可為數(shù)據(jù)中心定義一個更具通用性的網絡和計算資源基礎結構,但是在高性能計算領域,人們卻一直對優(yōu)化的網絡拓撲結構(如用于科學計算的環(huán)形拓撲結構、用于圖形分析的蜻蜓拓撲結構)頗感興趣。

11f1e75e-2809-11ed-ba43-dac502259ad0.jpg

圖8. 對網絡工作負載需求的示例

(來源于參考資料[8])

圖8展示了各式各樣工作負載類型的需求范圍。隨著特定工作負載的重要性不斷增加,針對特定任務(如人工智能訓練)來制定專門的計算和網絡設計將會是業(yè)界的一個關鍵考慮。

2.3

組合式/解聚式系統(tǒng)

針對特定的工作負載需求來構建資源是眾多數(shù)據(jù)中心設計者夢寐以求的能力。組合式/解聚式系統(tǒng)意味著人們可以使用高性能結構來改進數(shù)據(jù)中心的總體效率。其潛在的優(yōu)勢包括:硬件可具備獨立的恢復周期、用于特定工作負載的資源優(yōu)化分派更具靈活性、更容易添加新的資源形態(tài)(如新型加速器)、有效降低運行成本和資本支出等。

120d0912-2809-11ed-ba43-dac502259ad0.jpg

圖9. 當今異構結構和未來組合式結構的概念示意圖

圖9為異構結構和組合式結構的概念示意圖。其中,Compute Express Link[9]可為存儲器和加速器解聚提供支持。在總線和接口標準(Peripheral Component Interface Express, PCIe)物理層以及給定的數(shù)據(jù)速率條件下,光互連(在跨越機架或多機架距離的高速場景中)的一個關鍵問題便是PCIe Gen 6中64 Gbit/s和大量以太網應用中53-56 Gbit/s 或106-112 Gbit/s之間的失配特性。

2.4

物理層效率和共封裝光學

12357bb8-2809-11ed-ba43-dac502259ad0.jpg

圖10. 基于垂直腔面發(fā)射激光器的共封裝光學概念

(來源于參考資料[7])

在持續(xù)的CMOS代際和改進的電路設計基礎上,電學鏈路依舊能夠在功率效率方面獲得收效。然而,在更高的數(shù)據(jù)速率需求下,電學鏈路中不可避免的高信道衰減使得人們對利用光學鏈路滿足傳輸距離的需求顯著增多。共封裝技術可使得電學鏈路的傳輸距離大幅減小,在功耗和信號一致性方面有著明顯優(yōu)勢。它可為功耗低于5 pJ/bit的完整電-光-電鏈路(例如IBM公司正在開展的MOTIO2項目[10])提供潛在可能性。如圖10所示,該項目基于垂直腔面發(fā)射激光器的共封裝模塊技術,旨在實現(xiàn)低成本、高性能(112 Gbit/s,< $0.25/Gbps)傳輸。

03

小結

基于新技術標準化的重要性,許多標準化組織、產業(yè)聯(lián)盟和政府研究機構已開始著手制定未來光互連的各類技術規(guī)范。而為了跨越GPU網絡光互連的成本和功耗之墻,業(yè)界也正在探索諸如更加有效的網絡拓撲結構、針對特定工作負載的計算和網絡結構、光電共封裝等解決方案。以筆者觀察,這些方案可為滿足未來數(shù)據(jù)中心的高帶寬需求提供有效幫助。

倘若讀者對GPU網絡的光互連這一領域有著獨特興趣,歡迎你關注、走近沐曦,讓我們一起釋放和安頓這份好奇心以及追根究底的脾氣。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4949

    瀏覽量

    131309
  • 網絡
    +關注

    關注

    14

    文章

    7816

    瀏覽量

    90990
  • 模組
    +關注

    關注

    6

    文章

    1638

    瀏覽量

    31377

原文標題:【智算芯聞】面向GPU網絡的光互連(3):凡是過去,皆為序章

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    TE推出AMPMODU互連系統(tǒng)具有哪些產品特性?-赫聯(lián)電子

    印刷電路板 (PCB) 的工業(yè)應用。   小型化是影響全球工業(yè)的一個趨勢。 AMPMODU 元件的廣泛使用,加上其小尺寸,使其成為適合各種應用和系統(tǒng)的堅實互連系統(tǒng)。對板小型化日益增長的需求正在推動
    發(fā)表于 06-30 09:59

    華為智能伏第三屆全球安裝商大會圓滿收官

    華為智能伏第三屆全球安裝商大會在東莞三丫坡盛大召開,來自歐洲、亞太、拉美等全球各地的伙伴和頭部安裝商齊聚一堂,圍繞產業(yè)市場趨勢、安裝商戰(zhàn)略、優(yōu)秀案例、營銷
    的頭像 發(fā)表于 06-20 09:51 ?511次閱讀

    AI驅動的高速互連趨勢下,如何實現(xiàn)超前布局?

    汽車等應用端市場的爆發(fā),數(shù)據(jù)傳輸量呈指數(shù)級增長,那么隨之而來的是AI數(shù)據(jù)中心、AI PC、車載網絡等應用,高速互連技術得到更加多的應用。 談到高速
    的頭像 發(fā)表于 04-24 00:19 ?3280次閱讀
    AI驅動的高速<b class='flag-5'>互連</b><b class='flag-5'>趨勢</b>下,如何實現(xiàn)超前布局?

    OpenVINO?檢測到GPU,但網絡無法加載到GPU插件,為什么?

    OpenVINO?安裝在舊的 Windows 10 版本 Windows? 10 (RS1) 上。 已安裝 GPU 驅動程序版本 25.20.100.6373,檢測到 GPU,但網絡無法加載
    發(fā)表于 03-05 06:01

    半導體封裝革新之路:互連工藝的升級與變革

    在半導體產業(yè),封裝是連接芯片與外界電路的關鍵環(huán)節(jié),而互連工藝則是封裝的核心技術之一。它負責將芯片的輸入輸出端口(I/O端口)與封裝基板或外部電路連接起來,實現(xiàn)電信號的傳輸與交互。本
    的頭像 發(fā)表于 02-10 11:35 ?743次閱讀
    半導體封裝革新之路:<b class='flag-5'>互連</b>工藝的升級與變革

    TE推出AMPMODU互連系統(tǒng)是什么?哪家有?-赫聯(lián)電子

    印刷電路板 (PCB) 的工業(yè)應用。   小型化是影響全球工業(yè)的一個趨勢。 AMPMODU 元件的廣泛使用,加上其小尺寸,使其成為適合各種應用和系統(tǒng)的堅實互連系統(tǒng)。對板小型化日益增長的需求正在推動
    發(fā)表于 01-17 11:22

    華為發(fā)布2025充電網絡產業(yè)十大趨勢

    華為近期以“讓有路的地方就有高質量充電”為主題,成功舉辦了2025充電網絡產業(yè)十大趨勢發(fā)布會。會上,華為智能充電網絡領域總裁王志武全面解讀了未來充電
    的頭像 發(fā)表于 01-16 13:42 ?798次閱讀

    華為發(fā)布2025充電網絡產業(yè)十大趨勢

    近日,華為以“讓有路的地方就有高質量充電”為主題,舉辦2025充電網絡產業(yè)十大趨勢發(fā)布會。華為智能充電網絡領域總裁王志武從產業(yè)發(fā)展走向與技術
    的頭像 發(fā)表于 01-10 09:33 ?677次閱讀

    華為發(fā)布2025智能伏十大趨勢

    華為數(shù)字能源以“融合創(chuàng)新,智構未來,加速伏成為主力能源”為主題,舉辦2025智能伏十大趨勢發(fā)布會。華為數(shù)字能源智能伏產品線總裁周濤發(fā)布了智能
    的頭像 發(fā)表于 01-06 17:12 ?898次閱讀

    未來網絡的高速引擎:800G模塊市場預測與應用前景

    近年來,VR、物聯(lián)網、云計算等新業(yè)務的出現(xiàn),對網絡帶寬、并發(fā)、實時性能提出了更高的要求。隨著帶寬需求持續(xù)飆升,100G、200G和400G模塊將保持重要的市場份額,800G模塊也將
    的頭像 發(fā)表于 11-15 09:25 ?1146次閱讀

    如何構建及優(yōu)化GPU網絡

    并從計算節(jié)點成本優(yōu)化、集群網絡與拓撲的選擇等方面論述如何構建及優(yōu)化GPU網絡。
    的頭像 發(fā)表于 11-06 16:03 ?1033次閱讀
    如何構建及優(yōu)化<b class='flag-5'>GPU</b>云<b class='flag-5'>網絡</b>

    GPU服務器AI網絡架構設計

    眾所周知,在大型模型訓練,通常采用每臺服務器配備多個GPU的集群架構。在上一篇文章《高性能GPU服務器AI網絡架構(上篇)》,我們對
    的頭像 發(fā)表于 11-05 16:20 ?1251次閱讀
    <b class='flag-5'>GPU</b>服務器AI<b class='flag-5'>網絡</b>架構設計

    GPU市場趨勢與未來發(fā)展

    隨著科技的飛速發(fā)展,圖形處理單元(GPU)已經成為現(xiàn)代計算領域不可或缺的一部分。從游戲到專業(yè)圖形設計,再到人工智能和深度學習,GPU在各個領域都發(fā)揮著重要作用。 GPU市場現(xiàn)狀 1.
    的頭像 發(fā)表于 10-27 14:14 ?1373次閱讀

    碳化硅產業(yè)鏈成本大幅下降,市場迎來新變革

    近期市場消息指出,中國新能源汽車和市場的快速發(fā)展,推動了碳化硅(SiC)產業(yè)鏈在技術迭代和產能擴充上的加速。這一趨勢導致SiC
    的頭像 發(fā)表于 10-22 11:48 ?1226次閱讀

    TE推出AMPMODU互連系統(tǒng)產品特色是什么?-赫聯(lián)電子

    印刷電路板 (PCB) 的工業(yè)應用。   小型化是影響全球工業(yè)的一個趨勢。 AMPMODU 元件的廣泛使用,加上其小尺寸,使其成為適合各種應用和系統(tǒng)的堅實互連系統(tǒng)。對板小型化日益增長的需求正在推動
    發(fā)表于 09-27 17:09