99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在ZTR無配置大規(guī)模中實現(xiàn)的縮放零接觸RoCE技術(shù)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-14 14:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Zero Touch RoCE ( ZTR )使數(shù)據(jù)中心能夠無縫部署 聚合以太網(wǎng)上的 RDMA ( RoCE ) ,而無需任何特殊交換機(jī)配置。直到最近, ZTR 還僅適用于中小型數(shù)據(jù)中心。同時,大規(guī)模部署傳統(tǒng)上依賴于顯式擁塞通知( ECN )來啟用 RoCE 網(wǎng)絡(luò)傳輸,這需要交換機(jī)配置。

新的 NVIDIA 擁塞控制算法往返時間擁塞控制( RTTCC ) – 允許 ZTR 在不影響性能的情況下擴(kuò)展到數(shù)千臺服務(wù)器。通過使用 ZTR 和 RTTCC ,數(shù)據(jù)中心運(yùn)營商可以在無需任何交換機(jī)配置的情況下,享受部署和操作的便利性,以及大規(guī)模遠(yuǎn)程直接內(nèi)存訪問( RDMA )的卓越性能。

這篇文章描述了以前在大規(guī)模和小型 RoCE 部署中推薦的 RoCE 擁塞控制。然后介紹了一種新的擁塞控制算法,該算法允許 ZTR 的無配置大規(guī)模實現(xiàn),其性能類似于支持 ECN 的 RoCE 。

具有數(shù)據(jù)中心量化擁塞通知的 RoCE 部署

在典型的基于 TCP 的環(huán)境中,分布式內(nèi)存請求需要許多步驟和 CPU 周期,這會對應(yīng)用程序性能產(chǎn)生負(fù)面影響。 RDMA 消除了服務(wù)器之間內(nèi)存數(shù)據(jù)傳輸?shù)乃?CPU 參與,大大加快了對存儲數(shù)據(jù)的訪問和應(yīng)用程序性能。

RoCE 在以太網(wǎng)環(huán)境中提供 RDMA ,這是數(shù)據(jù)中心的主要網(wǎng)絡(luò)結(jié)構(gòu)。以太網(wǎng)需要高級擁塞控制機(jī)制來支持 RDMA 網(wǎng)絡(luò)傳輸。數(shù)據(jù)中心量化擁塞通知( DCQCN )是一種擁塞控制算法,能夠響應(yīng)擁塞通知并動態(tài)調(diào)整流量傳輸速率。

DCQCN 的實現(xiàn)需要啟用顯式擁塞通知( ECN ),這需要配置網(wǎng)絡(luò)交換機(jī)。 ECN 將交換機(jī)配置為設(shè)置擁塞經(jīng)歷( CE )位,以指示即將發(fā)生的擁塞。

具有無功擁塞控制的零接觸 RoCE

NVIDIA 開發(fā)的 ZTR 技術(shù)允許 RoCE 部署,無需配置交換機(jī)基礎(chǔ)設(shè)施。 ZTR 根據(jù) InfiniBand Trade Association ( IBTA ) RDMA 標(biāo)準(zhǔn)構(gòu)建,完全符合 RoCE specifications ,支持 RoCE 的無縫部署。 ZTR 還擁有與傳統(tǒng)交換機(jī)啟用的 RoCE 相當(dāng)?shù)男阅?,并且明顯優(yōu)于傳統(tǒng)的基于 TCP 的內(nèi)存訪問。此外,通過 ZTR , RoCE 網(wǎng)絡(luò)傳輸服務(wù)在普通 TCP / IP 環(huán)境中與非 RoCE 通信并行運(yùn)行。

正如 NVIDIA 零接觸 RoCE 技術(shù)為 Microsoft Azure Stack HCI 實現(xiàn)了云經(jīng)濟(jì) 文章中所指出的,微軟已經(jīng)為其 Azure Stack HCI 平臺驗證了 ZTR ,該平臺通??蓴U(kuò)展到幾十個節(jié)點。在這樣的環(huán)境中, ZTR 依賴于隱式丟包通知,這對于小規(guī)模部署來說已經(jīng)足夠了。通過添加新的基于往返計時器( RTT )的擁塞控制算法, ZTR 變得更加健壯和可擴(kuò)展,而無需依賴丟包來通知服務(wù)器網(wǎng)絡(luò)擁塞。

引入往返時間擁塞控制

新的 NVIDIA 擁塞控制算法 RTTCC 主動監(jiān)控網(wǎng)絡(luò) RTT ,以便在丟棄數(shù)據(jù)包之前主動檢測并適應(yīng)擁塞的發(fā)生。 RTTCC 使用基于硬件的反饋環(huán)路實現(xiàn)動態(tài)擁塞控制,與基于軟件的擁塞控制算法相比,該反饋環(huán)路提供了顯著優(yōu)越的性能。 RTTCC 還支持更快的傳輸速率,可以在更大范圍內(nèi)部署 ZTR 。帶有 RTTCC 的 ZTR 現(xiàn)在作為測試版功能提供, GA 計劃在 2022 年下半年推出。

ZTR-RTTCC 的工作原理

ZTR-RTTCC 通過基于硬件 RTT 的擁塞控制算法擴(kuò)展了 RoCE 網(wǎng)絡(luò)中的 DCQCN 。

圖 1 服務(wù)器之間的往返計時

定時數(shù)據(jù)包(上圖中的綠色網(wǎng)絡(luò)數(shù)據(jù)包)定期從啟動器發(fā)送到目標(biāo)。立即返回定時數(shù)據(jù)包,從而能夠測量往返延遲。 RTTCC 測量數(shù)據(jù)包發(fā)送和啟動器接收數(shù)據(jù)包之間的時間間隔。差異(接收時間–發(fā)送時間)衡量往返延遲,這表明路徑擁塞。未壓縮流繼續(xù)傳輸數(shù)據(jù)包,以最佳利用可用網(wǎng)絡(luò)路徑帶寬。延遲增加的流意味著路徑擁塞, RTTCC 會對流量進(jìn)行節(jié)流,以避免緩沖區(qū)溢出和數(shù)據(jù)包丟失。

隨著擁塞的減少或增加,網(wǎng)絡(luò)流量可以實時地向上或向下調(diào)整。主動監(jiān)控和應(yīng)對擁塞的能力對于使 ZTR 能夠主動管理擁塞至關(guān)重要。這種主動速率控制還可以減少數(shù)據(jù)包的重新傳輸,提高 RoCE 性能。使用 ZTR-RTTCC ,數(shù)據(jù)中心節(jié)點不會等待數(shù)據(jù)包丟失的通知;相反,它們主動識別擁塞 prior to 數(shù)據(jù)包丟失并作出相應(yīng)反應(yīng),通知啟動器調(diào)整傳輸速率。

如前所述, ZTR 的一個關(guān)鍵優(yōu)勢是能夠提供 RoCE 功能,同時在普通 TCP / IP 流量中與非 RoCE 通信同時運(yùn)行。 ZTR 提供 RoCE 網(wǎng)絡(luò)功能的無縫部署。通過添加 RTTCC 主動監(jiān)控?fù)砣?ZTR 提供數(shù)據(jù)中心范圍內(nèi)的操作,無需交換機(jī)配置。請繼續(xù)閱讀,看看它的性能如何。

具有 RTTCC 性能的 ZTR

如圖 2 所示,當(dāng)通過網(wǎng)絡(luò)結(jié)構(gòu)配置 ECN 和 PFC 時,帶有 RTTCC 的 ZTR 提供了與 RoCE 相當(dāng)?shù)膽?yīng)用程序性能。這些測試是在最壞的多對一( in-cast )情況下進(jìn)行的,以模擬擁擠條件下的吞吐量。

結(jié)果表明,具有 RTTCC 的 ZTR 不僅可以擴(kuò)展到數(shù)千個節(jié)點,而且其性能與目前可用的最快 RoCE 解決方案相當(dāng)。

在小規(guī)模( 256 個連接及以下)下,具有 RTTCC 的 ZTR 在啟用 ECN 擁塞控制(傳統(tǒng) RoCE )的 RoCE 的 99% 范圍內(nèi)執(zhí)行。

通過 16000 多個連接,具有 RTTCC 吞吐量的 ZTR 是傳統(tǒng) RoCE 吞吐量的 98% 。

帶有 RTTCC 的 ZTR 在不需要任何開關(guān)配置的情況下,提供了與傳統(tǒng) RoCE 幾乎相同的性能。

圖 2 連接不斷增加的應(yīng)用程序帶寬

配置 ZTR

要使用新的 RTTCC 算法配置 ZTR , 下載 并為 NVIDIA 網(wǎng)絡(luò)接口卡安裝最新固件和工具,請執(zhí)行以下步驟。

配置 ZTR

要使用新的 RTTCC 算法配置 ZTR , 下載 并為 NVIDIA 網(wǎng)絡(luò)接口卡安裝最新固件和工具,請執(zhí)行以下步驟。

使用mlxconfig(持續(xù)配置)啟用可編程擁塞控制:

mlxconfig -d /dev/mst/mt4125_pciconf0 -y s
ROCE_CC_LEGACY_DCQCN=0

使用mlxfwreset重置設(shè)備或重新啟動主機(jī):

mlxfwreset -d /dev/mst/mt4125_pciconf0 -l 3 -y r

完成這些步驟后,當(dāng) RDMA-CM 用于增強(qiáng)連接建立( ECE , MLNX _ OFED 版本 5.1 支持)時,將使用 ZTR-RTTCC 。

如果出現(xiàn)錯誤,無論 RDMA-CM 同步狀態(tài)如何,都可以強(qiáng)制使用 ZTR-RTTCC :

mlxreg -d /dev/mst/mt4125_pciconf0 --reg_id 0x506e --reg_len
0x40 --set "0x0.0:8=2,0x4.0:4=15" -y

總結(jié)

NVIDIA RTTCC 是 ZTR 的新?lián)砣刂扑惴?,在?shù)據(jù)中心范圍內(nèi)提供卓越的 RoCE 性能,無需對交換機(jī)基礎(chǔ)設(shè)施進(jìn)行任何特殊配置。此增強(qiáng)功能使數(shù)據(jù)中心能夠在現(xiàn)有和新的數(shù)據(jù)中心基礎(chǔ)架構(gòu)中無縫實現(xiàn) RoCE ,并從即時的應(yīng)用程序性能改進(jìn)中獲益。

關(guān)于作者

Aviv Barnea 是 NVIDIA 網(wǎng)絡(luò)軟件工程的高級主管。他監(jiān)督網(wǎng)絡(luò)適配器 RDMA 軟件和擁塞控制機(jī)制的開發(fā),實現(xiàn)高速、低延遲的數(shù)據(jù)中心連接。 Aviv 是 RDMA 和 RoCE 通信協(xié)議方面的專家,擁有該領(lǐng)域的多項專利,在推動 RDMA / RoCE 在業(yè)界的發(fā)展方面發(fā)揮了重要作用,在客戶和合作伙伴大規(guī)模部署加速網(wǎng)絡(luò)解決方案時與他們密切合作,并實現(xiàn)了無與倫比的性能和易用性。 Aviv 擁有特拉維夫大學(xué)工商管理碩士學(xué)位和理工學(xué)院物理與電氣工程學(xué)士學(xué)位。

Itay Ozery 是 NVIDIA 網(wǎng)絡(luò)產(chǎn)品營銷總監(jiān)。他為 Mellanox 的云網(wǎng)絡(luò)解決方案推動戰(zhàn)略性產(chǎn)品營銷和產(chǎn)品管理計劃。 Itay 在網(wǎng)絡(luò)安全領(lǐng)域領(lǐng)導(dǎo)了大規(guī)模的業(yè)務(wù)和項目,并與數(shù)據(jù)中心和電信服務(wù)提供商在 IT 系統(tǒng)和網(wǎng)絡(luò)工程領(lǐng)域擔(dān)任過多個職位。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 接口
    +關(guān)注

    關(guān)注

    33

    文章

    9005

    瀏覽量

    153759
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106412
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RDMA over RoCE V2設(shè)計2:ip 整體框架設(shè)計考慮

    ,設(shè)計使用標(biāo)準(zhǔn)化的 AXI4 及 AXI-Stream 總線接口進(jìn)行數(shù)據(jù)傳輸,同時使用標(biāo)準(zhǔn)化的 AXI-Lite 總線接口提供系統(tǒng)控制功能,保證傳輸性能的同時,使得本設(shè)計更容易集成到應(yīng)用、生產(chǎn)環(huán)境。 5
    發(fā)表于 07-16 08:51

    RDMA簡介3之四種子協(xié)議對比

    CPU卸載到RDMA網(wǎng)卡處理。僅需要使用普通以太網(wǎng)交換機(jī)和iWARP網(wǎng)卡即可實現(xiàn)路由。但在大規(guī)模部署時,由于TCP/IP協(xié)議點對點連接的特性,將會占用大量的內(nèi)存資源,對系統(tǒng)規(guī)格的要求更高在對比這四種
    發(fā)表于 06-04 16:05

    RDMA簡介1之RDMA開發(fā)必要性

    ,提供高通量、低延遲、遠(yuǎn)距離的拷貝網(wǎng)絡(luò)數(shù)據(jù)傳輸?;谌诤弦蕴W(wǎng)的遠(yuǎn)程直接內(nèi)存訪問(RoCE)提供了一種基于以太網(wǎng)的RDMA技術(shù)實現(xiàn)方法,相較于IB(InfiniBand)、互聯(lián)網(wǎng)廣域
    發(fā)表于 06-03 14:38

    算力革命:RoCE實測推理時延比InfiniBand低30%的底層邏輯

    AI 訓(xùn)練與推理的網(wǎng)絡(luò)效率瓶頸,助力數(shù)據(jù)中心高帶寬、低延遲、高可靠性的需求下實現(xiàn)算力資源的最優(yōu)配置
    的頭像 發(fā)表于 05-28 14:08 ?624次閱讀
    算力革命:<b class='flag-5'>RoCE</b>實測推理時延比InfiniBand低30%的底層邏輯

    三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)解析

    近期興起的神經(jīng)輻射場(NeRF)與三維高斯?jié)姙R(3DGS)技術(shù)視覺SLAM展現(xiàn)出令人鼓舞的突破性成果。然而,當(dāng)前主流方法多依賴RGBD傳感器,并且僅適用于室內(nèi)環(huán)境。
    的頭像 發(fā)表于 05-27 14:13 ?342次閱讀
    三維高斯?jié)姙R<b class='flag-5'>大規(guī)模</b>視覺SLAM系統(tǒng)解析

    大規(guī)模 GOA 液晶線路修復(fù)方法

    液晶面板制造領(lǐng)域,GOA(Gate Driver on Array)技術(shù)因其諸多優(yōu)勢得到廣泛應(yīng)用。然而,大規(guī)模生產(chǎn)過程,不可避免會出現(xiàn)線路故障,如何高效修復(fù)這些線路,成為保障產(chǎn)能與
    的頭像 發(fā)表于 04-24 13:46 ?313次閱讀
    <b class='flag-5'>大規(guī)模</b> GOA 液晶線路修復(fù)方法

    與樹莓派的“黃金”關(guān)系,是如何幫助這家醫(yī)療設(shè)備公司擴(kuò)大規(guī)模?

    穩(wěn)定的供應(yīng)和與樹莓派的“黃金”關(guān)系,幫助這家醫(yī)療設(shè)備公司擴(kuò)大規(guī)模。埃及醫(yī)療設(shè)備制造商BioBusiness需要將物聯(lián)網(wǎng)功能成功集成到其患者監(jiān)測設(shè)備系列。RaspberryPi技術(shù)使他們得以
    的頭像 發(fā)表于 03-25 09:48 ?349次閱讀
    與樹莓派的“黃金”關(guān)系,是如何幫助這家醫(yī)療設(shè)備公司擴(kuò)<b class='flag-5'>大規(guī)模</b>?

    廣和通助力昶氪科技實現(xiàn)智能割草機(jī)器人大規(guī)模商用

    近日,2025世界移動通信大會(MWC Barcelona 2025)期間,廣和通宣布:其為永強(qiáng)集團(tuán)旗下昶氪科技提供的圍線式智能割草機(jī)器人解決方案已實現(xiàn)大規(guī)模量產(chǎn)商用,滿足歐洲等市
    的頭像 發(fā)表于 03-12 09:23 ?659次閱讀

    i.MX RT處理器上使用PXP實現(xiàn)縮放和旋轉(zhuǎn)組合操作

    本文主要探討如何使用PXP實現(xiàn)縮放和旋轉(zhuǎn)組合操作,PXP是NXP推出的一個2D圖形加速器,主要完成對圖像的數(shù)據(jù)格式轉(zhuǎn)換、固定角度旋轉(zhuǎn)(90°,180°,270°),任意比例縮放、混色,移位以及翻轉(zhuǎn)等功能。運(yùn)行平臺為i.MX RT
    的頭像 發(fā)表于 02-20 10:53 ?1155次閱讀
    <b class='flag-5'>在</b>i.MX RT處理器上使用PXP<b class='flag-5'>實現(xiàn)</b><b class='flag-5'>縮放</b>和旋轉(zhuǎn)組合操作

    AGV大規(guī)模定制化生產(chǎn)中的應(yīng)用

    AGV智能工廠大規(guī)模定制生產(chǎn)中發(fā)揮重要作用,通過不同形式滿足多樣化物料搬運(yùn)需求,提高生產(chǎn)效率與靈活度,降低勞動力與成本,助力企業(yè)實現(xiàn)智能車間和工廠的升級改造。
    的頭像 發(fā)表于 02-13 18:09 ?362次閱讀
    AGV<b class='flag-5'>在</b><b class='flag-5'>大規(guī)模</b>定制化生產(chǎn)中的應(yīng)用

    RoCE與IB對比分析(二):功能應(yīng)用篇

    在上一篇,我們對RoCE、IB的協(xié)議棧層級進(jìn)行了詳細(xì)的對比分析,二者本質(zhì)沒有不同,但基于實際應(yīng)用的考量,RoCE開放性、成本方面更勝一籌。本文我們將繼續(xù)分析
    的頭像 發(fā)表于 11-15 14:03 ?1282次閱讀
    <b class='flag-5'>RoCE</b>與IB對比分析(二):功能應(yīng)用篇

    RoCE與IB對比分析(一):協(xié)議棧層級篇

    AI 算力建設(shè), RDMA 技術(shù)是支持高吞吐、低延遲網(wǎng)絡(luò)通信的關(guān)鍵。目前,RDMA技術(shù)主要通過兩種方案實現(xiàn):Infiniband和
    的頭像 發(fā)表于 11-15 13:58 ?2195次閱讀
    <b class='flag-5'>RoCE</b>與IB對比分析(一):協(xié)議棧層級篇

    FPGA仿真黑科技\"EasyGo Vs Addon \",助力大規(guī)模電力電子系統(tǒng)仿真

    可以輕松地將其與各種硬件和協(xié)議連接,增強(qiáng)測試系統(tǒng)的靈活性。二、產(chǎn)品亮點▍超強(qiáng)FPGA芯片與接口配置,助力大規(guī)模電力電子系統(tǒng)仿真EasyGo Vs Addon支持的PXIe 7891搭載全新
    發(fā)表于 10-23 18:18

    云平臺大規(guī)模設(shè)備管理和數(shù)據(jù)分析的作用

    在當(dāng)代數(shù)字化轉(zhuǎn)型的浪潮,云平臺作為信息技術(shù)基礎(chǔ)設(shè)施的核心組件,扮演著無可替代的角色,尤其大規(guī)模設(shè)備管理和數(shù)據(jù)分析領(lǐng)域,其重要性和影響力日益凸顯。本文旨在深入探討云平臺如何通過其獨特
    的頭像 發(fā)表于 09-19 17:22 ?710次閱讀
    云平臺<b class='flag-5'>在</b><b class='flag-5'>大規(guī)模</b>設(shè)備管理和數(shù)據(jù)分析<b class='flag-5'>中</b>的作用

    使用DSPLIB FFT實現(xiàn)實現(xiàn)實際輸入,無需數(shù)據(jù)縮放

    電子發(fā)燒友網(wǎng)站提供《使用DSPLIB FFT實現(xiàn)實現(xiàn)實際輸入,無需數(shù)據(jù)縮放.pdf》資料免費下載
    發(fā)表于 09-19 11:27 ?0次下載
    使用DSPLIB FFT<b class='flag-5'>實現(xiàn)實現(xiàn)</b>實際輸入,無需數(shù)據(jù)<b class='flag-5'>縮放</b>