99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過NVIDIA Spectrum Ethernet的自適應(yīng)路由加速網(wǎng)絡(luò)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-08-15 16:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 加速 AI 平臺(tái)和產(chǎn)品(如 NVIDIA EGX 、 DGX 、 OVX 和 NVIDIA AI for Enterprise )需要數(shù)據(jù)中心網(wǎng)絡(luò)的最佳性能。 NVIDIA Spectrum Ethernet 平臺(tái)通過芯片級(jí)創(chuàng)新實(shí)現(xiàn)了這一性能。

融合以太網(wǎng) RDMA 自適應(yīng)路由( RoCE )通過減少網(wǎng)絡(luò)擁塞問題加快了應(yīng)用程序的速度。這篇文章介紹了 NVIDIA 頻譜以太網(wǎng)的自適應(yīng)路由技術(shù),并提供了一些初步的性能基準(zhǔn)。

是什么讓我的網(wǎng)絡(luò)變慢了?

您不必是云服務(wù)提供商就可以從橫向擴(kuò)展網(wǎng)絡(luò)中獲益。網(wǎng)絡(luò)行業(yè)已經(jīng)發(fā)現(xiàn),具有第 2 層轉(zhuǎn)發(fā)和生成樹的傳統(tǒng)網(wǎng)絡(luò)架構(gòu)效率低下,而且難以擴(kuò)展。他們過渡到 IP 網(wǎng)絡(luò)結(jié)構(gòu)。

這是一個(gè)很好的開始,但在某些情況下,它可能不足以解決新類型的應(yīng)用程序和跨數(shù)據(jù)中心引入的流量。

可擴(kuò)展 IP 網(wǎng)絡(luò)的一個(gè)關(guān)鍵屬性是它們能夠跨多個(gè)交換機(jī)層次結(jié)構(gòu)分布大量流量和流量。

在一個(gè)完美的世界中,數(shù)據(jù)流是完全不相關(guān)的,因此在多個(gè)網(wǎng)絡(luò)鏈路上分布均勻、負(fù)載平衡平穩(wěn)。該方法依賴于現(xiàn)代哈希和多路徑算法,包括等成本多路徑( ECMP )。運(yùn)營(yíng)商受益于任何規(guī)模的數(shù)據(jù)中心中的高端口數(shù)、固定外形的交換機(jī)。

然而,在許多情況下,這是行不通的,通常包括無處不在的現(xiàn)代工作負(fù)載,如 AI 、云和存儲(chǔ)。

pYYBAGL5_TWARGiLAACVWFp7a9A234.png

圖 1 :。介紹 NVIDIA 自適應(yīng)路由

問題是有限熵的問題。熵是一種衡量流經(jīng)給定網(wǎng)絡(luò)的流量的豐富性和多樣性的方法。

當(dāng)您有數(shù)千個(gè)從全球各地的客戶端隨機(jī)連接的流時(shí),您的網(wǎng)絡(luò)被稱為有 high entropy 。然而,當(dāng)您只有少數(shù)大型流時(shí)(這在 AI 和存儲(chǔ)工作負(fù)載中經(jīng)常發(fā)生),大型流會(huì)控制帶寬,因此會(huì)出現(xiàn) low entropy 。這種低熵流量模式也稱為 elephant flow 分布,在許多數(shù)據(jù)中心工作負(fù)載中都很明顯。

那么為什么熵很重要呢?

使用靜態(tài) ECMP 的傳統(tǒng)技術(shù),您需要高熵來將流量均勻地分布在多個(gè)鏈路上,而不會(huì)出現(xiàn)擁塞。然而,在大象流場(chǎng)景中,多個(gè)流可以在同一條鏈路上對(duì)齊,從而創(chuàng)建一個(gè)超額預(yù)訂的熱點(diǎn)或微爆發(fā)。這會(huì)導(dǎo)致?lián)砣?、延遲增加、數(shù)據(jù)包丟失和重傳。

對(duì)于許多應(yīng)用程序,性能不僅取決于網(wǎng)絡(luò)的平均帶寬,還取決于流完成時(shí)間的分布。完成時(shí)間分布中的長(zhǎng)尾或異常值可能會(huì)顯著降低應(yīng)用程序性能。圖 2 顯示了低熵對(duì)流完成時(shí)間的影響。

pYYBAGL5_TyASv9ZAABqqYK5OY0942.png

圖 2 :。網(wǎng)絡(luò)擁塞示例

此示例由單個(gè)機(jī)架頂部交換機(jī)組成,具有 128 個(gè) 100G 端口

64 個(gè)端口是連接到服務(wù)器的 100G 下游端口。

64 個(gè)端口是連接到第 1 層交換機(jī)的 100G 上游端口。

每個(gè)下游端口接收四個(gè)帶寬相等的流量: 25G 每個(gè)流量,總共 256 個(gè)流量。

所有流量都通過靜態(tài)哈希和 ECMP 處理。

在最好的情況下,此配置的可用帶寬不會(huì)超額使用,因此可能會(huì)出現(xiàn)以下結(jié)果。在最壞的情況下,與理想情況相比,流程可能需要長(zhǎng)達(dá) 2.5 倍的時(shí)間才能完成(圖 3)。

poYBAGL5_USAXjEUAACiJ6DR9tA339.png

圖 3 :。流量完成時(shí)間可能會(huì)有很大變化

在這種情況下,一些端口擁塞,而其他端口未使用。最后一個(gè)流量(最壞流量)的預(yù)期持續(xù)時(shí)間是預(yù)期第一個(gè)流量持續(xù)時(shí)間的 250% 。此外, 10% 的流量預(yù)計(jì)流量完成時(shí)間超過 150% 。也就是說,有一個(gè)長(zhǎng)尾流,完成時(shí)間比預(yù)期的要長(zhǎng)。為了避免高置信度擁塞( 98% ),必須將所有流的帶寬降低到 50% 以下。

為什么有許多流會(huì)因完成時(shí)間過長(zhǎng)而受到影響?這是因?yàn)?ECMP 上的一些端口非常擁擠。當(dāng)流完成傳輸并釋放一些端口帶寬時(shí),滯后流通過相同的擁塞端口,導(dǎo)致更多擁塞。這是因?yàn)樵趯?duì)標(biāo)頭進(jìn)行哈希處理后,路由是靜態(tài)的。

自適應(yīng)路由

NVIDIA 正在為頻譜交換機(jī)引入自適應(yīng)路由。通過自適應(yīng)路由,轉(zhuǎn)發(fā)到 ECMP 組的流量選擇擁塞程度最低的端口進(jìn)行傳輸。擁塞基于出口隊(duì)列負(fù)載進(jìn)行評(píng)估,確保 ECMP 組在不考慮熵級(jí)別的情況下保持良好平衡。向多個(gè)服務(wù)器發(fā)出多個(gè)請(qǐng)求的應(yīng)用程序以最小的時(shí)間變化接收數(shù)據(jù)。

這是如何實(shí)現(xiàn)的?對(duì)于轉(zhuǎn)發(fā)到 ECMP 組的每個(gè)數(shù)據(jù)包,交換機(jī)在其出口隊(duì)列上選擇負(fù)載最小的端口。評(píng)估的隊(duì)列是那些與數(shù)據(jù)包服務(wù)質(zhì)量匹配的隊(duì)列。

相比之下,傳統(tǒng)的 ECMP 基于哈希方法進(jìn)行端口決策,這通常無法產(chǎn)生清晰的比較。當(dāng)相同流的不同數(shù)據(jù)包通過網(wǎng)絡(luò)的不同路徑傳輸時(shí),它們可能會(huì)無序到達(dá)目的地。在 RoCE 傳輸層, NVIDIA ConnectX NIC 負(fù)責(zé)處理無序數(shù)據(jù)包,并將數(shù)據(jù)按順序轉(zhuǎn)發(fā)給應(yīng)用程序。這使得從中受益的應(yīng)用程序看不到自適應(yīng)路由的魔力。

在發(fā)送方方面, ConnectX 可以動(dòng)態(tài)標(biāo)記流量,以符合網(wǎng)絡(luò)重新排序的條件,從而確保在需要時(shí)可以強(qiáng)制執(zhí)行消息間排序。交換機(jī)自適應(yīng)路由分類器只能對(duì)這些標(biāo)記的 RoCE 流量進(jìn)行分類,使其服從其唯一的轉(zhuǎn)發(fā)。

頻譜自適應(yīng)路由技術(shù)支持各種網(wǎng)絡(luò)拓?fù)?。?duì)于 CLO (或葉/脊椎)等典型拓?fù)洌浇o定目標(biāo)的各種路徑的距離是相同的。因此,交換機(jī)通過擁塞最小的端口傳輸數(shù)據(jù)包。在路徑之間距離不同的其他拓?fù)渲?,交換機(jī)傾向于通過最短路徑發(fā)送流量。如果擁塞發(fā)生在最短路徑上,則選擇擁塞最小的備選路徑。這確保了網(wǎng)絡(luò)帶寬得到有效利用。

工作量結(jié)果

存儲(chǔ)

為了驗(yàn)證 RoCE 中自適應(yīng)路由的效果,我們從測(cè)試簡(jiǎn)單的 RDMA 寫測(cè)試應(yīng)用程序開始。在這些在多個(gè) 50 Gb / s 主機(jī)上運(yùn)行的測(cè)試中,我們將主機(jī)分成幾對(duì),每對(duì)主機(jī)在很長(zhǎng)一段時(shí)間內(nèi)互相發(fā)送大型 RDMA 寫流。這種類型的流量模式是存儲(chǔ)應(yīng)用程序工作負(fù)載中的典型模式。

圖 4 顯示了基于哈希的靜態(tài)路由在上行鏈路端口上發(fā)生沖突,導(dǎo)致流完成時(shí)間增加,帶寬減少,流之間的公平性降低。在轉(zhuǎn)移到自適應(yīng)路由后,所有問題都得到了解決。

poYBAGL5_UqAR-2dAACod1EFBFQ723.png

圖 4 :。針對(duì)存儲(chǔ)工作負(fù)載的自適應(yīng)路由

在第一個(gè)圖中,所有流幾乎同時(shí)完成,峰值帶寬相當(dāng)。

在第二個(gè)圖中,一些流實(shí)現(xiàn)了相同的帶寬和完成時(shí)間,而其他流發(fā)生沖突,導(dǎo)致完成時(shí)間更長(zhǎng),帶寬更低。實(shí)際上,在 ECMP 的情況下,一些流在 13 秒的理想完成時(shí)間 T 內(nèi)完成,而性能最差的流需要 31 秒,約為 T 的 2.5 倍。

人工智能/高性能混凝土

為了繼續(xù)評(píng)估 RoCE 工作負(fù)載中的自適應(yīng)路由,我們?cè)谝粋€(gè) 32 服務(wù)器測(cè)試臺(tái)上測(cè)試了常見 AI 基準(zhǔn)的性能增益,該測(cè)試臺(tái)在兩級(jí) fat 樹網(wǎng)絡(luò)拓?fù)渲惺褂盟膫€(gè) NVIDIA 頻譜交換機(jī)構(gòu)建。該基準(zhǔn)評(píng)估了分布式 AI 培訓(xùn)和 HPC 工作負(fù)載中常見的集體操作和網(wǎng)絡(luò)流量模式,如全對(duì)全流量和全減少集體操作。

總結(jié)

在許多情況下,基于靜態(tài)哈希的轉(zhuǎn)發(fā)會(huì)導(dǎo)致高擁塞和可變流完成時(shí)間。這會(huì)降低應(yīng)用程序級(jí)性能。

NVIDIA 頻譜自適應(yīng)路由解決了這個(gè)問題。這項(xiàng)技術(shù)增加了網(wǎng)絡(luò)使用的帶寬,最大限度地減少了流完成時(shí)間的變化,從而提高了應(yīng)用程序的性能。

將此技術(shù)與 NVIDIA ConnectX NIC 提供的 RoCE 無序支持相結(jié)合,應(yīng)用程序?qū)λ褂玫募夹g(shù)是透明的。這確保了 NVIDIA Spectrum Ethernet 平臺(tái)提供了實(shí)現(xiàn)最大數(shù)據(jù)中心性能所需的加速以太網(wǎng)。

關(guān)于作者

Gil Levy 擁有 25 年的網(wǎng)絡(luò)產(chǎn)品 ASIC 設(shè)計(jì)經(jīng)驗(yàn)。他的重點(diǎn)領(lǐng)域是高速數(shù)據(jù)包處理、數(shù)據(jù)包緩沖、擁塞控制、可編程性和遙測(cè)。在過去的 8 年中,他一直在 NVIDIA 的頻譜以太網(wǎng)產(chǎn)品線工作。他之前曾為 Marvell 、 Broadlight 和 Galileo 工作,為企業(yè)、 metro 和數(shù)據(jù)中心市場(chǎng)開發(fā)以太網(wǎng)交換機(jī)和網(wǎng)絡(luò)處理器 ASIC 。吉爾擁有特拉維夫大學(xué)電氣工程學(xué)士學(xué)位,目前正在瑞奇曼大學(xué)攻讀計(jì)算機(jī)科學(xué)碩士學(xué)位。

Yonatan Piasetzky 在 NVIDIA 網(wǎng)絡(luò)業(yè)務(wù)部門( NBU )的端到端高級(jí)開發(fā)團(tuán)隊(duì)工作。 Yonatan 從端到端的角度研究 HPC 和 AI 工作負(fù)載的加速網(wǎng)絡(luò),包括 DPU 和交換機(jī),以及下一代高性能網(wǎng)絡(luò)的虛擬化和云解決方案。 Yonatan 在特拉維夫大學(xué)獲得物理和電氣工程學(xué)士學(xué)位,在魏茨曼研究所獲得理學(xué)碩士學(xué)位,目前正在特拉維夫大學(xué)攻讀集成光子學(xué)量子計(jì)算博士學(xué)位。

Barak Gafni 是 NVIDIA 的架構(gòu)師,專注于實(shí)現(xiàn)未來的高性能、可擴(kuò)展和簡(jiǎn)單網(wǎng)絡(luò)。巴拉克擁有特拉維夫大學(xué)電氣工程學(xué)士學(xué)位,曾參與撰寫多份 IETF 草案,并在網(wǎng)絡(luò)領(lǐng)域擁有多項(xiàng)專利。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    41

    文章

    5630

    瀏覽量

    175836
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5304

    瀏覽量

    106323
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    13

    文章

    9786

    瀏覽量

    87903
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    無刷直流電機(jī)自適應(yīng)模糊直接轉(zhuǎn)矩控制研究

    針對(duì)無刷直流電機(jī)( BLDCM)轉(zhuǎn)矩脈動(dòng)較大和傳統(tǒng) P1速度環(huán)調(diào)節(jié)能力差的問題,提出了自適應(yīng)模糊直接轉(zhuǎn)矩控制的策略。集成了轉(zhuǎn)矩直接控制和模糊控制自適應(yīng)強(qiáng)的優(yōu)點(diǎn),可以有效抑制轉(zhuǎn)矩脈動(dòng)和加快轉(zhuǎn)矩響應(yīng)速度
    發(fā)表于 07-09 14:20

    無刷直流電機(jī)自適應(yīng)模糊PID控制系統(tǒng)

    摘要:針對(duì)無刷直流電機(jī)傳統(tǒng)PID控制存在精度低、抗于抗能力差及模糊控制穩(wěn)態(tài)精度不高等問題,研究了一種自適應(yīng)模糊PID控制方法。論文分析了直流無刷電機(jī)的工作原理,建立了直流無刷電機(jī)自適應(yīng)模期PID
    發(fā)表于 07-09 14:18

    CYW43907使用AP功能時(shí)是否具有自適應(yīng)功能?

    我們想在我們的產(chǎn)品中使用這種芯片來獲得 CE 注冊(cè)證書,CE 需要自適應(yīng)功能,但是我們?cè)跀?shù)據(jù)表和源包中找不到任何消息。functions 要執(zhí)行如下: 啟動(dòng)時(shí)自動(dòng)掃描并選擇干擾較小的頻道,遇到干擾
    發(fā)表于 07-09 08:21

    無刷直流電機(jī)雙閉環(huán)模糊自適應(yīng)控制方法研究

    純分享帖,點(diǎn)擊下方附件免費(fèi)獲取完整資料~~~ *附件:無刷直流電機(jī)雙閉環(huán)模糊自適應(yīng)控制方法研究.pdf 【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請(qǐng)第一時(shí)間告知,刪除內(nèi)容,謝謝!
    發(fā)表于 07-08 18:35

    無刷直流電機(jī)模糊自適應(yīng)PID的研究及仿真

    附件免費(fèi)獲取完整資料~~~ *附件:無刷直流電機(jī)模糊自適應(yīng)PID的研究及仿真.pdf 【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請(qǐng)第一時(shí)間告知,刪除內(nèi)容,謝謝!
    發(fā)表于 07-07 18:26

    無刷直流電機(jī)單神經(jīng)元自適應(yīng)智能控制系統(tǒng)

    摘要:針對(duì)無刷直流電機(jī)(BLDCM)設(shè)計(jì)了一種可在線學(xué)習(xí)的單神經(jīng)元自適應(yīng)比例-積分-微分(PID)智能控制器,通過有監(jiān)督的 Hebb學(xué)習(xí)規(guī)則調(diào)整權(quán)值,每次采樣根據(jù)反饋誤差對(duì)神經(jīng)元權(quán)值進(jìn)行調(diào)整,以實(shí)現(xiàn)
    發(fā)表于 06-26 13:36

    矩陣變換器驅(qū)動(dòng)異步電機(jī)模糊自適應(yīng)PI控制

    純分享帖,需要者可點(diǎn)擊附件免費(fèi)獲取完整資料~~~*附件:矩陣變換器驅(qū)動(dòng)異步電機(jī)模糊自適應(yīng)PI控制.pdf【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請(qǐng)第一時(shí)間告知,刪除內(nèi)容!
    發(fā)表于 06-04 14:46

    NVIDIA硅光網(wǎng)絡(luò)交換機(jī)在數(shù)據(jù)中心中的優(yōu)勢(shì)

    NVIDIA 通過將硅光技術(shù)直接與 NVIDIA Quantum 和 NVIDIA Spectrum 交換機(jī) IC 集成,開辟了新的領(lǐng)域。在
    的頭像 發(fā)表于 04-11 09:54 ?435次閱讀

    永磁同步電機(jī)自適應(yīng)高階滑模Type-2模糊控制

    。文章來源于網(wǎng)絡(luò),純分享帖,點(diǎn)擊附件查看全文(如有涉及侵權(quán),請(qǐng)聯(lián)系刪除?。?附件:永磁同步電機(jī)自適應(yīng)高階滑模Type-2模糊控制.pdf
    發(fā)表于 03-27 11:54

    NVIDIA推出全新硅光網(wǎng)絡(luò)交換機(jī)

    NVIDIA 今天推出了 NVIDIA Spectrum-X 和 NVIDIA Quantum-X 硅光網(wǎng)絡(luò)交換機(jī),使 AI 工廠能夠跨區(qū)域
    的頭像 發(fā)表于 03-20 14:52 ?468次閱讀

    GLAD應(yīng)用:大氣像差與自適應(yīng)光學(xué)

    概述 激光在大氣湍流中傳輸時(shí)會(huì)拾取大氣湍流導(dǎo)致的相位畸變,特別是在長(zhǎng)距離傳輸?shù)募す馔ㄐ畔到y(tǒng)中。這種畸變會(huì)使傳輸激光的波前劣化。通過在系統(tǒng)中引入自適應(yīng)光學(xué)系統(tǒng),可以對(duì)激光傳輸時(shí)拾取的低頻畸變進(jìn)行校正
    發(fā)表于 03-10 08:55

    基于自適應(yīng)優(yōu)化的高速交叉矩陣設(shè)計(jì)

    提出了一種基于自適應(yīng)優(yōu)化的交叉矩陣傳輸設(shè)計(jì),采用AHB協(xié)議并引入自適應(yīng)突發(fā)傳輸調(diào)整和自適應(yīng)優(yōu)先級(jí)調(diào)整的創(chuàng)新機(jī)制。通過動(dòng)態(tài)調(diào)整突發(fā)傳輸?shù)拈L(zhǎng)度和優(yōu)先級(jí)分配,實(shí)現(xiàn)了對(duì)數(shù)據(jù)流的有效管理,提升了
    的頭像 發(fā)表于 01-18 10:24 ?397次閱讀

    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)

    市的 Colossus 超級(jí)計(jì)算機(jī)集群達(dá)到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡(luò)平臺(tái),該平臺(tái)
    發(fā)表于 10-30 09:33 ?354次閱讀
    <b class='flag-5'>NVIDIA</b> 以太網(wǎng)<b class='flag-5'>加速</b> xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)

    簡(jiǎn)單認(rèn)識(shí)NVIDIA網(wǎng)絡(luò)平臺(tái)

    NVIDIA Spectrum-X800 平臺(tái)是業(yè)界第一代 800Gb/s 的以太網(wǎng)網(wǎng)絡(luò)平臺(tái),包括了 NVIDIA Spectrum SN5
    的頭像 發(fā)表于 09-09 09:22 ?805次閱讀

    應(yīng)用NVIDIA Spectrum-X網(wǎng)絡(luò)構(gòu)建新型主權(quán)AI云

    法國(guó)云服務(wù)提供商 Scaleway 正在基于 NVIDIA 的 Hopper GPU和 Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺(tái) 構(gòu)建區(qū)域性 GPU 集群,為用戶提供 AI 按需服務(wù)業(yè)
    的頭像 發(fā)表于 07-26 18:58 ?1479次閱讀