99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA SuperNIC推進(jìn)現(xiàn)代AI基礎(chǔ)設(shè)施發(fā)展

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-11-06 13:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在生成式 AI 時(shí)代,加速網(wǎng)絡(luò)對于為大規(guī)模分布式 AI 工作負(fù)載構(gòu)建高性能計(jì)算平臺至關(guān)重要。NVIDIA 在加速網(wǎng)絡(luò)領(lǐng)域繼續(xù)保持領(lǐng)先地位,提供先進(jìn)的以太網(wǎng)和 InfiniBand 解決方案,可最大限度地提高 AI 工廠和云數(shù)據(jù)中心的性能和效率。

這些解決方案的核心是NVIDIA SuperNIC,一種專為超大規(guī)模 AI 工作負(fù)載而優(yōu)化的新型網(wǎng)絡(luò)加速器。這些 SuperNIC 是NVIDIA Spectrum-X 以太網(wǎng)和Quantum-X800 InfiniBand 網(wǎng)絡(luò)平臺的關(guān)鍵組件,旨在提供前所未有的可擴(kuò)展性和性能。

ConnectX-8 SuperNIC 是 NVIDIA SuperNIC 產(chǎn)品系列中的新成員,與 BlueField-3 SuperNIC 一起,共同推動加速的大規(guī)模 AI 計(jì)算網(wǎng)絡(luò)的新一輪創(chuàng)新浪潮。ConnectX-8 SuperNIC 的總數(shù)據(jù)吞吐量為 800 Gb/s,可為萬億級參數(shù)的 AI 模型提供所需的速度、網(wǎng)絡(luò)健壯性和可擴(kuò)展性,并與 NVIDIA 交換機(jī)無縫集成,以實(shí)現(xiàn)最佳性能。

本文將探討 NVIDIA SuperNIC 的獨(dú)特屬性及其在推進(jìn)現(xiàn)代 AI 基礎(chǔ)設(shè)施發(fā)展方面的關(guān)鍵作用。

RoCE 對于 AI 工作負(fù)載的重要性

對于 AI 模型訓(xùn)練來說,在數(shù)據(jù)中心內(nèi)的 GPU 之間高速傳輸龐大的數(shù)據(jù)集是 AI 方案縮短訓(xùn)練時(shí)間和加快上市時(shí)間的關(guān)鍵。

NVIDIA SuperNIC 具備了出色的硬件 RoCE 加速功能,可實(shí)現(xiàn)高達(dá) 800 Gb/s 的 GPUDirect RDMA 通信速度,解決了旁路 CPU 在 GPU 之間實(shí)現(xiàn)直接數(shù)據(jù)傳輸面臨的挑戰(zhàn)。

這種直接通信的方法可最大限度地減少 CPU 開銷并降低延遲,在 GPU 顯存之間實(shí)現(xiàn)更快、更高效的數(shù)據(jù)傳輸。在實(shí)際應(yīng)用中,此功能可實(shí)現(xiàn)更高的并行度,在 AI 工作負(fù)載多節(jié)點(diǎn)擴(kuò)展時(shí),不會出現(xiàn)傳統(tǒng)的基于 CPU 的數(shù)據(jù)傳輸常見的的通信瓶頸。

通過 Spectrum-X RoCE 動態(tài)路由

提升 AI 性能

NVIDIA SuperNIC 的直接數(shù)據(jù)放置(DDP)功能是 Spectrum-X 平臺提升 AI 網(wǎng)絡(luò)性能的關(guān)鍵之一。

隨著生成式 AI 工作負(fù)載擴(kuò)展到了數(shù)千個(gè)節(jié)點(diǎn)以上,以等價(jià)多路徑(ECMP)為代表的傳統(tǒng) IP 路由協(xié)議再難以處理 AI 模型生成的大規(guī)模、持續(xù)的數(shù)據(jù)流(俗稱大象流)。這些流可能會使網(wǎng)絡(luò)資源不堪重負(fù),并導(dǎo)致?lián)砣?,從而降低整體網(wǎng)絡(luò)性能。

Spectrum-X RoCE 動態(tài)路由可以在可用的網(wǎng)絡(luò)路徑中動態(tài)調(diào)整流量的分配,確保需要高帶寬的流以最佳方式路由,以防止網(wǎng)絡(luò)擁塞。該方法利用 NVIDIA Spectrum-4 以太網(wǎng)交換機(jī)可在多個(gè)路徑上均勻分發(fā)數(shù)據(jù)包的負(fù)載均衡功能,避免了傳統(tǒng)靜態(tài)路由機(jī)制造成的瓶頸。

然而,使用這樣的數(shù)據(jù)包分發(fā)的方式,可能會導(dǎo)致數(shù)據(jù)包亂序問題的出現(xiàn)。

NVIDIA SuperNIC 通過在數(shù)據(jù)包到達(dá)接收端時(shí)將其直接按序放入緩沖區(qū)來解決了這一問題,確保了應(yīng)用能收到正確順序的數(shù)據(jù)。這種 NVIDIA 交換機(jī)和 SuperNIC 之間的緊密合作,實(shí)現(xiàn)了高效、高速的 AI 工作負(fù)載通信,確保大規(guī)模 AI 模型能夠持續(xù)地處理數(shù)據(jù),而不會中斷或降低性能。

解決 AI 網(wǎng)絡(luò)的擁塞問題

由于 AI 工作負(fù)載的突發(fā)性,因此極易受到網(wǎng)絡(luò)擁塞的影響。AI 模型訓(xùn)練(尤其是通過集合通信在多個(gè) GPU 之間進(jìn)行同步和共享數(shù)據(jù)時(shí))會產(chǎn)生頻繁且短暫流量峰值,這需要先進(jìn)的擁塞管理機(jī)制來保持網(wǎng)絡(luò)的性能。傳統(tǒng)的擁塞控制方法(例如基于 TCP 的流量控制)無法處理這種 AI 獨(dú)特的流量模型。

為了解決這一問題,Spectrum-X 采用了基于 Spectrum-4 交換機(jī)的實(shí)時(shí)遙測功能的先進(jìn)擁塞控制機(jī)制,使得 SuperNIC 能夠根據(jù)當(dāng)前的網(wǎng)絡(luò)利用率主動地調(diào)整數(shù)據(jù)發(fā)送的速率,防止擁塞,避免問題的發(fā)生。

通過使用帶內(nèi)高頻遙測數(shù)據(jù),SuperNIC 可以以微秒級精度作出反應(yīng),確保即使在高流量條件下也能優(yōu)化網(wǎng)絡(luò)帶寬并盡可能降低延遲。

使用增強(qiáng)的可編程 I/O 加速 AI 網(wǎng)絡(luò)

隨著 AI 工作負(fù)載日益復(fù)雜,網(wǎng)絡(luò)基礎(chǔ)設(shè)施不僅必須在速度上不斷發(fā)展,還需要在適應(yīng)性方面進(jìn)步,以支持?jǐn)?shù)千個(gè)節(jié)點(diǎn)之間的各種通信模式。

NVIDIA SuperNIC 處于這項(xiàng)創(chuàng)新的前沿,提供增強(qiáng)的可編程 I/O 功能,這些功能對于現(xiàn)代 AI 數(shù)據(jù)中心環(huán)境至關(guān)重要。這些 SuperNIC 具有加速數(shù)據(jù)包處理管線,能夠以線速運(yùn)行,吞吐量高達(dá) 800 Gb/s。

通過將數(shù)據(jù)包處理任務(wù)從 CPU 卸載到 SuperNIC,此管道可顯著降低網(wǎng)絡(luò)延遲并提高整體系統(tǒng)效率。管道的可編程性由 NVIDIA DOCA 軟件框架提供支持,為網(wǎng)絡(luò)專業(yè)人員提供了大規(guī)模構(gòu)建和優(yōu)化網(wǎng)絡(luò)的靈活性。

NVIDIA SuperNIC 采用數(shù)據(jù)路徑加速器(DPA),可增強(qiáng)可編程性。DPA 是一種高度并行的 I/O 處理器,配備 16 個(gè)超線程核心,專為處理 I/O 密集型工作負(fù)載而設(shè)計(jì)。它可以通過 DOCA 針對設(shè)備仿真、擁塞控制和流量管理等各種低代碼應(yīng)用程序輕松進(jìn)行編程。這種可編程性使組織能夠根據(jù)其 AI 工作負(fù)載的特定需求定制網(wǎng)絡(luò)基礎(chǔ)設(shè)施,確保數(shù)據(jù)在保持峰值性能的同時(shí)跨網(wǎng)絡(luò)高效流動。

保護(hù) AI 網(wǎng)絡(luò)連接

保護(hù) AI 模型對于保護(hù)敏感數(shù)據(jù)和知識產(chǎn)權(quán)免遭潛在的漏洞和對抗性攻擊至關(guān)重要。當(dāng)您的組織構(gòu)建 AI 工廠和云數(shù)據(jù)中心時(shí),您需要有效的安全解決方案來解決可能損害模型性能和可信度的漏洞,最終保護(hù)競爭優(yōu)勢和用戶隱私。

傳統(tǒng)的網(wǎng)絡(luò)加密方法通常難以擴(kuò)展到 100 Gb/s 以上,從而使關(guān)鍵數(shù)據(jù)處于危險(xiǎn)之中。相比之下,NVIDIA SuperNIC 可提供加速網(wǎng)絡(luò)和在線加密加速,速度高達(dá) 800 Gb/s,確保數(shù)據(jù)在傳輸過程中保持加密狀態(tài),同時(shí)實(shí)現(xiàn)峰值 AI 性能。

NVIDIA SuperNIC 為 IPsec、TLS 和可擴(kuò)展的 PSP 加密操作提供硬件加速支持,為保護(hù)人工智能網(wǎng)絡(luò)環(huán)境提供成熟的解決方案。

PSP 由 Google 開發(fā),并為開源社區(qū)做出了貢獻(xiàn)。PSP 從一開始就采用無狀態(tài)設(shè)計(jì),非常適合支持超大規(guī)模數(shù)據(jù)中心環(huán)境的需求。該架構(gòu)允許獨(dú)立處理每個(gè)請求,從而增強(qiáng)在分布式系統(tǒng)中管理加密操作的可擴(kuò)展性和彈性。

結(jié)束語

在生成式 AI 的動態(tài)格局中,NVIDIA SuperNIC 作為 NVIDIA Spectrum-X 和 Quantum-X800 網(wǎng)絡(luò)平臺不可或缺的一部分,為網(wǎng)絡(luò)的變革時(shí)代奠定了基礎(chǔ)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106445
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7815

    瀏覽量

    90979
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35166

    瀏覽量

    280095

原文標(biāo)題:NVIDIA SuperNIC 驅(qū)動新一代 AI 網(wǎng)絡(luò)發(fā)展

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA DOCA 3.0版本的亮點(diǎn)解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎(chǔ)設(shè)施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每
    的頭像 發(fā)表于 07-04 14:27 ?345次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮點(diǎn)解析

    Arm如何助力AI基礎(chǔ)設(shè)施變革

    眾所周知,人工智能 (AI) 有望革新人類活動的方方面面。然而,要充分釋放這一潛力,就必須面對一個(gè)基本事實(shí):支撐傳統(tǒng)計(jì)算的基礎(chǔ)設(shè)施已無法滿足未來 AI 發(fā)展的需求。
    的頭像 發(fā)表于 07-03 14:29 ?348次閱讀

    NVIDIA技術(shù)助力企業(yè)創(chuàng)建主權(quán)AI智能體

    AI Factory 的經(jīng)驗(yàn)證設(shè)計(jì)將加速基礎(chǔ)設(shè)施與軟件(包括全新 NVIDIA NIM 微服務(wù)和經(jīng)擴(kuò)展的 NVIDIA Blueprint)相結(jié)合,為各國和企業(yè)簡化了全棧式
    的頭像 發(fā)表于 06-16 14:28 ?605次閱讀

    歐洲聯(lián)手NVIDIA打造AI基礎(chǔ)設(shè)施

    NVIDIA 于近日宣布,其正在攜手歐洲各國、科技和行業(yè)領(lǐng)導(dǎo)者,共同建造 NVIDIA Blackwell AI 基礎(chǔ)設(shè)施,以強(qiáng)化數(shù)字主權(quán)、支撐經(jīng)濟(jì)增長,并推動歐洲大陸成為
    的頭像 發(fā)表于 06-16 14:25 ?533次閱讀

    維諦加速推進(jìn)人工智能基礎(chǔ)設(shè)施演進(jìn),助力NVIDIA 800 VDC 電源架構(gòu)發(fā)布

    :VRT)今日宣布與NVIDIA在人工智能發(fā)展路線圖方面達(dá)成高度戰(zhàn)略協(xié)同。NVIDIA發(fā)布全新規(guī)劃,旨在為下一代AI數(shù)據(jù)中心部署800VDC電源基礎(chǔ)
    的頭像 發(fā)表于 05-22 14:18 ?426次閱讀
    維諦加速<b class='flag-5'>推進(jìn)</b>人工智能<b class='flag-5'>基礎(chǔ)設(shè)施</b>演進(jìn),助力<b class='flag-5'>NVIDIA</b> 800 VDC 電源架構(gòu)發(fā)布

    NVIDIA CEO黃仁勛展望AI基礎(chǔ)設(shè)施產(chǎn)業(yè)

    NVIDIA CEO 黃仁勛在 COMPUTEX 的主題演講中,描繪了 AI 未來的宏偉愿景,同時(shí)展示了新平臺與新合作。
    的頭像 發(fā)表于 05-22 10:11 ?355次閱讀

    PoE交換機(jī)如何助力智慧城市基礎(chǔ)設(shè)施建設(shè)?

    隨著全球城市化的加速發(fā)展,智慧城市的概念正逐步成為現(xiàn)實(shí)。通過技術(shù)手段提升居民生活質(zhì)量、優(yōu)化城市運(yùn)營并促進(jìn)可持續(xù)發(fā)展已成為趨勢。彈性且高效的網(wǎng)絡(luò)是智慧城市基礎(chǔ)設(shè)施的關(guān)鍵支撐,而以太網(wǎng)供電(PoE
    發(fā)表于 03-25 10:20

    英偉達(dá)GTC2025亮點(diǎn):NVIDIA與行業(yè)領(lǐng)先存儲企業(yè)共同推出面向AI時(shí)代的新型企業(yè)基礎(chǔ)設(shè)施

    的參考設(shè)計(jì),領(lǐng)先的存儲提供商可用來構(gòu)建全新的 AI 基礎(chǔ)設(shè)施,以滿足 AI 推理工作負(fù)載的嚴(yán)苛要求:即企業(yè)存儲平臺,搭載由 NVIDIA 加速計(jì)算、網(wǎng)絡(luò)和軟件驅(qū)動的
    的頭像 發(fā)表于 03-21 09:42 ?670次閱讀

    NVIDIA 與行業(yè)領(lǐng)先的存儲企業(yè)共同推出面向 AI 時(shí)代的新型企業(yè)基礎(chǔ)設(shè)施

    存儲提供商構(gòu)建搭載 AI 查詢智能體的基礎(chǔ)設(shè)施,利用 NVIDIA 計(jì)算、網(wǎng)絡(luò)和軟件,針對復(fù)雜查詢進(jìn)行推理并快速生成準(zhǔn)確響應(yīng) ? 美國加利福尼亞州圣何塞 —— GTC —— 太平洋時(shí)間 2025 年
    發(fā)表于 03-19 10:11 ?244次閱讀
    <b class='flag-5'>NVIDIA</b> 與行業(yè)領(lǐng)先的存儲企業(yè)共同推出面向 <b class='flag-5'>AI</b> 時(shí)代的新型企業(yè)<b class='flag-5'>基礎(chǔ)設(shè)施</b>

    單對以太網(wǎng)技術(shù)助力現(xiàn)代通信基礎(chǔ)設(shè)施發(fā)展

    單對以太網(wǎng)(SPE)技術(shù)為現(xiàn)代通信基礎(chǔ)設(shè)施帶來了真正的附加價(jià)值。Phoenix Contact憑借在SPE領(lǐng)域的全面產(chǎn)品組合,提供技術(shù)解決方案和跨行業(yè)專業(yè)知識。
    的頭像 發(fā)表于 02-26 14:19 ?564次閱讀

    DXC實(shí)現(xiàn)全球IT基礎(chǔ)設(shè)施現(xiàn)代

    -Skanska選擇DXC實(shí)現(xiàn)全球IT基礎(chǔ)設(shè)施現(xiàn)代化 弗吉尼亞州阿什布恩2025年2月26日?/美通社/ -- 全球領(lǐng)先的《財(cái)富》世界500強(qiáng)技術(shù)服務(wù)提供商DXC Technology
    的頭像 發(fā)表于 02-26 11:41 ?299次閱讀
    DXC實(shí)現(xiàn)全球IT<b class='flag-5'>基礎(chǔ)設(shè)施</b><b class='flag-5'>現(xiàn)代</b>化

    NVIDIA AI正加速推進(jìn)藥物研發(fā)

    在當(dāng)前的醫(yī)療健康領(lǐng)域,AI 的重要性愈發(fā)凸顯。NVIDIA AI 正加速推進(jìn)藥物研發(fā),致力于減少藥物的研發(fā)時(shí)間和成本,使更多的老年患者能夠更快獲得關(guān)鍵治療。
    的頭像 發(fā)表于 11-19 16:07 ?716次閱讀

    NVIDIA助力印度打造AI基礎(chǔ)設(shè)施

    在孟買舉辦的 NVIDIA AI Summit 上,黃仁勛和穆克什·安巴尼(Mukesh Ambani)探討了關(guān)于 AI 基礎(chǔ)設(shè)施的投資,這些投資有望為各行各業(yè)帶來變革。
    的頭像 發(fā)表于 10-27 09:44 ?579次閱讀

    NVIDIA與思科合作打造企業(yè)級生成式AI基礎(chǔ)設(shè)施

    NVIDIA 加速計(jì)算平臺、NVIDIA AI Enterprise 軟件和 NVIDIA NIM 推理微服務(wù)加持的思科 Nexus HyperFabric
    的頭像 發(fā)表于 10-10 09:35 ?848次閱讀

    Sam Altman的全球AI基礎(chǔ)設(shè)施建設(shè)計(jì)劃加速推進(jìn)

    Altman正密鑼緊鼓地籌備一項(xiàng)雄心勃勃的計(jì)劃,旨在吸引全球投資者的目光與資金,共同推動人工智能基礎(chǔ)設(shè)施的全面建設(shè)。這一計(jì)劃的輪廓日益清晰,預(yù)示著AI時(shí)代的新篇章即將開啟。
    的頭像 發(fā)表于 09-04 16:13 ?899次閱讀