99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用Magnum IO用于云本機(jī)超級(jí)計(jì)算架構(gòu)

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2022-04-15 14:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

超級(jí)計(jì)算機(jī)是一項(xiàng)重要的投資,但對(duì)于研究人員和科學(xué)家來(lái)說(shuō),它們是極其寶貴的工具。為了有效和安全地共享這些數(shù)據(jù)中心的計(jì)算能力, NVIDIA 引入了云本地超級(jí)計(jì)算架構(gòu)。它結(jié)合了裸機(jī)性能、多租戶(hù)和超級(jí)計(jì)算的性能隔離。

Magnum IO是數(shù)據(jù)中心的 I / O 子系統(tǒng),它引入了新的增強(qiáng)功能,以加速支持多租戶(hù)數(shù)據(jù)中心的 I / O 和通信。我們將這些增強(qiáng)功能稱(chēng)為 Magnum IO ,用于云本機(jī)超級(jí)計(jì)算架構(gòu)。

它們由 NVIDIA Quantum-2 InfiniBand 平臺(tái)提供,該平臺(tái)包括 NVIDIA Quantum-2 交換機(jī)系列、BlueField-3 DPU 和 ConnectX-7 網(wǎng)絡(luò)適配器。

這種進(jìn)化環(huán)境的挑戰(zhàn)是什么?

基于 GPU 的高性能計(jì)算已經(jīng)通過(guò)機(jī)器學(xué)習(xí)模擬改變了科學(xué)并增強(qiáng)了實(shí)驗(yàn)。運(yùn)行這些深度學(xué)習(xí)框架和模擬工具的 GPU 會(huì)消耗數(shù) PB 的數(shù)據(jù),并在整個(gè)數(shù)據(jù)中心造成擁塞和瓶頸。使事情進(jìn)一步復(fù)雜化的是,這些應(yīng)用程序的多個(gè)實(shí)例在共享超級(jí)計(jì)算基礎(chǔ)設(shè)施中同時(shí)運(yùn)行會(huì)對(duì)每個(gè)應(yīng)用程序的性能產(chǎn)生不利影響,從而導(dǎo)致無(wú)法預(yù)測(cè)的運(yùn)行時(shí)間。

Magnum IO for Cloud 本機(jī)超級(jí)計(jì)算體系結(jié)構(gòu)具有新的和改進(jìn)的功能,以減輕在多租戶(hù)環(huán)境中運(yùn)行對(duì)最終用戶(hù)性能的負(fù)面影響。它提供確定性的性能級(jí)別,就好像它們的應(yīng)用程序是網(wǎng)絡(luò)上唯一運(yùn)行的應(yīng)用程序一樣。

第三代 NVIDIA SHARP (可擴(kuò)展分層聚合和縮減協(xié)議)

夏普技術(shù)通過(guò)消除端點(diǎn)之間多次發(fā)送數(shù)據(jù)的需要,將集合操作從主機(jī) CPU 卸載到交換機(jī)網(wǎng)絡(luò),從而提高了 MPI 操作的性能。這種方法減少了到達(dá)聚合節(jié)點(diǎn)時(shí)通過(guò)網(wǎng)絡(luò)的數(shù)據(jù)量,并顯著減少了 MPI 操作時(shí)間。

在網(wǎng)絡(luò)中實(shí)現(xiàn)集體通信算法還有其他好處,例如釋放寶貴的 CPU 資源用于計(jì)算,而不是使用它們來(lái)處理通信。

圖 1 NVIDIA SHARP 聚合架構(gòu)框圖。

最近發(fā)布的 NVIDIA Quantum-2 InfiniBand 交換機(jī)為通過(guò)網(wǎng)絡(luò)的大型數(shù)據(jù)聚合提供了幾乎無(wú)限的可擴(kuò)展性。由于支持無(wú)限的小消息縮減和每個(gè)交換機(jī)的多個(gè)大消息縮減流,跨共享系統(tǒng)運(yùn)行應(yīng)用程序的多個(gè)租戶(hù)現(xiàn)在可以充分利用 SHARP 的優(yōu)勢(shì)。

Watch the In-Network Computing with NVIDIA SHARP Video.

性能隔離

多租戶(hù)超級(jí)計(jì)算涉及許多在共享基礎(chǔ)設(shè)施上運(yùn)行的用戶(hù)應(yīng)用程序,可能會(huì)重復(fù)使用物理服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)以及這些應(yīng)用程序生成的 I / O 流量模式。

NVIDIA Quantum InfiniBand 在檢測(cè)到網(wǎng)絡(luò)擁塞時(shí)管理網(wǎng)絡(luò)擁塞,并在源位置實(shí)施控制以減少網(wǎng)絡(luò)擁塞。但使用多租戶(hù),用戶(hù)應(yīng)用程序可能不知道對(duì)相鄰應(yīng)用程序流量的任意干擾,因此需要隔離以提供預(yù)期的性能級(jí)別。

借助最新的 NVIDIA Quantum-2 InfiniBand 平臺(tái)和 Magnum IO ,創(chuàng)新的主動(dòng)監(jiān)控和擁塞管理提供了所需的流量隔離。這幾乎消除了性能抖動(dòng),并確保了預(yù)期的預(yù)測(cè)性能,就像應(yīng)用程序在專(zhuān)用系統(tǒng)上運(yùn)行一樣。

pYYBAGJZFsmAYudXAABgOQ0GTXg079.png

圖 2 性能隔離的好處。

專(zhuān)為安全、多租戶(hù)、裸機(jī)性能而打造

NVIDIA Cloud-Native Supercomputing體系結(jié)構(gòu)使用 Magnum IO 在多租戶(hù)環(huán)境中實(shí)現(xiàn)最高性能、安全性和編排。

poYBAGJZFtCAc_hCAAECd4tBFts823.png

圖 3 使用 DPU 遷移到云本機(jī)超級(jí)計(jì)算體系結(jié)構(gòu)。

此外,實(shí)現(xiàn)這種架構(gòu)轉(zhuǎn)換的另一個(gè)核心元素是數(shù)據(jù)處理單元( DPU ),也稱(chēng)為 BlueField 。作為一個(gè)完全集成的片上數(shù)據(jù)中心平臺(tái), BlueField 卸載和管理數(shù)據(jù)中心基礎(chǔ)設(shè)施,而不是主機(jī)處理器,實(shí)現(xiàn)超級(jí)計(jì)算機(jī)的安全和協(xié)調(diào)。它還能夠提供額外的通信框架卸載,產(chǎn)生 100% 的通信計(jì)算重疊,同時(shí)實(shí)現(xiàn) MPI _ Alltoall 44% 的性能提升和 MPI _ iAllgather 36% 的性能提升。當(dāng)結(jié)合 NVIDIA Quantum-2 的最新進(jìn)展時(shí),該體系結(jié)構(gòu)在安全的多節(jié)點(diǎn)體系結(jié)構(gòu)中展示了裸機(jī)性能的性能隔離。

Magnum IO 消除了 I / O 瓶頸,并公開(kāi)了硬件級(jí)加速引擎、網(wǎng)絡(luò)計(jì)算和擁塞控制方面的最新技術(shù),這些技術(shù)是支持當(dāng)今具有裸機(jī)性能的多租戶(hù)數(shù)據(jù)中心所必需的。

關(guān)于作者

Scot Schultz 是 HPC 技術(shù)專(zhuān)家,專(zhuān)注于人工智能和機(jī)器學(xué)習(xí)系統(tǒng)。 Scot 在分布式計(jì)算、操作系統(tǒng)、人工智能框架、高速互連和處理器技術(shù)方面擁有廣泛的知識(shí)。在他的整個(gè)職業(yè)生涯中,擁有超過(guò) 25 年的高性能計(jì)算系統(tǒng)經(jīng)驗(yàn),他的職責(zé)包括各種工程和領(lǐng)導(dǎo)角色,包括戰(zhàn)略 HPC 技術(shù)生態(tài)系統(tǒng)支持。 Scot 在眾多行業(yè)標(biāo)準(zhǔn)組織的成長(zhǎng)和發(fā)展中發(fā)揮了重要作用。

Harry Petty 是一位經(jīng)驗(yàn)豐富的數(shù)據(jù)中心營(yíng)銷(xiāo)人員和技術(shù)專(zhuān)家,曾在大型科技公司擔(dān)任領(lǐng)導(dǎo)職務(wù),為混合云、存儲(chǔ)解決方案、網(wǎng)絡(luò)處理器和服務(wù)器產(chǎn)品線推廣 SDN 產(chǎn)品。他曾與許多客戶(hù)合作,在多個(gè)數(shù)據(jù)中心部署應(yīng)用程序。當(dāng) Harry 不討論 HPC 數(shù)據(jù)中心的 IO 子系統(tǒng)時(shí),他喜歡在北加利福尼亞州附近的 Sierra 山麓和湖泊中進(jìn)行戶(hù)外活動(dòng)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5232

    瀏覽量

    73544
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49035

    瀏覽量

    249775
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8505

    瀏覽量

    134677
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Blue Lion超級(jí)計(jì)算機(jī)將在NVIDIA Vera Rubin上運(yùn)行

    德國(guó)萊布尼茨超算中心(LRZ)將迎來(lái)全新超級(jí)計(jì)算機(jī) Blue Lion,其算力比該中心現(xiàn)有的 SuperMUC-NG 高性能計(jì)算機(jī)提升了約 30 倍。這臺(tái)新的超級(jí)
    的頭像 發(fā)表于 06-12 15:39 ?417次閱讀

    揭秘計(jì)算架構(gòu)的分層奧秘

    的重要基石。那么,計(jì)算架構(gòu)究竟是如何構(gòu)建的呢?今天,我們帶您揭秘計(jì)算架構(gòu)的分層奧秘——邊緣層
    的頭像 發(fā)表于 02-26 17:41 ?527次閱讀

    HPC計(jì)算的技術(shù)架構(gòu)

    HPC計(jì)算結(jié)合了HPC的強(qiáng)大計(jì)算能力和計(jì)算的彈性、可擴(kuò)展性,為用戶(hù)提供了按需獲取高性能計(jì)算
    的頭像 發(fā)表于 02-05 14:51 ?403次閱讀

    物聯(lián)網(wǎng)IO模塊是什么

    物聯(lián)網(wǎng)IO模塊,作為工業(yè)自動(dòng)化領(lǐng)域中的關(guān)鍵組件,扮演著數(shù)據(jù)傳輸與控制的核心角色。一種具有通信功能的數(shù)據(jù)采集與傳送模塊,主要負(fù)責(zé)將現(xiàn)場(chǎng)的各種信號(hào)轉(zhuǎn)換為數(shù)字或模擬信號(hào),并傳輸至平臺(tái),或者接收來(lái)自
    的頭像 發(fā)表于 01-21 16:57 ?541次閱讀

    什么是計(jì)算平臺(tái)?搭建計(jì)算平臺(tái)需要什么條件

    計(jì)算平臺(tái)是一種以計(jì)算技術(shù)為基礎(chǔ)的計(jì)算服務(wù)平臺(tái),用于提供靈活、可擴(kuò)展、可共享的
    的頭像 發(fā)表于 01-09 10:43 ?493次閱讀

    聯(lián)發(fā)科與NVIDIA合作 為NVIDIA 個(gè)人AI超級(jí)計(jì)算機(jī)設(shè)計(jì)NVIDIA GB10超級(jí)芯片

    聯(lián)發(fā)科近日宣布與NVIDIA合作設(shè)計(jì)NVIDIA GB10 Grace Blackwell超級(jí)芯片,將應(yīng)用于NVIDIA 的個(gè)人AI超級(jí)計(jì)算機(jī)NVIDIA? Project DIGIT
    的頭像 發(fā)表于 01-07 16:26 ?604次閱讀

    計(jì)算HPC軟件關(guān)鍵技術(shù)

    計(jì)算HPC軟件關(guān)鍵技術(shù)涉及系統(tǒng)架構(gòu)、處理器技術(shù)、操作系統(tǒng)、計(jì)算加速、網(wǎng)絡(luò)技術(shù)以及軟件優(yōu)化等多個(gè)方面。下面,AI部落小編帶您探討
    的頭像 發(fā)表于 12-18 11:23 ?467次閱讀

    云端超級(jí)計(jì)算機(jī)使用教程

    云端超級(jí)計(jì)算機(jī)是一種基于計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲(chǔ)資源集中在一起,通過(guò)網(wǎng)絡(luò)向
    的頭像 發(fā)表于 12-17 10:19 ?557次閱讀

    計(jì)算和HPC的關(guān)系

    盡管計(jì)算和HPC在架構(gòu)、應(yīng)用場(chǎng)景和成本效益等方面存在顯著差異,但計(jì)算和HPC之間并非孤立存在,而是相互補(bǔ)充、協(xié)同發(fā)展的關(guān)系。下面,AI部
    的頭像 發(fā)表于 12-14 10:35 ?457次閱讀

    λ-IO:存儲(chǔ)計(jì)算下的IO棧設(shè)計(jì)

    動(dòng)機(jī)和背景? ? 存儲(chǔ)計(jì)算存儲(chǔ)資源的充分利用。IO棧是管理存儲(chǔ)器的的基本組件,包括設(shè)備驅(qū)動(dòng)、塊接口層、文件系統(tǒng),目前一些用戶(hù)空間IO庫(kù)(如SPDK)有效降低了延遲,但是io棧仍然不可或
    的頭像 發(fā)表于 12-02 10:35 ?641次閱讀
    λ-<b class='flag-5'>IO</b>:存儲(chǔ)<b class='flag-5'>計(jì)算</b>下的<b class='flag-5'>IO</b>棧設(shè)計(jì)

    NVIDIA助力丹麥發(fā)布首臺(tái)AI超級(jí)計(jì)算機(jī)

    這臺(tái)丹麥最大的超級(jí)計(jì)算機(jī)由該國(guó)政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺(tái) NVIDIA DGX SuperPOD 超級(jí)計(jì)算機(jī)。
    的頭像 發(fā)表于 10-27 09:42 ?911次閱讀

    云端超級(jí)計(jì)算機(jī)怎么用

    云端超級(jí)計(jì)算機(jī)是一種基于計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲(chǔ)資源集中在一起,通過(guò)網(wǎng)絡(luò)向
    的頭像 發(fā)表于 10-18 10:14 ?486次閱讀

    AI平臺(tái)與傳統(tǒng)計(jì)算的區(qū)別

    AI平臺(tái)與傳統(tǒng)計(jì)算在定義、技術(shù)架構(gòu)、應(yīng)用場(chǎng)景和服務(wù)模式等方面存在顯著差異。
    的頭像 發(fā)表于 10-14 10:08 ?918次閱讀

    解析一體式IO與分布式IO:從架構(gòu)到應(yīng)用

    在工業(yè)自動(dòng)化領(lǐng)域,IO(輸入/輸出)系統(tǒng)扮演著舉足輕重的角色。它們不僅負(fù)責(zé)數(shù)據(jù)的采集和控制指令的發(fā)送,還直接影響到系統(tǒng)的靈活性、可靠性和成本效益。明達(dá)技術(shù)將為您介紹一體式IO和分布式IO架構(gòu)
    的頭像 發(fā)表于 10-08 10:02 ?859次閱讀
    解析一體式<b class='flag-5'>IO</b>與分布式<b class='flag-5'>IO</b>:從<b class='flag-5'>架構(gòu)</b>到應(yīng)用

    如何理解計(jì)算

    據(jù)的安全性。 **高性能計(jì)算:**計(jì)算平臺(tái)提供高性能的計(jì)算資源,用于處理復(fù)雜的科學(xué)和工程計(jì)算
    發(fā)表于 08-16 17:02