99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA引入云原生超級(jí)計(jì)算架構(gòu)

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2021-11-21 10:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

超級(jí)計(jì)算機(jī)是一項(xiàng)重要的投資,對(duì)于研究人員和科學(xué)家來(lái)說(shuō),它們是必不可少的寶貴工具。為了有效和安全地共享這些數(shù)據(jù)中心的計(jì)算能力, NVIDIA 引入了云原生超級(jí)計(jì)算架構(gòu)。它結(jié)合了裸機(jī)性能、多租戶和性能隔離統(tǒng)一為超級(jí)計(jì)算服務(wù)。

Magnum IO 是數(shù)據(jù)中心的 I / O 子系統(tǒng),它引入了新的增強(qiáng)功能,以加速多租戶數(shù)據(jù)中心的 I / O 和通信。我們將這些增強(qiáng)功能稱為 Magnum IO ,用于云原生超級(jí)計(jì)算架構(gòu)。

它由 NVIDIA Quantum-2 InfiniBand 平臺(tái)提供,該平臺(tái)包括 NVIDIA Quantum-2 交換機(jī)系列、BlueField-3 DPU 和 ConnectX-7 網(wǎng)卡。

這種進(jìn)化環(huán)境的挑戰(zhàn)是什么?

基于 GPU 的高性能計(jì)算已經(jīng)通過(guò)機(jī)器學(xué)習(xí)模擬計(jì)算大幅改變了科學(xué)和實(shí)驗(yàn)。在GPU 上運(yùn)行的這些深度學(xué)習(xí)框架和模擬工具可能會(huì)消耗 PB 級(jí)的數(shù)據(jù),并在整個(gè)數(shù)據(jù)中心內(nèi)造成擁塞和瓶頸。更復(fù)雜的是,這些應(yīng)用程序的多個(gè)實(shí)例在共享的超級(jí)計(jì)算設(shè)施上常常同時(shí)運(yùn)行并互相影響,因而造成運(yùn)行性能的抖動(dòng),從而導(dǎo)致無(wú)法預(yù)測(cè)的運(yùn)行時(shí)間。

面向云原生超級(jí)計(jì)算體系結(jié)構(gòu)設(shè)計(jì)的 Magnum IO 帶來(lái)新的增強(qiáng)功能,以減輕最終用戶在多租戶環(huán)境中運(yùn)行應(yīng)用帶來(lái)的性能負(fù)面影響。它提供確定性的性能,就好像它們的應(yīng)用程序是獨(dú)占網(wǎng)絡(luò)運(yùn)行。

第三代 NVIDIA SHARP

(可擴(kuò)展分層聚合和規(guī)約協(xié)議)

通過(guò)將集合操作從主機(jī) CPU 卸載到交換機(jī)網(wǎng)絡(luò),SHARP 技術(shù)有效消除了端點(diǎn)之間多次發(fā)送數(shù)據(jù)的需求,從而提高了 MPI 操作的性能。這種方法大幅減少了到達(dá)聚合節(jié)點(diǎn)的網(wǎng)絡(luò)流量,并顯著減少了 MPI 操作時(shí)間。

在網(wǎng)絡(luò)中實(shí)現(xiàn)集合通信算法還有其他好處,例如釋放寶貴的 CPU 資源用于計(jì)算,而不是使用它們來(lái)處理通信。

最近發(fā)布的 NVIDIA Quantum-2 InfiniBand 交換機(jī)為大型數(shù)據(jù)聚合提供了強(qiáng)大的可擴(kuò)展性。由于每個(gè)交換機(jī)支持幾乎無(wú)限的小消息聚合和多個(gè)大消息聚合流,在共享系統(tǒng)上運(yùn)行多租戶應(yīng)用程序可以充分利用 SHARP 的優(yōu)勢(shì)。

性能隔離

多租戶超級(jí)計(jì)算實(shí)現(xiàn)在共享資源上運(yùn)行很多用戶的應(yīng)用程序,可能造成物理服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)以及I / O流量模型的復(fù)用 。

NVIDIA Quantum InfiniBand 一直以來(lái)支持擁塞控制管理,當(dāng)檢測(cè)到網(wǎng)絡(luò)擁塞時(shí)在源端實(shí)施控制以緩解擁塞。但在多租戶場(chǎng)景,用戶應(yīng)用可能無(wú)意識(shí)地與相鄰用戶流量產(chǎn)生干擾,因此需要隔離以提供可預(yù)期的性能級(jí)別。

借助最新的 NVIDIA Quantum-2 InfiniBand 平臺(tái)和 Magnum IO ,創(chuàng)新的主動(dòng)監(jiān)控和擁塞管理提供了良好的流量隔離。這幾乎完全消除了性能抖動(dòng),并確保了預(yù)期的性能,就像應(yīng)用程序運(yùn)行在專用系統(tǒng)上一樣。

專為安全、多租戶、裸機(jī)性能而打造

NVIDIA Cloud-Native Supercomputing 體系結(jié)構(gòu)使用 Magnum IO 在多租戶環(huán)境中實(shí)現(xiàn)最高的性能、安全性和編排。

此外,實(shí)現(xiàn)這種架構(gòu)轉(zhuǎn)換的另一個(gè)核心元素是數(shù)據(jù)處理器( DPU ),也即 BlueField 。作為一個(gè)完全集成的片上數(shù)據(jù)中心平臺(tái), BlueField 從主機(jī)處理器卸載和管理數(shù)據(jù)中心基礎(chǔ)設(shè)施,實(shí)現(xiàn)超級(jí)計(jì)算機(jī)的安全和編排。

它還能夠提供額外的通信框架卸載,可達(dá)到 100% 的通信計(jì)算重疊,實(shí)現(xiàn) MPI _ Alltoall 44% 的性能提升和 MPI _ iAllgather 36% 的性能提升。當(dāng)結(jié)合最新的 NVIDIA Quantum-2 平臺(tái)時(shí),該體系結(jié)構(gòu)在安全的多節(jié)點(diǎn)體系結(jié)構(gòu)中展示性能隔離實(shí)現(xiàn)裸金屬性能。

Magnum IO 消除了 I / O 瓶頸,拓展了硬件級(jí)加速引擎、網(wǎng)絡(luò)計(jì)算和擁塞控制等最新技術(shù),成為支持當(dāng)今高性能裸金屬多租戶數(shù)據(jù)中心的必備利器。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5284

    瀏覽量

    106125
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    7974

    瀏覽量

    139739
  • 人工智能
    +關(guān)注

    關(guān)注

    1805

    文章

    48932

    瀏覽量

    248258

原文標(biāo)題:使用 Magnum IO 加速云原生超級(jí)計(jì)算

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    云原生環(huán)境里Nginx的故障排查思路

    本文聚焦于云原生環(huán)境下Nginx的故障排查思路。隨著云原生技術(shù)的廣泛應(yīng)用,Nginx作為常用的高性能Web服務(wù)器和反向代理服務(wù)器,在容器化和編排的環(huán)境中面臨著新的故障場(chǎng)景和挑戰(zhàn)。
    的頭像 發(fā)表于 06-17 13:53 ?210次閱讀
    <b class='flag-5'>云原生</b>環(huán)境里Nginx的故障排查思路

    云原生在汽車行業(yè)的優(yōu)勢(shì)

    近年來(lái),“云原生”已成為科技領(lǐng)域的高頻熱詞。從企業(yè)數(shù)字化轉(zhuǎn)型到智能化產(chǎn)業(yè)布局,各行各業(yè)對(duì)云原生技術(shù)的需求呈現(xiàn)爆發(fā)式增長(zhǎng),向云計(jì)算轉(zhuǎn)型已成為一大趨勢(shì)。根據(jù)Gartner的預(yù)測(cè),到2025年,超過(guò)95%的新數(shù)字工作負(fù)載將遷移至云端,
    的頭像 發(fā)表于 02-21 09:20 ?1168次閱讀

    云原生AI服務(wù)怎么樣

    云原生AI服務(wù),是指采用云原生的原則和技術(shù)來(lái)構(gòu)建、部署和管理人工智能應(yīng)用及工作負(fù)載的方法和模式。那么,云原生AI服務(wù)怎么樣呢?下面,AI部落小編帶您了解。
    的頭像 發(fā)表于 01-23 10:47 ?432次閱讀

    聯(lián)發(fā)科與NVIDIA合作 為NVIDIA 個(gè)人AI超級(jí)計(jì)算機(jī)設(shè)計(jì)NVIDIA GB10超級(jí)芯片

    聯(lián)發(fā)科近日宣布與NVIDIA合作設(shè)計(jì)NVIDIA GB10 Grace Blackwell超級(jí)芯片,將應(yīng)用于NVIDIA 的個(gè)人AI超級(jí)
    的頭像 發(fā)表于 01-07 16:26 ?570次閱讀

    云原生LLMOps平臺(tái)作用

    云原生LLMOps平臺(tái)是一種基于云計(jì)算基礎(chǔ)設(shè)施和開(kāi)發(fā)工具,專門(mén)用于構(gòu)建、部署和管理大型語(yǔ)言模型(LLM)全生命周期的平臺(tái)。以下,是對(duì)云原生LLMOps平臺(tái)作用的梳理,由AI部落小編整理。
    的頭像 發(fā)表于 01-06 10:21 ?442次閱讀

    如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺(tái)因其彈性擴(kuò)展、高效部署、低成本運(yùn)營(yíng)等優(yōu)勢(shì),逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場(chǎng)上的云原生機(jī)器學(xué)習(xí)平臺(tái)種類繁多,功能各異,如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)呢?下面,AI部落小編帶您探討。
    的頭像 發(fā)表于 12-25 11:54 ?432次閱讀

    什么是云原生MLOps平臺(tái)

    云原生MLOps平臺(tái),是指利用云計(jì)算的基礎(chǔ)設(shè)施和開(kāi)發(fā)工具,來(lái)構(gòu)建、部署和管理機(jī)器學(xué)習(xí)模型的全生命周期的平臺(tái)。以下,是對(duì)云原生MLOps平臺(tái)的介紹,由AI部落小編整理。
    的頭像 發(fā)表于 12-12 13:13 ?500次閱讀

    k8s微服務(wù)架構(gòu)就是云原生嗎??jī)烧呤鞘裁搓P(guān)系

    k8s微服務(wù)架構(gòu)就是云原生嗎?K8s微服務(wù)架構(gòu)并不等同于云原生,但兩者之間存在密切的聯(lián)系。Kubernetes在云原生
    的頭像 發(fā)表于 11-25 09:39 ?502次閱讀

    NVIDIA助力丹麥發(fā)布首臺(tái)AI超級(jí)計(jì)算機(jī)

    這臺(tái)丹麥最大的超級(jí)計(jì)算機(jī)由該國(guó)政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺(tái) NVIDIA DGX SuperPOD 超級(jí)計(jì)算機(jī)。
    的頭像 發(fā)表于 10-27 09:42 ?850次閱讀

    云原生和非云原生哪個(gè)好?六大區(qū)別詳細(xì)對(duì)比

    云原生和非云原生各有優(yōu)劣,具體選擇取決于應(yīng)用場(chǎng)景。云原生利用云計(jì)算的優(yōu)勢(shì),通過(guò)微服務(wù)、容器化和自動(dòng)化運(yùn)維等技術(shù),提高了應(yīng)用的可擴(kuò)展性、更新速度和成本效益。非
    的頭像 發(fā)表于 09-13 09:53 ?749次閱讀

    基于Arm架構(gòu)的Azure虛擬機(jī)助力云原生應(yīng)用開(kāi)發(fā)

    子系統(tǒng) (CSS) 所構(gòu)建的解決方案專為運(yùn)行現(xiàn)代通用云工作負(fù)載而設(shè)計(jì),并且通過(guò)優(yōu)化,為云原生產(chǎn)品提供更高的效率和性能。
    的頭像 發(fā)表于 09-05 15:54 ?2171次閱讀

    京東云原生安全產(chǎn)品重磅發(fā)布

    “安全產(chǎn)品那么多,我怎么知道防住了?”“大家都說(shuō)自己是云原生的,我看都是換湯不換藥”在與客戶溝通云原生安全方案的時(shí)候,經(jīng)常會(huì)遇到這樣的吐槽。越來(lái)越的客戶已經(jīng)開(kāi)始了云原生化的技術(shù)架構(gòu)改造
    的頭像 發(fā)表于 07-26 10:36 ?765次閱讀
    京東<b class='flag-5'>云原生</b>安全產(chǎn)品重磅發(fā)布

    從積木式到裝配式云原生安全

    云原生安全風(fēng)險(xiǎn) 隨著云原生架構(gòu)的快速發(fā)展,核心能力逐漸穩(wěn)定,安全問(wèn)題日趨緊急。在云原生安全領(lǐng)域不但有新技術(shù)帶來(lái)的新風(fēng)險(xiǎn),傳統(tǒng)IT基礎(chǔ)設(shè)施下的安全威脅也依然存在。要想做好
    的頭像 發(fā)表于 07-26 10:35 ?524次閱讀
    從積木式到裝配式<b class='flag-5'>云原生</b>安全

    借助NVIDIA超級(jí)計(jì)算機(jī)加速量子計(jì)算發(fā)展

    科學(xué)期刊《自然》(Nature)本月早些時(shí)候發(fā)表了一項(xiàng)研究,通過(guò)使用 NVIDIA 驅(qū)動(dòng)的超級(jí)計(jì)算機(jī),驗(yàn)證了量子計(jì)算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?880次閱讀

    基于DPU與SmartNic的云原生SDN解決方案

    隨著云計(jì)算,大數(shù)據(jù)和人工智能等技術(shù)的蓬勃發(fā)展,數(shù)據(jù)中心面臨著前所未有的數(shù)據(jù)洪流和計(jì)算壓力,這對(duì)SDN提出了更高的性能和效率要求。自云原生概念被提出以來(lái),Kubernetes為云原生應(yīng)用
    的頭像 發(fā)表于 07-22 11:44 ?1169次閱讀
    基于DPU與SmartNic的<b class='flag-5'>云原生</b>SDN解決方案