99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用GPU Operator 1.8簡(jiǎn)化GPU對(duì)部署場(chǎng)景的管理

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-11 16:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在本文中,我們將介紹 GPU Operator release 1.8 中添加的新功能,進(jìn)一步簡(jiǎn)化 GPU 對(duì)各種部署場(chǎng)景的管理,包括:

增加了對(duì) GPU 操作員升級(jí)的支持

支持 NVX 交換機(jī)系統(tǒng),包括 DGX A100 和 NVIDIA HGX A100 服務(wù)器

支持收集 GPU 操作員狀態(tài)指標(biāo)

GPU 運(yùn)營(yíng)商和網(wǎng)絡(luò)運(yùn)營(yíng)商改進(jìn)多節(jié)點(diǎn)培訓(xùn)

支持 Red Hat OpenShift 4.8

NVIDIA 軟件生命周期管理

GPU Operator 的 1.8 版為組織提供了更新機(jī)制,以更新其 GPU Operator 版本,而不會(huì)中斷運(yùn)行 GPU Operator 的群集的工作流。 GPU Operator 的早期版本要求用戶在安裝新版本之前卸載以前的版本,這意味著在升級(jí)過程中群集中沒有可用的 GPU 。

從 1.8 開始,升級(jí)版本不會(huì)中斷工作流程。該機(jī)制以滾動(dòng)方式一次更新一個(gè)節(jié)點(diǎn),因此其他節(jié)點(diǎn)可以繼續(xù)使用。只有在安裝完成且上一個(gè)節(jié)點(diǎn)重新聯(lián)機(jī)時(shí),下一個(gè)節(jié)點(diǎn)才會(huì)更新。用戶可以確信,在更新 GPU 操作員時(shí),他們的工作流程將得到更好的管理。

現(xiàn)在支持 NVS 交換機(jī)系統(tǒng)

對(duì)于 1.8 , GPU 操作員自動(dòng)在 NVIDIA 上部署初始化結(jié)構(gòu)所需的軟件 NVSwitch 系統(tǒng),包括 NVIDIA HGX A100 和 DGX A100 。一旦初始化,所有 GPU 都可以在全 NVLink 帶寬下相互通信,以創(chuàng)建一個(gè)可擴(kuò)展的終端計(jì)算平臺(tái)。

GPU 操作員還經(jīng)過認(rèn)證,可在 DGX A100 系統(tǒng)上與 Red Hat OpenShift 4 一起使用。

支持收集 GPU 操作員狀態(tài)指標(biāo)

在 1.8 版本中, GPU 運(yùn)營(yíng)商現(xiàn)在報(bào)告各種指標(biāo),供用戶監(jiān)控 GPU 運(yùn)營(yíng)商和 GPU – 運(yùn)營(yíng)商資源命名空間下的運(yùn)營(yíng)商部署資源的總體運(yùn)行狀況。 SRE 團(tuán)隊(duì)和集群管理員現(xiàn)在可以配置必要的 Prometheus 用于收集指標(biāo)以及在某些故障情況下觸發(fā)警報(bào)的資源。

對(duì)于 OpenShift 容器平臺(tái),這些資源將在此版本中自動(dòng)創(chuàng)建。監(jiān)控解決方案,如 Grafana 可用于構(gòu)建儀表板和可視化 GPU 操作員和節(jié)點(diǎn)組件的操作狀態(tài)。

更好地結(jié)合: NVIDIA 加速計(jì)算和聯(lián)網(wǎng)

最近, NVIDIA 發(fā)布了 NVIDIA Network Operator 。 模擬 NVIDIA GPU Operator ,網(wǎng)絡(luò)運(yùn)營(yíng)商通過自動(dòng)化網(wǎng)絡(luò)部署和配置的各個(gè)方面簡(jiǎn)化了 Kubernetes 的擴(kuò)展網(wǎng)絡(luò)設(shè)計(jì),否則需要手動(dòng)操作。它在具有 NVIDIA 網(wǎng)絡(luò)接口的任何群集節(jié)點(diǎn)上加載所需的驅(qū)動(dòng)程序、庫(kù)、設(shè)備插件和 CNI 。

當(dāng)它們一起部署時(shí), NVIDIA GPU 和網(wǎng)絡(luò)運(yùn)營(yíng)商啟用 GPU 直接 RDMA ,即不同節(jié)點(diǎn)上 NVIDIA GPU 之間的快速數(shù)據(jù)路徑。這是數(shù)據(jù)密集型工作負(fù)載(如 AI 多節(jié)點(diǎn)培訓(xùn))的關(guān)鍵技術(shù)促成因素。

了解有關(guān)最新版本的更多信息 NVIDIA 網(wǎng)絡(luò)運(yùn)營(yíng)商發(fā)布 。

增加了對(duì) Red Hat OpenShift 的支持

我們繼續(xù)支持紅帽 OpenShift 。

GPU Operator 1.8 和 1.7 支持 Red Hat OpenShift 4.8 和 4 . 7

GPU 運(yùn)算符 1.6 支持 Red Hat OpenShift 4. 7

GPU 運(yùn)算符 1. 5 支持 Red Hat OpenShift 4 . 6

GPU Operator 1. 4 和1 .3 分別支持 Red Hat OpenShift 4.5 和 4.4

概括

以下資源可用于使用 NVIDIA GPU 運(yùn)算符:

GPU 操作員 1.8 發(fā)行說明

入門指南

GPU NGC 上的操作員舵圖

GitHub 上的 GPU 運(yùn)算符

NVIDIA GPU 運(yùn)算符是許多應(yīng)用程序的關(guān)鍵組件 邊緣計(jì)算 解決。

關(guān)于作者

Troy Estes 是 NVIDIA Edge 和企業(yè)計(jì)算解決方案的產(chǎn)品營(yíng)銷經(jīng)理。在加入 Edge & Enterprise 業(yè)務(wù)部門之前,特洛伊曾在自主汽車業(yè)務(wù)部門和 NVIDIA 電網(wǎng)產(chǎn)品集團(tuán)從事營(yíng)銷活動(dòng)和支持產(chǎn)品 GTM 。

Erik Bohnhorst 是 NVIDIA 的高級(jí)產(chǎn)品經(jīng)理,專注于云本地技術(shù),為 edge 和數(shù)據(jù)中心構(gòu)建一流的解決方案。 Erik 于 2014 年加入 NVIDIA ,以解決方案架構(gòu)師的身份幫助客戶構(gòu)建世界一流的虛擬化遠(yuǎn)程工作站。埃里克領(lǐng)導(dǎo)技術(shù)營(yíng)銷團(tuán)隊(duì),直到他加入了 EGX 團(tuán)隊(duì)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106350
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5226

    瀏覽量

    73504
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    GPU架構(gòu)深度解析

    、游戲娛樂等領(lǐng)域。本文將深入探討GPU架構(gòu)的演變歷程、核心組件以及其在不同應(yīng)用場(chǎng)景中的優(yōu)勢(shì)。1、GPU架構(gòu)的演變?cè)缙诘?b class='flag-5'>GPU采用固定功能流水線架構(gòu),專為圖形渲染任務(wù)而
    的頭像 發(fā)表于 05-30 10:36 ?368次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)深度解析

    可以手動(dòng)構(gòu)建imx-gpu-viv嗎?

    使用 imx-gpu-viv-6.4.3.p4.2.aarch64.bin。 https://www.nxp.com/lgfiles/NMG/MAD/YOCTO//imx-gpu-viv-6.4.3.p4.2-aarch64.bin 我需要
    發(fā)表于 03-28 06:35

    無法在GPU上運(yùn)行ONNX模型的Benchmark_app怎么解決?

    在 CPU 和 GPU 上運(yùn)行OpenVINO? 2023.0 Benchmark_app推斷的 ONNX 模型。 在 CPU 上推理成功,但在 GPU 上失敗。
    發(fā)表于 03-06 08:02

    OpenVINO?檢測(cè)到GPU,但網(wǎng)絡(luò)無法加載到GPU插件,為什么?

    OpenVINO?安裝在舊的 Windows 10 版本 Windows? 10 (RS1) 上。 已安裝 GPU 驅(qū)動(dòng)程序版本 25.20.100.6373,檢測(cè)到 GPU,但網(wǎng)絡(luò)無法加載
    發(fā)表于 03-05 06:01

    GPU渲染才是大勢(shì)所趨?CPU渲染與GPU渲染的現(xiàn)狀與未來

    在3D建模和渲染領(lǐng)域,隨著技術(shù)的發(fā)展,CPU渲染和GPU渲染這兩種方法逐漸呈現(xiàn)出各自獨(dú)特的優(yōu)勢(shì),并且在不同的應(yīng)用場(chǎng)景中各有側(cè)重。盡管當(dāng)前我們處在一個(gè)CPU渲染和GPU渲染并行發(fā)展的時(shí)代,但隨著硬件
    的頭像 發(fā)表于 02-06 11:04 ?680次閱讀
    <b class='flag-5'>GPU</b>渲染才是大勢(shì)所趨?CPU渲染與<b class='flag-5'>GPU</b>渲染的現(xiàn)狀與未來

    GPU按需計(jì)費(fèi)的優(yōu)勢(shì)

    GPU按需計(jì)費(fèi),是指用戶根據(jù)實(shí)際使用的GPU資源和時(shí)間進(jìn)行費(fèi)用結(jié)算,而非傳統(tǒng)的一次性購(gòu)買或固定租賃模式。以下,是對(duì)GPU按需計(jì)費(fèi)優(yōu)勢(shì)的總結(jié),由AI部落小編整理。
    的頭像 發(fā)表于 01-14 10:43 ?370次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    問題,但會(huì)降低舊GPU硬件性能,可通過NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些GPU計(jì)算需要啟用,可通過命令行工具nvidia
    發(fā)表于 12-16 14:25

    GPU在虛擬現(xiàn)實(shí)中的表現(xiàn) 低功耗GPU的優(yōu)缺點(diǎn)

    GPU在虛擬現(xiàn)實(shí)中的表現(xiàn) 虛擬現(xiàn)實(shí)(VR)技術(shù)的發(fā)展離不開高性能的圖形處理單元(GPU)。GPU在VR中扮演著至關(guān)重要的角色,它負(fù)責(zé)渲染復(fù)雜的三維場(chǎng)景,提供流暢的圖像輸出,以及處理用戶
    的頭像 發(fā)表于 11-19 10:58 ?1048次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    本篇閱讀學(xué)習(xí)第七、八章,了解GPU架構(gòu)演進(jìn)及CPGPU存儲(chǔ)體系與線程管理 █從圖形到計(jì)算的GPU架構(gòu)演進(jìn) GPU圖像計(jì)算發(fā)展 ●從三角形開始的幾何階段 在現(xiàn)代圖形渲染中,三角形是最常用
    發(fā)表于 11-03 12:55

    談?wù)?b class='flag-5'>GPU的使用壽命

    上文結(jié)合論文談一談,三年壽命的GPU [上]說到,電路腐蝕導(dǎo)致橡樹嶺實(shí)驗(yàn)室的GPU壽命只有3年,更換了11,000塊GPU
    的頭像 發(fā)表于 11-01 10:27 ?833次閱讀
    談?wù)?b class='flag-5'>GPU</b>的使用壽命

    【一文看懂】大白話解釋“GPUGPU算力”

    隨著大模型的興起,“GPU算力”這個(gè)詞正頻繁出現(xiàn)在人工智能、游戲、圖形設(shè)計(jì)等工作場(chǎng)景中,什么是GPU,它與CPU的區(qū)別是什么?以及到底什么是GPU算力?本篇文章主要從以下5個(gè)角度,讓您
    的頭像 發(fā)表于 10-29 08:05 ?2579次閱讀
    【一文看懂】大白話解釋“<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>算力”

    常見GPU問題及解決方法

    GPU(圖形處理單元)是計(jì)算機(jī)硬件的重要組成部分,負(fù)責(zé)處理圖形和視頻渲染任務(wù)。隨著技術(shù)的發(fā)展,GPU在深度學(xué)習(xí)、游戲、視頻編輯等領(lǐng)域扮演著越來越重要的角色。然而,在使用GPU的過程中,我們可能會(huì)遇到
    的頭像 發(fā)表于 10-27 14:12 ?3653次閱讀

    如何選擇適合的GPU

    。因此,選擇一個(gè)適合自己需求的GPU是一個(gè)需要綜合考慮多個(gè)因素的過程。 1. 確定用途 首先,你需要明確你的GPU將用于什么目的。不同的應(yīng)用場(chǎng)景對(duì)GPU的需求差異很大。例如,如果你主要
    的頭像 發(fā)表于 10-27 11:07 ?1012次閱讀

    GPU算力租用平臺(tái)是什么

    GPU算力租用平臺(tái)是一種基于云計(jì)算的服務(wù)模式,它允許用戶通過互聯(lián)網(wǎng)按需租用高性能GPU資源,而無需自行購(gòu)買、部署和維護(hù)這些硬件。
    的頭像 發(fā)表于 10-16 10:15 ?670次閱讀

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42