99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NIM助力企業(yè)高效部署生成式AI模型

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-10-10 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Canonical、Nutanix 和 Red Hat 等廠商的開(kāi)源 Kubernetes 平臺(tái)集成了 NVIDIA NIM,將允許用戶(hù)通過(guò) API 調(diào)用來(lái)大規(guī)模地部署大語(yǔ)言模型。

在企業(yè)中部署生成式 AI 將變得空前簡(jiǎn)單。

NVIDIA NIM是一套生成式 AI 推理微服務(wù),將支持 KServe 開(kāi)源軟件,可以自動(dòng)將 AI 模型以云計(jì)算應(yīng)用的規(guī)模運(yùn)行。

NVIDIA NIM 與 KServe 的組合確保了生成式 AI 可以像任何其他大型企業(yè)級(jí)應(yīng)用一樣進(jìn)行部署,還讓用戶(hù)能夠通過(guò) Canonical、Nutanix 和 Red Hat 等數(shù)十家公司的平臺(tái)廣泛使用 NIM。

NIM 在 KServe 上的集成將使 NVIDIA 的技術(shù)擴(kuò)展到開(kāi)源社區(qū)、生態(tài)系統(tǒng)合作伙伴和客戶(hù)。借助 NIM,他們可以通過(guò) API 調(diào)用(即現(xiàn)代編程的一鍵式操作)來(lái)獲得NVIDIA AI Enterprise軟件平臺(tái)的性能、支持和安全性。

在 Kubernetes 上提供 AI

KServe 最初是基于 Kubernetes 的機(jī)器學(xué)習(xí)工具包 Kubeflow 的一部分。Kubernete 是一個(gè)開(kāi)源系統(tǒng),用于部署和管理包含大型分布式應(yīng)用組件的軟件容器。

隨著 Kubeflow 在 AI 推理方面的不斷擴(kuò)展,KServe 誕生了,并最終演變成為獨(dú)立的開(kāi)源項(xiàng)目。

許多公司都為 KServe 軟件做出了貢獻(xiàn)并采用了該軟件。目前,運(yùn)行 KServe 軟件的公司包括亞馬遜科技、彭博、Canonical、思科、慧與、IBM、Red Hat、Zillow 和 NVIDIA 等。

深入解析 KServe

KServe 本質(zhì)上是 Kubernetes 的擴(kuò)展,它像一個(gè)強(qiáng)大的云應(yīng)用一樣運(yùn)行 AI 推理。它使用標(biāo)準(zhǔn)協(xié)議,以經(jīng)過(guò)優(yōu)化的性能運(yùn)行,并支持 PyTorch、Scikit-learn、TensorFlow 和 XGBoost,而用戶(hù)無(wú)需了解這些 AI 框架的細(xì)節(jié)。

在新的大語(yǔ)言模型(LLM)層出不窮的情況下,該軟件尤其有用。

KServe 讓用戶(hù)可以輕松地在模型之間來(lái)回切換,測(cè)試哪一個(gè)最符合他們的需求。當(dāng)模型的新版本發(fā)布時(shí),KServe 的 “金絲雀發(fā)布(canary rollouts)” 功能會(huì)自動(dòng)執(zhí)行詳細(xì)驗(yàn)證,并逐步將其部署到生產(chǎn)系統(tǒng)中。

其另一項(xiàng)功能 “GPU 自動(dòng)縮放” 可以隨著服務(wù)需求的起伏來(lái)高效地管理模型的部署方式,從而使客戶(hù)和服務(wù)提供商獲得最佳體驗(yàn)。

生成式 AI 的 API 調(diào)用

KServe 的優(yōu)勢(shì)現(xiàn)在將通過(guò) NVIDIA NIM 的便捷性提供。

使用 NIM ,只需一個(gè)簡(jiǎn)單的 API 調(diào)用即可應(yīng)對(duì)所有的復(fù)雜性。企業(yè) IT 管理員能夠獲得確保應(yīng)用以最佳性能和效率運(yùn)行所需的指標(biāo),無(wú)論應(yīng)用是在他們的數(shù)據(jù)中心還是在遠(yuǎn)程云服務(wù)上,即使是在更改了 AI 模型的情況下。

NIM 讓 IT 專(zhuān)家成為生成式 AI 專(zhuān)家,變革了公司的運(yùn)營(yíng)。這就是為什么 Foxconn 和 ServiceNow 等眾多企業(yè)都正在部署 NIM 微服務(wù)的原因。

NIM 支持?jǐn)?shù)十個(gè) Kubernetes 平臺(tái)

由于 NIM 與 KServe 的集成,用戶(hù)將能夠在數(shù)十個(gè)企業(yè)平臺(tái)上訪問(wèn) NIM,比如 Canonical 的 Charmed KubeFlow 和 Charmed Kubernetes、Nutanix GPT-in-a-Box 2.0、Red Hat 的 OpenShift AI 等等。

KServe 貢獻(xiàn)者、Red Hat 首席軟件工程師 Yuan Tang 表示:“Red Hat 一直在與 NVIDIA 合作,以便讓企業(yè)更輕松地使用開(kāi)源技術(shù)來(lái)部署 AI。通過(guò)增強(qiáng) KServe 并在 Red Hat OpenShift AI 中增加對(duì) NIM 的支持,我們能夠讓 Red Hat 的客戶(hù)更方便地訪問(wèn) NVIDIA 的生成式 AI 平臺(tái)?!?/p>

“通過(guò)將 NVIDIA NIM 推理微服務(wù)與 Nutanix GPT-in-a-Box 2.0 集成,客戶(hù)將能夠從云端到邊緣以一致的方式去構(gòu)建可擴(kuò)展、安全、高性能的生成式 AI 應(yīng)用?!?Nutanix 工程副總裁 Debojyoti Dutta 表示,其團(tuán)隊(duì)為 KServe 和 Kubeflow 做出了貢獻(xiàn)。

Canonical 的 MLOps 產(chǎn)品經(jīng)理 Andreea Munteanu 表示:“作為一家對(duì) KServe 做出重大貢獻(xiàn)的公司,我們很高興通過(guò) Charmed Kubernetes 和 Charmed Kubeflow 提供 NIM。在我們的共同努力下,用戶(hù)將能夠輕松地使用生成式 AI 的全部功能,并使其保持最高的性能和效率?!?/p>

數(shù)十家其他軟件提供商都能感受到 NIM 的好處,因?yàn)樗麄兊漠a(chǎn)品中也包含了 KServe。

服務(wù)開(kāi)源社區(qū)

NVIDIA 一直積極地參與 KServe 項(xiàng)目。正如最近的一篇技術(shù)博客中所提到的,KServe 的開(kāi)放推理協(xié)議已經(jīng)被用于NVIDIA Triton 推理服務(wù)器,可以幫助用戶(hù)跨多個(gè) GPU、框架和操作模式同時(shí)運(yùn)行許多 AI 模型。

基于 KServe,NVIDIA 專(zhuān)注于在多個(gè) GPU 上一次運(yùn)行一個(gè) AI 模型的用例。

作為 NIM 集成的一部分,NVIDIA 計(jì)劃在其開(kāi)源軟件(包括 Triton 和TensorRT-LLM)的基礎(chǔ)上,成為 KServe 的積極貢獻(xiàn)者。NVIDIA 還是云原生計(jì)算基金會(huì)(CNCF)的活躍成員,該基金會(huì)支持生成式 AI 和其他項(xiàng)目的開(kāi)源代碼。

立即通過(guò) NVIDIA API 目錄試用 Llama 3 8B 或 Llama 3 70B 大語(yǔ)言模型的 NIM API。全球數(shù)百家 NVIDIA 合作伙伴也正在使用 NIM 來(lái)部署生成式 AI。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106351
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5226

    瀏覽量

    73504
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35109

    瀏覽量

    279575

原文標(biāo)題:COMPUTEX 2024 | KServe 提供商在云和數(shù)據(jù)中心提供由 NIM 賦能的推理

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    基礎(chǔ)設(shè)施以及生成 AI 服務(wù)首次實(shí)現(xiàn)集成,以幫助全球企業(yè)組織加速創(chuàng)建代理式 AI 應(yīng)用。 此次 Oracle Cloud Infrast
    的頭像 發(fā)表于 03-21 12:01 ?697次閱讀
    英偉達(dá)GTC2025亮點(diǎn):Oracle與<b class='flag-5'>NVIDIA</b>合作<b class='flag-5'>助力</b><b class='flag-5'>企業(yè)</b>加速代理式<b class='flag-5'>AI</b>推理

    聚云科技榮獲亞馬遜云科技生成AI能力認(rèn)證 助力企業(yè)加速生成AI應(yīng)用落地

    、數(shù)據(jù)處理、模型調(diào)優(yōu)到應(yīng)用集成與部署等方面,助力企業(yè)加速生成
    發(fā)表于 02-14 13:41 ?151次閱讀

    NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)

    務(wù)是 NVIDIA NeMo Guardrails 軟件工具系列的一部分。這些可移植且經(jīng)過(guò)優(yōu)化的推理微服務(wù)可幫助企業(yè)提高生成 AI 應(yīng)用的
    發(fā)表于 01-17 16:29 ?160次閱讀

    NVIDIA推出多個(gè)生成AI模型和藍(lán)圖

    NVIDIA 宣布推出多個(gè)生成 AI 模型和藍(lán)圖,將 NVIDIA Omniverse 一體化
    的頭像 發(fā)表于 01-08 10:48 ?624次閱讀

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開(kāi)發(fā)了一個(gè)全新的生成 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意
    的頭像 發(fā)表于 11-27 11:29 ?813次閱讀

    全新NVIDIA NIM微服務(wù)實(shí)現(xiàn)突破性進(jìn)展

    全新 NVIDIA NIM 微服務(wù)實(shí)現(xiàn)突破性進(jìn)展,可助力氣象技術(shù)公司開(kāi)發(fā)和部署 AI 模型,實(shí)現(xiàn)
    的頭像 發(fā)表于 11-21 10:07 ?667次閱讀

    NVIDIA助力企業(yè)創(chuàng)建定制AI應(yīng)用

    NVIDIA 近日宣布與眾多技術(shù)領(lǐng)導(dǎo)者一同使用最新NVIDIA NIM Agent Blueprint以及NVIDIA NeMo和NVIDIA
    的頭像 發(fā)表于 11-20 09:12 ?726次閱讀

    NVIDIA助力Amdocs打造生成AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開(kāi)發(fā)和交付基于商用大語(yǔ)言模型(LLM)和領(lǐng)域適配模型
    的頭像 發(fā)表于 11-19 14:48 ?905次閱讀

    NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業(yè)打造屬于自己的 AI

    可定制工作流目錄加快核心生成 AI 用例的部署速度。首批用例包括客戶(hù)服務(wù)、藥物研發(fā)和 PDF 數(shù)據(jù)提取,未來(lái)將加入更多用例 企業(yè)可以使用
    發(fā)表于 08-28 10:10 ?385次閱讀
    <b class='flag-5'>NVIDIA</b> 攜手全球合作伙伴推出 <b class='flag-5'>NIM</b> Agent Blueprints,<b class='flag-5'>助力</b><b class='flag-5'>企業(yè)</b>打造屬于自己的 <b class='flag-5'>AI</b>

    借助NVIDIA NIM加速AI應(yīng)用部署

    大語(yǔ)言模型(LLM)在企業(yè)組織中的應(yīng)用日益廣泛,許多企業(yè)都將其整合到 AI 應(yīng)用中。雖然從基礎(chǔ)模型著手十分
    的頭像 發(fā)表于 08-23 16:38 ?764次閱讀
    借助<b class='flag-5'>NVIDIA</b> <b class='flag-5'>NIM</b>加速<b class='flag-5'>AI</b>應(yīng)用<b class='flag-5'>部署</b>

    全新NVIDIA NIM微服務(wù)將生成AI引入數(shù)字環(huán)境

    生成物理 AI NIM 微服務(wù)以及 NVIDIA Metropolis 參考工作流旨在協(xié)助創(chuàng)建智能的沉浸
    的頭像 發(fā)表于 08-02 15:20 ?915次閱讀

    NVIDIA NIM:打造AI領(lǐng)域的AI-in-a-Box,提高AI開(kāi)發(fā)與部署高效

    據(jù)7月30日官方發(fā)布的資訊顯示,在全球備受矚目的計(jì)算機(jī)圖形學(xué)盛會(huì)——SIGGRAPH 2024上,NVIDIA公司對(duì)外展示了其在諸如渲染、仿真及生成AI等前沿領(lǐng)域所取得的卓越成果,而
    的頭像 發(fā)表于 07-30 16:27 ?1129次閱讀

    NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成AI服務(wù)

    NVIDIA近日宣布了一項(xiàng)重大舉措,正式推出NVIDIA AI Foundry服務(wù)與NVIDIA NIM
    的頭像 發(fā)表于 07-25 16:57 ?844次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1
    的頭像 發(fā)表于 07-25 09:48 ?1060次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成 AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護(hù)到評(píng)估的全方位生成 AI 模型服務(wù),以便
    發(fā)表于 07-24 09:39 ?916次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球<b class='flag-5'>企業(yè)</b>打造自定義 Llama 3.1 <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>