NVIDIA 于今日推出數(shù)十項(xiàng)企業(yè)級(jí)生成式 AI 微服務(wù),企業(yè)可以利用這些微服務(wù)在自己的平臺(tái)上創(chuàng)建和部署定制應(yīng)用,同時(shí)保留對(duì)知識(shí)產(chǎn)權(quán)的完整所有權(quán)和控制權(quán)。
這些云原生微服務(wù)目錄在NVIDIA CUDA平臺(tái)上開(kāi)發(fā),其中包括NVIDIA NIM微服務(wù),可適用于 NVIDIA 及合作伙伴生態(tài)系統(tǒng)中 20 多個(gè)熱門(mén)的 AI 模型進(jìn)行推理優(yōu)化。此外,用戶(hù)現(xiàn)能夠以NVIDIA CUDA-X微服務(wù)的形式使用 NVIDIA 加速軟件開(kāi)發(fā)套件、庫(kù)和工具,用于檢索增強(qiáng)生成(RAG)、護(hù)欄、數(shù)據(jù)處理、HPC 等。NVIDIA 還發(fā)布了 20 多項(xiàng)醫(yī)療 NIM 和 CUDA-X 微服務(wù)。
這些精心挑選的微服務(wù)為 NVIDIA 全棧計(jì)算平臺(tái)增添了新的一層,連接起了由模型開(kāi)發(fā)人員、平臺(tái)提供商和企業(yè)組成的 AI 生態(tài)系統(tǒng),使其能夠通過(guò)標(biāo)準(zhǔn)化的路徑來(lái)運(yùn)行針對(duì) NVIDIA CUDA 安裝基礎(chǔ)(在云、數(shù)據(jù)中心、工作站和 PC 中的數(shù)以?xún)|計(jì)的 GPU)優(yōu)化的定制 AI 模型。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“成熟的企業(yè)平臺(tái)坐擁數(shù)據(jù)金礦,這些數(shù)據(jù)可以轉(zhuǎn)化為生成式 AI 助手。我們與合作伙伴生態(tài)系統(tǒng)一起創(chuàng)建的這些容器化 AI 微服務(wù),是各行業(yè)企業(yè)成為 AI 公司的基石。”
NIM 推理微服務(wù)將部署時(shí)間從幾周縮短至幾分鐘
NIM 微服務(wù)提供基于 NVIDIA 推理軟件的預(yù)構(gòu)建容器,包括 Triton 推理服務(wù)器 和 TensorRT-LLM,使開(kāi)發(fā)者能夠?qū)⒉渴饡r(shí)間從幾周縮短至幾分鐘。
它們?yōu)檎Z(yǔ)言、語(yǔ)音和藥物發(fā)現(xiàn)等領(lǐng)域提供行業(yè)標(biāo)準(zhǔn) API,使開(kāi)發(fā)者能夠使用安全托管在自己的基礎(chǔ)設(shè)施中的專(zhuān)有數(shù)據(jù),來(lái)快速構(gòu)建 AI 應(yīng)用。這些應(yīng)用可按需擴(kuò)展,從而為在 NVIDIA 加速計(jì)算平臺(tái)上運(yùn)行生產(chǎn)級(jí)生成式 AI 提供靈活性和性能。
面向 RAG、數(shù)據(jù)處理、護(hù)欄、HPC 的 CUDA-X 微服務(wù)
CUDA-X 微服務(wù)為數(shù)據(jù)準(zhǔn)備、定制和訓(xùn)練提供端到端的構(gòu)建模塊,助力各行各業(yè)加快開(kāi)發(fā)生產(chǎn)級(jí) AI。
為了加快 AI 采用,企業(yè)可以使用 CUDA-X 微服務(wù),包括用于定制語(yǔ)音和翻譯 AI 的 NVIDIA Riva、用于路由優(yōu)化的 NVIDIA cuOpt,以及用于高分辨率氣候和天氣模擬的 NVIDIA Earth-2。
生態(tài)系統(tǒng)通過(guò)生成式 AI 微服務(wù)賦能企業(yè)平臺(tái)
除了領(lǐng)先的應(yīng)用提供商外,NVIDIA 生態(tài)系統(tǒng)中的數(shù)據(jù)、基礎(chǔ)設(shè)施和計(jì)算平臺(tái)提供商也在使用 NVIDIA 微服務(wù),為企業(yè)帶來(lái)生成式 AI。
包括 Box、Cloudera、Cohesity、Datastax、Dropbox 和 NetApp 在內(nèi)的頂級(jí)數(shù)據(jù)平臺(tái)提供商正在使用 NVIDIA 微服務(wù),幫助客戶(hù)優(yōu)化 RAG 管道,并將專(zhuān)有數(shù)據(jù)集成到生成式 AI 應(yīng)用中。Snowflake 正在使用 NeMo Retriever,充分利用企業(yè)數(shù)據(jù)來(lái)構(gòu)建 AI 應(yīng)用。
可用性
開(kāi)發(fā)者可以在 ai.nvidia.com 免費(fèi)試用 NVIDIA 微服務(wù)。企業(yè)則可以在 NVIDIA 認(rèn)證系統(tǒng)和領(lǐng)先的云平臺(tái)上使用 NVIDIA AI Enterprise 5.0 部署生產(chǎn)級(jí) NIM 微服務(wù)。
審核編輯:劉清
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106422 -
GPU芯片
+關(guān)注
關(guān)注
1文章
305瀏覽量
6206 -
生成式AI
+關(guān)注
關(guān)注
0文章
531瀏覽量
817
原文標(biāo)題:GTC24 | NVIDIA 推出生成式 AI 微服務(wù),供開(kāi)發(fā)者在 CUDA GPU 系統(tǒng)中創(chuàng)建部署生成式 AI 助手
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA發(fā)布全新NIM AI Guardrail微服務(wù)
NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)
Cirium發(fā)布業(yè)界首款生成式AI準(zhǔn)點(diǎn)率助手
NVIDIA Omniverse擴(kuò)展至生成式物理AI領(lǐng)域
NVIDIA推出多個(gè)生成式AI模型和藍(lán)圖
NVIDIA 推出高性?xún)r(jià)比的生成式 AI 超級(jí)計(jì)算機(jī)

NVIDIA推出全新生成式AI模型Fugatto
NVIDIA助力Amdocs打造生成式AI智能體
在設(shè)備上利用AI Edge Torch生成式API部署自定義大語(yǔ)言模型

NVIDIA AI助力SAP生成式AI助手Joule加速發(fā)展
全新NVIDIA NIM微服務(wù)將生成式AI引入數(shù)字環(huán)境
NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成式AI服務(wù)
英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)
NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

評(píng)論