NVIDIA推出生成式AI微服務(wù)，供開(kāi)發(fā)者在CUDA GPU系統(tǒng)中創(chuàng)建部署生成式AI助手

NVIDIA 于今日推出數(shù)十項(xiàng)企業(yè)級(jí)生成式 AI 微服務(wù)，企業(yè)可以利用這些微服務(wù)在自己的平臺(tái)上創(chuàng)建和部署定制應(yīng)用，同時(shí)保留對(duì)知識(shí)產(chǎn)權(quán)的完整所有權(quán)和控制權(quán)。

這些云原生微服務(wù)目錄在NVIDIA CUDA平臺(tái)上開(kāi)發(fā)，其中包括NVIDIA NIM微服務(wù)，可適用于 NVIDIA 及合作伙伴生態(tài)系統(tǒng)中 20 多個(gè)熱門(mén)的 AI 模型進(jìn)行推理優(yōu)化。此外，用戶(hù)現(xiàn)能夠以NVIDIA CUDA-X微服務(wù)的形式使用 NVIDIA 加速軟件開(kāi)發(fā)套件、庫(kù)和工具，用于檢索增強(qiáng)生成（RAG）、護(hù)欄、數(shù)據(jù)處理、HPC 等。NVIDIA 還發(fā)布了 20 多項(xiàng)醫(yī)療 NIM 和 CUDA-X 微服務(wù)。

這些精心挑選的微服務(wù)為 NVIDIA 全棧計(jì)算平臺(tái)增添了新的一層，連接起了由模型開(kāi)發(fā)人員、平臺(tái)提供商和企業(yè)組成的 AI 生態(tài)系統(tǒng)，使其能夠通過(guò)標(biāo)準(zhǔn)化的路徑來(lái)運(yùn)行針對(duì) NVIDIA CUDA 安裝基礎(chǔ)（在云、數(shù)據(jù)中心、工作站和 PC 中的數(shù)以?xún)|計(jì)的 GPU）優(yōu)化的定制 AI 模型。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：“成熟的企業(yè)平臺(tái)坐擁數(shù)據(jù)金礦，這些數(shù)據(jù)可以轉(zhuǎn)化為生成式 AI 助手。我們與合作伙伴生態(tài)系統(tǒng)一起創(chuàng)建的這些容器化 AI 微服務(wù)，是各行業(yè)企業(yè)成為 AI 公司的基石。”

NIM 推理微服務(wù)將部署時(shí)間從幾周縮短至幾分鐘

NIM 微服務(wù)提供基于 NVIDIA 推理軟件的預(yù)構(gòu)建容器，包括 Triton 推理服務(wù)器 和 TensorRT-LLM，使開(kāi)發(fā)者能夠?qū)⒉渴饡r(shí)間從幾周縮短至幾分鐘。

它們?yōu)檎Z(yǔ)言、語(yǔ)音和藥物發(fā)現(xiàn)等領(lǐng)域提供行業(yè)標(biāo)準(zhǔn) API，使開(kāi)發(fā)者能夠使用安全托管在自己的基礎(chǔ)設(shè)施中的專(zhuān)有數(shù)據(jù)，來(lái)快速構(gòu)建 AI 應(yīng)用。這些應(yīng)用可按需擴(kuò)展，從而為在 NVIDIA 加速計(jì)算平臺(tái)上運(yùn)行生產(chǎn)級(jí)生成式 AI 提供靈活性和性能。

面向 RAG、數(shù)據(jù)處理、護(hù)欄、HPC 的 CUDA-X 微服務(wù)

CUDA-X 微服務(wù)為數(shù)據(jù)準(zhǔn)備、定制和訓(xùn)練提供端到端的構(gòu)建模塊，助力各行各業(yè)加快開(kāi)發(fā)生產(chǎn)級(jí) AI。

為了加快 AI 采用，企業(yè)可以使用 CUDA-X 微服務(wù)，包括用于定制語(yǔ)音和翻譯 AI 的 NVIDIA Riva、用于路由優(yōu)化的 NVIDIA cuOpt，以及用于高分辨率氣候和天氣模擬的 NVIDIA Earth-2。

生態(tài)系統(tǒng)通過(guò)生成式 AI 微服務(wù)賦能企業(yè)平臺(tái)

除了領(lǐng)先的應(yīng)用提供商外，NVIDIA 生態(tài)系統(tǒng)中的數(shù)據(jù)、基礎(chǔ)設(shè)施和計(jì)算平臺(tái)提供商也在使用 NVIDIA 微服務(wù)，為企業(yè)帶來(lái)生成式 AI。

包括 Box、Cloudera、Cohesity、Datastax、Dropbox 和 NetApp 在內(nèi)的頂級(jí)數(shù)據(jù)平臺(tái)提供商正在使用 NVIDIA 微服務(wù)，幫助客戶(hù)優(yōu)化 RAG 管道，并將專(zhuān)有數(shù)據(jù)集成到生成式 AI 應(yīng)用中。Snowflake 正在使用 NeMo Retriever，充分利用企業(yè)數(shù)據(jù)來(lái)構(gòu)建 AI 應(yīng)用。

可用性

開(kāi)發(fā)者可以在 ai.nvidia.com 免費(fèi)試用 NVIDIA 微服務(wù)。企業(yè)則可以在 NVIDIA 認(rèn)證系統(tǒng)和領(lǐng)先的云平臺(tái)上使用 NVIDIA AI Enterprise 5.0 部署生產(chǎn)級(jí) NIM 微服務(wù)。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5309

瀏覽量
106422
GPU芯片

GPU芯片

+關(guān)注

關(guān)注
1

文章
305

瀏覽量
6206
生成式AI

生成式AI

+關(guān)注

關(guān)注
0

文章
531

瀏覽量
817

原文標(biāo)題：GTC24 | NVIDIA 推出生成式 AI 微服務(wù)，供開(kāi)發(fā)者在 CUDA GPU 系統(tǒng)中創(chuàng)建部署生成式 AI 助手

文章出處：【微信號(hào)：NVIDIA_China，微信公眾號(hào)：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

NVIDIA推出生成式AI微服務(wù)，供開(kāi)發(fā)者在CUDA GPU系統(tǒng)中創(chuàng)建部署生成式AI助手

評(píng)論