99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用 NVIDIA AI Foundation Models 構(gòu)建自定義企業(yè)級(jí)生成式 AI

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:未知 ? 2023-11-17 21:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgaomVXbAeAcNF2AADs9hQoRuI274.jpg

在生成式 AI 領(lǐng)域,構(gòu)建企業(yè)級(jí)大語(yǔ)言模型(LLM)需要具備采集高質(zhì)量數(shù)據(jù)、設(shè)置加速基礎(chǔ)設(shè)施和優(yōu)化模型方面的專(zhuān)業(yè)知識(shí)。

開(kāi)發(fā)者可以從預(yù)訓(xùn)練模型開(kāi)始,根據(jù)自己的用例對(duì)模型進(jìn)行微調(diào),從而節(jié)省時(shí)間并使其解決方案更快地投入市場(chǎng)。開(kāi)發(fā)者需要一種簡(jiǎn)單的方法來(lái)試用模型,并通過(guò) API 集成這些模型來(lái)評(píng)估其能力。這有助于他們確定哪種模型最適合其應(yīng)用。

NVIDIA AI Foundation Models

NVIDIA AI Foundation Models是由精心挑選的社區(qū)模型和 NVIDIA 構(gòu)建的模型組成,并針對(duì)峰值性能進(jìn)行了優(yōu)化。開(kāi)發(fā)者可以通過(guò) API 或圖形用戶(hù)界面直接在瀏覽器中快速使用這些模型,無(wú)需進(jìn)行任何設(shè)置。這些模型通過(guò)NVIDIA TensorRT-LLM和激活感知權(quán)重量化(AWQ)技術(shù)進(jìn)行優(yōu)化,以便確定最高吞吐量和最低延遲的配置,并且在 NVIDIA 加速計(jì)算堆棧上大規(guī)模運(yùn)行。

NVIDIA Nemotron-3 8B 系列 LLM 介紹

NVIDIA Nemotron-3 8B系列模型為想要構(gòu)建生產(chǎn)就緒生成式 AI 應(yīng)用的客戶(hù)提供了基礎(chǔ)。這些模型是基于可靠的數(shù)據(jù)集構(gòu)建,其運(yùn)行性能可媲美規(guī)模遠(yuǎn)超它們的模型,因此非常適合企業(yè)部署。

NVIDIA Nemotron-3 8B 系列模型的一大關(guān)鍵優(yōu)勢(shì)在于其具有多語(yǔ)言功能,這使其成為全球企業(yè)的理想選擇。這些模型精通 53 種語(yǔ)言,包括英語(yǔ)、德語(yǔ)、俄語(yǔ)、西班牙語(yǔ)、法語(yǔ)、日語(yǔ)、中文、意大利語(yǔ)和荷蘭語(yǔ)。

該系列模型還采用了一系列對(duì)齊技術(shù),包括監(jiān)督微調(diào)(SFT)、人類(lèi)反饋強(qiáng)化學(xué)習(xí)(RLHF)以及全新的NVIDIA SteerLM定制化技術(shù),使客戶(hù)可以在推理時(shí)調(diào)整模型。無(wú)論是自定義模型還是從頭開(kāi)始運(yùn)行模型,這些變體為支持各種不同的用例打下了基礎(chǔ)。

Nemotron-3 8B 系列模型包含:

  • Nemotron-3-8B-Chat-SteerLM:一個(gè)基于 NV-Nemotron-3-8B 基本模型的生成式語(yǔ)言模型,專(zhuān)為在推理過(guò)程中使用戶(hù)能夠采用 SteerLM 技術(shù)控制模型輸出而定制。

  • Nemotron-3-8B-QA:一個(gè)基于 NV-Nemotron-3-8B 基礎(chǔ)模型的生成式語(yǔ)言模型,可針對(duì)問(wèn)題回答指令進(jìn)行進(jìn)一步微調(diào)。

經(jīng)過(guò) NVIDIA 優(yōu)化的社區(qū)模型

此外,NVIDIA 還提供領(lǐng)先的社區(qū)模型,這些模型均經(jīng)過(guò) NVIDIA TensorRT-LLM 的優(yōu)化,具有最高的性?xún)r(jià)比,企業(yè)機(jī)構(gòu)可根據(jù)企業(yè)應(yīng)用對(duì)它們進(jìn)行自定義。這些模型包括:

  • Llama 2:最流行的 LLM 之一,能夠根據(jù)提示生成文本。

  • Stable Diffusion XL:一種熱門(mén)的生成式 AI 模型,可使用文本創(chuàng)建富有表現(xiàn)力的圖像。

  • Code Llama:Llama 2 模型的微調(diào)版本,可使用 Java、C++、Python 等多種流行語(yǔ)言生成代碼。

  • Mistral 7B:一種能遵循指令、完成請(qǐng)求并生成有創(chuàng)意的文本格式的 LLM。

  • Contrastive Language-Image Pre-Training (CLIP):一種流行的開(kāi)源模型,能同時(shí)理解圖像和文本,從而完成圖像分類(lèi)、物體檢測(cè)等任務(wù)。

當(dāng)開(kāi)發(fā)者確定了合適的基礎(chǔ)模型后,就可以輕松地對(duì)這些模型進(jìn)行微調(diào)和部署,無(wú)論是在自己的基礎(chǔ)設(shè)施上,還是通過(guò)NVIDIA DGX Cloud在 NVIDIA 維護(hù)的基礎(chǔ)設(shè)施上。

下面讓我們一起體驗(yàn)、定制和部署微調(diào)后的 Llama 2 模型。

體驗(yàn) Llama 2

NVIDIA 提供了一個(gè)易于使用的界面,使開(kāi)發(fā)者能夠直接在瀏覽器上與 Llama 2 模型進(jìn)行交互。只需在提示字段中輸入文本并點(diǎn)擊生成,模型就會(huì)立即開(kāi)始生成信息回復(fù)。

在圖 1 中,用戶(hù)要求模型進(jìn)行 SQL 查詢(xún),檢索 2021 年第一季度至少消費(fèi) 50,000 美元的客戶(hù)名單。模型不但正確理解了用戶(hù)的查詢(xún),并提供了答案和詳細(xì)解釋。

wKgaomVXbAeASNiOAAHfhVJza_w002.png

圖 1. Llama 2 模型對(duì) SQL 查詢(xún)“獲取 2021 年第一季度

至少消費(fèi) 50,000 美元的客戶(hù)名單”所做出的響應(yīng)

而開(kāi)發(fā)者通常對(duì)代碼更感興趣。因此,NVIDIA 也直接在瀏覽器中提供了一個(gè) API 小工具,讓用戶(hù)可以通過(guò) API 無(wú)縫體驗(yàn)這些模型。

如要試用這個(gè)瀏覽器內(nèi)置的 API,請(qǐng)單擊 API 模式,然后從下拉菜單中選擇您傾向的語(yǔ)言。圖 2 顯示了通過(guò) cURL 調(diào)用該 API 的 API 指令。

wKgaomVXbAeAfx5VAAJT5xM-gms898.png

圖 2. 用于體驗(yàn) Llama 2 模型的

瀏覽器內(nèi)置 API 小工具(cURL 語(yǔ)言)

自定義模型

通常情況下,一般模型無(wú)法滿(mǎn)足開(kāi)發(fā)者的需求,必須使用專(zhuān)有數(shù)據(jù)進(jìn)行微調(diào)。因此,NVIDIA 提供了多種自定義可用模型的途徑。

NVIDIA NeMo是一個(gè)端到端企業(yè)級(jí)云原生框架,開(kāi)發(fā)者可用它來(lái)構(gòu)建、定制和部署具有數(shù)十億參數(shù)的生成式 AI 模型。此外,NeMo 還提供用于微調(diào) LLM(如 Llama)的 API。

為了快速上手,我們也提供了一個(gè) NVIDIA LaunchPad 實(shí)驗(yàn)室。這個(gè)通用的試驗(yàn)場(chǎng)可對(duì)最新的 NVIDIA 企業(yè)級(jí)軟硬件進(jìn)行全方位測(cè)試。

該 LaunchPad 實(shí)驗(yàn)室體驗(yàn)中的以下示例使用自定義數(shù)據(jù)集對(duì) Llama 2 7B 文本-文本模型進(jìn)行了微調(diào),以更好地執(zhí)行問(wèn)答任務(wù)。

  1. 如要開(kāi)始使用,請(qǐng)單擊“Llama 2 微調(diào)實(shí)驗(yàn)室(https://www.nvidia.com/en-us/launchpad/ai/customize-llama-2-with-enterprise-data/)并申請(qǐng)?jiān)L問(wèn)。在 Launchpad 上工作時(shí),Llama 2 模型文件會(huì)以 .nemo 檢查點(diǎn)的形式預(yù)先下載,從而實(shí)現(xiàn)與 NVIDIA NeMo Framework 的微調(diào)兼容性。

  2. 模型準(zhǔn)備就緒后,我們從 Hugging Face 加載 Dolly 數(shù)據(jù)集(https://huggingface.co/datasets/databricks/databricks-dolly-15k)并對(duì)其進(jìn)行預(yù)處理,刪除不必要的字段、重命名某些字段,以更好地適應(yīng)提示調(diào)整任務(wù),并將數(shù)據(jù)集分割成訓(xùn)練文件和測(cè)試文件。

    dataset=load_dataset("aisquared/databricks-dolly-15k")

    面所示的是一個(gè)數(shù)據(jù)樣本。為了適應(yīng)特定的用例,數(shù)據(jù)集可以互換。

    {
    "question": "When did Virgin Australia start operating?", 
    "context": "Virgin Australia, the trading name of Virgin Australia Airlines Pty Ltd, is an Australian-based airline. It is the largest airline by fleet size to use the Virgin brand. It commenced services on 31 August 2000 as Virgin Blue, with two aircraft on a single route.[3] It suddenly found itself as a major airline in Australia's domestic market after the collapse of Ansett Australia in September 2001. The airline has since grown to directly serve 32 cities in Australia, from hubs in Brisbane, Melbourne and Sydney.[4]", 
    "answer": "Virgin Australia commenced services on 31 August 2000 as Virgin Blue, with two aircraft on a single route.", 
    "taskname": "genqa"
    }

  3. 然后,通過(guò)更新默認(rèn) NeMo 配置文件的某些字段來(lái)設(shè)置微調(diào)作業(yè),以適應(yīng)當(dāng)前的訓(xùn)練任務(wù)。接著,使用 NeMo 訓(xùn)練腳本啟動(dòng)作業(yè),運(yùn)行微調(diào)并在過(guò)程中生成模型檢查點(diǎn)。

  4. 微調(diào)任務(wù)完成后,我們就可以運(yùn)行筆記本內(nèi)推理,生成一些示例輸出,并評(píng)估微調(diào)后模型的性能。

  5. 接著讓我們來(lái)看看這樣一個(gè)示例輸出。我們?cè)谏舷挛闹刑峁┝藘煞N產(chǎn)品的描述:割草機(jī)和廚房機(jī)器人,并詢(xún)問(wèn)模型割草機(jī)是否由太陽(yáng)能供電。

    該模型準(zhǔn)確地把握了上下文,并給出了“是”的回答。在對(duì)該模型進(jìn)行微調(diào)后,它就能夠根據(jù)所提供的上下文準(zhǔn)確回答我們的問(wèn)題了。

    {
    "input": "Context: The Auto Chef Master is a personal kitchen robot that effortlessly turns raw ingredients into gourmet meals with the precision of a Michelin-star chef. The Eco Lawn Mower is a solar powered high-tech lawn mower that provides an eco-friendly and efficient way to maintain your lawn. Question: Is the lawn mower product solar powered? 
    Answer:", 
    "pred": "Yes", 
    "label": "Yes, the Eco Lawn Mower is solar powered.", 
    "taskname": "genqa"
    }

部署模型

NVIDIA AI FoundationEndpoints提供完全無(wú)服務(wù)器和可擴(kuò)展的 API,這些 API 可部署在您自己的云或NVIDIA DGX Cloud上。填寫(xiě)此表(https://developer.nvidia.com/login)即可開(kāi)始使用 AI Foundation Endpoints。

您還可以使用NVIDIA AI Enterprise在自己的云或數(shù)據(jù)中心基礎(chǔ)設(shè)施上進(jìn)行部署。這一端到端的云原生軟件平臺(tái)憑借其企業(yè)級(jí)的安全性、穩(wěn)定性、可管理性和支持,能夠加速生產(chǎn)級(jí)生成式 AI 的開(kāi)發(fā)和部署。當(dāng)您準(zhǔn)備從實(shí)驗(yàn)轉(zhuǎn)向生產(chǎn)階段時(shí),就可以使用 NVIDIA AI Enterprise 的企業(yè)級(jí)運(yùn)行時(shí)來(lái)微調(diào)和部署這些模型。

更多信息

通過(guò)這篇文章,我們了解了 NVIDIA AI Foundation 模型是如何通過(guò)提供易于使用的模型體驗(yàn)界面,以及簡(jiǎn)化的模型微調(diào)和部署路徑,從而幫助企業(yè)開(kāi)發(fā)者找到適合各種用例的模型。

歡迎探索NVIDIA NGC 目錄中提供的不同AI Foundation 模型(https://catalog.ngc.nvidia.com/ai-foundation-models),找到適合您的模型。

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國(guó)加州圣何塞會(huì)議中心舉行,線(xiàn)上大會(huì)也將同期開(kāi)放。點(diǎn)擊“閱讀原文”掃描下方海報(bào)二維碼,立即注冊(cè) GTC 大會(huì)。


原文標(biāo)題:利用 NVIDIA AI Foundation Models 構(gòu)建自定義企業(yè)級(jí)生成式 AI

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3948

    瀏覽量

    93685

原文標(biāo)題:利用 NVIDIA AI Foundation Models 構(gòu)建自定義企業(yè)級(jí)生成式 AI

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA助力安利生成AI在效能和安全上破局

    依托 NVIDIA AI Enterprise 企業(yè)級(jí)解決方案,安利正在構(gòu)建安全、高效、可擴(kuò)展的 AI 基礎(chǔ)設(shè)施體系,全面提升算力資源調(diào)度能
    的頭像 發(fā)表于 05-10 09:28 ?629次閱讀

    英偉達(dá)GTC2025亮點(diǎn):NVIDIA與行業(yè)領(lǐng)先存儲(chǔ)企業(yè)共同推出面向AI時(shí)代的新型企業(yè)基礎(chǔ)設(shè)施

    存儲(chǔ)提供商構(gòu)建搭載 AI 查詢(xún)智能體的基礎(chǔ)設(shè)施,利用 NVIDIA 計(jì)算、網(wǎng)絡(luò)和軟件,針對(duì)復(fù)雜查詢(xún)進(jìn)行推理并快速生成準(zhǔn)確響應(yīng)
    的頭像 發(fā)表于 03-21 09:42 ?655次閱讀

    NVIDIA 與行業(yè)領(lǐng)先的存儲(chǔ)企業(yè)共同推出面向 AI 時(shí)代的新型企業(yè)基礎(chǔ)設(shè)施

    3 月 18 日 —— NVIDIA 今日推出了 NVIDIA AI 數(shù)據(jù)平臺(tái) —— 一項(xiàng)可自定義的參考設(shè)計(jì),領(lǐng)先的存儲(chǔ)提供商可用來(lái)構(gòu)建
    發(fā)表于 03-19 10:11 ?243次閱讀
    <b class='flag-5'>NVIDIA</b> 與行業(yè)領(lǐng)先的存儲(chǔ)<b class='flag-5'>企業(yè)</b>共同推出面向 <b class='flag-5'>AI</b> 時(shí)代的新型<b class='flag-5'>企業(yè)</b>基礎(chǔ)設(shè)施

    NVIDIA推出多個(gè)生成AI模型和藍(lán)圖

    NVIDIA 宣布推出多個(gè)生成 AI 模型和藍(lán)圖,將 NVIDIA Omniverse 一體化進(jìn)一步擴(kuò)展至物理
    的頭像 發(fā)表于 01-08 10:48 ?622次閱讀

    Orange Business推出Live Intelligence:簡(jiǎn)化企業(yè)級(jí)生成AI部署

    Orange Business近期正式推出了一項(xiàng)名為L(zhǎng)ive Intelligence的創(chuàng)新解決方案,旨在為企業(yè)和地方政府提供全面且便捷的生成AI服務(wù)。該方案的推出,標(biāo)志著Orang
    的頭像 發(fā)表于 12-27 13:55 ?769次閱讀

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開(kāi)發(fā)了一個(gè)全新的生成 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意的音樂(lè)、人聲和聲音組合的作品。
    的頭像 發(fā)表于 11-27 11:29 ?812次閱讀

    NVIDIA助力Amdocs打造生成AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開(kāi)發(fā)和交付基于商用大語(yǔ)言模型(LLM)和領(lǐng)域適配模型的解決方案。該公司還在使用NVIDIA
    的頭像 發(fā)表于 11-19 14:48 ?901次閱讀

    在設(shè)備上利用AI Edge Torch生成API部署自定義大語(yǔ)言模型

    我們很高興地發(fā)布 AI Edge Torch 生成 API,它能將開(kāi)發(fā)者用 PyTorch 編寫(xiě)的高性能大語(yǔ)言模型 (LLM) 部署至 TensorFlow Lite (TFLite) 運(yùn)行時(shí)
    的頭像 發(fā)表于 11-14 10:23 ?1125次閱讀
    在設(shè)備上<b class='flag-5'>利用</b><b class='flag-5'>AI</b> Edge Torch<b class='flag-5'>生成</b><b class='flag-5'>式</b>API部署<b class='flag-5'>自定義</b>大語(yǔ)言模型

    NVIDIA NIM Agent Blueprint加速企業(yè)級(jí)AI應(yīng)用落地

    生成 AI 時(shí)代,每個(gè)企業(yè)都在嘗試構(gòu)建自己的 AI 應(yīng)用,來(lái)賦能
    的頭像 發(fā)表于 11-13 11:35 ?751次閱讀

    生成AI在制造業(yè)的應(yīng)用現(xiàn)狀和前景展望

    在上一期《IBM 企業(yè)級(jí) AI 為跨國(guó)制造業(yè)智能化注入新動(dòng)力》的文章中,我們重點(diǎn)分享了 IBM 企業(yè)級(jí)AI驅(qū)動(dòng)智能制造升級(jí)的若干場(chǎng)景,視覺(jué)檢測(cè)技術(shù)及知識(shí)庫(kù)平臺(tái)的應(yīng)用案例;接下來(lái),我們將
    的頭像 發(fā)表于 11-06 17:06 ?1467次閱讀

    NVIDIA與思科合作打造企業(yè)級(jí)生成AI基礎(chǔ)設(shè)施

    NVIDIA 加速計(jì)算平臺(tái)、NVIDIA AI Enterprise 軟件和 NVIDIA NIM 推理微服務(wù)加持的思科 Nexus HyperFabric
    的頭像 發(fā)表于 10-10 09:35 ?837次閱讀

    NVIDIA AI助力SAP生成AI助手Joule加速發(fā)展

    在美國(guó)佛羅里達(dá)州奧蘭多舉行的 SAP Sapphire 大會(huì)上,NVIDIA 與這家企業(yè)軟件公司公布了搭載NVIDIA AI Enterprise軟件的
    的頭像 發(fā)表于 09-09 09:37 ?813次閱讀

    NVIDIA NeMo加速并簡(jiǎn)化自定義模型開(kāi)發(fā)

    如果企業(yè)希望充分發(fā)揮出 AI 的力量,就需要根據(jù)其行業(yè)需求量身定制的自定義模型。
    的頭像 發(fā)表于 07-26 11:17 ?1249次閱讀
    <b class='flag-5'>NVIDIA</b> NeMo加速并簡(jiǎn)化<b class='flag-5'>自定義</b>模型開(kāi)發(fā)

    NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成AI服務(wù)

    NVIDIA近日宣布了一項(xiàng)重大舉措,正式推出NVIDIA AI Foundry服務(wù)與NVIDIA NIM(NVIDIA Inference
    的頭像 發(fā)表于 07-25 16:57 ?840次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成 AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護(hù)到評(píng)估的全方位生成 AI 模型服務(wù),以便部署自定義 Llama 3.1
    發(fā)表于 07-24 09:39 ?914次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球<b class='flag-5'>企業(yè)</b>打造<b class='flag-5'>自定義</b> Llama 3.1 <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 模型