上周, NVIDIA GTC 2022 宣布了對 Riva 的重大更新。 Riva 是一個用于構建語音 AI 應用程序的 SDK ,以及一個付費的 Riva 企業(yè)產(chǎn)品。 NeMo Megatron 是一個用于訓練大型語言模型的框架,它的幾項關鍵更新也已宣布。
Riva 2.0 通用性
Riva 為跨多種語言的實時自動語音識別( ASR )和文本到語音( TTS )技能提供了世界級的準確性,并且可以部署在 prem 上、任何云中。 Snap 、 T-Mobile 、 RingCentral 和 Kore 等行業(yè)領導者。 ai 在客戶服務中心應用程序、轉錄和虛擬助理中使用 Riva 。
最新的 Riva 版本包括:
ASR 有多種語言:英語、西班牙語、德語、俄語和普通話。
高質量的 TTS 語音可定制獨特的語音字體。
使用 TAO Toolkit 或 NVIDIA NeMo 進行特定于領域的定制,在口音、領域和國家特定術語方面具有無與倫比的準確性。
支持在云端、 prem 和嵌入式平臺上運行。
圖 1:NVIDIA Riva 可控文本到語音使得使用 SSML 標簽可以輕松調整音調和速度。
在手機上嘗試 Riva 自動語音識別 Riva 產(chǎn)品頁面 。
Defined.ai 與 NVIDIA 合作,為希望購買跨語言、域和錄音類型的語音培訓和驗證數(shù)據(jù)的企業(yè)提供一個順暢的工作流程??稍?此處 中找到針對 NVIDIA 開發(fā)人員的 DefinedCrowd 數(shù)據(jù)集示例。
下載 RIVA ,它是免費的NVIDIA 開發(fā)人員的成員從 NGC 免費。
Riva 企業(yè)
NVIDIA 還推出了 Riva Enterprise ,這是一款付費產(chǎn)品,面向在NVIDIA 專家的業(yè)務標準支持下大規(guī)模部署 Riva 的企業(yè)。
好處包括:
在任何云和 prem 平臺上不受限制地使用 ASR 和 TTS 服務。
在當?shù)貭I業(yè)時間與NVIDIA 人工智能專家聯(lián)系,獲取有關配置和性能的指導。
為維護控制和升級計劃提供長期支持。
優(yōu)先訪問新版本和功能。
Riva Enterprise 在 NVIDIA Launchpad 上提供免費試用版,供企業(yè)評估并制作應用程序原型。
Riva launchpad 上的 Enterprise 包括引導實驗室,用于:
與實時語音 AI API 交互。
將語音 AI 功能添加到對話 AI 應用程序中。
在自定義數(shù)據(jù)上微調語音 AI 管道以獲得更高的準確性。
申請 用于您的 Riva 企業(yè)試用。
通過 對話人工智能解謎 GTC 課程了解有關如何構建、優(yōu)化和部署語音 AI 應用程序的更多信息。
NeMo Megatron
NVIDIA 宣布了新的更新 NVIDIA NeMo Megatron ,這是一個培訓大型語言模型( LLM )的框架,其參數(shù)高達數(shù)萬億?;?Megatron paper 的創(chuàng)新, NeMo Megatron 的研究機構和企業(yè)可以培訓任何 LLM ,以實現(xiàn)融合。 NeMo Megatron 提供數(shù)據(jù)預處理、并行(數(shù)據(jù)、張量和管道)、編排和調度,以及自動精度自適應。
它包括經(jīng)過徹底測試的配方、流行的 LLM 架構實現(xiàn),以及組織快速開始 LLM 之旅所需的工具。
瑞典,法學博士。 com 、 Naver 和佛羅里達大學是 Nvidia 技術的早期采用者,用于建立大型語言模型。
最新版本包括:
Hyperparameter tuning tool 會根據(jù)客戶需求和基礎設施限制自動創(chuàng)建配方。
T5 和 mT5 車型的參考配方。
支持在云上培訓 LLM ,從 Azure 開始。
分布式數(shù)據(jù)預處理腳本,縮短端到端培訓時間。
關于作者
About Siddharth Sharma:
Siddharth Sharma 是NVIDIA 加速計算的高級技術營銷經(jīng)理。在加入NVIDIA 之前, Siddharth 是 Mathworks Simulink 和 Stateflow 的產(chǎn)品營銷經(jīng)理,與汽車和航空航天公司密切合作,采用基于模型的設計來創(chuàng)建控制軟件。
About Gordana Neskovic:
Gordana Neskovic 是AI/DL產(chǎn)品營銷團隊的成員,負責 NVIDIA Maxine。在加入 NVIDIA 之前,Gordana曾在VMware、Wells Fargo、Pinterest、SFO-ITT和KLA Tencor擔任過各種產(chǎn)品營銷、數(shù)據(jù)科學家、AI架構師和工程職位。她擁有博士學位。圣塔 Clara 大學,塞爾維亞貝爾格萊德大學電氣工程碩士和學士學位。
About Sirisha Rella:
Sirisha Rella 是 NVIDIA 的技術產(chǎn)品營銷經(jīng)理,專注于計算機視覺、語音和基于語言的深度學習應用。 Sirisha 獲得了密蘇里大學堪薩斯城分校的計算機科學碩士學位,是國家科學基金會大學習中心的研究生助理。
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
5309瀏覽量
106442 -
AI
+關注
關注
88文章
35165瀏覽量
280086
發(fā)布評論請先 登錄
最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)
東軟:以數(shù)據(jù)價值化為破局點 用AI構建城市新基礎設施
tscircuit - 電路開發(fā)的 React 范式? 用TypeScript、React和 AI工具構建電子產(chǎn)品

企業(yè)使用NVIDIA NeMo微服務構建AI智能體平臺
90元打造小智AI腕表,語音交互超有趣!
NVIDIA發(fā)布全新NIM AI Guardrail微服務
NVIDIA NeMo Guardrails引入三項全新NIM微服務
NVIDIA 發(fā)布保障代理式 AI 應用安全的 NIM 微服務
NVIDIA與合作伙伴推出代理式AI Blueprint
HarmonyOS NEXT 應用開發(fā)練習:AI智能語音播報
AI芯片在智能手機中具體怎么用?
日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新
AI云平臺怎么構建
NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業(yè)打造屬于自己的 AI

評論