99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌AI語音服務(wù)新增7種語言和31種聲音

電子那些事兒 ? 2019-03-01 10:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2月24日消息,為了擴展AI語音服務(wù)的市場,谷歌除了加強語音辨識模型、語言支持數(shù)量和聲音種類之外,也調(diào)整了語音服務(wù)的價格。

谷歌更新文字轉(zhuǎn)語音和語音轉(zhuǎn)文字服務(wù),除了優(yōu)化語音辨識模型、新支持7種語言和31種聲音之外,也調(diào)整了語音服務(wù)的價格,在特定的應(yīng)用情境中,用戶最多可以省下約50%的支出,而谷歌也提供每月前60分鐘免費的語言轉(zhuǎn)文字服務(wù)。

谷歌指出,語音辨識和生成技術(shù)在人機互動的應(yīng)用中非常關(guān)鍵,要讓人機互動更加自然、簡單且普遍,并不容易,即便使用準確度高達90%的語音辨識模型,還是很難真正達到有效的對話,由于許多企業(yè)的語音辨識模型都是要在電話中運行,受到噪音的干擾,產(chǎn)生的文字資訊讓模型難以處理,谷歌于去年4月針對這種應(yīng)用場景推出電話和影片的語音轉(zhuǎn)文字服務(wù)。

經(jīng)過不斷優(yōu)化,現(xiàn)在電話的文字錯誤已降低了62%,而影片的語音轉(zhuǎn)文字模型錯誤率也降低了64%,除此之外,影片的語音轉(zhuǎn)文字模型在辨識多個說話者的情境中,像是會議或是廣播,也有很好的表現(xiàn)。

在價格方面,為了吸引更多用戶,谷歌將影片語音轉(zhuǎn)文字模型收費調(diào)降了25%,而在標準和影片模型服務(wù)中,選擇加入資料收集計畫的用戶,收費價格會減少33%,因此,若使用影片模型且選擇加入收集資料計畫的用戶,將能夠減少約50%的支出。

此外,支持的語言也是企業(yè)使用語音轉(zhuǎn)文字辨識模型的一大考量,現(xiàn)在谷歌新增了7個語言和方言,包含丹麥語、葡萄牙語、俄語、波蘭語、斯洛伐克語、烏克蘭語和挪威語,加上上述新增的語言,目前總共支持持21種語言,這些新增的語言都還是測試版。在語音生成模型方面,谷歌的語音生成系統(tǒng)WaveNet也新增了31種聲音,目前總共有包含21種語言的57種聲音。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI語音控制模塊能做些什么

    在智能化浪潮中,AI 語音控制模塊成為眾多設(shè)備實現(xiàn)便捷交互的關(guān)鍵組件。WT3000A 作為一款功能卓越的 AI 語音控制模塊,在智能家居、工業(yè)物聯(lián)網(wǎng)等領(lǐng)域展現(xiàn)出強大的應(yīng)用能力。 豐富
    的頭像 發(fā)表于 06-18 11:48 ?246次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>語音</b>控制模塊能做些什么

    正點原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續(xù)航,語音暢聊,情景對話,知識科普,多色可選,隨身攜帶!

    品非它莫屬! 為什么選擇小智AI? 真人級交互體驗 ① AI情感對話:不止問答,更能陪你聊心事、講笑話,像朋友一樣懂你! ② 10+音色百變:溫柔御姐、萌趣童聲、磁性男神… 每天換一聲音
    發(fā)表于 04-24 16:11

    90元打造小智AI腕表,語音交互超有趣!

    最近小智AI非?;穑@周給大家分享一個來自開源平臺的小智AI腕表項目。 項目作者@dotnfc,復(fù)刻成本90元左右,開源協(xié)議:MIT License 項目簡介 本項目分享了小智AI聊天機器人的一
    發(fā)表于 04-16 14:26

    正點原子ESP32S3系列開發(fā)板全面支持小智AI

    飛速發(fā)展的大語言模型應(yīng)用到實際的硬件設(shè)備中。 小智AI功能如下: WiFi / ML307 Cat.1 4G BOOT鍵喚醒和打斷,支持點擊和長按兩觸發(fā)方式 離線語音喚醒ESP-SR
    發(fā)表于 02-14 17:01

    解鎖個性化語音交互新時代:九芯智能語音云平臺,讓創(chuàng)意聲音觸手可及!

    九芯智能語音云平臺提供全面高效安全的智能語音服務(wù),支持自定義語音內(nèi)容,簡化燒錄流程,依托AI技術(shù),助力各行業(yè)智能化升級,引領(lǐng)
    的頭像 發(fā)表于 01-02 16:51 ?888次閱讀
    解鎖個性化<b class='flag-5'>語音</b>交互新時代:九芯智能<b class='flag-5'>語音</b>云平臺,讓創(chuàng)意<b class='flag-5'>聲音</b>觸手可及!

    語言模型開發(fā)語言是什么

    在人工智能領(lǐng)域,大語言模型(Large Language Models, LLMs)背后,離不開高效的開發(fā)語言和工具的支持。下面,AI部落小編為您介紹大語言模型開發(fā)所依賴的主要編程
    的頭像 發(fā)表于 12-04 11:44 ?692次閱讀

    串口屏支持哪些編程語言和開發(fā)環(huán)境?

    串口屏作為一常用的顯示和交互設(shè)備,支持多種編程語言和開發(fā)環(huán)境。以下是對串口屏支持的編程語言和開發(fā)環(huán)境的詳細歸納:
    的頭像 發(fā)表于 11-13 11:45 ?748次閱讀
    串口屏支持哪些編程<b class='flag-5'>語言和</b>開發(fā)環(huán)境?

    HarmonyOS NEXT應(yīng)用元服務(wù)開發(fā)Intents Kit(意圖框架服務(wù))技能調(diào)用方案概述

    一、概述 技能調(diào)用是意圖框架依托系統(tǒng)AI多模態(tài)大模型能力做深度用戶輸入理解,并通過解析的用戶意圖對接應(yīng)用或元服務(wù)內(nèi)的功能和內(nèi)容。 二、場景體驗 用戶通過對小藝對話進行自然語言輸入實現(xiàn)內(nèi)容查詢,知識
    發(fā)表于 11-08 15:38

    MCU編程語言和開發(fā)環(huán)境介紹

    微控制器單元(Microcontroller Unit,簡稱MCU)是嵌入式系統(tǒng)的核心,廣泛應(yīng)用于各種電子產(chǎn)品中。隨著技術(shù)的發(fā)展,MCU編程語言和開發(fā)環(huán)境也在不斷進步,以適應(yīng)不同的應(yīng)用需求。 1.
    的頭像 發(fā)表于 11-01 11:51 ?2194次閱讀

    Waymo利用谷歌Gemini大模型,研發(fā)端到端自動駕駛系統(tǒng)

    10月31日訊,自動駕駛領(lǐng)域的先鋒Waymo,作為Alphabet旗下的一員,長久以來將其與谷歌DeepMind的緊密合作及深厚的AI研究底蘊視為其在自動駕駛競賽中脫穎而出的關(guān)鍵。如今,Waymo再
    的頭像 發(fā)表于 10-31 16:55 ?1717次閱讀

    C語言和C++中結(jié)構(gòu)體的區(qū)別

    同樣是結(jié)構(gòu)體,看看在C語言和C++中有什么區(qū)別?
    的頭像 發(fā)表于 10-30 15:11 ?767次閱讀

    TMS320LF240x DSP的C語言和匯編代碼快速入門

    電子發(fā)燒友網(wǎng)站提供《TMS320LF240x DSP的C語言和匯編代碼快速入門.pdf》資料免費下載
    發(fā)表于 10-18 10:14 ?1次下載
    TMS320LF240x DSP的C<b class='flag-5'>語言和</b>匯編代碼快速入門

    AI服務(wù)平臺介紹

    AI服務(wù)AI as a Service,AIaaS)平臺,是一基于云計算的、集成了人工智能和機器學習技術(shù)的服務(wù)平臺。
    的頭像 發(fā)表于 10-08 10:32 ?762次閱讀

    什么是AI服務(wù)器?AI服務(wù)器的優(yōu)勢是什么?

    AI服務(wù)器是一專門為人工智能應(yīng)用設(shè)計的服務(wù)器,它采用異構(gòu)形式的硬件架構(gòu),通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速芯片的組合來滿足高吞吐量互聯(lián)的需求,為自然
    的頭像 發(fā)表于 09-21 11:43 ?2024次閱讀

    谷歌推出Gemini Live,開啟AI語音聊天新紀元

    在萬眾矚目的Pixel 9系列手機發(fā)布會上,谷歌震撼宣布了一項創(chuàng)新服務(wù)——Gemini Live,該服務(wù)自今日起,率先向使用英語的Gemini Advanced訂閱用戶敞開大門。這一舉措標志著
    的頭像 發(fā)表于 08-15 17:29 ?1039次閱讀