99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟院士:Speech DDK技能太強了,語音識別超專業(yè)翻譯人士水平

漁翁先生 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:尹志堅 ? 2018-12-19 16:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導(dǎo)讀】2016年152層殘差網(wǎng)絡(luò)圖像識別精準(zhǔn)率96%,2017年語音識別基準(zhǔn)測試誤差率5.1%,2018年1月文本理解測試精準(zhǔn)率88.5%,3月機器翻譯研究系統(tǒng)精準(zhǔn)率達到69.9%,12月語音合成測試版在Azure正式上線,并首次達到超過專業(yè)翻譯人士的水平,微軟人工智能AI)再次刷新世界紀(jì)錄。

12月18日,在IoT In Action峰會上,微軟全球資深院士首席語音科學(xué)家黃學(xué)東博士介紹智能語音和語言上的最新進展。首款媲美專業(yè)發(fā)音人的實時在線語音合成系統(tǒng)預(yù)覽版在Azure上正式運營服務(wù)。

黃學(xué)東博士表示,微軟在云服務(wù)上提供了世界級的語音合成服務(wù),所有的互聯(lián)網(wǎng)內(nèi)容提供商都可以享受這個世界級的技術(shù)。它不僅解決了過去20年機器語音識別錯誤率居高不下的難題,更是人工智能語音和語言上的一次歷史性突破——采用先進深度網(wǎng)絡(luò)學(xué)習(xí),簡化了傳統(tǒng)語音合成的架構(gòu)。

從以上圖片可以看出,左邊紫色系統(tǒng)架構(gòu)下,微軟通過端到端的深度學(xué)習(xí)優(yōu)化,為大家提供前所未有的、最自然的語音合成系統(tǒng)。

“基于神經(jīng)網(wǎng)絡(luò)的語音合成系統(tǒng)”是業(yè)界第一個實時的在語音上上線的人工智能服務(wù)。黃學(xué)東博士指出,大家可以享受更好的語音合成質(zhì)量、更快的引擎性能、更廣的全球服務(wù)部署。所有的內(nèi)容提供商,不管是有沒有音頻、你的內(nèi)容都可以轉(zhuǎn)換成自然的聲音表達,不管是在開車還是在睡覺,都可以享受高質(zhì)量的交互。

同時,微軟聯(lián)合全球合作伙伴一起推出強大的語音麥克風(fēng)陣列開發(fā)系統(tǒng)(Speech Devices SDK簡稱Speech DDK),它可以在25m之外都可以轉(zhuǎn)寫你的聲音,DDK不僅可供用戶免費使用,還可以整合到任何硬件設(shè)備中去,通過微軟云服務(wù)為用戶提供最先進的、世界一流的語音交互服務(wù)。

DDK讓智能音箱“說話”。這是一款眼觀六路的智能音箱系統(tǒng),為企業(yè)級的會議轉(zhuǎn)寫提供前所未有的智能服務(wù)。

可以看到,它不僅僅是業(yè)界第一臺多人原場會議轉(zhuǎn)錄系統(tǒng),而且是業(yè)界第一臺“睜開雙眼”的智能音箱。

隨著語音識別技術(shù)不斷取得進步。放眼未來,各國間的語言溝通障礙不再有任何問題,人類離人工智能真正的目標(biāo)又將推進一小步。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6686

    瀏覽量

    105771
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103631
  • 語音識別
    +關(guān)注

    關(guān)注

    39

    文章

    1782

    瀏覽量

    114246
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49028

    瀏覽量

    249551
  • 語音合成
    +關(guān)注

    關(guān)注

    2

    文章

    92

    瀏覽量

    16499
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    EASY EAl Orin Nano(RK3576) whisper語音識別訓(xùn)練部署教程

    Whisper是OpenAI開源的,識別語音識別能力已達到人類水準(zhǔn)自動語音識別系統(tǒng)。Whisper作為一個通用的
    的頭像 發(fā)表于 07-17 14:55 ?478次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識別</b>訓(xùn)練部署教程

    USB PD 3.0控制器TPS65987DDK浪涌防護方案

    本文主要是針對USB PD 3.0控制器TPS65987DDK的浪涌防護方案,采用湖南靜芯研發(fā)的TDS浪涌保護器件對芯片進行浪涌防護,保護設(shè)備免受電氣系統(tǒng)中的浪涌電壓或浪涌電流的損害,確保設(shè)備
    的頭像 發(fā)表于 04-10 14:53 ?278次閱讀
    USB PD 3.0控制器TPS65987<b class='flag-5'>DDK</b>浪涌防護方案

    語音識別技術(shù)在通信領(lǐng)域中的應(yīng)用實例

    語音識別技術(shù)也被稱為自動語音識別(Automatic Speech Recognition,ASR),是通過計算機對
    的頭像 發(fā)表于 02-21 17:12 ?700次閱讀

    詳解語音識別技術(shù)在通信領(lǐng)域中的應(yīng)用

    語音識別技術(shù)也被稱為自動語音識別(Automatic Speech Recognition,ASR),是通過計算機對
    的頭像 發(fā)表于 02-21 17:05 ?785次閱讀
    詳解<b class='flag-5'>語音</b><b class='flag-5'>識別</b>技術(shù)在通信領(lǐng)域中的應(yīng)用

    AI助力實時翻譯耳機

    是一種能夠?qū)崟r將一種語言翻譯成另一種語言的耳機設(shè)備。它通常由一個耳機和一個配套的應(yīng)用程序組成,用戶可以通過應(yīng)用程序選擇需要翻譯的語言,并通過耳機聽到翻譯結(jié)果。 2 實時翻譯耳機是如何工
    的頭像 發(fā)表于 01-24 11:14 ?1676次閱讀
    AI助力實時<b class='flag-5'>翻譯</b>耳機

    NRK3502系列芯片 | 制氧機離線語音識別方案

    融合,為客戶提供Turnkey語音識別方案。該方案不僅大幅提升了制氧機操作的便捷性,還極大地增強了用戶體驗。用戶只需通過簡單的語音指令,如“開機”、“調(diào)整氧氣濃度
    的頭像 發(fā)表于 12-04 01:02 ?488次閱讀
    NRK3502系列芯片 | 制氧機離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>方案

    語音識別在智能家居中的應(yīng)用

    的特點,成為了智能家居控制的新寵。 一、語音識別技術(shù)簡介 語音識別,也稱為自動語音識別(Auto
    的頭像 發(fā)表于 11-26 09:31 ?1386次閱讀

    語音識別與自然語言處理的關(guān)系

    在人工智能的快速發(fā)展中,語音識別和自然語言處理(NLP)成為了兩個重要的技術(shù)支柱。語音識別技術(shù)使得機器能夠理解人類的語音,而自然語言處理則讓
    的頭像 發(fā)表于 11-26 09:21 ?1507次閱讀

    語音識別技術(shù)的應(yīng)用與發(fā)展

    語音識別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來,隨著計算能力的提升和機器學(xué)習(xí)技術(shù)的進步,這項技術(shù)才真正成熟并廣泛應(yīng)用于各個領(lǐng)域。語音識別技術(shù)的應(yīng)用不僅提高了工作效率,也極大
    的頭像 發(fā)表于 11-26 09:20 ?1634次閱讀

    ASR與傳統(tǒng)語音識別的區(qū)別

    ASR(Automatic Speech Recognition,自動語音識別)與傳統(tǒng)語音識別在多個方面存在顯著的區(qū)別。以下是對這兩者的對比
    的頭像 發(fā)表于 11-18 15:22 ?1353次閱讀

    ASR語音識別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識別技術(shù),是計算機科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個領(lǐng)域。
    的頭像 發(fā)表于 11-18 15:12 ?2071次閱讀

    基于Arm Neoverse N2實現(xiàn)自動語音識別技術(shù)

    自動語音識別 (Automatic Speech Recognition) 技術(shù)已經(jīng)深入到現(xiàn)代生活的方方面面,廣泛應(yīng)用于從語音助手、轉(zhuǎn)錄服務(wù),到呼叫中心分析和
    的頭像 發(fā)表于 11-15 11:35 ?1100次閱讀
    基于Arm Neoverse N2實現(xiàn)自動<b class='flag-5'>語音</b><b class='flag-5'>識別</b>技術(shù)

    WTK6900FC語音識別模塊

    語音識別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年09月25日 17:35:07

    唯創(chuàng)知音WT2605C用在離在線語音識別方案# #語音芯片 #語音識別 #唯創(chuàng)知音

    語音識別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年09月12日 17:24:28

    什么是離線語音識別芯片?與在線語音識別的區(qū)別

    離線語音識別芯片適用于智能家電等,特點為小詞匯量、低成本、安全性高、響應(yīng)快,無需聯(lián)網(wǎng)。在線語音識別功能更廣泛、識別準(zhǔn)確率高,但依賴穩(wěn)定網(wǎng)絡(luò)。
    的頭像 發(fā)表于 07-22 11:33 ?954次閱讀