99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音交互設(shè)備中的ASR和TTS技術(shù)

安富利 ? 來源:安富利 ? 作者:安富利 ? 2022-06-16 17:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本期導(dǎo)讀

-Hi Siri,今天天氣怎么樣?

-今天天氣晴,18℃至27℃,空氣質(zhì)量指數(shù)36,優(yōu)。

手機、手表、音箱等智能設(shè)備極大地便利了我們的生活,隨著語音交互設(shè)備的發(fā)展,智能交互依然面臨很多挑戰(zhàn)。

我們每天要說成百上千句話,長短不一。即便是一些轉(zhuǎn)瞬即逝的口頭語,也可以成為傳達自我意識的載體,向他人準確傳達信息。可語言似乎是人類群體特有的專利,在過往的時間中,想借助語言與其他物種、物體建立清晰明確溝通關(guān)系的可能性無限趨近于零,直到智能語音技術(shù)的出現(xiàn)。

作為最早落地的人工智能技術(shù)之一,AI語音技術(shù)已經(jīng)得到了長足的發(fā)展。如今,智能語音技術(shù)已經(jīng)被廣泛集成的就是家居產(chǎn)品之中。在即將到來的萬物互聯(lián)時代,以語音交互為主的智能設(shè)備無疑將極具競爭力與吸引力。仔細一想,一眾充滿科技感與未來感的智能設(shè)備,將天然具備人類最熟悉的“原始交互方式”,也頗有些化繁為簡、返璞歸真的意味。

語音交互設(shè)備的“助聽器”——ASR

在復(fù)雜環(huán)境中,我們總是可以忽略或弱化無關(guān)噪聲,集中注意力進行溝通,但語音交互設(shè)備在如此環(huán)境中只會無所適從,不免陷入“交互尚未開始,便已結(jié)束”的囧境。故此,設(shè)備擁有對各類“聲學(xué)場景”的聲源信號進行處理、優(yōu)化功能的必要性不言而喻。而借助降噪NS、語音增強SE等技術(shù),可以對聲學(xué)場景中的非語音噪音信號進行抑制,從含有噪音的語音信號中提取純凈語音,提升語音識別效果,讓語音交互設(shè)備可以分辨、傾聽出目標聲音,進而為后續(xù)的語音交互掃清障礙。

在語音識別技術(shù)(ASR)的加持下,語音交互設(shè)備能對聲音信號進行特征提取,提取而出的“特征”會作為參數(shù),為模型計算做準備。簡單理解就是將語音信息數(shù)字化,再通過相應(yīng)的模型對數(shù)字化信息進行計算。后續(xù)通過聲學(xué)模型計算得出相應(yīng)的音素(即把聲音轉(zhuǎn)成音素),其目的是根據(jù)音素來找到對應(yīng)的漢字或者單詞,最終轉(zhuǎn)換成設(shè)備可以理解的文本。

語音交互設(shè)備的“聲卡”——TTS

基于語音合成技術(shù)(TTS),語音交互設(shè)備可對文本逐句分析,進行詞匯、語法的和語義的分析,以確定句子的低層結(jié)構(gòu)和每個字的所對應(yīng)的音素組成,包括文本的斷句、字詞切分、多音字處理以及數(shù)字處理等。

在內(nèi)置芯片和神經(jīng)網(wǎng)絡(luò)技術(shù)的支持下,語音交互設(shè)備可把處理好的文本所對應(yīng)的單字或短語從語音合成庫中提取,使語言學(xué)描述轉(zhuǎn)化成言語波形,即把文字智能地轉(zhuǎn)化為自然語音流。至此,一次完整的語音交互便成功完成。當(dāng)然,在特有的智能語音控制器作用下,文本輸出的語音音律將會更加流暢,使得聽者在聽取信息時感覺自然、毫無機器語音輸出的冷漠與生澀感。

寫在最后

誠然,已普遍應(yīng)用于智能家居設(shè)備中的語音交互技術(shù)仍面臨諸多挑戰(zhàn),在設(shè)備喚醒率、識別率、誤報率、環(huán)境降噪等方面仍有改進的空間。但毫無疑問,在未來語音作為人類最自然、最便捷的溝通方式,將會成為所有設(shè)備和產(chǎn)品至關(guān)重要的入口和人與機器之間的通信紐帶,而強邏輯、無視覺或者弱視覺的智能語音技術(shù)也會找到更多用武之地。

原文標題:智能交互的盡頭是聊天?

文章出處:【微信公眾號:安富利】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ASR
    ASR
    +關(guān)注

    關(guān)注

    2

    文章

    44

    瀏覽量

    19134
  • TTS
    TTS
    +關(guān)注

    關(guān)注

    0

    文章

    53

    瀏覽量

    11166
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    307

    瀏覽量

    28609

原文標題:智能交互的盡頭是聊天?

文章出處:【微信號:AvnetAsia,微信公眾號:安富利】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    普強智能語音技術(shù)重新定義車載交互邊界

    普強憑借自主研發(fā)的智能語音技術(shù),為某國內(nèi)頭部車企提供的語音前處理、喚醒詞、ASRTTS技術(shù)
    的頭像 發(fā)表于 07-11 14:00 ?336次閱讀

    Air8000 TTS開源,語音合成從此“零距離”!

    文本轉(zhuǎn)語音)——是一種將書面文本轉(zhuǎn)換為人類可聽語音技術(shù),通過算法和模型模擬人類發(fā)聲,實現(xiàn)機器“說話”。其核心目標是生成自然、流暢且富有表現(xiàn)力的語音。 ?
    的頭像 發(fā)表于 07-03 16:33 ?197次閱讀
    Air8000 <b class='flag-5'>TTS</b>開源,<b class='flag-5'>語音</b>合成從此“零距離”!

    廣州唯創(chuàng)電子WT3000A離在線TTS語音提示器芯片IC設(shè)計方案深度解析

    引言:語音交互的智能化躍遷在全球化與智能化深度融合的今天,語音交互設(shè)備的應(yīng)用場景已從單一提示功能向多語言支持、情感化表達及AI深度交互演進。
    的頭像 發(fā)表于 04-25 09:13 ?308次閱讀
    廣州唯創(chuàng)電子WT3000A離在線<b class='flag-5'>TTS</b><b class='flag-5'>語音</b>提示器芯片IC設(shè)計方案深度解析

    智能收銀語音交互新標桿—WT3000T8語音合成芯片TTS技術(shù)應(yīng)用解析

    一、行業(yè)應(yīng)用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮,收銀設(shè)備正經(jīng)歷從功能型向服務(wù)型轉(zhuǎn)變的關(guān)鍵階段。WT3000T8語音合成芯片應(yīng)運而生,專為滿足新零售場景下智能收銀終端的語音
    的頭像 發(fā)表于 04-24 08:45 ?271次閱讀
    智能收銀<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新標桿—WT3000T8<b class='flag-5'>語音</b>合成芯片<b class='flag-5'>TTS</b><b class='flag-5'>技術(shù)</b>應(yīng)用解析

    TTS語音播報控制器能做什么?

    TTS(Text-to-Speech)語音播報控制器,作為一種能夠?qū)⑽谋拘畔⑥D(zhuǎn)換為語音輸出的技術(shù)設(shè)備,在現(xiàn)代社會的各個領(lǐng)域中展現(xiàn)出了廣泛的應(yīng)
    的頭像 發(fā)表于 02-20 18:18 ?683次閱讀

    TTS語音播報模塊簡介

    的橋梁,不僅在智能家居、車載導(dǎo)航、電子閱讀器等眾多領(lǐng)域發(fā)揮著關(guān)鍵作用,還逐漸滲透到教育、醫(yī)療、娛樂等多個行業(yè),成為提升用戶體驗、增強信息交互效率的重要工具。 TTS語音播報模塊,作為現(xiàn)代人機
    的頭像 發(fā)表于 02-18 16:16 ?980次閱讀

    TTS語音播報控制器應(yīng)用場景

    TTS(Text-to-Speech)語音播報控制器,作為一種能夠?qū)⑽谋拘畔⑥D(zhuǎn)換為語音輸出的技術(shù)設(shè)備,在現(xiàn)代社會的各個領(lǐng)域中都展現(xiàn)出了廣泛的
    的頭像 發(fā)表于 02-18 16:15 ?540次閱讀

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能語音播報

    一、DEMO思路 在這個HarmonyOS NEXT原生應(yīng)用DEMO,我們將使用ArkTS開發(fā)語言創(chuàng)建一個簡單的AI智能語音播報應(yīng)用。 該應(yīng)用能夠接收用戶輸入的文本,并使用TTS
    發(fā)表于 01-06 15:33

    基于智能語音交互的智能呼叫中心工作機制

    作為實現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之一的智能語音交互技術(shù),它通過集成自然語言處理(NLP)、語音識別(ASR
    的頭像 發(fā)表于 12-03 16:44 ?710次閱讀
    基于智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>的智能呼叫中心工作機制

    ASR與傳統(tǒng)語音識別的區(qū)別

    ASR(Automatic Speech Recognition,自動語音識別)與傳統(tǒng)語音識別在多個方面存在顯著的區(qū)別。以下是對這兩者的對比: 一、技術(shù)基礎(chǔ)
    的頭像 發(fā)表于 11-18 15:22 ?1350次閱讀

    ASR和機器學(xué)習(xí)的關(guān)系

    語音識別技術(shù)的目標是將人類語音轉(zhuǎn)換成可讀的文本。這項技術(shù)在多個領(lǐng)域都有應(yīng)用,包括語音助手、語音轉(zhuǎn)
    的頭像 發(fā)表于 11-18 15:16 ?780次閱讀

    ASR在智能家居中的應(yīng)用

    隨著科技的飛速發(fā)展,人工智能技術(shù)(AI)已經(jīng)滲透到我們生活的方方面面,其中自動語音識別(Automatic Speech Recognition,簡稱ASR技術(shù)在智能家居領(lǐng)域的應(yīng)用尤
    的頭像 發(fā)表于 11-18 15:15 ?1241次閱讀

    ASR語音識別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識別技術(shù),是計算機科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個領(lǐng)域。
    的頭像 發(fā)表于 11-18 15:12 ?2065次閱讀

    語音提示器-WT3000A離在線TTS方案-打破語種限制/AI對話多功能支持

    TTS(Text To Speech )技術(shù)作為智能語音領(lǐng)域的重要組成部分,能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為逼真的語音輸出,為各類硬件設(shè)備提供便捷的
    的頭像 發(fā)表于 10-25 10:36 ?694次閱讀
    <b class='flag-5'>語音</b>提示器-WT3000A離在線<b class='flag-5'>TTS</b>方案-打破語種限制/AI對話多功能支持

    WT2605C TTS在線語音合成芯片:賦能多行業(yè)領(lǐng)域,引領(lǐng)產(chǎn)品智能化

    在當(dāng)今科技日新月異的時代,語音技術(shù)正逐步滲透到我們生活的方方面面,而TTS(Text-To-Speech,文本到語音技術(shù)作為其中的重要一環(huán)
    的頭像 發(fā)表于 09-12 15:54 ?628次閱讀
    WT2605C <b class='flag-5'>TTS</b>在線<b class='flag-5'>語音</b>合成芯片:賦能多行業(yè)領(lǐng)域,引領(lǐng)產(chǎn)品智能化