99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音UI的基本原則

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Paul Beckmann ? 2022-10-25 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Amazon Echo和Google Home中的語音用戶界面(語音UI)功能吸引了消費(fèi)者的注意。語音識別系統(tǒng)的效率很大程度上取決于麥克風(fēng)陣列和算法集合,這些算法允許陣列聚焦于用戶的語音并拒絕不需要的噪聲。下面解釋這些算法的基本功能。

觸發(fā)/喚醒詞

語音 UI 系統(tǒng)使用分配的觸發(fā)詞(如“Alexa”或“確定谷歌”)來激活語音 UI 設(shè)備。設(shè)備必須使用自己的算法立即進(jìn)行識別,因?yàn)槭褂没ヂ?lián)網(wǎng)資源會產(chǎn)生太多的延遲。

觸發(fā)詞必須產(chǎn)生一個獨(dú)特的波形,該波形可以使算法與正常語音區(qū)分開來,否則成功識別的百分比可能低得令人無法接受。通常,使用三到五個音節(jié)的觸發(fā)詞是最好的。

小觸發(fā)詞算法占用較少的內(nèi)存和處理,但犯更多的錯誤,而大的算法需要更多的資源,但犯的錯誤更少。模型也是可調(diào)的 - 它們可以更嚴(yán)格(更少的誤報(bào),但更難觸發(fā))或更寬松(更多的誤報(bào),但更容易觸發(fā))。大多數(shù)產(chǎn)品設(shè)計(jì)師選擇更嚴(yán)格的調(diào)整,因?yàn)榭蛻魧﹀e誤觸發(fā)沒有同情心。

圖 1 比較了不同調(diào)諧點(diǎn)的三觸發(fā)模型的性能。在測試條件下,每小時(shí)實(shí)現(xiàn)少于兩個錯誤觸發(fā)器是一個合理的目標(biāo)。小模型只能通過圖形最左側(cè)的兩個最嚴(yán)格的調(diào)諧來實(shí)現(xiàn)這一點(diǎn)。中型和大型型號在更寬的工作范圍內(nèi)實(shí)現(xiàn)了這一目標(biāo)。

pYYBAGNXm7eAXMiVAAFTjAUgeAU218.png

圖 1. 每小時(shí)使用小型、中型和大型算法模型測試誤報(bào),左側(cè)調(diào)整更嚴(yán)格,右側(cè)調(diào)整更寬松。

到達(dá)目的地(到達(dá)方向)

一旦觸發(fā)詞被識別出來,下一步就是確定用戶語音的到達(dá)方向(DOA)。一旦確定了方向,DOA算法就會告訴波束成形算法它應(yīng)該聚焦在哪個方向。

DOA算法的核心功能是檢查來自陣列中不同麥克風(fēng)的信號的相位關(guān)系,并使用此信息來確定哪個麥克風(fēng)首先接收聲音。但是,由于來自墻壁,地板,天花板和房間內(nèi)其他物體的反射,用戶的聲音也將從其他方向傳來。為此,DOA算法包括優(yōu)先邏輯,它將更響亮的初始到達(dá)與更安靜的反射分開。

DOA 算法的操作通過自動調(diào)整環(huán)境噪聲水平得到增強(qiáng)。該算法測量房間內(nèi)的平均噪聲水平,并且僅當(dāng)輸入信號至少比環(huán)境噪聲水平高出一定數(shù)量的分貝時(shí),才會重新計(jì)算用戶嘴巴的位置。

回聲消除器

為了更好地關(guān)注用戶的聲音,語音 UI 設(shè)備必須從其麥克風(fēng)拾取的聲音中減去自己的揚(yáng)聲器產(chǎn)生的聲音。這似乎很簡單,就像將節(jié)目材料的相位反轉(zhuǎn)版本混合到來自麥克風(fēng)的信號中一樣簡單。然而,該過程不足以處理揚(yáng)聲器對波形的改變、數(shù)字信號處理(DSP)均衡、麥克風(fēng)和聲學(xué)反射。

AEC算法中的第一步是將麥克風(fēng)的輸出與原始(前DSP)輸入信號進(jìn)行比較,并計(jì)算校正曲線,以從語音命令的波形中減去揚(yáng)聲器的直接聲音。

第二步是減去聲學(xué)回聲。該算法必須在一定的誤差范圍內(nèi)“尋找”與節(jié)目材料匹配的聲音(以補(bǔ)償由聲學(xué)引起的波形變化),以及對應(yīng)于預(yù)期混響時(shí)間的已定義時(shí)間窗口內(nèi)的聲音。由于每個麥克風(fēng)接收的回聲集略有不同,并且來自揚(yáng)聲器的直接聲音也不同,因此要實(shí)現(xiàn)最佳性能,需要對每個麥克風(fēng)進(jìn)行單獨(dú)的 AEC 處理。

AEC 查找反射的時(shí)間段稱為“回波尾部長度”?;芈曃膊块L度越長,可以消除的反射越多,算法的性能就越好。然而,較長的尾巴需要更多的內(nèi)存和更多的處理。圖2顯示了回聲消除器在逐漸增加混響的房間中的表現(xiàn)。對更長的回聲尾部的需求是顯而易見的。

poYBAGNXm8KACjm8AAFJhHlrwKk343.png

圖 2. 回聲消除器在四個房間中表現(xiàn),混響時(shí)間增加。較大的房間受益于使用長回聲尾部的算法。

波束成形

波束成形允許麥克風(fēng)陣列聚焦于來自特定方向的聲音。它提高了信噪比(SNR),因?yàn)樗兄诟綦x用戶的聲音,同時(shí)抑制來自其他方向的聲音。

例如,如果用戶位于麥克風(fēng)陣列的一側(cè),而空調(diào)位于另一側(cè),則來自空調(diào)的聲音首先到達(dá)用戶對面的麥克風(fēng),然后在幾分之一秒后到達(dá)離用戶最近的麥克風(fēng)。波束成形算法使用這些時(shí)差來消除空調(diào)聲音,同時(shí)保留用戶的聲音。

具有兩個麥克風(fēng)的陣列取消聲音的能力有限,但具有三個或更多麥克風(fēng)的陣列可以消除來自更多方向的聲音。麥克風(fēng)越少,性能就越會隨著視角(用戶的聲音與語音 UI 產(chǎn)品前軸之間的角度)的變化而變化。

雖然麥克風(fēng)陣列系統(tǒng)使用定向拾音模式來濾除噪聲,但某些噪聲可以通過識別將噪聲與所需信號分離的特性,然后消除噪聲的算法進(jìn)行衰減。降噪算法可以幫助觸發(fā)單詞識別,并在所有其他算法完成其工作后提高語音UI性能。

語音命令是瞬時(shí)事件??梢詸z測到始終存在或重復(fù)的任何聲音,并將其從來自麥克風(fēng)陣列的信號中刪除。示例包括汽車中的道路噪聲,以及家庭中的洗碗機(jī)和HVAC系統(tǒng)噪聲。高于或低于人聲頻譜的聲音也可以從信號中濾除。

手機(jī)中使用的常見降噪算法傾向于突出顯示對人類理解最關(guān)鍵的頻譜,而不是對電子系統(tǒng)隔離和理解語音命令最關(guān)鍵的頻譜。大多數(shù)此類算法實(shí)際上會降低語音 UI 性能。簡單地說,人類聽的東西與語音UI系統(tǒng)不同。

圖3顯示了在有和沒有降噪的情況下觸發(fā)字檢測的功效。降噪算法將整體語音識別提高了2 dB -考慮到用戶的聲音通常僅比周圍噪聲大幾dB,這是一個很大的差異。

pYYBAGNXm86AEU3SAAFj-NKmSMQ786.png

圖 3. 降噪算法對觸發(fā)字檢測的影響。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • dsp
    dsp
    +關(guān)注

    關(guān)注

    556

    文章

    8158

    瀏覽量

    357816
  • 觸發(fā)器
    +關(guān)注

    關(guān)注

    14

    文章

    2039

    瀏覽量

    62162
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    UI開發(fā)概述

    基于ArkTS的聲明式開發(fā)范式的方舟開發(fā)框架是一套開發(fā)極簡、高性能、支持跨設(shè)備的UI開發(fā)框架,提供了構(gòu)建應(yīng)用UI所必需的能力,主要包括: ArkTS ArkTS是優(yōu)選的主力應(yīng)用開發(fā)語言,圍繞
    發(fā)表于 06-24 06:36

    PCB板設(shè)計(jì)測試點(diǎn)的基本原則

    線路板PCB測試點(diǎn)設(shè)置的原則是確保測試的準(zhǔn)確性和高效性,同時(shí)避免對PCB板造成不必要的損害。以下是一些關(guān)鍵的設(shè)置原則: 1.測試點(diǎn)的分布?: 測試點(diǎn)應(yīng)均勻分布在PCB板上,避免集中在某個小區(qū)域內(nèi),以
    的頭像 發(fā)表于 02-08 11:35 ?1087次閱讀

    通訊電源故障排除技巧 通訊電源與其他設(shè)備的連接方式

    通訊電源故障排除技巧 1. 故障診斷的基本原則 在進(jìn)行通訊電源故障排除時(shí),應(yīng)遵循以下基本原則: 安全第一 :確保在操作過程中遵循所有安全規(guī)程,避免觸電等危險(xiǎn)。 系統(tǒng)性檢查 :從電源輸入到輸出,逐步
    的頭像 發(fā)表于 12-16 15:25 ?1273次閱讀

    射頻電路設(shè)計(jì)的基本原則 射頻信號干擾的解決方法

    射頻電路設(shè)計(jì)的基本原則 射頻電路設(shè)計(jì)是一個復(fù)雜的過程,需要考慮多種因素以確保電路的性能和可靠性。以下是一些基本的設(shè)計(jì)原則: 頻率選擇性 :射頻電路需要根據(jù)工作頻率選擇合適的組件和設(shè)計(jì)參數(shù),以確保電路
    的頭像 發(fā)表于 12-03 09:59 ?1979次閱讀

    SQL數(shù)據(jù)庫設(shè)計(jì)的基本原則

    SQL數(shù)據(jù)庫設(shè)計(jì)的基本原則 1. 理解需求 在設(shè)計(jì)數(shù)據(jù)庫之前,首先要與業(yè)務(wù)團(tuán)隊(duì)緊密合作,了解業(yè)務(wù)需求。這包括數(shù)據(jù)的類型、數(shù)據(jù)的使用方式、數(shù)據(jù)的增長預(yù)期等。需求分析是數(shù)據(jù)庫設(shè)計(jì)的基礎(chǔ),它決定了數(shù)據(jù)庫
    的頭像 發(fā)表于 11-19 10:23 ?746次閱讀

    RNN的基本原理與實(shí)現(xiàn)

    RNN,即循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network),是一種特殊類型的人工神經(jīng)網(wǎng)絡(luò),專門設(shè)計(jì)用于處理序列數(shù)據(jù),如文本、語音、視頻等。以下是對RNN基本原理與實(shí)現(xiàn)的介紹: 一
    的頭像 發(fā)表于 11-15 09:49 ?1463次閱讀

    PCB上設(shè)置測試點(diǎn)的基本原則

    線路板PCB測試點(diǎn)設(shè)置的原則是確保測試的準(zhǔn)確性和高效性,同時(shí)避免對PCB板造成不必要的損害。以下是一些關(guān)鍵的設(shè)置原則
    的頭像 發(fā)表于 10-22 10:57 ?2172次閱讀

    連接器選型的幾項(xiàng)基本原則

    在連接器的領(lǐng)域連接器的選型是每個連接器人都必須要經(jīng)歷的事情,在連接器選型的道路上有很多需要注意的東西,稍有不慎就會導(dǎo)致最終選擇的連接器無法投入使用。蓬生電子給大家整理了連接器選型的幾項(xiàng)基本原則,來
    的頭像 發(fā)表于 10-17 17:29 ?818次閱讀

    差動保護(hù)動作電流整定原則

    差動保護(hù)動作電流整定原則涉及多個方面,以下是對該原則的介紹: 一、基本原則 對稱性原則 :差動保護(hù)動作電流應(yīng)該在正、負(fù)序電流及零序電流相等時(shí)啟動。這樣差動保護(hù)在正常工作時(shí)不至于誤動作,
    的頭像 發(fā)表于 10-08 15:45 ?2303次閱讀

    探針頭型怎么選擇尺寸

    探針頭型的選擇尺寸是一個復(fù)雜的過程,需要考慮多個因素,包括被測點(diǎn)的形狀、大小、間距、測試環(huán)境以及測試要求等。以下是一些選擇探針頭型尺寸的基本原則和步驟: 一、基本原則 測量精度 :首先,需要明確測試
    的頭像 發(fā)表于 09-07 10:48 ?1738次閱讀

    選擇電氣控制方案時(shí)的基本原則

    一系列基本原則。 控制方式與設(shè)備適應(yīng)性 控制方式的選擇應(yīng)與設(shè)備的通用化和專用化相適應(yīng)。對于通用設(shè)備,可以采用標(biāo)準(zhǔn)化的控制方式,以降低設(shè)計(jì)和生產(chǎn)成本;而對于專用設(shè)備,則需要根據(jù)其特殊需求定制控制方式,以滿足特定的
    的頭像 發(fā)表于 08-28 10:47 ?759次閱讀

    電氣控制系統(tǒng)設(shè)計(jì)時(shí)的基本原則

    在確定電氣控制方案時(shí),工程師必須考慮一系列復(fù)雜且互相關(guān)聯(lián)的因素,這些因素共同決定了最終系統(tǒng)的性能、可靠性以及安全性。以下是對電氣控制方案確定原則的詳細(xì)分析: 自動化程度與國情相適應(yīng):選擇電氣控制方案
    的頭像 發(fā)表于 08-22 11:16 ?1433次閱讀

    限流保護(hù)電路的基本原

    限流保護(hù)電路的基本原理是一個復(fù)雜但至關(guān)重要的概念,它涉及到電子電路中電流控制的多個方面。這種電路的主要目的是在電流超過預(yù)設(shè)的安全閾值時(shí),通過一系列機(jī)制來限制或切斷電流,從而保護(hù)電路中的元件和設(shè)備免受損壞。以下是對限流保護(hù)電路基本原理的詳細(xì)闡述,包括其工作機(jī)制、主要元件、設(shè)
    的頭像 發(fā)表于 08-19 17:55 ?4569次閱讀

    斷路器選擇額定電流的基本原則

    斷路器的基本概念 斷路器是一種用于保護(hù)電氣系統(tǒng)的設(shè)備,當(dāng)系統(tǒng)中的電流超過預(yù)定值時(shí),斷路器會自動切斷電源,以防止設(shè)備損壞或火災(zāi)等危險(xiǎn)。 斷路器的工作原理 斷路器的工作原理基于電磁力和熱效應(yīng)。當(dāng)電流超過額定值時(shí),電磁力會使斷路器的觸點(diǎn)分離,同時(shí)熱效應(yīng)會使斷路器的熱元件變形,從而實(shí)現(xiàn)斷路。 斷路器的類型 斷路器有多種類型,包括微型斷路器、塑殼斷路器、框架斷路器等。不同類型的斷路器適用于不同的應(yīng)用場景和負(fù)載要求。
    的頭像 發(fā)表于 08-14 15:09 ?2595次閱讀

    組成放大電路的基本原則是什么?

    組成放大電路的基本原則主要包括以下幾個方面: 1. 穩(wěn)定性原則 定義 :穩(wěn)定性是指放大電路在工作過程中應(yīng)能夠保持其性能不受外界干擾或內(nèi)部變化的影響。 實(shí)現(xiàn)方式 :通過采取一些措施來保持電路的工作點(diǎn)
    的頭像 發(fā)表于 08-07 10:02 ?1423次閱讀