99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音命令系統(tǒng)的低功耗解決方案三

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Paul Beckmann ? 2022-10-25 16:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

便攜式產(chǎn)品中語音命令的軟件算法

允許始終在線、始終收聽的語音命令產(chǎn)品運(yùn)行的算法必然是復(fù)雜的。他們必須24/7/365對喚醒詞保持警惕;可靠地識別喚醒詞;盡可能將用戶的聲音與周圍的噪音隔離開來;并產(chǎn)生足夠干凈的信號,供語音識別引擎使用。有許多不同的算法在起作用,所有這些算法都必須進(jìn)行調(diào)整以適應(yīng)產(chǎn)品的設(shè)計和應(yīng)用。便攜式產(chǎn)品的設(shè)計和功耗要求可能會影響這些算法的功能。

基本算法結(jié)構(gòu)

下面是語音命令算法包的基本組件。在這里,它們按從麥克風(fēng)端到最終信號輸出的順序呈現(xiàn)。

聲音探測器:通常,來自單個麥克風(fēng)的信號使用比較器進(jìn)行監(jiān)控。當(dāng)信號電平超過特定閾值時(例如當(dāng)用戶說出喚醒詞時),比較器會發(fā)送命令以打開系統(tǒng)其余部分的電源。此功能在家用產(chǎn)品中可能不是必需的,在家用產(chǎn)品中,功耗不是問題,并且可以隨時為更多的系統(tǒng)供電,但它對便攜式產(chǎn)品至關(guān)重要,因?yàn)樗试S關(guān)閉更多組件以節(jié)省電源。此功能還必須快速發(fā)生,以便系統(tǒng)能夠接收喚醒字。例如,上面引用的Vesper VM1010,麥克風(fēng)在50 μs內(nèi)喚醒,遠(yuǎn)遠(yuǎn)小于在任何關(guān)鍵字中說出第一個字母所需的時間。

降噪和濾波:為了提高聲音檢測功能,它有助于過濾掉聲音,例如來自汽車,HVAC系統(tǒng)和風(fēng)的噪音,這些聲音顯然不是人類的聲音,因此語音識別系統(tǒng)可以安全地忽略。通過麥克風(fēng)的選擇、產(chǎn)品的物理設(shè)計或音頻處理,產(chǎn)品可以(如上面引用的 Vesper VM1010 麥克風(fēng))過濾掉人類人聲范圍(大約跨越 100 Hz 到 6 kHz)之外的聲音。音頻處理還可以消除重復(fù)的聲音,例如冰箱噪音。但是,這些功能可能需要打開處理器電源,這可能會影響便攜式產(chǎn)品的電池壽命。

喚醒詞檢測:一旦系統(tǒng)檢測到聲音并通電,它必須錄制傳入的音頻并將其與喚醒詞的存儲數(shù)字文件(例如亞馬遜Echo的“Alexa”)進(jìn)行比較。如果傳入音頻的波形與存儲的文件足夠接近,則設(shè)備將接受語音命令。

到達(dá)方向檢測:為了使麥克風(fēng)陣列專注于用戶的聲音,它必須首先確定用戶相對于產(chǎn)品的位置。處理器通過比較來自麥克風(fēng)的信號的相位信息來確定到達(dá)方向。它還必須包括拒絕來自附近物體的用戶聲音反射的優(yōu)先邏輯,并且必須調(diào)整其工作閾值以補(bǔ)償環(huán)境噪聲水平,以便環(huán)境噪聲不會產(chǎn)生錯誤的方向線索。請注意,在耳機(jī)等產(chǎn)品中,可能不需要確定到達(dá)方向,在這些產(chǎn)品中,用戶嘴巴相對于麥克風(fēng)陣列的物理位置是已知的。

波束成形:麥克風(fēng)陣列的原因是可以處理來自多個麥克風(fēng)的信號,以使陣列變得定向;來自確定的到達(dá)方向的聲音被接受,而來自不同方向的聲音被拒絕。對于某些產(chǎn)品,例如耳機(jī)和汽車音頻系統(tǒng),用戶的聲音相對于麥克風(fēng)陣列的方向是已知的,因此波束成形器的方向可能是永久固定的。在智能揚(yáng)聲器、遙控器和家庭自動化墻板等設(shè)備中,必須確定波束成形器所需的聚焦方向,并調(diào)整陣列的響應(yīng)以聚焦于用戶的方向。

回聲消除:回聲消除會抑制來自設(shè)備本身的聲音(如音樂或公告),以便陣列可以更清晰地拾取用戶的聲音。由于原始信號和設(shè)備內(nèi)部揚(yáng)聲器的響應(yīng)是已知的,因此通過麥克風(fēng)返回的信號可能會被拒絕。然而,來自周圍物體的這種聲音的回聲 - 這是時間延遲的并且頻率內(nèi)容改變 - 也必須被抑制。AEC 在頭戴式耳機(jī)和入耳式等產(chǎn)品中不是必需的,因?yàn)閬碜援a(chǎn)品揚(yáng)聲器的聲音是有限的,并且通常沒有足夠的聲音泄漏出來以影響產(chǎn)品麥克風(fēng)的性能。

本地命令集識別:由于便攜式產(chǎn)品可能無法像今天的智能揚(yáng)聲器那樣依賴Internet連接,因此它們可能需要在沒有外部服務(wù)器幫助的情況下自行識別一定數(shù)量的基本功能命令。這些命令通常僅限于基本功能,如播放、暫停、跳過曲目、重復(fù)和應(yīng)答呼叫。識別這些命令的工作方式與喚醒詞檢測的工作方式相同。但是,即使命令集有限,與只需要識別其喚醒詞并將其他語音識別任務(wù)卸載到外部連接 Internet 的服務(wù)器相比,對本地命令集識別的需求也會增加處理器的負(fù)載。

算法調(diào)優(yōu)

上述每種算法的功能都很復(fù)雜,必須進(jìn)行調(diào)整以適應(yīng)應(yīng)用,特別是在便攜式產(chǎn)品中,其環(huán)境和使用模式可能與家用產(chǎn)品不同。以下是必須調(diào)整以獲得最佳語音識別準(zhǔn)確性的算法函數(shù)。

檢測/喚醒閾值:聲音檢測和喚醒詞檢測的閾值級別必須設(shè)置得足夠高,以最大程度地減少設(shè)備的錯誤觸發(fā),但又要足夠低,以便用戶可以在正常說話級別對設(shè)備進(jìn)行尋址。特別是在便攜式產(chǎn)品中,可能需要動態(tài)調(diào)整這些電平,因此性能會進(jìn)行調(diào)整以補(bǔ)償不同級別的環(huán)境聲音。動態(tài)補(bǔ)償?shù)墓δ鼙旧肀仨氝M(jìn)行調(diào)整。

降噪/降噪:根據(jù)應(yīng)用的不同,可能會遇到不同類型的噪聲,并且可以對設(shè)備進(jìn)行調(diào)整以抑制它們。例如,制造商知道任何給定汽車在不同速度下的道路和發(fā)動機(jī)噪音的頻譜,因此可以調(diào)整語音識別系統(tǒng)以拒絕這些聲音。降噪/消除算法也可以動態(tài)運(yùn)行,適應(yīng)不斷變化的環(huán)境,但這種動態(tài)功能也必須進(jìn)行調(diào)整。

波束成形器波束寬度:波束成形器的波束寬度越緊,它就越能抑制環(huán)境聲音和來自其他物體的用戶聲音反射。但是,如果用戶稍微移動,則將波束寬度設(shè)置得太緊將導(dǎo)致設(shè)備拒絕用戶的聲音。在耳機(jī)和頭戴式耳機(jī)等產(chǎn)品中,用戶語音的到達(dá)方向沒有變化,光束寬度可以設(shè)置得很緊,但在遙控器和家庭自動化面板等產(chǎn)品中,必須設(shè)置得更寬,以適應(yīng)用戶說話時的移動。

喚醒/睡眠策略:如前所述,最大限度地降低功耗的目標(biāo)之一是使設(shè)備盡可能頻繁地進(jìn)入睡眠狀態(tài),并使其盡可能長時間保持睡眠狀態(tài)。但是,此目標(biāo)需要權(quán)衡利弊。如果設(shè)備在使用后進(jìn)入睡眠狀態(tài)的速度太快,則可能會錯過喚醒詞后面的命令,并要求用戶再次說出喚醒詞,這可能會使用戶感到沮喪。如果設(shè)備保持喚醒的時間超過必要的時間,它將消耗比所需更多的功率。

DSP概念的語音UI算法經(jīng)過專門設(shè)計,可以輕松調(diào)整上述所有功能,并創(chuàng)建自定義處理配置,以適應(yīng)任何便攜式或電池供電的語音命令產(chǎn)品。信號處理鏈可以通過簡單的圖形界面進(jìn)行配置,使用400多個可用處理模塊的任意組合(圖1)。這些模塊可以通過熟悉的屏幕旋鈕和按鈕進(jìn)行調(diào)整,其直觀方式與機(jī)架安裝式音頻處理器的調(diào)整方式相同。

pYYBAGNXny2AbdAhAAOVh2X4t7Q837.png

[圖1|顯示使用 DSP 概念語音 UI 的音頻處理鏈的圖形配置的屏幕圖像]

由于功耗要求和外形尺寸限制,大多數(shù)便攜式產(chǎn)品中使用的音頻處理器的功能通常低于家用產(chǎn)品中使用的處理器的功能。因此,產(chǎn)品設(shè)計團(tuán)隊在為語音命令產(chǎn)品設(shè)計信號鏈時必須謹(jǐn)慎,不要超過可用的處理能力。然而,要實(shí)現(xiàn)最佳性能,他們需要充分利用可用的處理方式。由于 DSP 概念語音 UI 算法已經(jīng)針對運(yùn)行它們的處理器進(jìn)行了優(yōu)化,因此不需要重寫它們以適應(yīng)特定的處理器,也不需要調(diào)試。信號鏈可以實(shí)時測試,也可以針對不同的處理器進(jìn)行測試,這使得為應(yīng)用選擇合適的處理器變得更加容易和快速。

DSP 概念語音 UI 的可調(diào)諧性和多功能性帶來了明顯的性能優(yōu)勢,這可以在 DSP 概念網(wǎng)站的演示視頻中看到。

結(jié)論

創(chuàng)建始終在線的語音命令產(chǎn)品,這些產(chǎn)品可以使用電池供電運(yùn)行數(shù)小時到數(shù)月,同時實(shí)現(xiàn)與當(dāng)今流行的智能揚(yáng)聲器類似的功能,這是相當(dāng)大的挑戰(zhàn)。但是,由于本文中描述的產(chǎn)品,這些挑戰(zhàn)現(xiàn)在是可以控制的。正確選擇組件,結(jié)合仔細(xì)調(diào)整以適應(yīng)應(yīng)用,可以產(chǎn)生便攜式語音命令產(chǎn)品,為消費(fèi)者提供令人滿意和可靠的體驗(yàn)??纯催@些技術(shù)將為未來的便攜式和電池供電技術(shù)產(chǎn)品帶來哪些新功能,便利性和功能將會很有趣。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 電源
    +關(guān)注

    關(guān)注

    185

    文章

    18365

    瀏覽量

    256231
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19890

    瀏覽量

    235122
  • dsp
    dsp
    +關(guān)注

    關(guān)注

    556

    文章

    8157

    瀏覽量

    357426
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    低功耗語音芯片有哪些?

    ? 超低功耗語音芯片有哪些好處?當(dāng)然是給產(chǎn)品帶來更好的續(xù)航表現(xiàn)和更好的節(jié)電表現(xiàn),但是一位的追求低功耗的也是不對的,因?yàn)?b class='flag-5'>功耗和產(chǎn)品性能之間始終是要做取舍的。下面小編給大家?guī)硪恍┏?/div>
    的頭像 發(fā)表于 07-02 17:27 ?153次閱讀
    超<b class='flag-5'>低功耗</b><b class='flag-5'>語音</b>芯片有哪些?

    芯知識|廣州唯創(chuàng)電子WT2003H語音芯片:智能低功耗,喚醒隨心控

    在電池供電或?qū)?b class='flag-5'>功耗敏感的語音應(yīng)用場景中,WT2003H語音芯片憑借其精心設(shè)計的雙模式低功耗休眠架構(gòu),為開發(fā)者提供了靈活高效的節(jié)能解決方案,顯
    的頭像 發(fā)表于 06-30 08:52 ?106次閱讀
    芯知識|廣州唯創(chuàng)電子WT2003H<b class='flag-5'>語音</b>芯片:智能<b class='flag-5'>低功耗</b>,喚醒隨心控

    低功耗應(yīng)用開發(fā)寶典:實(shí)網(wǎng)測試功耗數(shù)據(jù),源碼公開共享!

    為開發(fā)者量身打造的低功耗解決方案!基于實(shí)網(wǎng)環(huán)境采集的功耗數(shù)據(jù),提煉優(yōu)化策略,并共享開源代碼,加速項(xiàng)目落地。本文將以Air8000核心板為例,帶你快速上手
    的頭像 發(fā)表于 06-18 13:17 ?157次閱讀
    <b class='flag-5'>低功耗</b>應(yīng)用開發(fā)寶典:實(shí)網(wǎng)測試<b class='flag-5'>功耗</b>數(shù)據(jù),源碼公開共享!

    低功耗藍(lán)牙網(wǎng)關(guān)在智慧工地上的使用

    合適的方案。 低功耗藍(lán)牙網(wǎng)關(guān):按照一定的區(qū)域進(jìn)行規(guī)劃部署,對工人佩戴的定位標(biāo)簽進(jìn)行檢測,確保工人在合適的時間,出現(xiàn)在合適的地點(diǎn)。一旦出現(xiàn)異常,可以及時報警提醒工地安全人員進(jìn)行及時干預(yù)。 低功耗藍(lán)牙標(biāo)簽
    發(fā)表于 05-27 14:08

    藍(lán)牙語音遙控器 低功耗芯片選型HS6621CxC/OM6621

    隨著智能家居的蓬勃發(fā)展,藍(lán)牙語音遙控器憑借其便捷的操作和智能交互體驗(yàn),正迅速取代傳統(tǒng)紅外遙控器,成為智能電視、機(jī)頂盒等設(shè)備的首選控制工具。相較于需對準(zhǔn)設(shè)備的紅外遙控器,藍(lán)牙語音遙控器通過藍(lán)牙低功耗
    發(fā)表于 05-22 15:23

    電機(jī)溫度監(jiān)測系統(tǒng)低功耗無線節(jié)點(diǎn)模塊設(shè)計

    提出了一種用于電機(jī)溫度監(jiān)測系統(tǒng)的無線數(shù)據(jù)收發(fā)節(jié)點(diǎn)模塊設(shè)計方案,利用LPC1114的省電耗模式配合Si4432集成芯片實(shí)現(xiàn)無線收發(fā)模塊的低功耗。另外,針對模塊硬件實(shí)現(xiàn)RF前端高頻電路設(shè)計和前期仿真做出
    發(fā)表于 04-30 00:42

    低功耗振蕩器在嵌入式系統(tǒng)中的應(yīng)用

    探索FCom富士晶振低功耗振蕩器FCO-2C-UP與FCO-3C-UP在嵌入式系統(tǒng)中的各個行業(yè)應(yīng)用,涵蓋可穿戴設(shè)備、物聯(lián)網(wǎng)、醫(yī)療電子、智能家居和通信模組等領(lǐng)域,提供高穩(wěn)定性、低功耗、寬溫支持的理想時鐘
    的頭像 發(fā)表于 04-11 14:41 ?1842次閱讀
    超<b class='flag-5'>低功耗</b>振蕩器在嵌入式<b class='flag-5'>系統(tǒng)</b>中的應(yīng)用

    蜂窩物聯(lián)網(wǎng)的超低功耗特性

    針對低功耗進(jìn)行優(yōu)化的蜂窩物聯(lián)網(wǎng) 革命性的蜂窩解決方案: 無與倫比的電源效率 要打造卓越的蜂窩物聯(lián)網(wǎng)產(chǎn)品,低功耗是一個不可或缺的因素。憑借我們在制造屢獲殊榮的超低功耗設(shè)備方面的豐富專業(yè)知
    的頭像 發(fā)表于 04-07 14:57 ?520次閱讀

    基于WTV380-8S語音芯片的智能電子鎖語音交互系統(tǒng)設(shè)計方案介紹

    ?一、方案背景與需求智能電子鎖作為現(xiàn)代家居安防的核心設(shè)備,用戶對交互友好性、功能多樣性和系統(tǒng)穩(wěn)定性的需求日益提升。WTV380-8S語音芯片憑借多模式控制、高集成度、低功耗設(shè)計及豐富的
    的頭像 發(fā)表于 03-06 08:56 ?409次閱讀
    基于WTV380-8S<b class='flag-5'>語音</b>芯片的智能電子鎖<b class='flag-5'>語音</b>交互<b class='flag-5'>系統(tǒng)</b>設(shè)計<b class='flag-5'>方案</b>介紹

    SiWx917 Wi-Fi6 SoC低功耗無線連接解決方案

    SiliconLabs (芯科科技)的SiWx917 Wi-Fi6 SoC是一款低功耗無線連接解決方案,非常適合需要 Wi-Fi 6、低功耗藍(lán)牙(Bluetooth LE)5.4、Matter
    的頭像 發(fā)表于 12-23 09:15 ?1062次閱讀

    電子鎖語音芯片方案,低功耗語音播報ic,NV256H

    方案——NV256H語音芯片,為電子鎖行業(yè)注入了全新的語音交互體驗(yàn)。相比市面上的語音芯片,NV256H語音芯片有以下幾點(diǎn)優(yōu)勢:一、
    的頭像 發(fā)表于 12-06 01:01 ?432次閱讀
    電子鎖<b class='flag-5'>語音</b>芯片<b class='flag-5'>方案</b>,<b class='flag-5'>低功耗</b><b class='flag-5'>語音</b>播報ic,NV256H

    電子鎖語音芯片方案,低功耗語音播報ic,NV256H

    廣州九芯電子推出NV256H語音芯片,為電子鎖提供低功耗、高耐用、高質(zhì)量音頻、靈活控制、平臺自定義及廣泛應(yīng)用兼容性,注入全新語音交互體驗(yàn),滿足智能便捷安全需求。
    的頭像 發(fā)表于 12-05 14:12 ?605次閱讀

    物聯(lián)網(wǎng)系統(tǒng)中常用的低功耗自組網(wǎng)無線傳輸方案)_藍(lán)牙芯片篇

    01 物聯(lián)網(wǎng)系統(tǒng)中為什么要使用藍(lán)牙芯片 物聯(lián)網(wǎng)系統(tǒng)中使用藍(lán)牙芯片的原因主要基于藍(lán)牙芯片在連接性能、數(shù)據(jù)傳輸、功耗、安全性以及應(yīng)用靈活性等方面的優(yōu)勢。以下是詳細(xì)分析: 低功耗性能 藍(lán)牙芯
    的頭像 發(fā)表于 09-29 17:11 ?1348次閱讀
    物聯(lián)網(wǎng)<b class='flag-5'>系統(tǒng)</b>中常用的<b class='flag-5'>低功耗</b>自組網(wǎng)無線傳輸<b class='flag-5'>方案</b>(<b class='flag-5'>三</b>)_藍(lán)牙芯片篇

    使用耦合變壓器的150V輸出、低功耗升壓解決方案

    電子發(fā)燒友網(wǎng)站提供《使用耦合變壓器的150V輸出、低功耗升壓解決方案.pdf》資料免費(fèi)下載
    發(fā)表于 09-24 09:25 ?1次下載
    使用耦合變壓器的150V輸出、<b class='flag-5'>低功耗</b>升壓<b class='flag-5'>解決方案</b>

    低功耗毫米波雷達(dá)解決方案使電池供電類接近感應(yīng)產(chǎn)品實(shí)現(xiàn)新功能

    電子發(fā)燒友網(wǎng)站提供《低功耗毫米波雷達(dá)解決方案使電池供電類接近感應(yīng)產(chǎn)品實(shí)現(xiàn)新功能.pdf》資料免費(fèi)下載
    發(fā)表于 09-09 09:29 ?0次下載
    <b class='flag-5'>低功耗</b>毫米波雷達(dá)<b class='flag-5'>解決方案</b>使電池供電類接近感應(yīng)產(chǎn)品實(shí)現(xiàn)新功能