99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在本地與云端部署語音識別

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Todd Mozer ? 2022-07-09 07:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

、熟悉 Siri、Google Now、Cortana、S-Voice 和/或 Echo 的每個(gè)人都熟悉過去十年語音識別的進(jìn)步和改進(jìn)。這種改進(jìn)大部分來自基于云的識別器在大數(shù)據(jù)上部署“深度學(xué)習(xí)”。

盡管它經(jīng)常不在聚光燈下,但嵌入式系統(tǒng)的語音識別已經(jīng)取得了很大進(jìn)展。事實(shí)上,大多數(shù)主要的語音引擎都部署了嵌入式和基于云的識別的組合。這在“Hey Siri”、“OK Google”、“Hey Cortana”、“Hi Galaxy”和“Alexa”等命令中最為明顯。所有這些基于云的識別系統(tǒng)都使用嵌入的“觸發(fā)”短語來打開云連接,為語音識別做好準(zhǔn)備。

嵌入式觸發(fā)短語允許一些基于云的方法的改進(jìn)和實(shí)用性。一方面,擁有一個(gè)“永遠(yuǎn)在線”的嵌入式識別器比讓你的對話上傳到云端讓谷歌和其他人以他們想要的任何方式分析要少得多。由于它在設(shè)備上,因此在說出觸發(fā)短語之前不會進(jìn)行語音錄制或傳輸,并且觸發(fā)偵聽是實(shí)時(shí)完成的,而不會發(fā)送您的語音。

嵌入式喚醒觸發(fā)器也有實(shí)際原因,其中一個(gè)主要原因是功耗。僅在云中運(yùn)行需要大量數(shù)據(jù)傳輸和分析,使得電池供電或“綠色”產(chǎn)品不切實(shí)際。許多主要的 DSP 公司都為“始終開啟”的 DSP 提供解決方案,這些 DSP 以 2 mA 或更低的電流運(yùn)行 Sensory 的 TrulyHandsfree 喚醒觸發(fā)選項(xiàng)。使用健全的活動(dòng)檢測方案,平均電池消耗可以低于 1 mA,將其置于電池泄漏領(lǐng)域。

嵌入式語音識別的其他流行用途是在需要對有限命令進(jìn)行快速準(zhǔn)確響應(yīng)的設(shè)備中。我最喜歡的例子之一是三星 Galaxy 智能手機(jī),在相機(jī)模式下,用戶可以啟用語音命令來拍照。這適用于我在 20 英尺遠(yuǎn)的安靜環(huán)境或 5 英尺遠(yuǎn)的嘈雜位置。這是隨身攜帶自拍桿的絕佳替代品,每當(dāng)我向人們展示此功能時(shí),他們都會很快獲得并喜歡它。

嵌入式揚(yáng)聲器驗(yàn)證也被更頻繁地部署,并且通常被合并到喚醒觸發(fā)器中,以降低其他人喚醒您的設(shè)備的可能性。對于語音識別和說話人驗(yàn)證,總是需要在錯(cuò)誤接受(接受錯(cuò)誤的用戶)和錯(cuò)誤拒絕(拒絕正確的用戶)之間進(jìn)行權(quán)衡。首選的喚醒觸發(fā)設(shè)置通常是以偶爾讓正確的人進(jìn)入為代價(jià)來保持極低的錯(cuò)誤拒絕。在需要更復(fù)雜的揚(yáng)聲器驗(yàn)證以確保安全的系統(tǒng)中,可以部署不需要最低要求的更復(fù)雜的算法功耗,以增加電流消耗為代價(jià)獲得更好的精度。

隨著消費(fèi)產(chǎn)品和手機(jī)使用更復(fù)雜的處理器,我預(yù)計(jì)更高比例的語音識別使用將轉(zhuǎn)移到嵌入式設(shè)備,并且會出現(xiàn)“分層”語音識別方法,從而在設(shè)備上進(jìn)行快速初始分析并做出響應(yīng)如果設(shè)備對成功有很高的信心(自我認(rèn)知),但如果它不太確定自己的響應(yīng)或需要基于云的搜索,則將其傳遞給云端。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19896

    瀏覽量

    235287
  • 嵌入式
    +關(guān)注

    關(guān)注

    5152

    文章

    19675

    瀏覽量

    317643
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122799
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    EASY EAl Orin Nano(RK3576) whisper語音識別訓(xùn)練部署教程

    Whisper是OpenAI開源的,識別語音識別能力已達(dá)到人類水準(zhǔn)自動(dòng)語音識別系統(tǒng)。Whisper作為一個(gè)通用的
    的頭像 發(fā)表于 07-17 14:55 ?518次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識別</b>訓(xùn)練<b class='flag-5'>部署</b>教程

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    接口則讓語音機(jī)器人可以連接到互聯(lián)網(wǎng),實(shí)時(shí)獲取最新的信息,增強(qiáng)其智能性和交互能力。 實(shí)際應(yīng)用場景中,以智能客服語音機(jī)器人為例。SSD2351開發(fā)板可以驅(qū)動(dòng)語音
    發(fā)表于 05-28 11:36

    芯資訊|廣州唯創(chuàng)電子WTK6900P語音識別芯片:離線語音交互的革新者

    智能設(shè)備全面普及的浪潮中,語音交互技術(shù)正逐步從“云端依賴”向“本地化高效處理”演進(jìn)。廣州唯創(chuàng)電子推出的WTK6900P語音
    的頭像 發(fā)表于 05-22 09:22 ?254次閱讀
    芯資訊|廣州唯創(chuàng)電子WTK6900P<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片:離線<b class='flag-5'>語音</b>交互的革新者

    智能語音交互方案客服領(lǐng)域的應(yīng)用

    著客服行業(yè)的面貌,為企業(yè)和用戶帶來了全新的體驗(yàn)。 語音識別模型優(yōu)化私部署 方案:精準(zhǔn)高效,定制專屬服務(wù) 語音識別技術(shù)作為智能
    的頭像 發(fā)表于 04-11 14:35 ?298次閱讀

    依托raksmart服務(wù)器多種系統(tǒng)上本地部署deepseek注意事項(xiàng)

    RAKsmart服務(wù)器上本地部署DeepSeek時(shí),需根據(jù)不同的操作系統(tǒng)和環(huán)境做好全面適配。以下是關(guān)鍵注意事項(xiàng)及分步指南,主機(jī)推薦小編為您整理發(fā)布依托raksmart服務(wù)器多種系統(tǒng)
    的頭像 發(fā)表于 03-19 11:25 ?375次閱讀

    新品發(fā)布|啟英泰倫聯(lián)合啟明云端推出離在線語音大模型方案

    當(dāng)前,生成式大模型正以顛覆性姿態(tài)重塑人機(jī)交互的邊界,并逐漸向終端場景滲透。然而,云端大模型落地終端場景時(shí)面臨兩大挑戰(zhàn):1.真實(shí)噪聲場景下容易聽不清、誤識別,影響交互準(zhǔn)確性;2.
    的頭像 發(fā)表于 03-11 14:07 ?612次閱讀
    新品發(fā)布|啟英泰倫聯(lián)合啟明<b class='flag-5'>云端</b>推出離在線<b class='flag-5'>語音</b>大模型方案

    語音識別技術(shù)通信領(lǐng)域中的應(yīng)用實(shí)例

    語音識別技術(shù)也被稱為自動(dòng)語音識別(Automatic Speech Recognition,ASR),是通過計(jì)算機(jī)對語音信號進(jìn)行分析和
    的頭像 發(fā)表于 02-21 17:12 ?700次閱讀

    詳解語音識別技術(shù)通信領(lǐng)域中的應(yīng)用

    語音識別技術(shù)也被稱為自動(dòng)語音識別(Automatic Speech Recognition,ASR),是通過計(jì)算機(jī)對語音信號進(jìn)行分析和
    的頭像 發(fā)表于 02-21 17:05 ?786次閱讀
    詳解<b class='flag-5'>語音</b><b class='flag-5'>識別</b>技術(shù)<b class='flag-5'>在</b>通信領(lǐng)域中的應(yīng)用

    華為云發(fā)布DeepSeek本地部署方案

    華為云正式推出基于華為云Stack混合云的DeepSeek本地部署方案。
    的頭像 發(fā)表于 02-18 10:05 ?1078次閱讀

    NRK3502系列芯片 | 制氧機(jī)離線語音識別方案

    NRK3502芯片制氧機(jī)離線語音識別方案制氧機(jī)離線語音識別方案是基于NRK3502藍(lán)牙雙模智能語音IoT芯片,依托于九芯電子
    的頭像 發(fā)表于 12-04 01:02 ?489次閱讀
    NRK3502系列芯片 | 制氧機(jī)離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>方案

    語音識別技術(shù)醫(yī)療領(lǐng)域的應(yīng)用

    語音識別技術(shù)醫(yī)療領(lǐng)域的應(yīng)用已經(jīng)越來越廣泛,為醫(yī)療服務(wù)帶來了諸多便利和效率提升。以下是對語音識別技術(shù)
    的頭像 發(fā)表于 11-26 09:35 ?1217次閱讀

    離線語音識別芯片,讓您的產(chǎn)品“聽懂會說”

    ;內(nèi)置NPU、浮點(diǎn)運(yùn)算單元。依托于九芯電子語音識別技術(shù)上的積累和算法的不斷優(yōu)化和創(chuàng)新,將本地識別算法與芯片架構(gòu)深度融合,為客戶提供Turn
    的頭像 發(fā)表于 11-17 01:01 ?901次閱讀
    離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片,讓您的產(chǎn)品“聽懂會說”

    EVS103智能純離線語音識別芯片介紹

    算法與芯片架構(gòu)深度融合,為客戶提供 Turnkey 語音識別方案,可廣泛且快速應(yīng)用于各類帶電池的小家電、可穿戴設(shè)備、玩具、單火線供電設(shè)備、86盒等需要語音操控的產(chǎn)品。該方案支持50條本地
    的頭像 發(fā)表于 11-11 11:34 ?908次閱讀
    EVS103智能純離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片介紹

    智能玩具用離線語音識別芯片有什么優(yōu)勢

    離線語音識別芯片NRK3301智能玩具中應(yīng)用廣泛,其高識別率、低成本、低功耗等特性,提升了用戶體驗(yàn)和互動(dòng)性,支持本地
    的頭像 發(fā)表于 09-19 10:00 ?1104次閱讀
    智能玩具用離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片有什么優(yōu)勢

    NRK3502空氣凈化器語音芯片方案,本地識別算法+芯片架構(gòu)

    隨著環(huán)境污染問題的日益嚴(yán)重,空氣凈化器成為人們居家、辦公環(huán)境中不可或缺的設(shè)備,為了提升用戶體驗(yàn)和產(chǎn)品性能,廣州九芯電子研發(fā)出了一款創(chuàng)新的空氣凈化器語音芯片方案--NRK3502。此方案結(jié)合了本地識別
    的頭像 發(fā)表于 09-19 08:02 ?750次閱讀
    NRK3502空氣凈化器<b class='flag-5'>語音</b>芯片方案,<b class='flag-5'>本地</b><b class='flag-5'>識別</b>算法+芯片架構(gòu)