99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

針對(duì)智能語(yǔ)音交互的“金耳朵”語(yǔ)音前端處理技術(shù)進(jìn)行了深度分享

fjYQ_ittbank ? 來(lái)源:未知 ? 作者:伍文輝 ? 2017-12-27 17:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能,可以說(shuō)是今年最熱的一個(gè)關(guān)鍵詞,并推動(dòng)著很多產(chǎn)品和產(chǎn)業(yè)的創(chuàng)新。而提到人工智能,目前主要的還是語(yǔ)音識(shí)別和圖像識(shí)別,這兩點(diǎn)也一直是上游芯片原廠和方案商想要突破和創(chuàng)新的技術(shù)關(guān)卡。

作為國(guó)內(nèi)知名音頻芯片廠商炬芯科技,不但于去年在音頻領(lǐng)域進(jìn)入了小米、魅族等幾家大公司的供應(yīng)鏈,現(xiàn)在也開(kāi)始聚焦音頻AI領(lǐng)域,推出了一系列的智能語(yǔ)音產(chǎn)品和解決方案。12月15日,炬芯科技在深圳舉行了針對(duì)智能語(yǔ)音技術(shù)的專屬品牌活動(dòng):炬芯科技2017 TcehLife開(kāi)發(fā)者交流大會(huì)。

單麥克風(fēng)or麥克風(fēng)陣列,語(yǔ)音交互該選用怎樣的方案?

本次的TechLife活動(dòng)交流分享環(huán)節(jié),炬芯特邀地平線語(yǔ)音前端處理技術(shù)負(fù)責(zé)人,南京大學(xué)聲科學(xué)與工程系教授,噪聲控制與通信聲學(xué)研究室主任盧晶盧教授,為大家針對(duì)智能語(yǔ)音交互的“金耳朵”語(yǔ)音前端處理技術(shù)進(jìn)行了深度分享。

據(jù)WER統(tǒng)計(jì),目前最頂尖的語(yǔ)音識(shí)別技術(shù)的誤識(shí)率是3%,已經(jīng)與人類聽(tīng)力的誤識(shí)率持平,但是WER統(tǒng)計(jì)大多數(shù)針對(duì)安靜場(chǎng)景的語(yǔ)音數(shù)據(jù),在復(fù)雜環(huán)境中語(yǔ)音性能顯著惡化。人耳能夠自動(dòng)屏蔽掉周圍的噪音,只關(guān)注你想聽(tīng)到的聲音;但是機(jī)器做不到,在語(yǔ)音識(shí)別系統(tǒng)看來(lái)所接收到的所有聲音重要性都是一樣的,無(wú)法區(qū)分噪音和聲音,在復(fù)雜環(huán)境下語(yǔ)音識(shí)別率自然會(huì)下降。

因此,智能語(yǔ)音技術(shù)的發(fā)展讓語(yǔ)音前端處理的重要性日益凸顯。不僅要像手機(jī)、藍(lán)牙耳機(jī)、助聽(tīng)器的語(yǔ)音前端處理系統(tǒng)一樣實(shí)現(xiàn)降噪,還要進(jìn)一步還原語(yǔ)音,讓要讓機(jī)器聽(tīng)得懂,進(jìn)而提升語(yǔ)音識(shí)別和說(shuō)話人識(shí)別系統(tǒng)的實(shí)用性和識(shí)別率。

盧晶盧教授表示,目前對(duì)干擾噪音的抑制有單麥克風(fēng)和麥克風(fēng)陣列兩種方案。其中單通道方案的關(guān)鍵點(diǎn)是噪聲功率譜的有效追蹤和語(yǔ)音邊界檢測(cè),也可以基于深度學(xué)習(xí)的方案提升抑制干擾噪聲的能力。單通道方案優(yōu)點(diǎn)是結(jié)構(gòu)簡(jiǎn)單,硬件成本低,對(duì)平穩(wěn)噪聲效果明顯,但弱點(diǎn)是對(duì)非平穩(wěn)噪聲處理效果不佳。

麥克風(fēng)陣列由一組按一定幾何結(jié)構(gòu)(常用線形、環(huán)形)擺放的麥克風(fēng)組成,對(duì)采集的不同空間方向的聲音信號(hào)進(jìn)行空時(shí)處理,實(shí)現(xiàn)噪聲抑制、混響去除、人聲干擾抑制、聲源測(cè)向、聲源跟蹤、陣列增益等功能,進(jìn)而提高語(yǔ)音信號(hào)處理質(zhì)量,以提高真實(shí)環(huán)境下的語(yǔ)音識(shí)別率。

理論上來(lái)說(shuō),麥克風(fēng)數(shù)量多多益善,但系統(tǒng)的實(shí)現(xiàn)必須考慮性價(jià)比。那么,對(duì)于開(kāi)發(fā)者來(lái)說(shuō),該如何平衡語(yǔ)音前端硬件系統(tǒng)的性能和價(jià)格呢?盧晶盧教授認(rèn)為,在一般應(yīng)用場(chǎng)景,說(shuō)話人距離3m以內(nèi)可以采用單麥克風(fēng);復(fù)雜場(chǎng)景使用2顆;需要DOA估計(jì)的復(fù)雜場(chǎng)景則需要3-4顆甚至8顆的麥克風(fēng)。

聚焦音頻AI,炬芯推出智能語(yǔ)音全系列產(chǎn)品線

炬芯科技技術(shù)專家陶永耀在現(xiàn)場(chǎng)也為大家詳細(xì)的講解了炬芯目前的幾大核心平臺(tái),同時(shí)也對(duì)智能語(yǔ)音的未來(lái)發(fā)表了獨(dú)到的觀點(diǎn)。

熟悉炬芯的人都知道,炬芯是做音頻起家的,最早做MP3,老人機(jī)、小音箱等產(chǎn)品。陶永耀表示,炬芯未來(lái)三到五年仍將重點(diǎn)聚焦以音頻為主線的三大領(lǐng)域,并引入人工智能元素。一是無(wú)線音頻和智能穿戴運(yùn)動(dòng)耳機(jī);二是智能多媒體,將原來(lái)的老人機(jī)、游戲機(jī)、學(xué)習(xí)機(jī),與人工智能結(jié)合形成跨界的產(chǎn)品。三是智慧計(jì)算與物聯(lián)網(wǎng),包括無(wú)人機(jī)、VR/AR、OTT盒子等產(chǎn)品。

作為一家芯片廠商,炬芯聚焦解決智能語(yǔ)音平臺(tái)的共性需求,致力于智能語(yǔ)音交互技術(shù)中的前臺(tái)技術(shù)的發(fā)展。主要包括以下四點(diǎn):1.mic陣列語(yǔ)音采集芯片;2整合語(yǔ)音前處理相關(guān)算法;3.整合本地語(yǔ)音識(shí)別引擎;4.雙mic語(yǔ)音前處理模塊。

目前炬芯已經(jīng)擁有非常豐富的智能語(yǔ)音產(chǎn)品線,尤其是目前熱門且已經(jīng)成功落地的智能早教機(jī)器人產(chǎn)品。其實(shí)在早教機(jī)器人方面炬芯已經(jīng)推出了比較全面的解決方案,完整布局了低、中、高端市場(chǎng),主要包括ATS3503、ATS3603、ATS3703。

針對(duì)火爆的智能音箱市場(chǎng),炬芯在本次開(kāi)發(fā)者交流大會(huì)上正式推出了全新的智能語(yǔ)音多媒體平臺(tái)。包括面向無(wú)屏Linux系統(tǒng)的智能語(yǔ)音平臺(tái)ATS3605D,面向有屏的Android智能語(yǔ)音平臺(tái)有S500、S700、S900,以及一顆支持4-8麥的語(yǔ)音采集套片ATT300X。

此外,炬芯還推出了雙模藍(lán)牙平臺(tái)AT3282X和ATB12XX,以及針對(duì)BLE藍(lán)牙智能語(yǔ)音平臺(tái)ATB110X。

此前,炬芯科技CEO周正宇博士被采訪表示,人工智能和物聯(lián)網(wǎng)概念一樣的龐大,如果人工智能像物聯(lián)網(wǎng)一樣不追求產(chǎn)品的落地,它將依然得不到人工智能需要追求實(shí)際的產(chǎn)品落地和智能化的用戶體驗(yàn),堅(jiān)持小步快走的微智能化發(fā)展方針才是長(zhǎng)久之計(jì)。炬芯在此次開(kāi)發(fā)者大會(huì)上充分展示了智能語(yǔ)音全面的產(chǎn)品線,正是基于其小步快走的微智能化發(fā)展方針的最好實(shí)踐。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35165

    瀏覽量

    280093
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    11

    文章

    804

    瀏覽量

    49531

原文標(biāo)題:從音頻到智能語(yǔ)音,看炬芯AI創(chuàng)新之路

文章出處:【微信號(hào):ittbank,微信公眾號(hào):ittbank】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    普強(qiáng)智能語(yǔ)音技術(shù)重新定義車載交互邊界

    普強(qiáng)憑借自主研發(fā)的智能語(yǔ)音技術(shù),為某國(guó)內(nèi)頭部車企提供的語(yǔ)音處理、喚醒詞、ASR、TTS等技術(shù)
    的頭像 發(fā)表于 07-11 14:00 ?343次閱讀

    藍(lán)牙語(yǔ)音遙控器:智能家居的智慧控制核心

    和低功耗特性,成為理想選擇。 藍(lán)牙語(yǔ)音遙控器不僅是智能家居控制的樞紐,更是技術(shù)進(jìn)步的縮影。其便捷的操作、智能語(yǔ)音
    發(fā)表于 06-01 20:24

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強(qiáng)勁的運(yùn)算性能,能夠高效處理語(yǔ)音機(jī)器人運(yùn)行過(guò)程中的復(fù)雜任務(wù)。語(yǔ)音識(shí)別和合成需要大量的計(jì)算資源,該處理器可以快速對(duì)
    發(fā)表于 05-28 11:36

    芯資訊|廣州唯創(chuàng)電子WTK6900P語(yǔ)音識(shí)別芯片:離線語(yǔ)音交互的革新者

    智能設(shè)備全面普及的浪潮中,語(yǔ)音交互技術(shù)正逐步從“云端依賴”向“本地化高效處理”演進(jìn)。廣州唯創(chuàng)電子推出的WTK6900P
    的頭像 發(fā)表于 05-22 09:22 ?256次閱讀
    芯資訊|廣州唯創(chuàng)電子WTK6900P<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片:離線<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>的革新者

    芯資訊|廣州唯創(chuàng)電子WTV系列語(yǔ)音芯片:以技術(shù)創(chuàng)新賦能智能語(yǔ)音交互

    在萬(wàn)物互聯(lián)的智能化時(shí)代,語(yǔ)音交互技術(shù)已成為人機(jī)交互的重要橋梁。廣州唯創(chuàng)電子深耕語(yǔ)音芯片領(lǐng)域多年,
    的頭像 發(fā)表于 05-21 08:45 ?211次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語(yǔ)音</b>芯片:以<b class='flag-5'>技術(shù)</b>創(chuàng)新賦能<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>

    智能收銀語(yǔ)音交互新標(biāo)桿—WT3000T8語(yǔ)音合成芯片TTS技術(shù)應(yīng)用解析

    一、行業(yè)應(yīng)用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮中,收銀設(shè)備正經(jīng)歷從功能型向服務(wù)型轉(zhuǎn)變的關(guān)鍵階段。WT3000T8語(yǔ)音合成芯片應(yīng)運(yùn)而生,專為滿足新零售場(chǎng)景下智能收銀終端的語(yǔ)音
    的頭像 發(fā)表于 04-24 08:45 ?277次閱讀
    <b class='flag-5'>智能</b>收銀<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新標(biāo)桿—WT3000T8<b class='flag-5'>語(yǔ)音</b>合成芯片TTS<b class='flag-5'>技術(shù)</b>應(yīng)用解析

    智能語(yǔ)音交互方案在客服領(lǐng)域的應(yīng)用

    著客服行業(yè)的面貌,為企業(yè)和用戶帶來(lái)了全新的體驗(yàn)。 語(yǔ)音識(shí)別模型優(yōu)化私部署 方案:精準(zhǔn)高效,定制專屬服務(wù) 語(yǔ)音識(shí)別技術(shù)作為智能語(yǔ)音
    的頭像 發(fā)表于 04-11 14:35 ?299次閱讀

    零知開(kāi)源——ESP32語(yǔ)音交互系統(tǒng)(AI小智)開(kāi)發(fā)教程

    小智AI聊天機(jī)器人是一個(gè)基于嵌入式硬件與人工智能技術(shù)深度融合的智能交互系統(tǒng)。該項(xiàng)目以ESP32開(kāi)發(fā)板為核心,結(jié)合語(yǔ)音喚醒、自然語(yǔ)言
    的頭像 發(fā)表于 03-29 15:33 ?7128次閱讀
    零知開(kāi)源——ESP32<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>系統(tǒng)(AI小智)開(kāi)發(fā)教程

    智能語(yǔ)音交互新標(biāo)桿】WTK6900HC語(yǔ)音識(shí)別芯片:重新定義離線語(yǔ)音控制體驗(yàn)

    在萬(wàn)物智聯(lián)時(shí)代,離線語(yǔ)音控制技術(shù)正以革命性姿態(tài)重塑智能設(shè)備交互方式。WTK6900HC語(yǔ)音識(shí)別芯片憑借其突破性的
    的頭像 發(fā)表于 03-05 09:26 ?408次閱讀
    【<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新標(biāo)桿】WTK6900HC<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片:重新定義離線<b class='flag-5'>語(yǔ)音</b>控制體驗(yàn)

    前端技術(shù)的未來(lái)趨勢(shì):擁抱創(chuàng)新,塑造無(wú)限可能

    為未來(lái)的重要趨勢(shì)之一。智能交互將變得更加自然和流暢。例如,通過(guò)語(yǔ)音識(shí)別和自然語(yǔ)言處理技術(shù),用戶可以直接通過(guò)
    的頭像 發(fā)表于 01-22 10:07 ?446次閱讀

    【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語(yǔ)音識(shí)別的智能杯墊

    項(xiàng)目二維碼下圖 該作品通過(guò)采集飲水?dāng)?shù)據(jù),多種交互方式,數(shù)據(jù)分析處理,提醒用戶定期飲水,達(dá)到保持健康的作用。 主要功能是語(yǔ)音識(shí)別。 ASR-PRO語(yǔ)音模塊是一款高度集成的
    發(fā)表于 01-02 18:15

    解鎖個(gè)性化語(yǔ)音交互新時(shí)代:九芯智能語(yǔ)音云平臺(tái),讓創(chuàng)意聲音觸手可及!

    九芯智能語(yǔ)音云平臺(tái)提供全面高效安全的智能語(yǔ)音服務(wù),支持自定義語(yǔ)音內(nèi)容,簡(jiǎn)化燒錄流程,依托AI技術(shù)
    的頭像 發(fā)表于 01-02 16:51 ?902次閱讀
    解鎖個(gè)性化<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新時(shí)代:九芯<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>云平臺(tái),讓創(chuàng)意聲音觸手可及!

    基于語(yǔ)音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

    標(biāo)貝科技專注智能語(yǔ)音交互領(lǐng)域多年,在語(yǔ)音識(shí)別和語(yǔ)音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能
    的頭像 發(fā)表于 12-20 10:35 ?592次閱讀

    基于智能語(yǔ)音交互智能呼叫中心工作機(jī)制

    作為實(shí)現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之一的智能語(yǔ)音交互技術(shù),它通過(guò)集成自然語(yǔ)言
    的頭像 發(fā)表于 12-03 16:44 ?715次閱讀
    基于<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>的<b class='flag-5'>智能</b>呼叫中心工作機(jī)制

    樂(lè)鑫聲學(xué)前端算法:打造智能語(yǔ)音交互新體驗(yàn),ESP32-S3 SOC技術(shù)方案

    隨著人工智能技術(shù)的不斷進(jìn)步,智能語(yǔ)音設(shè)備正逐漸成為我們生活中不可或缺的一部分。然而,在嘈雜的現(xiàn)實(shí)環(huán)境中,如何實(shí)現(xiàn)清晰、準(zhǔn)確的語(yǔ)音交互,一直是
    的頭像 發(fā)表于 08-03 08:04 ?2209次閱讀
    樂(lè)鑫聲學(xué)<b class='flag-5'>前端</b>算法:打造<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新體驗(yàn),ESP32-S3 SOC<b class='flag-5'>技術(shù)</b>方案