隨著人工智能技術(shù)的發(fā)展,支持遠(yuǎn)場語音交互的智能家居產(chǎn)品越來越受到大眾青睞。近日,智能投影領(lǐng)先品牌堅果發(fā)布了全球首款支持遠(yuǎn)場語音交互的人工智能4K投影儀——J7S智能投影儀,這款投影儀采用阿里人工智能實驗室與聲智科技聯(lián)合為其開發(fā)的專為智能投影定制的遠(yuǎn)場智能語音交互技術(shù),讓傳統(tǒng)的按鍵交互變成免遙控器,一句話即可控制的自然語音交互。
低功耗高集成算法,極速喚醒識別體驗
作為業(yè)界首款支持遠(yuǎn)場語音識別的智能投影儀,堅果J7S智能投影儀在堅果J7旗艦投影儀的基礎(chǔ)上進(jìn)行了全新升級,內(nèi)置Mstar6A838四核A53架構(gòu)旗艦級智能電視芯片,支持4K高清片源解碼播放。在原有功能的基礎(chǔ)上增加了AI遠(yuǎn)場語音、MEMC運(yùn)動補(bǔ)償?shù)裙δ?,新增兒童觀影模式,并在畫質(zhì)色彩、散熱、系統(tǒng)等諸多方面進(jìn)行優(yōu)化升級,帶給用戶更智能更貼心的大屏使用體驗。
為打造4K高清觀影效果,堅果J7S智能投影儀在播放高清視頻過程中將CPU的運(yùn)行資源絕大部分都用于進(jìn)行視頻處理。因此,這就要求聲學(xué)處理算法需要在CPU占用少、算力低等諸多高要求的情況下,為用戶提供流暢的智能交互體驗。
根據(jù)CPU算力要求,聲智科技重新優(yōu)化算法,訓(xùn)練模型,提升喚醒率和喚醒速度,不斷降低CPU占用率,最終推出了新一代SoundAI Azero低功耗遠(yuǎn)場語音喚醒識別算法,該算法計算量小且內(nèi)存占用量少,成功應(yīng)對更復(fù)雜的應(yīng)用場景并提高準(zhǔn)確度,保證CPU的順暢運(yùn)行,為用戶提供高清視頻播放的前提下打造極速的喚醒和識別速度體驗。搭載聲智科技SoundAI Azero系統(tǒng)的堅果J7S已達(dá)到將機(jī)器應(yīng)答時間控制在400~500毫秒的領(lǐng)先水平,從喚醒到內(nèi)容的全鏈條響應(yīng)速度已實現(xiàn)全球領(lǐng)先的1.4s內(nèi),確保了更人性化的智能交互速度。
獨(dú)家優(yōu)化降噪喚醒技術(shù),流暢人機(jī)交互體驗
堅果J7S智能投影儀內(nèi)置聲智科技遠(yuǎn)場智能交互系統(tǒng)SoundAI Azero,采用4麥環(huán)形麥克風(fēng)陣列設(shè)計,以及針對投影儀應(yīng)用場景優(yōu)化的遠(yuǎn)場語音識別、噪聲抑制、語音喚醒等核心算法,首次有效解決了智能投影儀應(yīng)用場景中信號失真、回聲抵消等問題,打造無障礙人機(jī)交互體驗。
投影儀因其特殊的結(jié)構(gòu)設(shè)計,在遠(yuǎn)場聲學(xué)處理過程中需要應(yīng)對密封性不足、自噪聲干擾大等問題,以提高喚醒和識別的準(zhǔn)確率。為實現(xiàn)音視頻播放時的立體聲效果,堅果J7S智能投影儀內(nèi)置2枚5W的高品質(zhì)對稱式揚(yáng)聲器,搭配高保真四向發(fā)聲環(huán)繞技術(shù),但也對語音信號的拾取造成了極大干擾。同時,為了具有更好的散熱性能,堅果J7S采用了渦輪增壓散熱設(shè)計,風(fēng)扇運(yùn)行時的噪聲會干擾到交互時的識別率和喚醒率。
針對智能投影儀真實應(yīng)用環(huán)境中的特殊噪聲,聲智科技遠(yuǎn)場智能交互系統(tǒng)SoundAI Azero推出了一系列優(yōu)化的語音喚醒核心算法和識別算法,包括聲源測向、波束形成、噪聲抑制、抗強(qiáng)噪聲喚醒(AKS)和回聲抵消等,在保護(hù)主方向語音不失真的前提下,抑制環(huán)境中的語音等非穩(wěn)態(tài)噪聲以及空調(diào)等其他平穩(wěn)噪聲的干擾,增強(qiáng)語音清晰度,賦予堅果J7S以更靈敏的人機(jī)交互能力。
場景化語音識別技術(shù),賦能智能語義理解
智能投影儀在真實應(yīng)用場景中,不可避免地要面對用戶指令中的網(wǎng)絡(luò)熱詞,這就對語音識別和語義理解能力提出了更高要求,要求設(shè)備可以快速的識別特定詞并作出準(zhǔn)確解讀。
聲智科技SoundAI Azero系統(tǒng)為堅果J7S智能投影儀提供的遠(yuǎn)場語音識別解決方案,采用貝葉斯學(xué)習(xí)框架,基于神經(jīng)網(wǎng)絡(luò),提取用戶語音數(shù)據(jù)特征,進(jìn)行聲學(xué)和語言建模,動態(tài)生成最優(yōu)識別結(jié)果,讓用戶可享受便捷的語音識別服務(wù)。
同時,智能投影儀的識別更偏向于影音娛樂領(lǐng)域,為此,聲智科技運(yùn)用了場景化任務(wù)識別數(shù)據(jù)系統(tǒng),強(qiáng)化場景特點(diǎn)的訓(xùn)練與學(xué)習(xí),結(jié)合用戶習(xí)慣,讓對用戶語言的識別與解讀更合情理。聲智科技ASR算法的識別效果已達(dá)到行業(yè)領(lǐng)先水平,可支持各類媒體類熱詞,將誤識別率控制在極低水平內(nèi),譬如不會將“黃金瞳”誤識別為“黃巾同”。
在高精度的語音識別基礎(chǔ)之上,如何對轉(zhuǎn)化為文本的用戶指令信息進(jìn)行高效準(zhǔn)確的解碼,是自然語言處理技術(shù)的應(yīng)用價值所在。聲智科技遠(yuǎn)場智能交互系統(tǒng)SoundAI Azero的自然語言處理解決方案,基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)和條件隨機(jī)場模型,提取實體信息,對文本進(jìn)行分詞處理,通過規(guī)則匹配生成有效信息邏輯排列,運(yùn)用樹形結(jié)構(gòu)模型,聯(lián)系上下文邏輯,推理出用戶的意圖,實現(xiàn)“聽你所言,知你所想”的完美體驗。
隨著智能交互技術(shù)在越來越多的硬件產(chǎn)品中落地,萬物互聯(lián)的生態(tài)圈將得到進(jìn)一步豐富,越來越多的智能交互場景落地。聲智科技將持續(xù)專注聲學(xué)語音技術(shù)和場景語義技術(shù)的創(chuàng)新與應(yīng)用,攜手合作伙伴,共建智慧未來。
-
人工智能
+關(guān)注
關(guān)注
1806文章
49014瀏覽量
249412 -
語音交互
+關(guān)注
關(guān)注
3文章
307瀏覽量
28613 -
智能投影
+關(guān)注
關(guān)注
0文章
31瀏覽量
7504
發(fā)布評論請先 登錄
微型投影儀的正確使用方法
給微型投影儀進(jìn)行分類
給微型投影儀進(jìn)行分類
淺談微型投影儀的開機(jī)順序
請問投影儀什么牌子好?投影儀排行榜推薦
投影儀的成像原理是什么
投影儀啟動不開是怎么回事_投影儀無法啟動如何解決(解決辦法)
選擇智能電視還是投影儀?不如選這個投影儀
堅果G7S和堅果G9的battle,半路殺出一個當(dāng)貝D3X,投影儀屆的Star!

堅果J10S投影儀:讓用戶享受極致的影院體驗

堅果投影最新推出了堅果J10S家用旗艦投影儀

評論