近期,來自于約翰霍普金斯大學(xué)(John Hopkins University)和亞馬遜(Amazon)的研究人員們發(fā)布了一篇論文,介紹他們是如何通過訓(xùn)練一個(gè)深度學(xué)習(xí)系統(tǒng)來幫助亞馬遜Alexa語音助手識(shí)別并忽略那些并非是對(duì)她說的話,從而將其語義識(shí)別模型的識(shí)別準(zhǔn)確度提高了15%。
研究人員在他們的論文中指出,“諸如Amazon Echo和Google Home的這類家用聲控設(shè)備都面臨著一個(gè)問題,那就是當(dāng)周圍存在干擾聲源的時(shí)候,設(shè)備如何能夠照常地識(shí)別指令?!?/p>
為了讓Alexa更好地識(shí)別指令,研究人員訓(xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò),來匹配和識(shí)別“喚醒詞”(通常是“Alexa”)以及緊隨其后的指令,并忽略那些來自于其他人或媒體設(shè)備的干擾。
研究人員介紹說:“這項(xiàng)任務(wù)的挑戰(zhàn)在于需要從含有特定詞匯的話語片段中學(xué)習(xí)使用者的語言習(xí)慣。借助于兩種不同的神經(jīng)網(wǎng)絡(luò)架構(gòu),我們最終實(shí)現(xiàn)了這一目標(biāo)。兩個(gè)神經(jīng)網(wǎng)絡(luò)架構(gòu)都是具有注意機(jī)制的序列到序列編碼器 - 解碼器網(wǎng)絡(luò)的變體?!?/p>
借助于NVIDIA V100 GPU和OpenSeq2Seq工具,用于序列到序列模型的分布式和混合精度訓(xùn)練,使用TensorFlow建立,團(tuán)隊(duì)用1,200小時(shí)來自于Amazon Echo的實(shí)時(shí)英文數(shù)據(jù)訓(xùn)練他們的算法。
通過改進(jìn)所開發(fā)的基線網(wǎng)絡(luò),該團(tuán)隊(duì)還添加了一個(gè)額外的輸入端,能夠通過優(yōu)先處理類似于錨字的語音來增強(qiáng)注意機(jī)制。研究人員總結(jié)說: “在訓(xùn)練期間,注意機(jī)制會(huì)自動(dòng)學(xué)習(xí)喚醒詞的哪些聲學(xué)特征,以便在隨后的演講中尋找?!?/p>
該團(tuán)隊(duì)還開發(fā)了一個(gè)mask-based模型,該模型能夠更加明確地將輸入語音與錨字的聲學(xué)輪廓相匹配。
最后的測試結(jié)果顯示:第一種方法的性能更好,達(dá)到了15%的改進(jìn);第二種模型也達(dá)到了13%的改進(jìn)。
根據(jù)研究人員介紹,該算法在訓(xùn)練和推理過程中都采用了NVIDIA GPU。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106401 -
亞馬遜
+關(guān)注
關(guān)注
8文章
2696瀏覽量
84673
原文標(biāo)題:借助AI研究,將亞馬遜Alexa語義識(shí)別準(zhǔn)確度提高15%
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
關(guān)于CAPSENSE?每個(gè) Vref 電壓的準(zhǔn)確度的疑問求解
電工儀表準(zhǔn)確度等級(jí)詳解

亞馬遜升級(jí)版Alexa推遲發(fā)布
《CST Studio Suite 2024 GPU加速計(jì)算指南》
如何提升人臉門禁一體機(jī)的識(shí)別準(zhǔn)確率?

語音識(shí)別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用
語音識(shí)別技術(shù)的應(yīng)用與發(fā)展
ASR與傳統(tǒng)語音識(shí)別的區(qū)別
亞馬遜基于人工智能的Alexa發(fā)布計(jì)劃延期至明年
隧道門禁人臉識(shí)別系統(tǒng)是專為隧道安全管理設(shè)計(jì)的先進(jìn)技術(shù)系統(tǒng)

GPU深度學(xué)習(xí)應(yīng)用案例
AI大模型在圖像識(shí)別中的優(yōu)勢(shì)
【飛凌嵌入式OK3576-C開發(fā)板體驗(yàn)】RKNN神經(jīng)網(wǎng)絡(luò)-車牌識(shí)別
魔搭社區(qū)借助NVIDIA TensorRT-LLM提升LLM推理效率
基于高光譜數(shù)據(jù)的典型地物分類識(shí)別方法研究

評(píng)論