99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究證明:商業(yè)語音識別系統(tǒng)的錯誤率非常高

如意 ? 來源:雷鋒網(wǎng) ? 作者:楊麗 ? 2020-10-26 16:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

某些語音識別系統(tǒng)(ASR)的準確性可能要比之前假定的差很多?!边@是最近約翰·霍普金斯大學、波蘭波茲南工業(yè)大學、弗羅茨瓦夫科技大學以及初創(chuàng)公司Avaya的研究人員一項正在進行的研究主要發(fā)現(xiàn)。

這項研究對內(nèi)部創(chuàng)建的數(shù)據(jù)集上的商業(yè)語音識別模型進行了基準測試。共同作者聲稱,詞錯誤率(Word Error Rate, WER)(一種常見的語音識別性能指標)要顯著高于最佳報告結(jié)果,這可能表明自然語言處理(NLP)領(lǐng)域存在更多待克服的問題。

據(jù)了解,目前ASR已廣泛應用于諸多場景中,如電話會議、電子郵件、智能設備等。ASR模型的綜合基準中,標準語料庫的WER僅有2%~3%,而正是這一統(tǒng)計數(shù)據(jù)遭到了上述作者的質(zhì)疑。他們聲稱,大多數(shù)ASR的交互場景都是在“類似于聊天機器人”的背景下進行的,說話人往往因為意識到跟他們的交互對象是聊天機器人,因此通常會將命令簡化成結(jié)構(gòu)緊湊的簡短詞語,而非正常的自然對話。作者基于來自1595個供應商和1261個客戶的50個呼叫中心對話數(shù)據(jù)集對幾套ASR系統(tǒng)進行了評估。其通常時間長達8.5個小時,其中2.2個小時是對話。通過測試,作者發(fā)現(xiàn)ASR系統(tǒng)的錯誤率基本在15%以下,這與基準測試中的2%相悖。

研究證明:商業(yè)語音識別系統(tǒng)的錯誤率非常高

而基于保險、通信、預定等金融行業(yè)的語料庫中,作者發(fā)現(xiàn)其WER的測試結(jié)果高達23.31%。其中,預定和通信的錯誤率最高,可能是因為對話涉及特定的日期、時間、訂單金額、地點、產(chǎn)品和公司名稱等。但在所有領(lǐng)域的測試中,其錯誤率均高于13.73%。

研究人員將這一問題歸結(jié)為領(lǐng)域適應性問題——基準測試使用了單一性語料,例如Librispeech(1000小時英語有聲讀物錄音)、WSJ(新聞口述的談話)和Switchboard(電話交談),這些都可能太過簡單而無法真正挑戰(zhàn)ASR系統(tǒng)的可靠性。

而且,盡管他們試圖刻意模仿真實、自發(fā)的對話,但本質(zhì)上還是受約束的,比如需要配音演員,就某一合適主題進行腳本/半腳本對話,而且正是由于配音演員的存在,幾乎都不需要考慮因性別、母語因素而產(chǎn)生的發(fā)音問題。

作為一種補救措施,研究人員建議ASR和NLP社區(qū)收集和注釋音頻數(shù)據(jù)集,使其更好地與ASR系統(tǒng)的實際應用場景保持一致,他們還呼吁建立更具包容性的聲學模型,更廣泛的方言語料庫,這些改變將會促進音頻信號處理的技術(shù)改進。

因此,這些問題并非無法克服?!皩W界和工業(yè)界應該深思熟慮,考慮可以創(chuàng)建高質(zhì)量的測試數(shù)據(jù)集。我們認為,對ASR準確性的過于樂觀會損害NLP領(lǐng)域下游應用程序的開發(fā)。”研究人員最后表示。
責編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 軟件
    +關(guān)注

    關(guān)注

    69

    文章

    5154

    瀏覽量

    89231
  • 語音識別
    +關(guān)注

    關(guān)注

    39

    文章

    1782

    瀏覽量

    114250
  • ASR
    ASR
    +關(guān)注

    關(guān)注

    2

    文章

    44

    瀏覽量

    19142
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    工地AI行為識別系統(tǒng)作用

    等),并即時預警,幫助工地實現(xiàn)從“人防”到“技防”的轉(zhuǎn)型升級。 為什么工地需要AI行為識別系統(tǒng)? 1、事故頻發(fā),安全難保障 工地環(huán)境復雜,工人違規(guī)操作、防護缺失等問題頻出,傳統(tǒng)人工巡檢難以及時發(fā)現(xiàn)風險。 2、監(jiān)管成本,效率低 2
    的頭像 發(fā)表于 05-08 12:00 ?285次閱讀

    手持終端火車號識別系統(tǒng):99%準確賦能智慧物流 #手持終端火車號識別

    識別系統(tǒng)
    jf_60141436
    發(fā)布于 :2025年05月08日 10:57:31

    景區(qū)AI行為識別系統(tǒng)作用

    景區(qū)AI行為識別系統(tǒng)作用 景區(qū)AI行為識別系統(tǒng)是什么? 景區(qū)AI行為識別系統(tǒng)是利用人工智能技術(shù)(如視頻分析、人臉識別)構(gòu)建的智能管理方案。通過部署攝像頭+AI算法,實時監(jiān)控游客行為,自
    的頭像 發(fā)表于 05-07 15:32 ?309次閱讀
    景區(qū)AI行為<b class='flag-5'>識別系統(tǒng)</b>作用

    工廠園區(qū)AI行為識別系統(tǒng)作用

    工廠園區(qū)AI行為識別系統(tǒng)作用 工廠園區(qū)AI行為識別系統(tǒng)是什么? 工廠園區(qū)AI行為識別系統(tǒng)是基于人工智能技術(shù)的智能化管理方案,通過攝像頭與AI算法融合,實時監(jiān)控人員行為、設備操作寄環(huán)境狀態(tài),自動
    的頭像 發(fā)表于 05-06 17:49 ?245次閱讀

    普強信息入選2024語音識別技術(shù)公司TOP30榜單

    企業(yè)數(shù)字化升級,這一榮譽不僅體現(xiàn)了普強在語音交互、語義理解、多語種識別等核心技術(shù)上的領(lǐng)先優(yōu)勢,更是對普強自主研發(fā)的端到端語音識別系統(tǒng)噪聲
    的頭像 發(fā)表于 04-18 17:25 ?643次閱讀

    鐵路車號自動識別系統(tǒng)工作原理#鐵路火車車號識別 #鐵路車號識別系統(tǒng)

    識別系統(tǒng)
    jf_60141436
    發(fā)布于 :2025年04月08日 10:05:01

    岸橋箱號識別系統(tǒng)的工作原理 #人工智能 #識別系統(tǒng)

    識別系統(tǒng)
    jf_60141436
    發(fā)布于 :2025年03月24日 09:28:11

    OpenAI攻克Sora視頻創(chuàng)建錯誤率高難題

    在人工智能與多媒體技術(shù)的交叉領(lǐng)域,OpenAI近期宣布了一項重要進展:成功解決了Sora視頻創(chuàng)建過程中錯誤率的問題。這一突破不僅標志著OpenAI在視頻處理技術(shù)上取得了顯著進步,也為廣大用戶帶來
    的頭像 發(fā)表于 12-31 10:37 ?542次閱讀

    RFID識別系統(tǒng)

    隨著信息技術(shù)的快速發(fā)展,RFID(射頻識別)技術(shù)在各行各業(yè)的應用日益廣泛,其中RFID識別系統(tǒng)作為核心應用,已經(jīng)成為智能化管理不可或缺的基石。通過無線射頻信號的非接觸式識別與數(shù)據(jù)傳輸,RFID
    的頭像 發(fā)表于 12-06 17:57 ?1112次閱讀
    RFID<b class='flag-5'>識別系統(tǒng)</b>

    什么是離線語音識別芯片?與在線語音識別的區(qū)別

    離線語音識別芯片適用于智能家電等,特點為小詞匯量、低成本、安全性、響應快,無需聯(lián)網(wǎng)。在線語音識別功能更廣泛、
    的頭像 發(fā)表于 07-22 11:33 ?958次閱讀