99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能語音語義在產(chǎn)業(yè)化方面有哪些應(yīng)用

機器人創(chuàng)新生態(tài) ? 來源:未知 ? 作者:工程師郭婷 ? 2018-09-04 14:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

智能語音發(fā)展如火如荼

根據(jù)《2018中國智能語音行業(yè)前景研究報告》,2017年中國的智能語音市場規(guī)模已經(jīng)達到了105.71億元,比2016年增長了70%,而2018年這個規(guī)模預(yù)計將繼續(xù)擴大三分之一,達到159.7億元。

國內(nèi)的行業(yè)規(guī)模越來越大,但從技術(shù)角度看,目前的智能語音發(fā)展到了什么階段呢?我們先從頭開始說。

上世紀50年代到60年代,語音識別研究著眼于單個字詞到連續(xù)語音的識別,當(dāng)時最大的困境是對相關(guān)數(shù)據(jù)的計算能力的低下,這直接導(dǎo)致該時期研究進展極其緩慢。到了70年代,計算機性能大幅提升,之前的問題便不復(fù)存在,并且隨著計算機軟硬件技術(shù)的高速發(fā)展,該研究已不再受困于計算能力,人們便開始將研究重點放在數(shù)據(jù)算法的優(yōu)化提升上,并將這一方向保持至今。

簡單來講,這個方向的問題解決方案是基于一個框架,通過對框架內(nèi)的各部分進行改進,最終向著識別的極限正確率邁進。各部分中,聲學(xué)模型和語言模型的構(gòu)建,則是整個方案中的研究焦點。

80年代末李開復(fù)將隱馬爾科夫模型與高斯混合模型(GMM)相結(jié)合進行語音識別建模,開發(fā)出世界上第一個“非特定人連續(xù)語音識別系統(tǒng)”,即SPHINX系統(tǒng)。隨后,主流的GMM-HMM技術(shù)框架的發(fā)展日益穩(wěn)定,但語音識別效果難以轉(zhuǎn)向應(yīng)用化的局面長時期沒有被打破,這意味著語音識別技術(shù)又遇到了瓶頸。

轉(zhuǎn)機出現(xiàn)在2006年。這一年,深度學(xué)習(xí)的概念被辛頓提出,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)研究因此而復(fù)蘇。2009年,辛頓和他的學(xué)生將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于語音的聲學(xué)建模上并獲得成功。到了2010年前后,微軟研究院的俞棟、鄧力等人將深度學(xué)習(xí)在圖像領(lǐng)域的突破移植到語音識別領(lǐng)域,使識別錯誤率降低了20%以上。從此,基于GMM-HMM的語音識別框架被打破,人們開始轉(zhuǎn)向基于DNN-HMM的語音識別模型的研究。

從2011年到2018年,以深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的語音識別建模技術(shù)迅速發(fā)展,語音識別乃至語音交互行業(yè)呈現(xiàn)出這樣一個現(xiàn)象:全世界范圍內(nèi)的企業(yè)的建模技術(shù)萬變不離“深度神經(jīng)網(wǎng)絡(luò)”這一宗,雖大同小異但又各顯神通。

技術(shù)篇:語音識別和NLP技術(shù)仍不成熟

智能語音語義包含語音合成、語音識別和自然語言處理(NLP)三項主要技術(shù)。

語音合成技術(shù)發(fā)展最早,應(yīng)用已較為普遍,除了合成音仍偏機械之外,基本不存在太大技術(shù)問題;語音識別在2012年卷積神經(jīng)網(wǎng)絡(luò)(CNN)應(yīng)用之后,準(zhǔn)確率大幅提升,已經(jīng)在C端、B端得到了廣泛應(yīng)用,但效果和體驗還不夠理想;NLP技術(shù)雖然在搜索引擎中早有應(yīng)用,但在人機交互領(lǐng)域仍屬于淺層處理。

語音識別“魯棒性“問題顯著

在生物學(xué)中,有個術(shù)語叫做“魯棒性”,是指系統(tǒng)在擾動或不確定的情況下,仍能保持它的特征行為。這一問題在語音識別領(lǐng)域也存在。

語音識別整個過程包含語音信號處理、靜音切除、聲學(xué)特征提取、模式匹配等多個環(huán)節(jié)。由于語音信號的多樣性和復(fù)雜性,系統(tǒng)只能在一定限制條件下才能獲得滿意效果。在真實使用場景中,考慮到遠場、方言、噪音、斷句等問題,準(zhǔn)確率會大打折扣。目前業(yè)內(nèi)普遍宣稱的97%識別準(zhǔn)確率,更多的是人工測評結(jié)果,只在安靜室內(nèi)的進場識別中才能實現(xiàn)。

要解決語音識別魯棒性問題,需要在技術(shù)和產(chǎn)品兩方面進行優(yōu)化。一方面,在語音增強、麥克風(fēng)陣列以及說話人分離等多項技術(shù)領(lǐng)域持續(xù)投入,并結(jié)合后端語義,促進對上下文的理解,從而提升識別效果;另一方面,需要從產(chǎn)品設(shè)計上進行優(yōu)化,比如通過進一步交互,使語音識別變得更為準(zhǔn)確。

語義分析仍是淺層處理

NLP技術(shù)大致包含三個層面:詞法分析、句法分析、語義分析,三者之間既遞進又相互包含。

詞義消歧是NLP技術(shù)的最大瓶頸。機器在切詞、標(biāo)注詞性、并識別完后,需要對各個詞語進行理解。由于語言中往往一詞多義,人在理解時會基于已有知識儲備和上下文環(huán)境,但機器很難做到。雖然系統(tǒng)會對句子做句法分析,可以在一定程度上幫助機器理解詞義和語義,但實際情況并不理想。

目前,機器對句子的理解還只能做到語義角色標(biāo)注層面,即標(biāo)出句中的句子成分和主被動關(guān)系等,它屬于比較成熟的淺層語義分析技術(shù)。未來要讓機器更好地理解人類語言,并實現(xiàn)自然交互,還是需要依賴深度學(xué)習(xí)技術(shù),通過大規(guī)模的數(shù)據(jù)訓(xùn)練,讓機器不斷學(xué)習(xí)。當(dāng)然,在實際應(yīng)用領(lǐng)域中,也可以通過產(chǎn)品設(shè)計來減少較為模糊的問答內(nèi)容,以提升用戶體驗。

由于人工智能技術(shù)對數(shù)據(jù)依賴性極高,因此,這一領(lǐng)域的技術(shù)進步和產(chǎn)業(yè)化推進是一種協(xié)同關(guān)系——通過工程化的方法提升技術(shù)效果和體驗,從而促進產(chǎn)業(yè)化應(yīng)用,再根據(jù)實際應(yīng)用中的數(shù)據(jù)和反饋,反過來推動技術(shù)實現(xiàn)突破。那么,智能語音語義在產(chǎn)業(yè)化方面都有哪些應(yīng)用領(lǐng)域,又存在哪些問題?

應(yīng)用篇:C端提升體驗,B端提升效率

以問答和聊天為服務(wù)形式,智能語音語義在多個使用場景和行業(yè)領(lǐng)域都有廣泛應(yīng)用,我們可以簡單從C端和B端兩個方向分別來看。

C端應(yīng)用方面,主要用于移動設(shè)備、汽車、家居三大場景,用來變革原有人機交互方式;B端則針對垂直行業(yè)需求,提升人工效率,比如幫助醫(yī)生做電子病歷錄入,或代替部分人力工作,比如回答大部分簡單重復(fù)的客服問題。由于兩大領(lǐng)域解決的問題不同,因此遇到的挑戰(zhàn)也各不相同。

特別地,在智能機器人的應(yīng)用方面,目前的機器人與用戶一般都會采用相互問答的小型對話形式進行交流。為實現(xiàn)上方便,問答對話的領(lǐng)域?qū)⒈贿M行合理的限制。

除迎賓和問候語外,一般設(shè)計為4個問題域:有關(guān)時間、日期和星期的問答,有關(guān)全世界各大城市所在時區(qū)和當(dāng)?shù)貢r間的問答,100以內(nèi)的數(shù)學(xué)四則運算題目的問答,沒有關(guān)系機器人的身世、本領(lǐng)等自身情況的問答。對于每個限定的問題域,相應(yīng)詞匯表的大小是有限的。在限定領(lǐng)域、有限詞匯的條件下,機器人基本可以與觀眾進行自由問答,并可以在不同的問題與之間相互切換。系統(tǒng)工作流程圖如下:

智能語音語義在產(chǎn)業(yè)化方面有哪些應(yīng)用

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    29748

    瀏覽量

    212969
  • 語音識別
    +關(guān)注

    關(guān)注

    39

    文章

    1782

    瀏覽量

    114250
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    804

    瀏覽量

    49531

原文標(biāo)題:智能語音主題月開啟,DNN時代語音技術(shù)的突破口在哪?

文章出處:【微信號:robotplaces,微信公眾號:機器人創(chuàng)新生態(tài)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    無噴粉三維掃描高反光場景的產(chǎn)業(yè)化實踐:激光偏振技術(shù)如何重塑精密測量

    精密制造、文物保護等領(lǐng)域,高反光場景下的三維測量長期面臨技術(shù)瓶頸。傳統(tǒng)噴粉測量雖能改善效果,但存在損傷物體、污染環(huán)境等弊端,難以滿足產(chǎn)業(yè)化需求。激光偏振技術(shù)的突破,推動無噴粉三維掃描高反光場景
    的頭像 發(fā)表于 07-07 09:42 ?127次閱讀
    無噴粉三維掃描<b class='flag-5'>在</b>高反光場景的<b class='flag-5'>產(chǎn)業(yè)化</b>實踐:激光偏振技術(shù)如何重塑精密測量

    敏芯股份入選江蘇省國家專利產(chǎn)業(yè)化樣板企業(yè)培育庫

    近日,根據(jù)國家知識產(chǎn)權(quán)局、工業(yè)和信息部、中國人民銀行、金融監(jiān)管總局、中國證監(jiān)會聯(lián)合印發(fā)的《專利產(chǎn)業(yè)化促進中小企業(yè)成長計劃實施方案》(以下簡稱“《實施方案》”),江蘇省知識產(chǎn)權(quán)局公布了全省進入國家專利產(chǎn)業(yè)化樣板企業(yè)培育庫名單,敏
    的頭像 發(fā)表于 06-20 17:49 ?732次閱讀

    智能語音交互方案客服領(lǐng)域的應(yīng)用

    在當(dāng)今數(shù)字浪潮中,客服領(lǐng)域正經(jīng)歷著前所未有的變革,智能語音交互方案憑借其高效、便捷的特性,成為推動這一變革的核心力量。其中,語音識別模型優(yōu)化私部署方案與
    的頭像 發(fā)表于 04-11 14:35 ?299次閱讀

    格科GC7272榮獲第八屆“IC創(chuàng)新獎”成果產(chǎn)業(yè)化

    近日,中國集成電路創(chuàng)新聯(lián)盟正式公布第八屆“IC創(chuàng)新獎”獲獎名單。格科GalaxyCore自主研發(fā)的觸控顯示驅(qū)動集成芯片(TDDI)GC7272憑借超1億顆出貨規(guī)模及自主技術(shù)產(chǎn)業(yè)化成果,榮膺“成果產(chǎn)業(yè)化獎”。這一獎項不僅是對格科技術(shù)創(chuàng)新的高度認可,更是對其
    的頭像 發(fā)表于 03-25 16:55 ?551次閱讀

    東風(fēng)汽車一體壓鑄產(chǎn)業(yè)化項目進入沖刺階段

    東風(fēng)汽車一體壓鑄產(chǎn)業(yè)化項目是東風(fēng)汽車新能源汽車領(lǐng)域關(guān)鍵制造技術(shù)項目,項目指揮部最新通報顯示,8月24日廠房將具備竣工驗收條件,預(yù)計9月15日產(chǎn)線開始聯(lián)調(diào),這一節(jié)點的確立,標(biāo)志著全球最大噸位一體壓鑄工廠正式進入投產(chǎn)倒計時。
    的頭像 發(fā)表于 03-21 09:16 ?419次閱讀

    宇樹科技物聯(lián)網(wǎng)方面

    場景中,如智能家居、智能工廠、智慧城市等。例如,與中大力德等企業(yè)減速器供應(yīng)方面合作,保障機器人關(guān)節(jié)運動的準(zhǔn)確性和穩(wěn)定性;與科大訊飛等企業(yè)
    發(fā)表于 02-04 06:48

    FPGAAI方面有哪些應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,對計算性能的需求也日益增長。FPGA(現(xiàn)場可編程門陣列)作為一種高性能、低功耗、可靈活編程的硬件平臺,正逐漸 AI 領(lǐng)域嶄露頭角,展現(xiàn)出獨特的優(yōu)勢,為 AI 應(yīng)用的落地
    的頭像 發(fā)表于 01-06 17:37 ?1406次閱讀

    基于W2605C語音識別合成芯片的智能語音交互鬧鐘方案-AI對話享受智能生活

    隨著科技的飛速發(fā)展,智能家居產(chǎn)品正逐步滲透到我們的日常生活中,其中智能鬧鐘作為時間管理的得力助手,也不斷進化?;赪2605C語音識別與語音
    的頭像 發(fā)表于 12-31 11:54 ?883次閱讀

    ADS1299微弱信號采集方面有哪些優(yōu)勢?

    我想請問下,該芯片在微弱信號采集方面有哪些優(yōu)勢?針對于每個通道的放大機理是什么?
    發(fā)表于 11-19 08:27

    芯馳科技出席SAECCE 2024汽車芯片關(guān)鍵技術(shù)及產(chǎn)業(yè)化應(yīng)用論壇

    近日,第三十一屆中國汽車工程學(xué)會年會暨展覽會(SAECCE 2024)重慶召開,芯馳科技資深產(chǎn)品市場總監(jiān)金輝受邀出席“汽車芯片關(guān)鍵技術(shù)及產(chǎn)業(yè)化應(yīng)用”論壇,并發(fā)表了《場景驅(qū)動,助力汽車智能化高效落地》的主題演講,與國內(nèi)外汽車企業(yè)
    的頭像 發(fā)表于 11-18 09:57 ?700次閱讀

    紫光同芯亮相SAECCE 2024汽車芯片關(guān)鍵技術(shù)及產(chǎn)業(yè)化應(yīng)用論壇

    近日,SAECCE 2024汽車芯片關(guān)鍵技術(shù)及產(chǎn)業(yè)化應(yīng)用論壇順利舉行。本次活動主要從汽車芯片關(guān)鍵技術(shù)、核心制造工藝、檢測認證體系建設(shè)及產(chǎn)業(yè)化應(yīng)用等方面討論我國當(dāng)前汽車芯片技術(shù)發(fā)展及產(chǎn)業(yè)
    的頭像 發(fā)表于 11-17 09:28 ?779次閱讀

    【實操文檔】智能硬件的大模型語音交互流程中接入RAG知識庫

    非常明顯的短板。盡管這些模型在理解和生成自然語言方面有極高的性能,但它們處理專業(yè)領(lǐng)域的問答時,卻往往不能給出明確或者準(zhǔn)確的回答。 這時就需要接一個專有知識庫來滿足產(chǎn)品專有和專業(yè)知識的回復(fù)需求,理論
    發(fā)表于 09-29 17:12

    固態(tài)電池產(chǎn)業(yè)化加速,企業(yè)積極布局市場

    電動的浪潮席卷全球之際,兩大核心驅(qū)動力——技術(shù)的持續(xù)革新與應(yīng)用領(lǐng)域的廣泛拓展,正引領(lǐng)著固態(tài)電池產(chǎn)業(yè)加速邁向產(chǎn)業(yè)化。固態(tài)電池企業(yè)在這一進程中,不僅要深耕技術(shù)路徑的優(yōu)化,還需精準(zhǔn)錨定契
    的頭像 發(fā)表于 09-20 15:15 ?964次閱讀

    FPGA人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    天合光能陳奕峰分析光伏技術(shù)產(chǎn)業(yè)化走勢

    7月24日,中國光伏行業(yè)年中會平行論壇“光伏產(chǎn)業(yè)發(fā)展投融資論壇”召開,天合光能副總裁、光伏科學(xué)與技術(shù)全國重點實驗室副主任陳奕峰博士受邀參加,并發(fā)表《光伏技術(shù)產(chǎn)業(yè)化走勢》的主題演講。
    的頭像 發(fā)表于 07-29 09:12 ?862次閱讀
    天合光能陳奕峰分析光伏技術(shù)<b class='flag-5'>產(chǎn)業(yè)化</b>走勢