完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 智能語(yǔ)音
語(yǔ)音識(shí)別技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別Automatic Speech Recognition,(ASR),其目標(biāo)是將人類的語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。
語(yǔ)音識(shí)別技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別Automatic Speech Recognition,(ASR),其目標(biāo)是將人類的語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。與說(shuō)話人識(shí)別及說(shuō)話人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語(yǔ)音的說(shuō)話人而非其中所包含的詞匯內(nèi)容。
語(yǔ)音識(shí)別技術(shù)的應(yīng)用包括語(yǔ)音撥號(hào)、語(yǔ)音導(dǎo)航、室內(nèi)設(shè)備控制、語(yǔ)音文檔檢索、簡(jiǎn)單的聽(tīng)寫數(shù)據(jù)錄入等。語(yǔ)音識(shí)別技術(shù)與其他自然語(yǔ)言處理技術(shù)如機(jī)器翻譯及語(yǔ)音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復(fù)雜的應(yīng)用,例如語(yǔ)音到語(yǔ)音的翻譯。
語(yǔ)音識(shí)別技術(shù)所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽(tīng)覺(jué)機(jī)理、人工智能等等。
語(yǔ)音識(shí)別技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別Automatic Speech Recognition,(ASR),其目標(biāo)是將人類的語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。與說(shuō)話人識(shí)別及說(shuō)話人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語(yǔ)音的說(shuō)話人而非其中所包含的詞匯內(nèi)容。
語(yǔ)音識(shí)別技術(shù)的應(yīng)用包括語(yǔ)音撥號(hào)、語(yǔ)音導(dǎo)航、室內(nèi)設(shè)備控制、語(yǔ)音文檔檢索、簡(jiǎn)單的聽(tīng)寫數(shù)據(jù)錄入等。語(yǔ)音識(shí)別技術(shù)與其他自然語(yǔ)言處理技術(shù)如機(jī)器翻譯及語(yǔ)音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復(fù)雜的應(yīng)用,例如語(yǔ)音到語(yǔ)音的翻譯。
語(yǔ)音識(shí)別技術(shù)所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽(tīng)覺(jué)機(jī)理、人工智能等等。
原理
語(yǔ)音識(shí)別系統(tǒng)提示客戶在新的場(chǎng)合使用新的口令密碼,這樣使用者不需要記住固定的口令,系統(tǒng)也不會(huì)被錄音欺騙。文本相關(guān)的聲音識(shí)別方法可以分為動(dòng)態(tài)時(shí)間伸縮或隱馬爾可夫模型方法。文本無(wú)關(guān)聲音識(shí)別已經(jīng)被研究很長(zhǎng)時(shí)間了,不一致環(huán)境造成的性能下降是應(yīng)用中的一個(gè)很大的障礙。
其工作原理:
動(dòng)態(tài)時(shí)間伸縮方法使用瞬間的、變動(dòng)倒頻。1963年Bogert et al出版了《回聲的時(shí)序倒頻分析》。通過(guò)交換字母順序,他們用一個(gè)含義廣泛的詞匯定義了一個(gè)新的信號(hào)處理技術(shù),倒頻譜的計(jì)算通常使用快速傅立葉變換。
從1975年起,隱馬爾可夫模型變得很流行。運(yùn)用隱馬爾可夫模型的方法,頻譜特征的統(tǒng)計(jì)變差得以測(cè)量。文本無(wú)關(guān)語(yǔ)音識(shí)別方法的例子有平均頻譜法、矢量量化法和多變量自回歸法。
平均頻譜法使用有利的倒頻距離,語(yǔ)音頻譜中的音位影響被平均頻譜去除。使用矢量量化法,語(yǔ)者的一套短期訓(xùn)練的特征向量可以直接用來(lái)描繪語(yǔ)者的本質(zhì)特征。但是,當(dāng)訓(xùn)練向量的數(shù)量很大時(shí),這種直接的描繪是不切實(shí)際的,因?yàn)榇鎯?chǔ)和計(jì)算的量變得離奇的大。所以嘗試用矢量量化法去尋找有效的方法來(lái)壓縮訓(xùn)練數(shù)據(jù)。Montacie et al在倒頻向量的時(shí)序中應(yīng)用多變量自回歸模式來(lái)確定語(yǔ)者特征,取得了很好的效果。
想騙過(guò)語(yǔ)音識(shí)別系統(tǒng)要有高質(zhì)量的錄音機(jī),那不是很容易買到的。一般的錄音機(jī)不能記錄聲音的完整頻譜,錄音系統(tǒng)的質(zhì)量損失也必須是非常低的。對(duì)于大多數(shù)的語(yǔ)音識(shí)別系統(tǒng),模仿的聲音都不會(huì)成功。用語(yǔ)音識(shí)別來(lái)辨認(rèn)身份是非常復(fù)雜的,所以語(yǔ)音識(shí)別系統(tǒng)會(huì)結(jié)合個(gè)人身份號(hào)碼識(shí)別或芯片卡。
語(yǔ)音識(shí)別系統(tǒng)得益于廉價(jià)的硬件設(shè)備,大多數(shù)的計(jì)算機(jī)都有聲卡和麥克風(fēng),也很容易使用。但語(yǔ)音識(shí)別還是有一些缺點(diǎn)的。語(yǔ)音隨時(shí)間而變化,所以必須使用生物識(shí)別模板。語(yǔ)音也會(huì)由于傷風(fēng)、嗓音沙啞、情緒壓力或是青春期而變化。語(yǔ)音識(shí)別系統(tǒng)比指紋識(shí)別系統(tǒng)有著較高的誤識(shí)率,因?yàn)槿藗兊穆曇舨幌裰讣y那樣獨(dú)特和唯一。對(duì)快速傅立葉變換計(jì)算來(lái)說(shuō),系統(tǒng)需要協(xié)同處理器和比指紋系統(tǒng)更多的效能。目前語(yǔ)音識(shí)別系統(tǒng)不適合移動(dòng)應(yīng)用或以電池為電源的系統(tǒng)。
可以說(shuō)人們的生活從古至今,無(wú)時(shí)無(wú)刻不與通信息息相關(guān)。因此千百年來(lái),人們一直在創(chuàng)造新的溝通方式上進(jìn)行不懈的努力和探索:語(yǔ)言的產(chǎn)生、文字的創(chuàng)造,互聯(lián)網(wǎng)的發(fā)展...
什么是智能語(yǔ)音技術(shù),怎么產(chǎn)生有哪些廠商?都在這里了趕緊收藏起來(lái)
語(yǔ)音識(shí)別技術(shù)的發(fā)展 與機(jī)器進(jìn)行語(yǔ)音交流,讓它聽(tīng)明白你在說(shuō)什么。語(yǔ)音識(shí)別技術(shù)將人類這一曾經(jīng)的夢(mèng)想變成了現(xiàn)實(shí)。語(yǔ)音識(shí)別就好比機(jī)器的聽(tīng)覺(jué)系統(tǒng),該技術(shù)讓機(jī)器通過(guò)...
NLP指在計(jì)算機(jī)讀取語(yǔ)言時(shí)將文本轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)的過(guò)程。簡(jiǎn)而言之,NLP是計(jì)算機(jī)的閱讀語(yǔ)言??梢源致缘卣f(shuō),在NLP中,系統(tǒng)攝取人語(yǔ),將其分解,分析,確定...
2019-06-12 標(biāo)簽:機(jī)器人智能語(yǔ)音自然語(yǔ)言處理 1.5萬(wàn) 0
對(duì)于如何做好一個(gè)智能音箱,筆者腦海里面最先浮現(xiàn)的是讀書那會(huì)兒圖書館、書店里面不斷沖擊眼球的《21天,C++從入門到精通》。當(dāng)然,很多時(shí)候讀完的感覺(jué)是,這...
智能語(yǔ)音交互是怎么實(shí)現(xiàn)交互流程中的輸入輸出呢?
智能語(yǔ)音交互是人工智能的分支,相當(dāng)于語(yǔ)音助手,屬于一款智能型的手機(jī)應(yīng)用,通過(guò)智能對(duì)話與即時(shí)問(wèn)答的智能交互,實(shí)現(xiàn)幫助用戶解決問(wèn)題的功能。
該公司推出了新一款全屋語(yǔ)音智能系統(tǒng),包括:智能管家、86型語(yǔ)音中控、智能開(kāi)關(guān)、智能插座、門窗傳感器、人體傳感器以及智能門鎖等產(chǎn)品,系統(tǒng)內(nèi)的各個(gè)產(chǎn)品成員可...
與此同時(shí),為保障用戶登陸的“安全性”,云知聲為平安好醫(yī)生客戶端聲紋登錄系統(tǒng)提供數(shù)字串注冊(cè)和登錄的“文本弱相關(guān)”技術(shù),工程難度更高,安全性更強(qiáng)。與傳統(tǒng)固定...
智能語(yǔ)音技術(shù)之麥克風(fēng)的主要技術(shù)特性分析
智能語(yǔ)音助理成為當(dāng)紅炸子雞,作為相關(guān)應(yīng)用不可或缺的聲音感測(cè)器,麥克風(fēng)的市場(chǎng)規(guī)模也將出現(xiàn)明顯爆發(fā),其中又以MEMS麥克風(fēng)受惠最大。至于駐極體麥克風(fēng)(ECM...
2017-12-20 標(biāo)簽:mems麥克風(fēng)頻率響應(yīng) 1.0萬(wàn) 0
究竟什么是智能電視?這是一個(gè)很好的問(wèn)題?,F(xiàn)在很多電視品牌都在智能這個(gè)問(wèn)題上大做文章,都號(hào)稱自己是智能電視,但始終沒(méi)有給大家一個(gè)明確的答案。其實(shí)想要給智能...
智能語(yǔ)音產(chǎn)品的詳細(xì)介紹及形態(tài)的詳細(xì)資料概述
目前圍繞著智能音箱語(yǔ)音助理的產(chǎn)品,在以Alexa、Google Assistant為中心層出不窮,產(chǎn)品形態(tài)也是多樣化,首先看看圍繞著語(yǔ)音助理作為載體的產(chǎn)...
1
1
SYN6658語(yǔ)音合成芯片引領(lǐng)停車場(chǎng)收費(fèi)系統(tǒng)走向巔峰
標(biāo)簽:語(yǔ)音合成智能語(yǔ)音語(yǔ)音合成技術(shù) 4894 1
0
1
新品TTS芯片SYN8086模塊開(kāi)箱評(píng)測(cè)和一張可愛(ài)的手繪說(shuō)明書
標(biāo)簽:語(yǔ)音合成智能語(yǔ)音語(yǔ)音合成芯片 3551 0
ASR語(yǔ)音識(shí)別技術(shù)的介紹應(yīng)用和優(yōu)勢(shì)及實(shí)際案例分析立即下載
類別:人工智能 2018-10-17 標(biāo)簽:語(yǔ)音識(shí)別ASR智能語(yǔ)音
NXP4330智能語(yǔ)音主板的電路原理圖免費(fèi)下載立即下載
類別:PCB設(shè)計(jì)規(guī)則 2019-10-23 標(biāo)簽:主板智能語(yǔ)音
智能電話機(jī)器人如何提高團(tuán)隊(duì)業(yè)績(jī)?詳細(xì)資料免費(fèi)下載立即下載
類別:人工智能 2018-09-05 標(biāo)簽:機(jī)器人神經(jīng)網(wǎng)絡(luò)AI
電話銷售機(jī)器人系統(tǒng)還有哪些缺點(diǎn)需要改善?立即下載
類別:人工智能 2018-08-28 標(biāo)簽:機(jī)器人計(jì)算機(jī)智能語(yǔ)音
使用Arduino進(jìn)行智能語(yǔ)音燈設(shè)計(jì)的接線說(shuō)明和程序資料免費(fèi)下載立即下載
類別:C語(yǔ)言|源代碼 2019-05-27 標(biāo)簽:程序智能語(yǔ)音Arduino
騰訊聽(tīng)聽(tīng)、天貓精靈、小愛(ài)同學(xué)、小度在家對(duì)比評(píng)測(cè)_哪個(gè)更好?
騰訊聽(tīng)聽(tīng)、天貓精靈、小愛(ài)同學(xué)、小度在家一個(gè)個(gè)可愛(ài)名字的背后,是智能語(yǔ)音,及其硬件市場(chǎng)的廝殺。除了國(guó)內(nèi)企業(yè),還要面對(duì)國(guó)際上的一眾玩家,雖然亞馬遜Echo還...
2018-06-24 標(biāo)簽:智能語(yǔ)音 44.7萬(wàn) 0
前身安徽中科大訊飛信息科技有限公司,成立于1999年12月30日,2014年4月18日變更為科大訊飛股份有限公司 ,專業(yè)從事智能語(yǔ)音及語(yǔ)言技術(shù)研究、軟件...
四款智能語(yǔ)音機(jī)器人對(duì)比測(cè)試 哪個(gè)最好
關(guān)于智能語(yǔ)音機(jī)器人,想必大家都不陌生,它們?cè)谀撤N程度上給我們帶來(lái)了極大的便利。
科大訊飛智能語(yǔ)音技術(shù),能幫助聽(tīng)障人士“看見(jiàn)”聲音 能人與人的交流
今年5月19日,全國(guó)助殘日,訊飛聽(tīng)見(jiàn)APP正式聯(lián)合中國(guó)聾人協(xié)會(huì)發(fā)起“聽(tīng)見(jiàn)A.I.的聲音”關(guān)愛(ài)聽(tīng)障人士公益行動(dòng),通過(guò)借助科大訊飛智能語(yǔ)音技術(shù),幫助聽(tīng)障人士...
科大訊飛股份有限公司(IFLYTEK CO.,LTD.),前身安徽中科大訊飛信息科技有限公司,成立于1999年12月30日,2014年4月18日變更為科...
2018-03-05 標(biāo)簽:語(yǔ)音技術(shù)智能語(yǔ)音科大訊飛 6.0萬(wàn) 0
天貓精靈(TmallGenie)是阿里巴巴人工智能實(shí)驗(yàn)室(Alibaba A.I.Labs)于2017年7月5日發(fā)布的AI智能產(chǎn)品品牌,當(dāng)天同步發(fā)布了天...
RK3308和RK3326是Rockchip今年全新推出的AI智能語(yǔ)音方案
據(jù)前瞻產(chǎn)業(yè)研究院數(shù)據(jù)顯示,預(yù)計(jì)今年我國(guó)的智能家居市場(chǎng)規(guī)模將達(dá)1800億元,2020年將達(dá)到3576億元,2021年更將達(dá)5000多億元,龐大的市場(chǎng)空間將...
2018-08-02 標(biāo)簽:芯片智能語(yǔ)音可制造性設(shè)計(jì) 5.6萬(wàn) 0
科大智能科技股份有限公司是由安徽東財(cái)投資管理有限公司、中國(guó)科學(xué)技術(shù)大學(xué)及部分自然人股東于2002年共同發(fā)起成立的,專業(yè)從事配電自動(dòng)化系統(tǒng)、用電自動(dòng)化系統(tǒng)...
訊飛轉(zhuǎn)寫機(jī)重磅發(fā)布 開(kāi)創(chuàng)語(yǔ)音轉(zhuǎn)寫全新品類
近日,上海世博中心,科大訊飛董事長(zhǎng)劉慶峰在“科大訊飛2019新品發(fā)布會(huì)”上剛剛做完一場(chǎng)半個(gè)多小時(shí)的主題演講,遠(yuǎn)在四百公里之外的安徽合肥總部,科大訊飛園區(qū)...
科大訊飛翻譯機(jī)怎么樣_科大訊飛翻譯機(jī)測(cè)評(píng)
科大訊飛股份有限公司(IFLYTEK CO.,LTD.),前身安徽中科大訊飛信息科技有限公司,成立于1999年12月30日,2014年4月18日變更為科...
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語(yǔ)言教程專題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無(wú)刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺(jué) | 無(wú)人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國(guó)民技術(shù) | Microchip |
Arduino | BeagleBone | 樹(shù)莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |