99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于增量K均值分段HMM的識別算法在微機器人控制系統(tǒng)中的應(yīng)用

電子設(shè)計 ? 來源:郭婷 ? 作者:電子設(shè)計 ? 2018-12-07 08:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言

據(jù)統(tǒng)計,人類日常生活中的溝通大約有75%左右是通過語言來完成的。語言作為人類特有的功能,不但是相互傳遞信息的主要手段,也是人們最理想的人機交互方式之一。在現(xiàn)代社會機器人這個詞語已經(jīng)不再新鮮。有些機器人已經(jīng)走進(jìn)了我們的生活,成為我們生活的組成部分。在下文我們要講的是基于毫米級全方位無回轉(zhuǎn)半徑移動機器人課題。我們微系統(tǒng)配置示意圖如圖1所示。主要由主機Host(配有圖像采集卡)、兩個CCD攝像頭(其中一個為顯微攝像頭)、微移動裝配平臺、微機器人本體和系統(tǒng)控制電路板等組成。計算機和攝像機組用于觀察微機器人的方位,控制系統(tǒng)控制微機器人的移動。

基于增量K均值分段HMM的識別算法在微機器人控制系統(tǒng)中的應(yīng)用

與機器進(jìn)行語音交流,讓機器明白你說什么,這是人們長期以來夢寐以求的事情。語音識別技術(shù)就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語音識別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個方面。 本文在系統(tǒng)控制電路中嵌入式實現(xiàn)語音識別算法,通過語音控制微機器人。也就是說可以通過你的話微型機器人做出相應(yīng)的動作。

微機器人控制系統(tǒng)的資源有限,控制方法比較復(fù)雜,并且需要有較高人的實時性,因此本文采用的語音識別算法必須簡單、識別率高、占用系統(tǒng)資源少。畢竟微型機器人里面能放的東西有限,放多了東西雖然提高了語音識別率或者工作效率,但是也加大了微型機器人的體積,說不定就不能做有些工作。

隱馬爾可夫模型(Hidden Markov Model,HMM)作為一種統(tǒng)計分析模型,創(chuàng)立于20世紀(jì)70年代。80年代得到了傳播和發(fā)展,成為信號處理的一個重要方向,現(xiàn)已成功地用于語音識別,行為識別,文字識別以及故障診斷等領(lǐng)域。HMM(隱馬爾可夫模型)的適應(yīng)性強、識別率高,是當(dāng)前語音識別的主流算法。使用基于HMM非特定人的語音識別算法雖然借助模板匹配減小了識別所需的資源,但是前期的模板儲存工作需要大量的計算和存儲空間,因此移植到嵌入式系統(tǒng)還有一定的難度,所以很多嵌入式應(yīng)用平臺的訓(xùn)練部分仍在PC機上實現(xiàn)。

為了使訓(xùn)練和識別都在嵌入式系統(tǒng)上實現(xiàn),本文給出了一種基于K均值分段HMM模型的實時學(xué)習(xí)語音識別算法,不僅解決了上述問題,而且做到了智能化,實現(xiàn)了真正意義上的自動語音識別。

1 增量K均值分段HMM的算法及實現(xiàn)

由于語音識別過程中非特定的因素較多,為了提高識別的準(zhǔn)確率,針對本系統(tǒng)的特點,采用動態(tài)改變識別參數(shù)的方法提高系統(tǒng)的識別率。

語音識別方法主要是模式匹配法。 在訓(xùn)練階段,用戶將詞匯表中的每一詞依次說一遍,并且將其特征矢量作為模板存入模板庫。 在識別階段,將輸入語音的特征矢量依次與模板庫中的每個模板進(jìn)行相似度比較,將相似度最高者作為識別結(jié)果輸出。

訓(xùn)練算法是HMM中運算量最大、最復(fù)雜的部分,訓(xùn)練算法的輸出是即將存儲的模型。目前的語音識別系統(tǒng)大都使用貝斯曼參數(shù)的HMM模型,采取最大似然度算法。這些算法通常是批處理函數(shù),所有的訓(xùn)練數(shù)據(jù)要在識別之前訓(xùn)練好并存儲。因此很多嵌入式系統(tǒng)因為資源有限不能達(dá)到高識別率和實時輸出。

本系統(tǒng)采用了自適應(yīng)增量K均值分段算法。在每次輸入新的語句時都連續(xù)地計算而不對前面的數(shù)據(jù)進(jìn)行存儲,這可以節(jié)約大量的時間和成本。輸入語句時由系統(tǒng)的識別結(jié)果判斷輸入語句的序號,并對此語句的參數(shù)動態(tài)地修改,真正做到了實時學(xué)習(xí)。

K均值分段算法是基于最佳狀態(tài)序列的理論,因此可以采用Viterbi算法得到最佳狀態(tài)序列,從而方便地在線修改系統(tǒng)參數(shù),使訓(xùn)練的速度大大提高。

為了達(dá)到本系統(tǒng)所需要的功能,對通常的K均值算法作了一定的改進(jìn)。在系統(tǒng)無人監(jiān)管的情況下,Viterbi解碼計算出最大相似度的語音模型,根據(jù)這個假設(shè)計算分段K均值算法的輸入?yún)?shù),對此模型進(jìn)行參數(shù)重估。首先按照HMM模型的狀態(tài)數(shù)進(jìn)行等間隔分段,每個間隔的數(shù)據(jù)段作為某一狀態(tài)的訓(xùn)練數(shù)據(jù),計算模型的初始參數(shù)λ=f(a,A,B)。采用Viterbi的最佳狀態(tài)序列搜索,得到當(dāng)前最佳狀態(tài)序列參數(shù)和重估參數(shù)θ,其中概率密度函數(shù)P(X,S|θ)代替了最大似然度算法中的P(X,θ),在不同的馬爾科夫狀態(tài)和重估之間跳轉(zhuǎn)?;贙均值算法的參數(shù)重估流程如下:

基于增量K均值分段HMM的識別算法在微機器人控制系統(tǒng)中的應(yīng)用

為了使參數(shù)能更快地收斂,在每幀觀察語音最佳狀態(tài)序列的計算結(jié)束后,加入一個重估過程,以求更快地響應(yīng)速度。

基于增量K均值分段HMM的識別算法在微機器人控制系統(tǒng)中的應(yīng)用

可以看到,增量K均值算法的特點為:在每次計算完觀察值最佳狀態(tài)序列后,插入一個重估過程。隨時調(diào)整參數(shù)以識別下一個句子。

由于采用混合高斯密度函數(shù)作為輸出概率分布可以達(dá)到較好的識別效果,因此本文采用M的混合度對數(shù)據(jù)進(jìn)行訓(xùn)練。

對λ重估,并比較收斂性,最終得到HMM模型參數(shù)訓(xùn)練結(jié)果。

可見,用K均值法在線修改時,一次數(shù)據(jù)輸入會有多次重估過程,這使系統(tǒng)使用最近的模型估計后續(xù)語句的最佳狀態(tài)序列成為可能。但是對于在線修改參數(shù)要求,快速收斂是很重要的。為了得到更好的Viterbi序列,最佳狀態(tài)序列使用了漸增的算法模型,即快速收斂算法。

語音識別的具體實現(xiàn)過程為:數(shù)字語音信號通過預(yù)處理和特征向量的提取,用戶通過按鍵選擇學(xué)習(xí)或者識別模式;如果程序進(jìn)入訓(xùn)練過程,即用戶選擇進(jìn)行新詞條的學(xué)習(xí),則用分段K均值法對數(shù)據(jù)進(jìn)行訓(xùn)練得到模板;如果進(jìn)入識別模式,則從Flash中調(diào)出聲音特征向量,進(jìn)行HMM算法識別。在識別出結(jié)果后,立即將識別結(jié)果作為正確結(jié)果與前一次的狀態(tài)做比較,得到本詞條更好的模板,同時通過LED數(shù)字顯示和語音輸出結(jié)果。系統(tǒng)軟件流程如圖2所示。

基于增量K均值分段HMM的識別算法在微機器人控制系統(tǒng)中的應(yīng)用

對采集到的語音進(jìn)行16kHz、12位量化,并對數(shù)字語音信號進(jìn)行預(yù)加重:

基于增量K均值分段HMM的識別算法在微機器人控制系統(tǒng)中的應(yīng)用

L選擇為320個點,用短時平均能量和平均過零率判斷起始點,去除不必要的信息。

對數(shù)據(jù)進(jìn)行FFT運算,得到能量譜,通過24通道的帶通濾波輸出X(k),然后再通過DCT運算,提取12個MFCC系數(shù)和一階二階對數(shù)能量,提取38個參數(shù)可以使系統(tǒng)識別率得到提高。

為了進(jìn)行連接詞識別,需要由訓(xùn)練數(shù)據(jù)得到單個詞條的模型。方法為:首先從連接詞中分離出每個孤立的詞條,然后再進(jìn)行孤立詞條的模型訓(xùn)練。對于本系統(tǒng)不定長詞條的情況,每個詞條需要有一套初始的模型參數(shù),然后按照分層構(gòu)筑的HMM算法將所有詞串分成孤立的詞條。對每個詞條進(jìn)行參數(shù)的重估,判斷是否收斂。如果差異小于某個域值就判斷為收斂;否則將得到的參數(shù)作為新的初始參數(shù)再進(jìn)行重估,直到收斂。

當(dāng)然本系統(tǒng)還要對語音進(jìn)行前端處理工作。主要是指在特征提取之前,先對原始語音進(jìn)行處理,部分消除噪聲和不同說話人帶來的影響,使處理后的信號更能反映語音的本質(zhì)特征。最常用的前端處理有端點檢測和語音增強。端點檢測是指在語音信號中將語音和非語音信號時段區(qū)分開來,準(zhǔn)確地確定出語音信號的起始點。經(jīng)過端點檢測后,后續(xù)處理就可以只對語音信號進(jìn)行,這對提高模型的精確度和識別正確率有重要作用。語音增強的主要任務(wù)就是消除環(huán)境噪聲對語音的影響。目前通用的方法是采用維納濾波,該方法在噪聲較大的情況下效果好于其它濾波器。

2 實驗結(jié)果

實驗采用30個人(15男,15女)的聲音模型進(jìn)行識別。首先由10人(5男,5女)對5個命令詞(前進(jìn)、后退、左移、右移、快速)分別進(jìn)行初始數(shù)據(jù)訓(xùn)練,每人每詞訓(xùn)練10次,得到訓(xùn)練模板。然后再由這30人隨機進(jìn)行非特定人語音識別。采用6狀態(tài)的HMM模型,高斯混合度選為14,得到圖3的實驗結(jié)果。

基于增量K均值分段HMM的識別算法在微機器人控制系統(tǒng)中的應(yīng)用

逐步增加高斯混合度數(shù)目,可以得到圖4的實驗結(jié)果??梢姼咚够旌隙仍?8的時候達(dá)到較好的識別效果,混合度太高識別率反而會有所下降,這是由于嵌入式系統(tǒng)的資源有限,運算復(fù)雜度的增長超過了嵌入式設(shè)備的限制所造成的。

基于增量K均值分段HMM的識別算法在微機器人控制系統(tǒng)中的應(yīng)用

為了使微機器人能夠正確地執(zhí)行人的聲音指令,本文將語音識別的過程嵌入微機器人的控制系統(tǒng)中,根據(jù)微機器人控制系統(tǒng)資源有限、對實時性要求高的特點,使用增量K均值分段HMM的算法,簡化計算節(jié)省了所需的硬件資源,實現(xiàn)了實時學(xué)習(xí)的語音識別,能方便地對微機器人進(jìn)行控制。

本系統(tǒng)的識別率達(dá)到了較高的標(biāo)準(zhǔn),又由于加入了智能化的用戶選擇部分,用戶可隨時選擇學(xué)習(xí)新的語句,使其有更廣闊的應(yīng)用前景。

結(jié)論

本文介紹了一種應(yīng)用于微機器人控制平臺的語音識別算法,可實現(xiàn)簡單命令詞語的識別,控制微機器人的移動。利用K均值分段法,在每次計算完觀察值最佳狀態(tài)序列后,插入一個重估過程,隨時調(diào)整參數(shù)以識別下一個句子。實驗結(jié)果表明,這種實時學(xué)習(xí)的語音識別算法適合嵌入式應(yīng)用。當(dāng)然由于嵌入式平臺受到處理速度、存儲空間的限制,所以能夠?qū)ξC器人發(fā)出的指令十分有限,識別率還有待提高。因此,研究語音識別算法,比較各種算法的優(yōu)缺點,進(jìn)而在嵌入式微機器人控制系統(tǒng)上實現(xiàn)大詞匯量非特定人的語音識別,實現(xiàn)真正意義上的人機交流是今后進(jìn)一步的工作。相信在科學(xué)技術(shù)的發(fā)展迅速社會背景下,這個語音控制微型機器人的技術(shù)會逐漸發(fā)展起來,最終達(dá)到人機交流與人人交流一般。讓微型機器人的應(yīng)用更加廣泛。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 控制系統(tǒng)
    +關(guān)注

    關(guān)注

    41

    文章

    6781

    瀏覽量

    112191
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    29748

    瀏覽量

    212940
  • 攝像頭
    +關(guān)注

    關(guān)注

    61

    文章

    4982

    瀏覽量

    98420
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強勁的運算性能,能夠高效處理語音機器人運行過程的復(fù)雜任務(wù)。語音識別和合成需要大量的計算資源,該處理器可以快速對語音信號進(jìn)行分析、處理和轉(zhuǎn)換。實時語音交互
    發(fā)表于 05-28 11:36

    詳細(xì)介紹機場智能指路機器人的工作原理

    路徑。路徑規(guī)劃算法會考慮多種因素,如距離最短、避開人流密集區(qū)域、優(yōu)先選擇寬闊通道等,以確保旅客能夠快速、順暢地到達(dá)目的地。 實時導(dǎo)航與避障 :機器人引導(dǎo)旅客的過程,導(dǎo)航
    發(fā)表于 05-10 18:26

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用

    部署,詳細(xì)介紹了基于顏色閾值和深度學(xué)習(xí)的巡線方法。 二維碼識別則廣泛應(yīng)用于機器人定位與任務(wù)觸發(fā),例如AGV(自動導(dǎo)引車)的路徑規(guī)劃。 深度學(xué)習(xí)機器人視覺
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】機器人入門的引路書

    ROS的全稱:Robot Operating System 機器人操作系統(tǒng) ROS的 目的 :ROS支持通用庫,是通信總線,協(xié)調(diào)多個傳感器 為了解決機器人里各廠商模塊不通用的問題,讓機器人
    發(fā)表于 04-30 01:05

    電機微機控制系統(tǒng)可靠性分析

    方法。各種技術(shù)措施合理搭配才能有效地提高電機微機控制系統(tǒng)的可靠性。 電機微機控制系統(tǒng)的研制過程
    發(fā)表于 04-29 16:14

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】+內(nèi)容初識

    出有用的信息,如障礙物的位置和形狀。對于攝像頭數(shù)據(jù),可以使用 OpenCV 等圖像處理庫進(jìn)行圖像識別、目標(biāo)跟蹤等操作,為機器人的導(dǎo)航和決策提供支持。 運動控制:運動控制
    發(fā)表于 04-27 11:24

    基于先進(jìn)MCU的機器人運動控制系統(tǒng)設(shè)計:理論、實踐與前沿技術(shù)

    AS32A601為例,全面闡述其機器人運動控制領(lǐng)域的卓越性能與廣泛應(yīng)用前景,旨在為機器人技術(shù)多領(lǐng)域的深化發(fā)展提供有力支撐。 關(guān)鍵詞 :M
    的頭像 發(fā)表于 04-27 10:58 ?291次閱讀

    高安全低功耗MCU:機器人控制系統(tǒng)的智能化與可靠性提升

    。機器人不斷向更復(fù)雜、更智能的方向發(fā)展的當(dāng)下,對控制系統(tǒng)的性能要求也成倍提升。高安全性和低功耗成為了機器人
    的頭像 發(fā)表于 04-20 15:13 ?362次閱讀

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎(chǔ)模塊

    具身智能機器人的基礎(chǔ)模塊,這個是本書的第二部分內(nèi)容,主要分為四個部分:機器人計算系統(tǒng),自主機器人的感知系統(tǒng),自主
    發(fā)表于 01-04 19:22

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型

    的設(shè)計不僅提高了機器人對環(huán)境的理解能力,還使其能夠更精準(zhǔn)地執(zhí)行復(fù)雜任務(wù)。 擴(kuò)散模型的新思路 除了大模型,擴(kuò)散模型的引入為機器人控制開辟了新的研究方向。以UniPi為代表的創(chuàng)新工作
    發(fā)表于 12-29 23:04

    【「具身智能機器人系統(tǒng)」閱讀體驗】1.初步理解具身智能

    重要。 書中還詳細(xì)介紹了支持具身智能機器人的核心技術(shù)系統(tǒng),包括自主機器人計算系統(tǒng)、感知系統(tǒng)、定位系統(tǒng)
    發(fā)表于 12-28 21:12

    【「具身智能機器人系統(tǒng)」閱讀體驗】1.全書概覽與第一章學(xué)習(xí)

    機器人的背景知識,特別是結(jié)合了當(dāng)前的產(chǎn)業(yè)發(fā)展介紹了相應(yīng)的問題與挑戰(zhàn),并講解了具身智能機器人的歷史發(fā)展和未來走向。 之后第二部分,從機器人計算系統(tǒng)
    發(fā)表于 12-27 14:50

    《具身智能機器人系統(tǒng)》第1-6章閱讀心得之具身智能機器人系統(tǒng)背景知識與基礎(chǔ)模塊

    搜索策略等規(guī)劃算法,強調(diào)了軌跡規(guī)劃需要考慮機器人的運動學(xué)約束。軌跡規(guī)劃,機器人需要同時考慮最大曲率、加速度限制等物理約束,生成平滑可行的
    發(fā)表于 12-19 22:26

    編碼器機器人技術(shù)的應(yīng)用 編碼器傳感器系統(tǒng)的作用

    測量機器人位置和移動的裝置,它能夠?qū)?b class='flag-5'>機器人位置和運動轉(zhuǎn)化為數(shù)字信號,以供機器人控制系統(tǒng)使用。編碼器機器
    的頭像 發(fā)表于 11-24 10:02 ?1621次閱讀

    FPGA人工智能的應(yīng)用有哪些?

    :FPGA語音識別領(lǐng)域也有廣泛應(yīng)用。通過算法優(yōu)化和硬件自適應(yīng)能力,F(xiàn)PGA可以實現(xiàn)高效的語音信號處理和識別,提供低延時、高精度的語音識別系統(tǒng)
    發(fā)表于 07-29 17:05