資料介紹
描述
本實(shí)驗(yàn)的目的:
在本實(shí)驗(yàn)中,我們分析了“Khule Dao”和“Bondho Koro”的真實(shí)音頻信號(hào)。之后,我們開發(fā)了一種算法,可以自動(dòng)識(shí)別測(cè)試數(shù)據(jù)。
研究趨勢(shì):
這里簡(jiǎn)要討論最近關(guān)于孟加拉語(yǔ)語(yǔ)音識(shí)別的兩項(xiàng)研究。
在語(yǔ)音識(shí)別方面,世界各地在各種語(yǔ)言中進(jìn)行了大量的研究實(shí)驗(yàn)并取得了成果。但是,在孟加拉語(yǔ)中,該領(lǐng)域的早期研究人員取得了一定的成功,盡管近年來(lái)情況正在發(fā)生變化。本研究工作旨在開發(fā)一種基于神經(jīng)網(wǎng)絡(luò)的孟加拉語(yǔ)連接數(shù)字識(shí)別系統(tǒng)。首先,開發(fā)了一個(gè)由男性和女性說(shuō)話者組成的孟加拉語(yǔ)數(shù)字語(yǔ)料庫(kù)。語(yǔ)音以連接方式記錄,單詞通過(guò)自動(dòng)分割提取。然后計(jì)算分割詞的 MFCC 特征,并將這些特征值作為輸入發(fā)送到反向傳播神經(jīng)網(wǎng)絡(luò) (BPNN)。BPNN 學(xué)習(xí)算法用于訓(xùn)練網(wǎng)絡(luò)。訓(xùn)練網(wǎng)絡(luò)所需的時(shí)間、隱藏層的數(shù)量、在訓(xùn)練網(wǎng)絡(luò)以達(dá)到最佳識(shí)別精度時(shí),會(huì)考慮錯(cuò)誤閾值和時(shí)期數(shù)。這個(gè)提議的系統(tǒng)已經(jīng)使用面向?qū)ο蟮?a target='_blank' class='arckwlink_none'>編程實(shí)現(xiàn)了,所獲得的識(shí)別精度非常令人滿意和一致。該網(wǎng)絡(luò)已經(jīng)針對(duì)三種不同的設(shè)置進(jìn)行了測(cè)試,數(shù)字?jǐn)?shù)據(jù)集的最佳識(shí)別準(zhǔn)確率為 98.46%。[1]
語(yǔ)音識(shí)別是一種生物識(shí)別技術(shù),用于識(shí)別特定的個(gè)人語(yǔ)音。特定語(yǔ)音的語(yǔ)音波構(gòu)成了說(shuō)話人識(shí)別的基礎(chǔ)。我們可以在電話銀行、電話購(gòu)物、訪問(wèn)數(shù)據(jù)庫(kù)信息和語(yǔ)音郵件等多個(gè)應(yīng)用領(lǐng)域使用語(yǔ)音識(shí)別。語(yǔ)音識(shí)別的強(qiáng)大應(yīng)用之一是出于安全目的,一個(gè)人可以輸入他/她的語(yǔ)音進(jìn)行身份驗(yàn)證。每種類型的聲音都有其獨(dú)特的特征,稱為特征,從單個(gè)聲音中提取這些特征的過(guò)程稱為特征提取。將提取的語(yǔ)音特征與數(shù)據(jù)庫(kù)中已保存的語(yǔ)音進(jìn)行比較以進(jìn)行匹配。[2]
提取技術(shù):
audioread、num2str、strcat、fft、abs、最大值、長(zhǎng)度。
建議功能:
1.我們的技術(shù)特點(diǎn)是基于快速傅立葉變換(fft)的簡(jiǎn)單語(yǔ)音識(shí)別系統(tǒng)。
2.首先使用MATLAB的audioread函數(shù)分析音頻信號(hào)
對(duì)于 I = 1:116
s1 ='Z:\EEE 309\Open_Ended\Train_Data\Train_Open\OP-';
s2 = num2str(i);
s3 = '.mp3';
文件1 = strcat(s1,s2,s3);
如果存在 (file1, 'file') == [y, t] = audioread(file1);
3. 然后對(duì)所有循環(huán)中的所有信號(hào)的給定輸入數(shù)據(jù)應(yīng)用 fft
NFFT=長(zhǎng)度(y);% 找到 y 的長(zhǎng)度
x=fft(y, NFFT);
4.使用max函數(shù)求最大幅度
x1=abs(x);
F=((0:1/NFFT:1-1/NFFT)*Fs);
max_amp=max(x1);
5.使用find函數(shù)找到最大幅度的對(duì)應(yīng)頻率
b=find(x1==max_amp(1));
F_KD_max(i)=F(b(1));
6. “Khule Dao”和“Bondho Koro”的頻率值相加并取平均值
7. if(F_KD_max(i)>50 && F_KD_max(i)<600)
c1 = c1 +1;
sum1=sum1+F_KD_max(i);
結(jié)尾
average_max_frequency_of_Khule_Dao=sum1/c1
8. 我們建議,如果測(cè)試數(shù)據(jù)的頻率之差(絕對(duì)值)對(duì)應(yīng)于最大幅度,并且“Khule Dao”的平均頻率值小于測(cè)試數(shù)據(jù)的頻率與“Bondho Koro”的平均頻率之差,那么測(cè)試數(shù)據(jù)將被預(yù)測(cè)為“Khule Dao”,反之亦然“Bondho Koro”
Diff_khule_dao_max(i)= abs(F_max(i)-average_max_frequency_of_Khule_Dao);
Diff_bondo_koro_max(i)= abs(F_max(i)-average_max_frequency_of_bondo_koro);
if(Diff_bondo_koro_max(i) >= Diff_khule_dao_max(i))
disp('Khule 道')
No_of_khule_dao=No_of_khule_dao+1;
別的
disp('邦多科羅')
No_of_bondho_koro=No_of_bondho_koro+1;
?
- 自定義神經(jīng)網(wǎng)絡(luò)對(duì)象識(shí)別開源分享
- 開源硬件邊緣語(yǔ)音識(shí)別
- 語(yǔ)音識(shí)別芯片LD3320開發(fā)手冊(cè) 45次下載
- NRK330X語(yǔ)音識(shí)別芯片離線語(yǔ)音喚醒模塊資料說(shuō)明書!
- 語(yǔ)音識(shí)別_ML-KWS-for-MCU_資料整理
- NRK220X語(yǔ)音識(shí)別模塊語(yǔ)音芯片語(yǔ)音ic數(shù)據(jù)資料
- 結(jié)合MFCC和特征的語(yǔ)音情感識(shí)別方法 23次下載
- 基于性能影響因素分析的語(yǔ)音識(shí)別平臺(tái)體系結(jié)構(gòu) 20次下載
- 基于改進(jìn)長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的兒童語(yǔ)音情感識(shí)別模型 14次下載
- 如何使用LVQ進(jìn)行普米語(yǔ)語(yǔ)譜圖的識(shí)別說(shuō)明 7次下載
- 如何進(jìn)行馬來(lái)語(yǔ)語(yǔ)音合成系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)概述 4次下載
- 如何使用MATLAB進(jìn)行語(yǔ)音識(shí)別算法研究的論文資料免費(fèi)下載 44次下載
- 科大訊飛5.0語(yǔ)音軟件的安裝和操作要領(lǐng)資料說(shuō)明 11次下載
- 緬甸語(yǔ)分詞方法及其實(shí)現(xiàn)方法來(lái)開發(fā)緬甸語(yǔ)的語(yǔ)音合成系統(tǒng) 0次下載
- 云知聲語(yǔ)音識(shí)別開發(fā)平臺(tái) 27次下載
- 自動(dòng)語(yǔ)音識(shí)別技術(shù)基本指南 2027次閱讀
- 基于JuliUS語(yǔ)音識(shí)別引擎實(shí)現(xiàn)機(jī)器人孤立詞語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì) 1809次閱讀
- dfrobot語(yǔ)音識(shí)別控制板 介紹 3202次閱讀
- firefly百度人臉識(shí)別開發(fā)套件介紹 2333次閱讀
- 語(yǔ)音識(shí)別系統(tǒng)功能_語(yǔ)音識(shí)別系統(tǒng)的應(yīng)用 5694次閱讀
- 語(yǔ)音識(shí)別芯片的原理_語(yǔ)音識(shí)別芯片有哪些 5308次閱讀
- 一文解讀語(yǔ)音識(shí)別的運(yùn)行原理 3949次閱讀
- 語(yǔ)音識(shí)別技術(shù)的發(fā)展歷程,語(yǔ)音識(shí)別是如何工作的?語(yǔ)音識(shí)別資料概述 1w次閱讀
- 深度學(xué)習(xí)進(jìn)行語(yǔ)音識(shí)別的方法 如何建立自己的語(yǔ)音識(shí)別系統(tǒng) 1w次閱讀
- 語(yǔ)音識(shí)別技術(shù)的發(fā)展及難點(diǎn)分析 2.3w次閱讀
- 語(yǔ)音識(shí)別技術(shù)是什么_語(yǔ)音識(shí)別技術(shù)應(yīng)用領(lǐng)域介紹 1.6w次閱讀
- 語(yǔ)音識(shí)別技術(shù)原理全面解析 1.2w次閱讀
- 語(yǔ)音識(shí)別技術(shù)的應(yīng)用及發(fā)展 2346次閱讀
- 基于語(yǔ)音識(shí)別技術(shù)的聲控鼠標(biāo)光標(biāo)程序設(shè)計(jì) 5195次閱讀
- 如何關(guān)閉word語(yǔ)音識(shí)別 (數(shù)據(jù)丟失) 5179次閱讀
下載排行
本周
- 1DD3118電路圖紙資料
- 0.08 MB | 1次下載 | 免費(fèi)
- 2AD庫(kù)封裝庫(kù)安裝教程
- 0.49 MB | 1次下載 | 免費(fèi)
- 3PC6206 300mA低功耗低壓差線性穩(wěn)壓器中文資料
- 1.12 MB | 1次下載 | 免費(fèi)
- 4網(wǎng)絡(luò)安全從業(yè)者入門指南
- 2.91 MB | 1次下載 | 免費(fèi)
- 5DS-CS3A P00-CN-V3
- 618.05 KB | 1次下載 | 免費(fèi)
- 6海川SM5701規(guī)格書
- 1.48 MB | 次下載 | 免費(fèi)
- 7H20PR5電磁爐IGBT功率管規(guī)格書
- 1.68 MB | 次下載 | 1 積分
- 8IP防護(hù)等級(jí)說(shuō)明
- 0.08 MB | 次下載 | 免費(fèi)
本月
- 1貼片三極管上的印字與真實(shí)名稱的對(duì)照表詳細(xì)說(shuō)明
- 0.50 MB | 103次下載 | 1 積分
- 2涂鴉各WiFi模塊原理圖加PCB封裝
- 11.75 MB | 89次下載 | 1 積分
- 3錦銳科技CA51F2 SDK開發(fā)包
- 24.06 MB | 43次下載 | 1 積分
- 4錦銳CA51F005 SDK開發(fā)包
- 19.47 MB | 19次下載 | 1 積分
- 5PCB的EMC設(shè)計(jì)指南
- 2.47 MB | 16次下載 | 1 積分
- 6HC05藍(lán)牙原理圖加PCB
- 15.76 MB | 13次下載 | 1 積分
- 7802.11_Wireless_Networks
- 4.17 MB | 12次下載 | 免費(fèi)
- 8蘋果iphone 11電路原理圖
- 4.98 MB | 6次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935127次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191390次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183342次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81588次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73815次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65989次下載 | 10 積分
評(píng)論