99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開發(fā)者說 | 手語翻譯系統(tǒng)系列之使用旭日X3派實現(xiàn)實時語音轉(zhuǎn)寫

地瓜機器人 ? 2023-01-05 14:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

準備工作

  • 硬件部分:旭日X3派,USB免驅(qū)攝像頭,電源適配器,燒錄Ubuntu系統(tǒng)的SD卡,USB揚聲器,顯示屏(或者VNC/SSH遠程連接)

  • 軟件部分:Thonny IDE集成開發(fā)環(huán)境
2.jfif

注意:購買麥克風時要購買二合一的USB麥克風,切勿購買3.5mm耳機接口傳輸?shù)柠溈孙L。

首先更新軟件源和所有軟件,只需要使用快捷鍵ctrl+alt+T打開命令行,輸入以下命令,耐心等待即可。

# 更新軟件源 apt-get update # 更新升級所有軟件 apt-get upgrade

開發(fā)工具依然是沿用Thonny,作為一款輕量化的python集成開發(fā)環(huán)境,對新手十分友好,簡單易上手,后續(xù)安裝各種python依賴庫也相當方便。安裝完成后同樣是使用快捷鍵ctrl+alt+T打開命令行,輸入Thonny啟動,然后開始項目的重頭戲——安裝項目依賴庫,需要用到的第三方庫和版本如下,大家可以根據(jù)這個順序進行安裝,以免遺漏(也可以復(fù)制到一個新的txt文件利用pip一次性安裝)。

cffi==1.12.3 gevent==1.4.0 greenlet==0.4.15 pycparser==2.19 six==1.12.0 websocket==0.2.1 websocket-client==0.56.0

注意:有些庫安裝失敗的話代碼可能不會有高亮提示,但運行時會報錯,所以,出現(xiàn)報錯第一時間檢查第三方庫是否成功安裝。

本文著重介紹需要用到的Python標準GUI庫——Tkinter。

在Python程序中,Tkinter是Python的一個模塊,它可以像其他模塊一樣在Python交互式shell中(或者“.py”程序中)導入,導入Tkinter模塊后,就可使用Tkinter模塊中的函數(shù)、方法等進行GUI編程。同時,開發(fā)者也可以使用Tkinter庫中的文本框、按鈕、標簽等組件實現(xiàn)GUI開發(fā)。

首先,需檢查Tkinter是否成功導入,如運行無誤則說明導入成功,否之,則需要重新安裝Tkinter庫。

import tkinter

接著創(chuàng)建一個窗口,先使用http://tkinter.Tk生成一個主窗口對象,然后才能使用Tkinter模塊中其他的函數(shù)和方法等元素。生成主窗口以后才可以向里面添加組件,或者直接調(diào)用其mainloop()方法進行消息循環(huán)。示例如下:

import tkinter #導入Tkinter模塊 top = tkinter.Tk()#生成一個主窗口對象 top.mainloop()#進入消息循環(huán)

我們要有交互,就需要有組件。組件與窗口一樣,也是通過Tkinter模塊中相應(yīng)的組件函數(shù)生成的。在生成組件以后,就可以使用pack、grid或place等方法將它添加到窗口中,以下示例給窗口增添兩個按鈕:

import tkinter #導入Tkinter模塊 root = tkinter.Tk()#生成一個主窗口對象 label= tkinter.Label(root, text="Python, tkinter!") label.pack()#將標簽添加到窗口中 button1 = tkinter.Button(root, text="按鈕1")#創(chuàng)建按鈕1 button1.pack(side=tkinter.LEFT)#將按鈕1添加到窗口中 button2 = tkinter.Button(root, text="按鈕2")#創(chuàng)建按鈕2 button2.pack(side=tkinter.RIGHT)#將按鈕2添加到窗口中 root.mainloop()#進入消息循環(huán)

3.jfif

至此,用Tkinter庫創(chuàng)建一個帶交互功能的窗口已經(jīng)完成,大家感興趣可以繼續(xù)學習其他組件,這里就不再贅述。

接下來進行云服務(wù)器部署,本項目選用云端語音平臺,登錄平臺后,通過右上角「控制臺」,或右上角下拉菜單的「我的應(yīng)用」進入控制臺。如果賬戶未曾創(chuàng)建過應(yīng)用,平臺會引導創(chuàng)建,創(chuàng)建完成后,便可通過左側(cè)的服務(wù)列表,選擇要使用的服務(wù)。

在服務(wù)管理面板中,將看到這個服務(wù)對應(yīng)的可用量、歷史用量、服務(wù)接口的驗證信息,還有可以調(diào)用的API和SDK。值得注意的是,要將應(yīng)用創(chuàng)建后生成的APPID,APISecret和APIKey去替換代碼中的APPID,APISecret和APIKey一定要一一對應(yīng),否則會影響代碼的正常運行!

def run(): global wsParam wsParam = Ws_Param(APPID='你的APPID', APIKey='你的APIKey',APISecret='你的APISecret') websocket.enableTrace(False) wsUrl = wsParam.create_url() ws = websocket.WebSocketApp(wsUrl, on_message=on_message, on_error=on_error, on_close=on_close) ws.on_open = on_open ws.run_forever(sslopt={"cert_reqs": ssl.CERT_NONE}, ping_timeout=2)

隨后選擇需要的語種和服務(wù)即可,支持除中文和英語外的51種外語,24種方言和1種民族語言。

4.png

實現(xiàn)原理

本項目主要就是利用python程序錄制本地mp3格式的用戶音頻,并將音頻上傳到云端語音平臺進行實時轉(zhuǎn)寫,最后利用GUI庫在屏幕上展示轉(zhuǎn)寫結(jié)果(云端語音平臺翻譯文本的方法和窗口的實現(xiàn),點擊文末閱讀原文即可獲?。?/p>

效果展示

結(jié)果顯示,本項目對本地資源占用較小,得益于旭日X3派的高算力和高性能,溫度的控制讓人十分滿意(和上一個項目手語翻譯終端同時運行也沒有問題)。

5.jfif


6.jfif

性能測試

系統(tǒng)測試方案:將程序?qū)胄袢誜3派中,接入電源后等待初始化完成,在安靜的室內(nèi)環(huán)境下,在麥克風前分別測試普通話,英語,方言(東北話/四川話),將轉(zhuǎn)寫終端實時轉(zhuǎn)寫的準確率記錄,同時將識別的總時長記錄收集。

測試數(shù)據(jù)如下:

7.jfif


8.jfif

結(jié)果分析:接收到語音信息后到完成轉(zhuǎn)寫結(jié)果的顯示總時長在0.5秒之內(nèi),可基本實現(xiàn)實時轉(zhuǎn)譯,對普通話和英文以及51種外語,24種方言和1種民族語言的識別率在95%以上。

結(jié)論:實現(xiàn)語音轉(zhuǎn)寫除了支持普通話和英語外,支持51個外國語種(包括日語、俄語、泰語、捷克語等常用語種)、24種方言(包括四川話、廣東話、河南話、上海話,閩南語等常用方言),另外,還支持一種民族語言(彝語),真正做到無障礙溝通交流。

本文轉(zhuǎn)自地平線開發(fā)者社區(qū)
原作者:鑫辰大海王

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5152

    文章

    19675

    瀏覽量

    317667
  • 語音
    +關(guān)注

    關(guān)注

    3

    文章

    399

    瀏覽量

    38713
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249608
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    開鴻Bot系列:為開源鴻蒙開發(fā)者而生!

    操作系統(tǒng),實現(xiàn)從國產(chǎn)高性能芯片到操作系統(tǒng)的全棧自主化,構(gòu)建起一站式的開源鴻蒙學習與開發(fā)平臺。融合開發(fā)與辦公場景打造開源鴻蒙生態(tài)的“第一站”作
    的頭像 發(fā)表于 05-16 16:06 ?480次閱讀
    開鴻Bot<b class='flag-5'>系列</b>:為開源鴻蒙<b class='flag-5'>開發(fā)者</b>而生!

    RDK X3 帶飛的智能護理系統(tǒng):讓機器人秒變貼心小棉襖

    濟往開來團隊帶著超燃黑科技來了!基于 RDK X3 開發(fā)的老年智能監(jiān)控系統(tǒng),跌倒秒報警、手勢一鍵呼叫、還能陪嘮嗑!最絕的是 開源代碼直接甩鏈接 ,技術(shù)黨狂喜!
    的頭像 發(fā)表于 05-09 21:53 ?272次閱讀
    RDK <b class='flag-5'>X3</b> 帶飛的智能護理<b class='flag-5'>系統(tǒng)</b>:讓機器人秒變貼心小棉襖

    【第一彈】樹莓開發(fā)者必看!Ubuntu Snap煥新升級:跨平臺開發(fā)從未如此簡單!

    導語:當樹莓遇上UbuntuSnap,會發(fā)生什么?無論是用樹莓搭建智能家居中樞,還是開發(fā)物聯(lián)網(wǎng)邊緣設(shè)備,依賴管理和跨平臺兼容性始終是開發(fā)者的痛點。而UbuntuSnap
    的頭像 發(fā)表于 03-25 09:19 ?401次閱讀
    【第一彈】樹莓<b class='flag-5'>派</b><b class='flag-5'>開發(fā)者</b>必看!Ubuntu Snap煥新升級:跨平臺<b class='flag-5'>開發(fā)</b>從未如此簡單!

    AI助力實時翻譯耳機

    是一種能夠實時將一種語言翻譯成另一種語言的耳機設(shè)備。它通常由一個耳機和一個配套的應(yīng)用程序組成,用戶可以通過應(yīng)用程序選擇需要翻譯的語言,并通過耳機聽到翻譯結(jié)果。 2
    的頭像 發(fā)表于 01-24 11:14 ?1678次閱讀
    AI助力<b class='flag-5'>實時</b><b class='flag-5'>翻譯</b>耳機

    Cadence推出Palladium Z3與Protium X3系統(tǒng)

    楷登電子(Cadence)公司近日宣布,正式推出新一代Cadence? Palladium? Z3 Emulation和Protium? X3 FPGA原型驗證系統(tǒng)。這一組合標志著數(shù)字孿生
    的頭像 發(fā)表于 01-07 13:48 ?1076次閱讀

    開發(fā)者的開源鴻蒙故事

    近日,在以“一切為了開發(fā)者”為主題的“2024開放原子開發(fā)者大會暨首屆開源技術(shù)學術(shù)大會”上,開源鴻蒙5.0 Release版本正式發(fā)布,備受各方關(guān)注。該版本在系統(tǒng)完備度、分布式創(chuàng)新、開發(fā)者
    的頭像 發(fā)表于 01-06 10:28 ?874次閱讀

    《HarmonyOS第一課》煥新升級,賦能開發(fā)者快速掌握鴻蒙應(yīng)用開發(fā)

    應(yīng)用集成與開發(fā)能力,能夠獨立完成復(fù)雜任務(wù)及擁有團隊組織能力。 主題課程則聚焦前沿應(yīng)用開發(fā)主題和實踐,如應(yīng)用UX體驗標準、實時語音與文本互轉(zhuǎn)、賬戶能力集成等應(yīng)用核心功能的
    發(fā)表于 01-02 14:24

    訊維智能語音轉(zhuǎn)寫系統(tǒng):開啟智能會議記錄新篇章!

    隨著人工智能技術(shù)的飛速發(fā)展,智能語音轉(zhuǎn)寫系統(tǒng)逐漸走進我們的日常生活和工作之中,成為提升工作效率、優(yōu)化信息處理的重要工具。訊維智能語音轉(zhuǎn)寫
    的頭像 發(fā)表于 11-15 15:41 ?1123次閱讀
    訊維智能<b class='flag-5'>語音</b><b class='flag-5'>轉(zhuǎn)寫</b><b class='flag-5'>系統(tǒng)</b>:開啟智能會議記錄新篇章!

    精準高效,訊維智能語音轉(zhuǎn)寫系統(tǒng)打造智慧會議新體驗!

    在快節(jié)奏的現(xiàn)代工作環(huán)境中,會議已成為企業(yè)溝通、決策和協(xié)作不可或缺的一部分。然而,傳統(tǒng)會議記錄方式往往存在效率低下、信息遺漏、人力成本高等問題。隨著人工智能技術(shù)的飛速發(fā)展,智能語音轉(zhuǎn)寫系統(tǒng)應(yīng)運而生,其中訊維智能
    的頭像 發(fā)表于 11-15 15:27 ?1055次閱讀
    精準高效,訊維智能<b class='flag-5'>語音</b><b class='flag-5'>轉(zhuǎn)寫</b><b class='flag-5'>系統(tǒng)</b>打造智慧會議新體驗!

    訊維智能語音轉(zhuǎn)寫系統(tǒng)核心優(yōu)勢大解析!

    憑借其高精度識別、實時轉(zhuǎn)寫、智能糾錯以及多語種支持等核心優(yōu)勢,正在深刻改變著會議記錄、教育培訓、采訪報道和法律取證等多個領(lǐng)域的工作方式,成為提升工作效率和優(yōu)化信息處理的重要工具。下面我們來整理下訊維智能語音
    的頭像 發(fā)表于 11-15 15:24 ?1028次閱讀
    訊維智能<b class='flag-5'>語音</b><b class='flag-5'>轉(zhuǎn)寫</b><b class='flag-5'>系統(tǒng)</b>核心優(yōu)勢大解析!

    香橙與昇思MindSpore合作提速,軟硬結(jié)合助力開發(fā)者構(gòu)建創(chuàng)新AI應(yīng)用

    AIpro開發(fā)板構(gòu)建創(chuàng)新AI應(yīng)用,助力開發(fā)者積累開發(fā)經(jīng)驗、繁榮人工智能產(chǎn)業(yè)生態(tài)。目前,昇思MindSporeAI框架已實現(xiàn)預(yù)置在香橙AIp
    的頭像 發(fā)表于 11-01 17:02 ?1275次閱讀
    香橙<b class='flag-5'>派</b>與昇思MindSpore合作提速,軟硬結(jié)合助力<b class='flag-5'>開發(fā)者</b>構(gòu)建創(chuàng)新AI應(yīng)用

    KaihongOS 4.1.2開發(fā)者預(yù)覽版正式上線,誠邀開發(fā)者免費試用!

    獨特的搶先體驗機會,涵蓋了原生應(yīng)用開發(fā)、分布式能力、原子化服務(wù)等核心功能特性,助力開發(fā)者探索國產(chǎn)操作系統(tǒng)的更多可能性。此次發(fā)布的預(yù)覽版適配RK3568、RK358
    的頭像 發(fā)表于 09-28 08:07 ?741次閱讀
    KaihongOS 4.1.2<b class='flag-5'>開發(fā)者</b>預(yù)覽版正式上線,誠邀<b class='flag-5'>開發(fā)者</b>免費試用!

    KaihongOS 4.1.2開發(fā)者預(yù)覽版正式上線,誠邀開發(fā)者免費試用!

    開發(fā)者提供了獨特的搶先體驗機會,涵蓋了原生應(yīng)用開發(fā)、分布式能力、原子化服務(wù)等核心功能特性,助力開發(fā)者探索國產(chǎn)操作系統(tǒng)的更多可能性。 此次發(fā)布的預(yù)覽版適配RK3568、RK3588、ES
    的頭像 發(fā)表于 09-26 15:59 ?750次閱讀

    開發(fā)者空間實踐指導:基于 3 大 PaaS 主流服務(wù)輕松實現(xiàn)文字轉(zhuǎn)換語音

    【摘要】 基于 CodeArts API 設(shè)計語音合成接口,基于 API Explorer 調(diào)試接口,并利用 CodeArts IDE 實現(xiàn)數(shù)據(jù)流轉(zhuǎn)換為音頻 案例簡介 開發(fā)者將在云主機中
    的頭像 發(fā)表于 09-13 16:25 ?750次閱讀
    <b class='flag-5'>開發(fā)者</b>空間實踐指導:基于 <b class='flag-5'>3</b> 大 PaaS 主流服務(wù)輕松<b class='flag-5'>實現(xiàn)</b>文字轉(zhuǎn)換<b class='flag-5'>語音</b>

    訊維智能語音轉(zhuǎn)寫系統(tǒng)確保企業(yè)數(shù)據(jù)的安全性

    隨著人工智能技術(shù)的飛速發(fā)展,智能語音轉(zhuǎn)寫系統(tǒng)逐漸走進我們的日常生活和工作之中,成為提升工作效率、優(yōu)化信息處理的重要工具。訊維智能語音轉(zhuǎn)寫
    的頭像 發(fā)表于 08-02 15:53 ?1100次閱讀