99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于RK3576開發(fā)板的OCR文字識別算法

ljx2016 ? 來源:ljx2016 ? 作者:ljx2016 ? 2025-05-08 09:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. OCR文字識別簡介

文字識別也是圖像領(lǐng)域一個常見問題。然而,對于自然場景圖像,首先要定位圖像中的文字位置,然后才能進行文字的識別。所以一般包含兩個步驟:

文字檢測:解決的問題是哪里有文字,文字的范圍有多少。

文字識別:對定位好的文字區(qū)域進行識別,主要解決的問題是每個文字是什么,將圖像中的文字區(qū)域進轉(zhuǎn)化為字符信息。

我們的OCR算法是基于CTPN+CRNN設(shè)計的。CTPN是一種文字檢測算法,能有效的檢測出復(fù)雜場景的橫向分布的文字,是目前比較好的文字檢測算法。CRNN算法主要用于端到端地對不定長的文本序列進行識別,不用先對單個文字進行切割,而是將文本識別轉(zhuǎn)化為時序依賴的序列學(xué)習(xí)問題,就是基于圖像的序列識別。

基于EASY-EAI-Orin-nano硬件主板的運行效率:

算法種類 模型大小 運行效率
文字檢測算法 3.31MB 37ms
文字識別算法 6.19MB 3ms

2. 快速上手

如果您初次閱讀此文檔,請閱讀:《入門指南/源碼管理及編程介紹/源碼工程管理》,按需管理自己工程源碼(注:此文檔必看,并建議采用【遠(yuǎn)程掛載管理】方式,否則有代碼丟失風(fēng)險?。。。?/p>

2.1 開源碼工程下載

先在PC虛擬機定位到nfs服務(wù)目錄,再在目錄中創(chuàng)建存放源碼倉庫的管理目錄:

cd ~/nfsroot
mkdir GitHub
cd GitHub

再通過git工具,在管理目錄內(nèi)克隆遠(yuǎn)程倉庫(需要設(shè)備能對外網(wǎng)進行訪問)

git clone https://github.com/EASY-EAI/EASY-EAI-Toolkit-3576.git
wKgZPGgcCpWAPmWOAAFJlZ-Xh3k614.png

注:

* 此處可能會因網(wǎng)絡(luò)原因造成卡頓,請耐心等待。

* 如果實在要在gitHub網(wǎng)頁上下載,也要把整個倉庫下載下來,不能單獨下載本實例對應(yīng)的目錄。

2.2 開發(fā)環(huán)境搭建

通過adb shell進入板卡開發(fā)環(huán)境,如下圖所示。

wKgZO2gcCpWADCYhAAC554P6NFE403.png

通過以下命令,把nfs目錄掛載上nfs服務(wù)器。

mount -t nfs -o nolock : /home/orin-nano/Desktop/nfs/
wKgZPGgcCpaAeWuoAAD8wWi-yWg276.png

2.3 例程編譯

然后定位到板卡的nfs的掛載目錄(按照實際掛載目錄),進入到對應(yīng)的例程目錄執(zhí)行編譯操作,具體命令如下所示:

cd EASY-EAI-Toolkit-3576/Demos/algorithm-ocr/
./build.sh
wKgZO2gcCpaARon-AAFi6Caoj7A860.png

2.4 模型部署

要完成算法Demo的執(zhí)行,需要先下載法模型。

百度網(wǎng)盤鏈接為:https://pan.baidu.com/s/1g4kpLTgMnYm1xop9LFeMIw?pwd=1234 (提取碼:1234 )。

wKgZPGgcCpaAHpB4AAA07vf6mR4257.png

同時需要把下載的檢測模型和識別模型復(fù)制粘貼到Release/目錄:

wKgZO2gcCpaAfjwbAABfvAeEDoQ199.png

2.5 例程運行及效果

進入開發(fā)板Release目錄,執(zhí)行下方命令,運行示例程序:

cd Release/
./test-ocr test.jpg

運行例程命令如下所示:

wKgZPGgcCpaAPIlEAAMgujgnozY569.png

結(jié)果圖片如下所示:

wKgZO2gcCpeAGQClAAEkuy9pDjk591.jpg

API的詳細(xì)說明,以及API的調(diào)用(本例程源碼),詳細(xì)信息見下方說明。

3. OCR文字識別API說明

3.1 引用方式

為方便客戶在本地工程中直接調(diào)用我們的EASY EAI api庫,此處列出工程中需要鏈接的庫以及頭文件等,方便用戶直接添加。

選項 描述
頭文件目錄 easyeai-api/algorithm/ocr
庫文件目錄 easyeai-api/algorithm/ocr
庫鏈接參數(shù) -locr

3.2 OCR檢測初始化函數(shù)

設(shè)置OCR檢測初始化函數(shù)原型如下所示。

int ocr_det_init(const char* model_path, rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數(shù)名: ocr_det_init
頭文件 ocr.h
輸入?yún)?shù) model_path:算法模型名字/路徑
輸入?yún)?shù) app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

3.3 OCR檢測運行函數(shù)

設(shè)置OCR檢測運行原型如下所示。

int ocr_det_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_det_postprocess_params* params, ocr_det_result* out_result);

具體介紹如下所示。

函數(shù)名:ocr_det_run
頭文件 ocr.h
輸入?yún)?shù) app_ctx:算法模型句柄
輸入?yún)?shù) input_image:Cv::Mat輸入圖像
輸入?yún)?shù) params:ocr檢測算法參數(shù)
輸出參數(shù) out_result:返回結(jié)果
返回值 成功返回:0
失敗返回:-1
注意事項

3.4 OCR檢測釋放函數(shù)

設(shè)置OCR檢測釋放原型如下所示。

int ocr_det_release(rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數(shù)名:ocr_det_release
頭文件 ocr.h
輸入?yún)?shù) app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

3.5 OCR識別初始化函數(shù)

OCR識別初始化函數(shù)原型如下所示。

int ocr_rec_init(const char* model_path, rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數(shù)名:ocr_rec_init
頭文件 ocr.h
輸入?yún)?shù) model_path:算法模型名字/路徑
輸入?yún)?shù) app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

3.6 OCR識別運行函數(shù)

OCR識別運行函數(shù)原型如下所示。

int ocr_rec_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_rec_result* out_result);

具體介紹如下所示。

函數(shù)名:ocr_rec_run
頭文件 ocr.h
輸入?yún)?shù) app_ctx:算法模型句柄
輸入?yún)?shù) input_image:輸入圖像
輸出參數(shù) out_result:返回結(jié)果
返回值 成功返回:0
失敗返回:-1
注意事項

3.7 OCR識別釋放函數(shù)

OCR識別釋放函數(shù)原型如下所示。

int ocr_rec_release(rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數(shù)名:ocr_rec_release
頭文件 ocr.h
輸入?yún)?shù) app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

4. OCR檢測算法例程

例程目錄為Demos/algorithm-ocr/test-ocr.cpp,操作流程如下。

wKgZPGgcCpeAakeIAABD0JksQWc004.png

#include 
#include 
#include 
#include"ocr.h"

using namespace cv;
using namespace std;

#define INDENT "    "
#define THRESHOLD 0.3 // pixel score threshold
#define BOX_THRESHOLD 0.9 // box score threshold
#define USE_DILATION false // whether to do dilation, true or false
#define DB_UNCLIP_RATIO 1.5 // unclip ratio for poly type

int main(int argc, char **argv)
{
	if (argc != 2) {
		printf("%s n", argv[0]);
		return -1;
	}
	/* 參數(shù)初始化 */
	const char *img_path = argv[1];
	Mat input_image, rgb_img;
	input_image = imread(img_path);
	if (input_image.empty()) {
		cout 

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 板卡
    +關(guān)注

    關(guān)注

    3

    文章

    138

    瀏覽量

    17202
  • 文字識別
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    8814
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    161

    瀏覽量

    16789
  • rk3576
    +關(guān)注

    關(guān)注

    1

    文章

    173

    瀏覽量

    720
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于RK3576開發(fā)板的WDT看門狗使用說明

    RK3576開發(fā)板的WDT使用說明
    的頭像 發(fā)表于 05-06 17:15 ?635次閱讀
    基于<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>的WDT看門狗使用說明

    基于RK3576開發(fā)板的PCIE固態(tài)硬盤使用說明

    RK3576開發(fā)板的PICE固態(tài)硬盤使用方法
    的頭像 發(fā)表于 05-06 17:33 ?1350次閱讀
    基于<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>的PCIE固態(tài)硬盤使用說明

    基于RK3576開發(fā)板的TF卡槽使用說明

    RK3576開發(fā)板使用TF卡槽
    的頭像 發(fā)表于 05-07 09:24 ?748次閱讀
    基于<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>的TF卡槽使用說明

    基于RK3576開發(fā)板的PWN使用說明

    RK3576開發(fā)板使用PWN教程及Demo
    的頭像 發(fā)表于 05-07 14:07 ?1275次閱讀
    基于<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>的PWN使用說明

    基于RK3576開發(fā)板的RTC使用說明

    文章主要展示RK3576開發(fā)板的RTC信息和快速上手例程
    的頭像 發(fā)表于 05-07 15:04 ?811次閱讀
    基于<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>的RTC使用說明

    基于RK3576開發(fā)板的人臉識別算法

    RK3576開發(fā)板展示人臉識別算法例程和API說明
    的頭像 發(fā)表于 05-07 16:48 ?1932次閱讀
    基于<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>的人臉<b class='flag-5'>識別</b><b class='flag-5'>算法</b>

    【米爾RK3576開發(fā)板評測】+項目名稱【米爾RK3576開發(fā)板評測】一個視頻和你共同認(rèn)識一下米爾RK3576開發(fā)板

    學(xué)習(xí)框架,能夠處理復(fù)雜的AI算法,提高監(jiān)控效率,降低誤報率。 1、DC_M576_V01是定昌最新研發(fā)的RK3576開發(fā)板,面向大算力邊緣計算,工業(yè)Alot邊緣AI物聯(lián),HMI人機交互上位機,AI
    發(fā)表于 12-18 20:50

    新品體驗 | RK3576開發(fā)板

    RK3399、RK3566、RK3568、RK3588、RK3576等型號的核心與評估
    的頭像 發(fā)表于 11-01 08:08 ?1917次閱讀
    新品體驗 | <b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>

    米爾RK3576開發(fā)板特惠活動!

    近日,米爾電子發(fā)布基于瑞芯微RK3576核心開發(fā)板,RK3576作為國產(chǎn)熱門處理器,其高性能數(shù)據(jù)處理能力、領(lǐng)先的AI智能分析、強大的擴展性與兼容性受到廣大
    的頭像 發(fā)表于 11-12 01:00 ?858次閱讀
    米爾<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>特惠活動!

    敬請期待 | 迅為RK3576開發(fā)板即將發(fā)布

    敬請期待 | 迅為RK3576開發(fā)板即將發(fā)布
    的頭像 發(fā)表于 11-22 15:13 ?618次閱讀
    敬請期待 | 迅為<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>即將發(fā)布

    迅為RK3576開發(fā)板核心與底板接口硬件介紹

    迅為RK3576開發(fā)板核心與底板接口硬件介紹
    的頭像 發(fā)表于 01-14 15:15 ?1511次閱讀
    迅為<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>核心<b class='flag-5'>板</b>與底板接口硬件介紹

    迅為RK3576開發(fā)板Android?多屏顯示

    迅為RK3576開發(fā)板Android?多屏顯示
    的頭像 發(fā)表于 01-16 16:58 ?1008次閱讀
    迅為<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>Android?多屏顯示

    基于RK3576開發(fā)板的MIPI-DSI使用

    MIPI DSI接口是由MIPI聯(lián)盟下的Display工作組指定的DSI(Display Serial Interface)的接口標(biāo)準(zhǔn)。rk3576開發(fā)板使用mipi-dsi教程
    的頭像 發(fā)表于 05-06 16:11 ?373次閱讀
    基于<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>的MIPI-DSI使用

    基于RK3576開發(fā)板的HDMI-OUT使用說明

    RK3576開發(fā)板的HDMI-OUT使用說明
    的頭像 發(fā)表于 05-06 16:48 ?340次閱讀
    基于<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>的HDMI-OUT使用說明

    基于RK3576開發(fā)板的人員檢測算法

    展示了RK3576開發(fā)板的人員檢測算法例程及API說明
    的頭像 發(fā)表于 05-07 17:33 ?292次閱讀
    基于<b class='flag-5'>RK3576</b><b class='flag-5'>開發(fā)板</b>的人員檢測<b class='flag-5'>算法</b>