伊人久久综合精品蜜桃97,久草中文在线视频巨臀牛仔裤后入,午夜精品免费视频

一、導(dǎo)讀

OCR方向的工程師，一定需要知道這個(gè)OCR開源項(xiàng)目：PaddleOCR

短短半年時(shí)間，累計(jì)Star數(shù)量已超過11.5K，

頻頻登上Github Trending和Paperswithcode 日榜月榜第一，

在《Github 2020數(shù)字洞察報(bào)告》中被評為中國Github Top20活躍項(xiàng)目。

稱它為 OCR方向目前最火的repo絕對不為過。

最近，它又帶來兩項(xiàng)全新發(fā)布：

AAAI 2021 頂會論文開源：PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network 提出了一種簡單且有效的任意方向端到端文本識別模型，在精度可比的基礎(chǔ)上，與之前大火的ABCNet相比，預(yù)測速度快了三倍，達(dá)到SOTA效果。

多語言支持種類提升至80+種：基本覆蓋國際主流語言種類，在開源測試集MLT2017評估，中文、韓文、日文、拉丁語系、阿拉伯語系，識別效果均顯著優(yōu)于EasyOCR，開源SOTA效果。

二、PaddleOCR歷史表現(xiàn)回顧

先看下PaddleOCR自去年6月開源以來，短短幾個(gè)月在GitHub上的表現(xiàn)：

2020年6月，8.6M超輕量模型發(fā)布，GitHub Trending 全球趨勢榜日榜第一。

2020年8月，開源CVPR2020頂會算法，再上GitHub趨勢榜單！

2020年10月，發(fā)布PP-OCR算法，開源3.5M超超輕量模型，再下Paperswithcode 趨勢榜第一

2021年1月，發(fā)布Style-Text文本合成算法，PPOCRLabel數(shù)據(jù)標(biāo)注工具，star數(shù)量突破10000+，截至目前已經(jīng)達(dá)到11.5k，在《Github 2020數(shù)字洞察報(bào)告》中被評為中國Github Top20活躍項(xiàng)目。

這個(gè)含金量，廣大的GitHub開發(fā)者們自然懂

超輕量模型的效果：火車票、表格、金屬銘牌、翻轉(zhuǎn)圖片、外語都是妥妥的，

動靜統(tǒng)一的開發(fā)體驗(yàn)

動態(tài)圖和靜態(tài)圖是深度學(xué)習(xí)框架常用的兩種模式。在動態(tài)圖模式下，代碼編寫運(yùn)行方式符合Python 程序員的習(xí)慣，易于調(diào)試，但在性能方面， Python執(zhí)行開銷較大，與C++有一定差距。

相比動態(tài)圖，靜態(tài)圖在部署方面更具有性能的優(yōu)勢。靜態(tài)圖程序在編譯執(zhí)行時(shí)，預(yù)先搭建好的神經(jīng)網(wǎng)絡(luò)可以脫離Python依賴，在C++端被重新解析執(zhí)行，而且擁有整體網(wǎng)絡(luò)結(jié)構(gòu)也能進(jìn)行一些網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化。

飛槳?jiǎng)討B(tài)圖中新增了動態(tài)圖轉(zhuǎn)靜態(tài)圖的功能，支持用戶使用動態(tài)圖編寫組網(wǎng)代碼。預(yù)測部署時(shí)，飛槳會對用戶代碼進(jìn)行分析，自動轉(zhuǎn)換為靜態(tài)圖網(wǎng)絡(luò)結(jié)構(gòu)，兼顧了動態(tài)圖易用性和靜態(tài)圖部署性能兩方面優(yōu)勢。

文本合成工具Style-Text效果：相比于傳統(tǒng)的數(shù)據(jù)合成算法，Style-Text可以實(shí)現(xiàn)特殊背景下的圖片風(fēng)格遷移，只需要少許目標(biāo)場景圖像，就可以合成大量數(shù)據(jù)，效果展示如下：

半自動標(biāo)注工具PPOCRLabel：通過內(nèi)置高質(zhì)量的PPOCR中英文超輕量預(yù)訓(xùn)練模型，可以實(shí)現(xiàn)OCR數(shù)據(jù)的高效標(biāo)注。CPU機(jī)器運(yùn)行也是完全沒問題的。效果演示如下：

用法也是非常的簡單，標(biāo)注效率提升60%-80%是妥妥的。

傳送門：

Github：https://github.com/PaddlePaddle/PaddleOCR

那么最近的2021年4月份更新，又給大家?guī)砟男@喜呢？

三、AAAI 2021 頂會論文：端到端SOTA算法PGNet開源：

直接先看指標(biāo)評測表現(xiàn)：PGNet算法在ICDAR2015數(shù)據(jù)集上的檢測及端到端性能表現(xiàn)，在精度接近的條件下，速度上與之前大火的ABCNet相比翻了三倍，達(dá)到了SOTA的效果。

圖1：PGNet模型的速度與精度性能對比

詳細(xì)數(shù)據(jù)指標(biāo)：

表1：ICDAR2015數(shù)據(jù)集上的檢測及端到端性能

PGNet提出的方法框架如下圖所示，輸入的圖象經(jīng)過Backbone網(wǎng)絡(luò)得到1/4下采樣特征圖，通過多任務(wù)學(xué)習(xí)，同時(shí)回歸四個(gè)任務(wù)的內(nèi)容，包括文本邊緣偏移量預(yù)測（TBO），文本中心線預(yù)測（TCL），文本方向偏移量預(yù)測（TDO）以及文本字符分類圖預(yù)測（TCC）。其中文本行的檢測結(jié)果由TBO以及TCL經(jīng)過后處理得到，文本行的識別結(jié)果由TCL，TDO以及TCC的輸出得到。

圖2 網(wǎng)絡(luò)流程框架

在ICDAR2015以及Total-Text數(shù)據(jù)集上可以看一下模型效果：

圖3Total-Text及ICDAR2015數(shù)據(jù)集可視化效果圖

PGNet論文地址:https://www.aaai.org/AAAI21Papers/AAAI-2885.WangP.pdf

【基于頂尖算法，開放拿來即用的成熟印章識別能力】同時(shí)，基于PGNet研發(fā)的印章識別能力已經(jīng)在百度AI開放平臺開放，可以有效檢測并識別合同文件或常用票據(jù)中的印章，輸出文字內(nèi)容、印章位置信息以及相關(guān)置信度，已支持圓形章、橢圓形章、方形章等常見印章。提供標(biāo)準(zhǔn)化API 接口，快速集成，同時(shí)支持私有化部署至本地，保障業(yè)務(wù)數(shù)據(jù)私密性。

開放能力地址：https://ai.baidu.com/tech/ocr/seal

注：此處非模型直接開源，但可以申請免費(fèi)試用。

四、豐富的多語言種類支持，目前已經(jīng)支持全球80+ 語言模型

簡單對比一下目前主流OCR方向開源repo的核心能力：

中英文模型性能及功能對比

其中，部分多語言模型性能及功能（F1-Score）對比（僅EasyOCR提供）

模型效果

值得一提的是，目前已經(jīng)有全球開發(fā)者通過PR或者issue的方式為PaddleOCR提供多語言的字典和語料，在PaddleOCR上已經(jīng)完成了全球80+ 主流語言的廣泛覆蓋：包括中文簡體、中文繁體、英文、法文、德文、韓文、日文、意大利文、西班牙文、葡萄牙文、俄羅斯文、阿拉伯文、印地文、維吾爾文、波斯文、烏爾都文、塞爾維亞文（latin）、歐西坦文、馬拉地文、尼泊爾文、塞爾維亞文、保加利亞文、烏克蘭文、白俄羅斯文、泰盧固文、卡納達(dá)文、泰米爾文，也歡迎更多開發(fā)者可以參與共建。

五、良心出品的中英文文檔教程

別的不需要多說了，大家訪問GitHub點(diǎn)過star之后自己體驗(yàn)吧：https://github.com/PaddlePaddle/PaddleOCR

責(zé)任編輯：lq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

語言模型

語言模型

+關(guān)注

關(guān)注
0

文章
561

瀏覽量
10787
python

python

+關(guān)注

關(guān)注
56

文章
4827

瀏覽量
86711
開源項(xiàng)目

開源項(xiàng)目

+關(guān)注

關(guān)注
0

文章
38

瀏覽量
7460

原文標(biāo)題：Github Star 11.5K項(xiàng)目再發(fā)版：AAAI 2021 頂會論文開源，80+多語言模型全新升級

文章出處：【微信號：vision263com，微信公眾號：新機(jī)器視覺】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

PaddleOCR歷史表現(xiàn)回顧

評論