99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PaddleOCR歷史表現(xiàn)回顧

新機(jī)器視覺 ? 來源:CSDN ? 作者:CSDN ? 2021-04-15 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、導(dǎo)讀

OCR方向的工程師,一定需要知道這個(gè)OCR開源項(xiàng)目:PaddleOCR

短短半年時(shí)間,累計(jì)Star數(shù)量已超過11.5K,

頻頻登上Github Trending和Paperswithcode 日榜月榜第一,

在《Github 2020數(shù)字洞察報(bào)告》中被評為中國Github Top20活躍項(xiàng)目。

稱它為 OCR方向目前最火的repo絕對不為過。

最近,它又帶來兩項(xiàng)全新發(fā)布:

AAAI 2021 頂會論文開源:PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network 提出了一種簡單且有效的任意方向端到端文本識別模型,在精度可比的基礎(chǔ)上,與之前大火的ABCNet相比,預(yù)測速度快了三倍,達(dá)到SOTA效果。

多語言支持種類提升至80+種:基本覆蓋國際主流語言種類,在開源測試集MLT2017評估,中文、韓文、日文、拉丁語系、阿拉伯語系,識別效果均顯著優(yōu)于EasyOCR,開源SOTA效果。

二、PaddleOCR歷史表現(xiàn)回顧

先看下PaddleOCR自去年6月開源以來,短短幾個(gè)月在GitHub上的表現(xiàn):

2020年6月,8.6M超輕量模型發(fā)布,GitHub Trending 全球趨勢榜日榜第一。

2020年8月,開源CVPR2020頂會算法,再上GitHub趨勢榜單!

2020年10月,發(fā)布PP-OCR算法,開源3.5M超超輕量模型,再下Paperswithcode 趨勢榜第一

2021年1月,發(fā)布Style-Text文本合成算法,PPOCRLabel數(shù)據(jù)標(biāo)注工具,star數(shù)量突破10000+,截至目前已經(jīng)達(dá)到11.5k,在《Github 2020數(shù)字洞察報(bào)告》中被評為中國Github Top20活躍項(xiàng)目。

e7b9998a-9cdd-11eb-8b86-12bb97331649.gif


這個(gè)含金量,廣大的GitHub開發(fā)者們自然懂

超輕量模型的效果:火車票、表格、金屬銘牌、翻轉(zhuǎn)圖片、外語都是妥妥的,

e7c6ba70-9cdd-11eb-8b86-12bb97331649.gif

動靜統(tǒng)一的開發(fā)體驗(yàn)

動態(tài)圖和靜態(tài)圖是深度學(xué)習(xí)框架常用的兩種模式。在動態(tài)圖模式下,代碼編寫運(yùn)行方式符合Python程序員的習(xí)慣,易于調(diào)試,但在性能方面, Python執(zhí)行開銷較大,與C++有一定差距。

相比動態(tài)圖,靜態(tài)圖在部署方面更具有性能的優(yōu)勢。靜態(tài)圖程序在編譯執(zhí)行時(shí),預(yù)先搭建好的神經(jīng)網(wǎng)絡(luò)可以脫離Python依賴,在C++端被重新解析執(zhí)行,而且擁有整體網(wǎng)絡(luò)結(jié)構(gòu)也能進(jìn)行一些網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化。

飛槳?jiǎng)討B(tài)圖中新增了動態(tài)圖轉(zhuǎn)靜態(tài)圖的功能,支持用戶使用動態(tài)圖編寫組網(wǎng)代碼。預(yù)測部署時(shí),飛槳會對用戶代碼進(jìn)行分析,自動轉(zhuǎn)換為靜態(tài)圖網(wǎng)絡(luò)結(jié)構(gòu),兼顧了動態(tài)圖易用性和靜態(tài)圖部署性能兩方面優(yōu)勢。

文本合成工具Style-Text效果:相比于傳統(tǒng)的數(shù)據(jù)合成算法,Style-Text可以實(shí)現(xiàn)特殊背景下的圖片風(fēng)格遷移,只需要少許目標(biāo)場景圖像,就可以合成大量數(shù)據(jù),效果展示如下:

e83d58e2-9cdd-11eb-8b86-12bb97331649.png

半自動標(biāo)注工具PPOCRLabel:通過內(nèi)置高質(zhì)量的PPOCR中英文超輕量預(yù)訓(xùn)練模型,可以實(shí)現(xiàn)OCR數(shù)據(jù)的高效標(biāo)注。CPU機(jī)器運(yùn)行也是完全沒問題的。效果演示如下:

e85051ea-9cdd-11eb-8b86-12bb97331649.gif

用法也是非常的簡單,標(biāo)注效率提升60%-80%是妥妥的。

傳送門:

Github:https://github.com/PaddlePaddle/PaddleOCR

那么最近的2021年4月份更新,又給大家?guī)砟男@喜呢?

三、AAAI 2021 頂會論文:端到端SOTA算法PGNet開源:

直接先看指標(biāo)評測表現(xiàn):PGNet算法在ICDAR2015數(shù)據(jù)集上的檢測及端到端性能表現(xiàn),在精度接近的條件下,速度上與之前大火的ABCNet相比翻了三倍,達(dá)到了SOTA的效果。

e92bad3a-9cdd-11eb-8b86-12bb97331649.png

圖1:PGNet模型的速度與精度性能對比

詳細(xì)數(shù)據(jù)指標(biāo):

e936e65a-9cdd-11eb-8b86-12bb97331649.png

表1:ICDAR2015數(shù)據(jù)集上的檢測及端到端性能

PGNet提出的方法框架如下圖所示,輸入的圖象經(jīng)過Backbone網(wǎng)絡(luò)得到1/4下采樣特征圖,通過多任務(wù)學(xué)習(xí),同時(shí)回歸四個(gè)任務(wù)的內(nèi)容,包括文本邊緣偏移量預(yù)測(TBO),文本中心線預(yù)測(TCL),文本方向偏移量預(yù)測(TDO)以及文本字符分類圖預(yù)測(TCC)。其中文本行的檢測結(jié)果由TBO以及TCL經(jīng)過后處理得到,文本行的識別結(jié)果由TCL,TDO以及TCC的輸出得到。

e94c2998-9cdd-11eb-8b86-12bb97331649.png

圖2 網(wǎng)絡(luò)流程框架

在ICDAR2015以及Total-Text數(shù)據(jù)集上可以看一下模型效果:

e9572848-9cdd-11eb-8b86-12bb97331649.png

圖3Total-Text及ICDAR2015數(shù)據(jù)集可視化效果圖

PGNet論文地址:https://www.aaai.org/AAAI21Papers/AAAI-2885.WangP.pdf

【基于頂尖算法,開放拿來即用的成熟印章識別能力】同時(shí),基于PGNet研發(fā)的印章識別能力已經(jīng)在百度AI開放平臺開放,可以有效檢測并識別合同文件或常用票據(jù)中的印章,輸出文字內(nèi)容、印章位置信息以及相關(guān)置信度,已支持圓形章、橢圓形章、方形章等常見印章。提供標(biāo)準(zhǔn)化API接口,快速集成,同時(shí)支持私有化部署至本地,保障業(yè)務(wù)數(shù)據(jù)私密性。

ea1bdd82-9cdd-11eb-8b86-12bb97331649.gif

開放能力地址:https://ai.baidu.com/tech/ocr/seal

注:此處非模型直接開源,但可以申請免費(fèi)試用。

四、豐富的多語言種類支持,目前已經(jīng)支持全球80+ 語言模型

簡單對比一下目前主流OCR方向開源repo的核心能力:

中英文模型性能及功能對比

ea4c7a82-9cdd-11eb-8b86-12bb97331649.jpg

其中,部分多語言模型性能及功能(F1-Score)對比(僅EasyOCR提供)

ea5daa0a-9cdd-11eb-8b86-12bb97331649.png

模型效果

ea671720-9cdd-11eb-8b86-12bb97331649.gif


值得一提的是,目前已經(jīng)有全球開發(fā)者通過PR或者issue的方式為PaddleOCR提供多語言的字典和語料,在PaddleOCR上已經(jīng)完成了全球80+ 主流語言的廣泛覆蓋:包括中文簡體、中文繁體、英文、法文、德文、韓文、日文、意大利文、西班牙文、葡萄牙文、俄羅斯文、阿拉伯文、印地文、維吾爾文、波斯文、烏爾都文、塞爾維亞文(latin)、歐西坦文、馬拉地文、尼泊爾文、塞爾維亞文、保加利亞文、烏克蘭文、白俄羅斯文、泰盧固文、卡納達(dá)文、泰米爾文,也歡迎更多開發(fā)者可以參與共建。

五、良心出品的中英文文檔教程

ea9e056e-9cdd-11eb-8b86-12bb97331649.png


別的不需要多說了,大家訪問GitHub點(diǎn)過star之后自己體驗(yàn)吧:https://github.com/PaddlePaddle/PaddleOCR

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    561

    瀏覽量

    10787
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86711
  • 開源項(xiàng)目
    +關(guān)注

    關(guān)注

    0

    文章

    38

    瀏覽量

    7460

原文標(biāo)題:Github Star 11.5K項(xiàng)目再發(fā)版:AAAI 2021 頂會論文開源,80+多語言模型全新升級

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    C語言的歷史及程序介紹

    電子發(fā)燒友網(wǎng)站提供《C語言的歷史及程序介紹.pdf》資料免費(fèi)下載
    發(fā)表于 04-09 16:10 ?0次下載

    使用OpenVINO優(yōu)化并部署飛槳PP-OCRv4模型

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 一,什么是PaddleOCR工具庫? PaddleOCR 旨在打造一套豐富、領(lǐng)先、且實(shí)用的 OCR 工具庫,助力開發(fā)者訓(xùn)練出更好的模型,并應(yīng)用落地。在
    的頭像 發(fā)表于 04-03 18:07 ?1209次閱讀
    使用OpenVINO優(yōu)化并部署飛槳PP-OCRv4模型

    FRED的光路和光路歷史記錄

    對于雜散光分析,通常會使用“高級光線追跡”對話框,并選擇“創(chuàng)建/使用光線歷史文件”和“確定光路”選項(xiàng)。下面是對這兩個(gè)選項(xiàng)的簡要解釋。 確定光線路徑 選擇此選項(xiàng)會使得FRED存儲所有光路信息。這允許
    發(fā)表于 03-07 08:55

    高通Q1業(yè)績創(chuàng)歷史新高,手機(jī)與汽車芯片表現(xiàn)搶眼

    移動芯片大廠高通(Qualcomm)公司于近日公布了其2025會計(jì)年度第一季(截至2024年12月29日)的財(cái)報(bào),業(yè)績表現(xiàn)出色,創(chuàng)下歷史同期新高。
    的頭像 發(fā)表于 02-08 15:48 ?535次閱讀

    安森美2024年度大事記回顧

    讓我們通過年度十大新聞回顧這些重要時(shí)刻!
    的頭像 發(fā)表于 01-08 10:26 ?590次閱讀

    中航光電2024年度大事記回顧

    中航光電2024年度大事記回顧
    的頭像 發(fā)表于 01-02 16:10 ?976次閱讀

    大象機(jī)器人2024年度大事件回顧

    值此辭舊迎新之際,我們在此回顧深耕細(xì)作的2024年。
    的頭像 發(fā)表于 12-30 15:01 ?1288次閱讀

    臺積電股價(jià)創(chuàng)歷史新高,年度表現(xiàn)有望25年最佳

    近日,全球領(lǐng)先的芯片代工制造商臺積電在臺北股市的股價(jià)再度攀升,一度上漲1.4%,成功突破了11月8日創(chuàng)下的1095臺幣的高點(diǎn),觸及歷史新高。這一優(yōu)異表現(xiàn)使得臺積電有望創(chuàng)下25年來最佳的年度股票表現(xiàn)
    的頭像 發(fā)表于 12-25 14:26 ?1014次閱讀

    機(jī)智云歷史數(shù)據(jù)導(dǎo)出與排查指南

    機(jī)智云歷史數(shù)據(jù)導(dǎo)出與排查指南在使用機(jī)智云平臺進(jìn)行設(shè)備管理和數(shù)據(jù)監(jiān)控時(shí),歷史數(shù)據(jù)的導(dǎo)出和排查是常見的需求。機(jī)智云提供了開放的API接口,方便用戶通過編程方式導(dǎo)出設(shè)備歷史數(shù)據(jù),以便進(jìn)行分析或排查故障
    的頭像 發(fā)表于 11-21 01:01 ?693次閱讀
    機(jī)智云<b class='flag-5'>歷史</b>數(shù)據(jù)導(dǎo)出與排查指南

    展會回顧 | 明治傳感德國SPS,與世界共享科技創(chuàng)新的果實(shí)

    明治傳感——AKUSENSE德國紐倫堡工業(yè)展SPS展會回顧01展會盛況:聚焦智能傳感
    的頭像 發(fā)表于 11-20 01:05 ?873次閱讀
    展會<b class='flag-5'>回顧</b> | 明治傳感德國SPS,與世界共享科技創(chuàng)新的果實(shí)

    臺積電第三季度業(yè)績超預(yù)期,股價(jià)創(chuàng)歷史新高

    近日,臺積電(TSMC)在美股市場大放異彩,周四收盤時(shí)股價(jià)大漲超過9.79%,創(chuàng)下歷史新高,市值更是達(dá)到了驚人的1.07萬億美元。這一強(qiáng)勢表現(xiàn)主要得益于臺積電剛剛披露的第三季度業(yè)績,其表現(xiàn)大幅超出了市場的預(yù)期。
    的頭像 發(fā)表于 10-18 16:43 ?766次閱讀

    手機(jī)芯片的歷史與發(fā)展

    手機(jī)芯片的歷史和由來
    的頭像 發(fā)表于 09-20 08:50 ?7131次閱讀

    簡述微處理器的發(fā)展歷史

    微處理器的發(fā)展歷史是一部充滿創(chuàng)新與突破的技術(shù)演進(jìn)史,它見證了計(jì)算機(jī)技術(shù)的飛速發(fā)展和人類社會的巨大變革。以下是對微處理器發(fā)展歷史的詳細(xì)回顧,內(nèi)容將涵蓋其關(guān)鍵節(jié)點(diǎn)、重要里程碑以及技術(shù)演進(jìn)趨勢。
    的頭像 發(fā)表于 08-22 14:22 ?5872次閱讀

    圖像處理器的發(fā)展歷史

    圖像處理器(Image Processor)的發(fā)展歷史是一段充滿創(chuàng)新與突破的歷程,它伴隨著計(jì)算機(jī)技術(shù)的不斷進(jìn)步和圖像處理需求的日益增長而逐漸成熟。以下是對圖像處理器發(fā)展歷史的詳細(xì)回顧,旨在展現(xiàn)其從誕生到如今的演變過程。
    的頭像 發(fā)表于 08-14 09:42 ?1986次閱讀

    射頻天線的發(fā)展歷史

    射頻天線,作為無線通信系統(tǒng)的關(guān)鍵組成部分,其發(fā)展歷程充滿了探索與創(chuàng)新。從最初的簡單形態(tài)到如今的復(fù)雜多樣,天線技術(shù)不僅見證了無線通信技術(shù)的飛速發(fā)展,也深刻影響了人類社會的方方面面。以下是對射頻天線發(fā)展歷史的詳細(xì)回顧。
    的頭像 發(fā)表于 08-13 10:50 ?1839次閱讀