亚洲AV无码A片在线观看蜜芽,毛多色婷婷一区二区

近年來(lái)，學(xué)生黨們擁有了一款新的學(xué)習(xí)神器——拍照搜題。當(dāng)遇到不會(huì)做的題目時(shí)，只需要對(duì)著題目拍照，手機(jī)中就會(huì)出現(xiàn)這道題目的詳細(xì)解答思路和答案。“拍照搜題”背后的黑科技就是光學(xué)字符識(shí)別技術(shù)，即OCR。OCR是指電子設(shè)備，例如掃描儀或相機(jī)檢查紙上打印的字符，通過(guò)檢測(cè)暗、亮的模式確定其形狀，然后用字符識(shí)別的方法將形狀翻譯成計(jì)算機(jī)文字的過(guò)程。

OCR的應(yīng)用領(lǐng)域十分廣泛。最早為我們熟知的“哪里不會(huì)點(diǎn)哪里”的點(diǎn)讀機(jī)就應(yīng)用了OCR。點(diǎn)讀機(jī)的點(diǎn)讀筆中裝有一個(gè)掃描文字的攝像頭，當(dāng)點(diǎn)讀筆接觸到書(shū)本后，便可將文字內(nèi)容識(shí)別和提取。作為常用的一款辦公軟件，掃描全能王可以實(shí)現(xiàn)“圖片轉(zhuǎn)文字”的功能。軟件可以識(shí)別各種文件類(lèi)型中的文字信息，這是非常典型的OCR技術(shù)的應(yīng)用。

目前，文本識(shí)別分為以下幾類(lèi)：

· 通用文字識(shí)別：一般是指如PDF等不規(guī)則文檔類(lèi)的識(shí)別。

·卡證識(shí)別：包括身份證、銀行卡、營(yíng)業(yè)執(zhí)照、名片、護(hù)照、港澳通行證、戶口本、駕駛證、行駛證等等。

· 票據(jù)識(shí)別：包括增值稅發(fā)票、定額發(fā)票、火車(chē)票、出租車(chē)票、行程單、保單、銀行單據(jù)等等。

· 其他：如車(chē)牌、車(chē)輛合格證、印章檢測(cè)等等。

隨著分類(lèi)的不斷拓展，OCR技術(shù)的應(yīng)用場(chǎng)景也越來(lái)越廣泛，以下是幾個(gè)應(yīng)用較為成熟的領(lǐng)域：

· 遠(yuǎn)程身份認(rèn)證：結(jié)合OCR和人臉識(shí)別技術(shù)，實(shí)現(xiàn)用戶證件信息的自動(dòng)錄入，并完成用戶身份驗(yàn)證。應(yīng)用于金融保險(xiǎn)、社保、O2O等行業(yè)，有效控制業(yè)務(wù)風(fēng)險(xiǎn)。

· 內(nèi)容審核與監(jiān)管：自動(dòng)識(shí)別圖片、視頻中的文字內(nèi)容，及時(shí)發(fā)現(xiàn)涉黃、涉暴、政治敏感、惡意廣告等不合規(guī)內(nèi)容，規(guī)避業(yè)務(wù)風(fēng)險(xiǎn)，大幅節(jié)約人工審核成本。

· 紙質(zhì)文檔票據(jù)電子化：通過(guò)OCR實(shí)現(xiàn)紙質(zhì)文檔資料、票據(jù)、表格的自動(dòng)識(shí)別和錄入，減少人工錄入成本，提高輸入效率。

針對(duì)上述的場(chǎng)景，基于深度學(xué)習(xí)的技術(shù)而言，訓(xùn)練數(shù)據(jù)的數(shù)量很大程度上影響了技術(shù)效果。數(shù)據(jù)堂作為深耕于AI數(shù)據(jù)領(lǐng)域近10年的人工智能數(shù)據(jù)服務(wù)提供商，一直致力于為全球人工智能企業(yè)提供專(zhuān)業(yè)的數(shù)據(jù)服務(wù)。依托自身的數(shù)據(jù)優(yōu)勢(shì)以及豐富的數(shù)據(jù)處理經(jīng)驗(yàn)，數(shù)據(jù)堂推出了系列OCR標(biāo)注及轉(zhuǎn)寫(xiě)數(shù)據(jù)，為相關(guān)技術(shù)應(yīng)更廣泛的落地提供助力。

數(shù)據(jù)涵蓋8種語(yǔ)言、多種場(chǎng)景、不同拍攝角度、不同拍攝距離、不同光照條件。在標(biāo)注方面，標(biāo)注行級(jí)文本的四邊形框，行級(jí)文本轉(zhuǎn)寫(xiě)。四邊形框頂點(diǎn)偏差不超過(guò)五個(gè)像素為正確檢測(cè)，檢測(cè)框精度不低于95%，文本轉(zhuǎn)寫(xiě)精度不低于95%，該數(shù)據(jù)可用于多國(guó)語(yǔ)言O(shè)CR任務(wù)。

數(shù)據(jù)涵蓋12種語(yǔ)言(6種亞洲語(yǔ)、6種歐洲語(yǔ))，包括商店牌匾、站牌、海報(bào)、車(chē)票、路標(biāo)、漫畫(huà)、井蓋畫(huà)、提示語(yǔ)、警示語(yǔ)、包裝說(shuō)明、菜單、建筑物標(biāo)志等多種自然場(chǎng)景。在標(biāo)注方面，標(biāo)注行級(jí)文本的四邊形框，行級(jí)文本轉(zhuǎn)寫(xiě)，四邊形框頂點(diǎn)偏差不超過(guò)五個(gè)像素為正確檢測(cè)，檢測(cè)框精度不低于97%，文本轉(zhuǎn)寫(xiě)精度不低于97%。

數(shù)據(jù)包括自然場(chǎng)景圖片2,056張，互聯(lián)網(wǎng)圖像1,103張，文本圖像347張。在標(biāo)注方面，行級(jí)內(nèi)容用行級(jí)四邊形框標(biāo)注、行級(jí)內(nèi)容轉(zhuǎn)寫(xiě);豎列內(nèi)容用豎列四邊形框標(biāo)注、豎列內(nèi)容轉(zhuǎn)寫(xiě)。數(shù)據(jù)可用于多場(chǎng)景下的印地語(yǔ)識(shí)別、印地語(yǔ)拍照翻譯等任務(wù)。

數(shù)據(jù)包括自然場(chǎng)景圖片258張，互聯(lián)網(wǎng)圖像2,553張，文本圖像2,184張。在標(biāo)注方面，行級(jí)內(nèi)容用行級(jí)四邊形框標(biāo)注、行級(jí)內(nèi)容轉(zhuǎn)寫(xiě);豎列內(nèi)容用豎列四邊形框標(biāo)注、豎列內(nèi)容轉(zhuǎn)寫(xiě)。數(shù)據(jù)可用于多種場(chǎng)景下的越南語(yǔ)識(shí)別、越南語(yǔ)拍照翻譯等任務(wù)。

相比物體檢測(cè)識(shí)別，OCR由于包含傾斜文本框、低分辨率文字和文本版面多樣化的情況，因此OCR數(shù)據(jù)標(biāo)注具有特殊性，標(biāo)注成本更高。數(shù)據(jù)堂的數(shù)加加Pro標(biāo)注平臺(tái)支持私有化部署，能夠幫助企業(yè)快速、安全的對(duì)人工智能數(shù)據(jù)進(jìn)行標(biāo)注，為企業(yè)提供更專(zhuān)業(yè)、更安全的數(shù)據(jù)基礎(chǔ)設(shè)施。

fqj

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴