作為人工智能的關(guān)鍵領(lǐng)域之一的計(jì)算機(jī)視覺(jué)近期再次成為了熱點(diǎn),那么你真的了解什么是計(jì)算機(jī)視覺(jué)嗎?
什么是計(jì)算機(jī)視覺(jué)
計(jì)算機(jī)視覺(jué),英文Computer Vision,簡(jiǎn)稱(chēng)CV。計(jì)算機(jī)視覺(jué)是一門(mén)研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步的說(shuō),就是指用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等。
計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)有何區(qū)別?
事實(shí)上,二者經(jīng)常會(huì)被混淆,甚至有些“專(zhuān)家”也沒(méi)分清。
簡(jiǎn)單的說(shuō),二者最大的區(qū)別,在于技術(shù)要求的側(cè)重點(diǎn)不一樣,甚至差別很大。計(jì)算機(jī)視覺(jué)(CV),主要是對(duì)質(zhì)的分析,比如分類(lèi)識(shí)別,這是一個(gè)杯子那是一條狗?;蛘咦錾矸荽_認(rèn),比如人臉識(shí)別,車(chē)牌識(shí)別?;蛘咦鲂袨榉治?,比如人員入侵,徘徊,遺留物,人群聚集等。
機(jī)器視覺(jué)(MV),主要側(cè)重對(duì)量的分析,比如通過(guò)視覺(jué)去測(cè)量一個(gè)零件的直徑,一般來(lái)說(shuō),對(duì)準(zhǔn)確度要求很高。
計(jì)算機(jī)視覺(jué)主要任務(wù)是什么?
計(jì)算機(jī)視覺(jué)的主要任務(wù)就是通過(guò)對(duì)采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場(chǎng)景的信息。計(jì)算機(jī)視覺(jué)任務(wù)的主要類(lèi)型有以下幾種:
01 物體檢測(cè)
物體檢測(cè)是視覺(jué)感知的第一步,也是計(jì)算機(jī)視覺(jué)的一個(gè)重要分支。物體檢測(cè)的目標(biāo),就是用框去標(biāo)出物體的位置,并給出物體的類(lèi)別。
物體檢測(cè)和圖像分類(lèi)不一樣,檢測(cè)側(cè)重于物體的搜索,而且物體檢測(cè)的目標(biāo)必須要有固定的形狀和輪廓。圖像分類(lèi)可以是任意的目標(biāo),這個(gè)目標(biāo)可能是物體,也可能是一些屬性或者場(chǎng)景。
02物體識(shí)別(狹義)
計(jì)算機(jī)視覺(jué)的經(jīng)典問(wèn)題便是判定一組圖像數(shù)據(jù)中是否包含某個(gè)特定的物體,圖像特征或運(yùn)動(dòng)狀態(tài)。這一問(wèn)題通常可以通過(guò)機(jī)器自動(dòng)解決,但是到目前為止,還沒(méi)有某個(gè)單一的方法能夠廣泛的對(duì)各種情況進(jìn)行判定:在任意環(huán)境中識(shí)別任意物體。
現(xiàn)有技術(shù)能夠也只能夠很好地解決特定目標(biāo)的識(shí)別,比如簡(jiǎn)單幾何圖形識(shí)別、人臉識(shí)別、印刷或手寫(xiě)文件識(shí)別,或者車(chē)輛識(shí)別。而且這些識(shí)別需要在特定的環(huán)境中,具有指定的光照,背景和目標(biāo)姿態(tài)要求。
03圖像分類(lèi)
一張圖像中是否包含某種物體,對(duì)圖像進(jìn)行特征描述是物體分類(lèi)的主要研究?jī)?nèi)容。一般說(shuō)來(lái),物體分類(lèi)算法通過(guò)手工特征或者特征學(xué)習(xí)方法對(duì)整個(gè)圖像進(jìn)行全局描述,然后使用分類(lèi)器判斷是否存在某類(lèi)物體。
圖像分類(lèi)問(wèn)題就是給輸入圖像分配標(biāo)簽的任務(wù),這是計(jì)算機(jī)視覺(jué)的核心問(wèn)題之一。這個(gè)過(guò)程往往與機(jī)器學(xué)習(xí)和深度學(xué)習(xí)不可分割。
04物體定位
如果說(shuō)圖像識(shí)別解決的是what,那么,物體定位解決的則是where的問(wèn)題。利用計(jì)算視覺(jué)技術(shù)找到圖像中某一目標(biāo)物體在圖像中的位置,即定位。
目標(biāo)物體的定位對(duì)于計(jì)算機(jī)視覺(jué)在安防、自動(dòng)駕駛等領(lǐng)域的應(yīng)用有著至關(guān)重要的意義。
05圖像分割
在圖像處理過(guò)程中,有時(shí)會(huì)需要對(duì)圖像進(jìn)行分割來(lái)提取有價(jià)值的用于后繼處理的部分,例如篩選特征點(diǎn),或者分割一或多幅圖片中含有特定目標(biāo)的部分等。
圖像分割指的是將數(shù)字圖像細(xì)分為多個(gè)圖像子區(qū)域(像素的集合,也被稱(chēng)作超像素)的過(guò)程。圖像分割的目的是簡(jiǎn)化或改變圖像的表示形式,使得圖像更容易理解和分析。更精確地說(shuō),圖像分割是對(duì)圖像中的每個(gè)像素加標(biāo)簽的一個(gè)過(guò)程,這一過(guò)程使得具有相同標(biāo)簽的像素具有某種共同視覺(jué)特性。
“圖像語(yǔ)意分割”是一個(gè)像素級(jí)別的物體識(shí)別,即每個(gè)像素點(diǎn)都要判斷它的類(lèi)別。它和檢測(cè)的區(qū)別是,物體檢測(cè)是一個(gè)物體級(jí)別的,他只需要一個(gè)框,去框住物體的位置,而通常分割是比檢測(cè)要更難的問(wèn)題。
計(jì)算機(jī)視覺(jué)是通過(guò)創(chuàng)建人工模型來(lái)模擬本由人類(lèi)執(zhí)行的視覺(jué)任務(wù)。其本質(zhì)是模擬人類(lèi)的感知與觀察的一個(gè)過(guò)程。這個(gè)過(guò)程不止識(shí)別,而是包含了一系列的過(guò)程,并且最終是可以在人工系統(tǒng)中被理解和實(shí)現(xiàn)的。
目前在計(jì)算機(jī)視覺(jué)領(lǐng)域已經(jīng)涌現(xiàn)出商湯科技、曠視科技、深蘭科技、依圖科技、云從科技等一批技術(shù)領(lǐng)先的獨(dú)角獸公司,行業(yè)稱(chēng)為“視覺(jué)五虎將”。
來(lái)源:機(jī)器視覺(jué)沙龍
審核編輯:湯梓紅
-
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7667瀏覽量
90868 -
機(jī)器視覺(jué)
+關(guān)注
關(guān)注
163文章
4598瀏覽量
122962 -
AI
+關(guān)注
關(guān)注
88文章
35197瀏覽量
280327 -
人工智能
+關(guān)注
關(guān)注
1807文章
49036瀏覽量
249793 -
視覺(jué)技術(shù)
+關(guān)注
關(guān)注
0文章
93瀏覽量
13797
原文標(biāo)題:【光電智造】干貨!一文讀懂AI計(jì)算機(jī)視覺(jué)技術(shù)!
文章出處:【微信號(hào):今日光電,微信公眾號(hào):今日光電】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
什么是計(jì)算機(jī)視覺(jué)?計(jì)算機(jī)視覺(jué)的三種方法

機(jī)器視覺(jué)與計(jì)算機(jī)視覺(jué)的關(guān)系簡(jiǎn)述
自動(dòng)駕駛系統(tǒng)要完成哪些計(jì)算機(jī)視覺(jué)任務(wù)?
深度學(xué)習(xí)后的計(jì)算機(jī)視覺(jué)應(yīng)用領(lǐng)域解析
計(jì)算機(jī)視覺(jué)常用算法_計(jì)算機(jī)視覺(jué)有哪些分類(lèi)
計(jì)算機(jī)視覺(jué)中的重要研究方向
計(jì)算機(jī)視覺(jué)技術(shù)的概念
計(jì)算機(jī)視覺(jué)中主要的五大技術(shù)

計(jì)算機(jī)視覺(jué)的基礎(chǔ)概念和現(xiàn)實(shí)應(yīng)用
計(jì)算機(jī)視覺(jué)相關(guān)概念總結(jié)
計(jì)算機(jī)視覺(jué)是什么 計(jì)算機(jī)視覺(jué)歷史及發(fā)展趨勢(shì)
工業(yè)視覺(jué)與計(jì)算機(jī)視覺(jué)的區(qū)別

計(jì)算機(jī)視覺(jué)的十大算法

評(píng)論