99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器視覺:圖像二值化

新機器視覺 ? 來源:新機器視覺 ? 作者:新機器視覺 ? 2021-03-29 14:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

傳統(tǒng)的機器視覺通常包括兩個步驟——預處理和物體檢測。而溝通二者的橋梁則是圖像分割(Image Segmentation)[1]。圖像分割通過簡化或改變圖像的表示形式,使得圖像更易于分析。

舉個例子,食品加工廠新進了一批肉雞,想通過視覺檢測其美味程度。機器在預處理優(yōu)化完圖像之后,要先把圖像中的雞肉和背景分開,并對感興趣的區(qū)域單獨進行分析,才能做出快速準確的判斷。

食品加工廠的視覺處理

然而,圖像分割對愚蠢的AI來說并不容易。聰明的人類一眼就能看出下圖中哪些東西能吃、哪些不能吃。但計算機要把這些東西分開卻得花費一番功夫。

原圖

圖像分割結(jié)果

最簡單的圖像分割方法是二值化(Binarization)。二值圖像每個像素只有兩種取值:要么純黑,要么純白。

彩色圖、灰度圖、二值圖對比

由于二值圖像數(shù)據(jù)足夠簡單,許多視覺算法都依賴二值圖像。通過二值圖像,能更好地分析物體的形狀和輪廓。二值圖像也常常用作原始圖像的掩模(又稱遮罩、蒙版,Mask):它就像一張部分鏤空的紙,把我們不感興趣的區(qū)域遮掉。進行二值化有多種方式,其中最常用的就是采用閾值法(Thresholding)進行二值化。

計算機視覺里,一般用矩陣來表示圖像。也就是說,無論你的圖片看上去多么好吃,對計算機來說都不過是個矩陣而已。

在這個矩陣里,每一個像素就是矩陣中的一個元素。在三通道的彩色圖像中,這個元素是由三個數(shù)字組成的元組。

彩色三通道圖像

而對于單通道的灰度圖像來說,這個元素就是一個數(shù)字。這個數(shù)字代表了圖像在這個點的亮度,數(shù)字越大像素點也就越亮,在常見的八位單通道色彩空間中,0代表全黑,255代表全白。

單通道的灰度圖

閾值法是指選取一個數(shù)字,大于它就視為全白,小于它就視為全黑。就像教室里的燈管開關(guān),我們輕輕地推動它,如果突然間超過了某個閾值,燈就啪的一聲亮了。

根據(jù)閾值選取方式的不同,可以分為全局閾值和局部閾值。

全局閾值

Global Method

全局閾值,指的是對整個圖像中的每一個像素都選用相同的閾值。我們可以在Photoshop的圖像-調(diào)整-閾值里體驗這一操作:

Photoshop里的閾值

可以看到閾值色階從1到255的移動過程中,圖像變黑的區(qū)域越來越多。當閾值數(shù)字在某個特定范圍內(nèi)的時候,紅米腸的輪廓清晰可辨。

正確的二值化使紅米腸輪廓清晰可辨

在生產(chǎn)線環(huán)境下,光照是已知的,常常會設(shè)定一個固定的數(shù)字來作為全局閾值。但是在室外或者機器人比賽中,光照條件往往更加復雜*。

RoboMaster賽場的絢麗燈光

*此圖采用了夸張手法,RoboMaster是個很正規(guī)的比賽,絕對不會在比賽的時候這么難為大家的。

同樣是奧利奧冰激凌,在白天和晚上,攝像頭看到的畫面可能不太一樣,常數(shù)閾值無法同時適應(yīng)這兩種情況。

明暗不同的畫面

對于畫面比較暗的晚上,我們需要一個比較低的閾值,比如說設(shè)定閾值為50,它在晚上能很清楚地把黑白兩種顏色分開,但是到了白天就是一片白(左邊);如果我們把閾值設(shè)置得比較高,比如說172,在白天能順利分割,但在晚上就是一片黑(右邊)。我們需要能夠適應(yīng)復雜環(huán)境的算法。

左邊閾值=50,右邊閾值=172

其實,稍作分析我們可以發(fā)現(xiàn),這張圖像中的顏色差異還是比較明顯的,只有深淺兩種顏色。因此,無論是在白天還是黑夜,它的色階直方圖都應(yīng)該是兩個明顯的波峰,分別代表深色和淺色的區(qū)域。只是色階直方圖在白天會整體向右偏移,而在夜晚整體向左偏移。

圖像的色階直方圖

如果選擇兩個波峰之間的波谷作為閾值,就能輕松地把這兩類像素分開。但是圖像的直方圖往往是不連續(xù)的,有非常多尖峰和抖動,要找到準確的極值點十分困難。

日本工程師大津展之為這個波谷找到了一個合適的數(shù)學表達,并于1979年發(fā)表[2]。這個二值化方法稱為大津算法(Otsu’s method)。大津算法類似于一維Fisher判別分析的離散化模擬。通過窮舉法找到一個閾值數(shù)字,把這些像素切成兩類,使得這兩類像素的亮度的類內(nèi)方差最小。類內(nèi)方差指的是兩類像素的方差的加權(quán)和,這里權(quán)指的是這類像素點數(shù)量占整個圖像像素點數(shù)量的比值。

也許你的畫面不會只有兩坨差異較大的顏色,比如這款雪糕的就有三個尖峰。

三色雪糕(取雪糕部位的直方圖)

這時候,只需對大津算法稍加擴展也可以完成。對大津算法的多級推廣成為多大津算法(multi Otsu method)[3]。

局部閾值*

Local Method

*又稱自適應(yīng)閾值,Adaptive Thresholding

比賽中常常會有聚光燈照在一個特定區(qū)域,產(chǎn)生局部受光、局部不受光的畫面。

局部受光的圖像

對于局部受光的圖像進行全局閾值,可能會出現(xiàn)“無論設(shè)置什么閾值參數(shù),都無法滿足全圖要求”的尷尬。比如上面這幅圖像,直接進行全局閾值時,左上半邊的壽司全都顯露出來時,右下半邊還是一片黑色。

局部受光圖像的全局閾值處理

這個時候我們就要用到局部閾值來處理了。其實,人的眼睛也是自帶了這一步操作的。我們判定一個東西顏色深淺,往往會受到物體周邊的顏色影響,這也就是為什么黑人的牙齒看上去更白。

局部閾值法假定圖像在一定區(qū)域內(nèi)受到的光照比較接近。它用一個滑窗掃描圖像,并取滑窗中心點亮度與滑窗內(nèi)其他區(qū)域(稱為鄰域, neighborhood area)的亮度進行比較。如果中心點亮度高于鄰域亮度*,則將中心點標記為白色,否則標記為黑色。

局部閾值的滑窗

*這里提到的是局部閾值的基本方法,對于實際使用中常見的其他局部閾值方法,請參閱Chow-Kaneko自適應(yīng)閾值法[4]。

局部閾值的應(yīng)用非常廣泛,特別是對白紙黑字的處理非常有效。光學字符識別(OCR)和二維碼掃描的算法中,很多都用了局部閾值操作。

比如下面這張二維碼就是一張典型的局部受光圖像:

掃掃看,局部受光的二維碼

如果對這張圖片采用全局閾值(例如下圖采用大津算法進行分割),是無論如何都無法正確分割的。

全局方法不能處理局部受光圖像

而采用局部閾值方法就能很好地分割圖像。從圖片里可以明顯觀察到,局部閾值方法對于一大片干凈區(qū)域的細節(jié)比較敏感,所以紙面上多出了很多我們原本注意不到的斑點。

局部方法分割二維碼

◆◆◆

實際運用中,我們要根據(jù)需求選擇不同的二值化方法,沒有哪個方法是絕對完美的。

例如,在識別敵方機器人時,由于裝甲片燈條是自發(fā)光物體,受環(huán)境光影響較小,為了提高程序運行效率,我們采用固定數(shù)字作為全局閾值:

基地自動反擊

在能量機關(guān)的識別中,由于能量機關(guān)只有黑白兩種顏色,我們采用了大津算法及其多種變體:

大能量機關(guān)各區(qū)域的二值圖

而在空中機器人讀取基地區(qū)二維碼的時候又用到了局部閾值方法:

空中機器人識別基地

今天所講的內(nèi)容只是圖像分割的冰山一角,作為視覺領(lǐng)域最古老的問題之一,時至今日仍有非常多圖像分割的新算法被提出。

除了基于閾值的圖像分割方法外,常用的分割方法還可以基于邊緣(如Yanowitz-Bruckstein自適應(yīng)閾值方法[5])、區(qū)域(如區(qū)域生長算法[6])等,它們在衛(wèi)星圖像處理、交通控制系統(tǒng)、工業(yè)生產(chǎn)監(jiān)控、醫(yī)療影像等領(lǐng)域發(fā)揮著巨大的作用。

腦部組織圖像分割

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35165

    瀏覽量

    280086
  • 圖像分割
    +關(guān)注

    關(guān)注

    4

    文章

    182

    瀏覽量

    18344
  • 二值化
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    4354

原文標題:機器視覺入門之圖像二值化

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    一文帶你了解什么是機器視覺網(wǎng)卡

    機器視覺網(wǎng)卡通常指的是在機器視覺系統(tǒng)中用于連接工業(yè)相機到計算機的以太網(wǎng)卡。它的核心作用是實現(xiàn)高速、穩(wěn)定、低延遲的圖像數(shù)據(jù)傳輸。以下是關(guān)于
    的頭像 發(fā)表于 07-09 16:18 ?152次閱讀
    一文帶你了解什么是<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>網(wǎng)卡

    工業(yè)相機圖像采集卡:機器視覺的核心樞紐

    工業(yè)相機圖像采集卡是用于連接工業(yè)相機與計算機的關(guān)鍵硬件設(shè)備,主要負責將相機輸出的圖像信號轉(zhuǎn)換為計算機可處理的數(shù)字信號,并實現(xiàn)高速、穩(wěn)定的數(shù)據(jù)傳輸。它在工業(yè)自動機器
    的頭像 發(fā)表于 05-21 12:13 ?200次閱讀
    工業(yè)相機<b class='flag-5'>圖像</b>采集卡:<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>的核心樞紐

    EtherCAT科普系列(8):EtherCAT技術(shù)在機器視覺領(lǐng)域的應(yīng)用

    機器視覺是基于軟件與硬件的組合,通過光學裝置和非接觸式的傳感器自動地接受一個真實物體的圖像,并利用軟件算法處理圖像以獲得所需信息或用于控制機器
    的頭像 發(fā)表于 05-15 17:09 ?655次閱讀
    EtherCAT科普系列(8):EtherCAT技術(shù)在<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>領(lǐng)域的應(yīng)用

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用

    的cv_bridge庫,可以輕松實現(xiàn)ROS圖像消息與OpenCV格式的轉(zhuǎn)換,這在實際開發(fā)中極為便利。 視覺巡線與維碼識別的應(yīng)用 視覺巡線是機器
    發(fā)表于 05-03 19:41

    工業(yè)相機與采集卡配套方案:構(gòu)建高性能機器視覺系統(tǒng)的核心要素

    機器視覺技術(shù)作為人工智能和智能制造的關(guān)鍵組成部分,正日益廣泛地應(yīng)用于工業(yè)自動、質(zhì)量檢測、機器人引導等領(lǐng)域。而一套高性能的機器
    的頭像 發(fā)表于 03-31 15:53 ?339次閱讀
    工業(yè)相機與采集卡配套方案:構(gòu)建高性能<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>系統(tǒng)的核心要素

    工業(yè)自動機器視覺技術(shù)的演變和未來發(fā)展趨勢

    機器視覺是一項使機器或工業(yè)設(shè)備能夠解釋和分析視覺數(shù)據(jù)的技術(shù),它將計算機科學與圖像處理技術(shù)相結(jié)合,實現(xiàn)了自動
    的頭像 發(fā)表于 03-06 11:39 ?942次閱讀
    工業(yè)自動<b class='flag-5'>化</b>中<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>技術(shù)的演變和未來發(fā)展趨勢

    紅外熱成像技術(shù)推動機器視覺向智能、精準發(fā)展

    如今,機器視覺作為人工智能領(lǐng)域的重要分支,正逐步滲透到各行各業(yè),從智能制造到智能安防,從醫(yī)療健康到智能駕駛,其應(yīng)用廣泛且深入。而紅外熱成像技術(shù),作為機器視覺中的一種特殊且強大的工具,正
    的頭像 發(fā)表于 02-28 13:29 ?529次閱讀
    紅外熱成像技術(shù)推動<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>向智能<b class='flag-5'>化</b>、精準<b class='flag-5'>化</b>發(fā)展

    Fibocom AI Stack滿足各種機器視覺應(yīng)用需求

    機器視覺作為AI應(yīng)用的“智慧之眼”,正成為各行各業(yè)數(shù)字轉(zhuǎn)型的核心技術(shù),廣泛應(yīng)用于工業(yè)自動、智能安防、醫(yī)療診斷等各個領(lǐng)域。訓練和優(yōu)化目標檢測、關(guān)鍵點檢測、
    的頭像 發(fā)表于 02-20 10:18 ?515次閱讀

    labview視覺助手 - machine vision - map defects,輸出float圖像,像素0.89*39496中的0.89是啥意思?

    labview視覺助手 - machine vision - map defects,輸出float圖像,像素0.89*39496中的0.89是啥意思? 無論是
    發(fā)表于 01-04 21:20

    【「具身智能機器人系統(tǒng)」閱讀體驗】+兩本互為支持的書

    最近在閱讀《具身智能機器人系統(tǒng)》這本書的同時,還讀了 《計算機視覺之PyTorch數(shù)字圖像處理》一書,這兩本書完全可以視為是互為依托的姊妹篇?!队嬎銠C視覺之PyTorch數(shù)字
    發(fā)表于 01-01 15:50

    適用于機器視覺應(yīng)用的智能機器視覺控制平臺

    工控機在機器視覺系統(tǒng)設(shè)計中是不可或缺的核心組件,在機器視覺中發(fā)揮著至關(guān)重要的作用,其強大的計算能力、高度的穩(wěn)定性和可靠性、實時性以及圖像處理
    的頭像 發(fā)表于 11-23 01:08 ?552次閱讀
    適用于<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>應(yīng)用的智能<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>控制平臺

    機器視覺與運動控制:科技協(xié)同下的完美搭檔

    的 “眼睛”,它主要由相機、鏡頭、光源和圖像處理軟件等組成。通過相機捕捉物體的圖像,再經(jīng)過圖像處理算法對圖像進行分析和處理,從而獲取物體的各種特征信息,如形狀、顏色、尺寸、位置等。
    的頭像 發(fā)表于 09-10 10:03 ?496次閱讀

    視覺檢測是什么意思?機器視覺檢測的適用行業(yè)及場景有哪些?

    檢測的定義與原理 機器視覺檢測,是利用光學成像、數(shù)字信號處理和計算機技術(shù),模擬人類視覺的功能,對目標物體進行自動檢測和分析的技術(shù)。它包括圖像采集、預處理、特征提取、分類識別等多個環(huán)節(jié),
    的頭像 發(fā)表于 08-30 11:20 ?895次閱讀

    機器視覺在焊接質(zhì)量檢測中的應(yīng)用

    的可能性。今天跟隨創(chuàng)想智控小編一起了解機器視覺在焊接質(zhì)量檢測中的應(yīng)用。 1. 機器視覺原理 機器視覺
    的頭像 發(fā)表于 08-13 16:33 ?629次閱讀

    DSP教學實驗箱_數(shù)字圖像處理操作_案例分享:5-13 灰度圖像

    一、實驗目的 學習灰度圖像的原理,掌握圖像的讀取方法,并實現(xiàn)在LCD上顯示
    發(fā)表于 07-25 15:03