摘要:提出了一種基于小波和熵提取圖像字符特征的方法。該方法利用小波變換對圖像字符進行多尺度分解,用marr零交叉邊緣檢測算子提取邊緣;用基于判別熵最小化提取每一尺度圖像的邊界特征,小波的“數(shù)字顯微鏡”的優(yōu)點與熵能確切地表達各類的交疊狀況且能直接表達錯誤率的特征相結(jié)合。與其它方法相比,該方法提取的特征向量穩(wěn)定、識別率高、算法快,非常有利于分類,且特征提取的方法有人類視覺的特點。
在線簽名驗證是通過計算機采集和驗證個人簽名,從而實現(xiàn)無紙化辦公的一種技術(shù)[1]。其中,從采集到的視頻圖像中提取有效的字符特片是在線簽名驗證系統(tǒng)的核心步驟。
隨著計算機和模式識別技術(shù)的迅速發(fā)展,出現(xiàn)了很多提取字符特征的方案,最具代表性的有邊緣描述法和矩描述法[2]。描述邊緣形狀的方法可用曲線擬合和傅立葉描述子方法。傅立葉描述子雖較好地描述了一封閉的圖像輪廓,但其特征很多,噪聲和量化誤差對具有較低幅值的系數(shù)影響較大。當(dāng)用FFT計算傅立葉系數(shù),必須將其邊界點的長度修成2的整數(shù)次冪,且其描述不具有三個(方向、位置、大?。┎蛔冃?,不能直接用于目標識別,必須進行復(fù)雜的變換。這些都影響了它的使用。矩描述法就是利用圖像灰度分布的各階矩描述圖像灰度分布的特征。矩特征是定義在整個圖像空間上的一個二重積分,它同樣不具有三個不變性,使用時必須進行歸一化處理。不變矩只是一種旋轉(zhuǎn)歸一化方法,必須結(jié)合大小,位置歸一化處理才有三個不變性。
圖1
雖然用這些特征進行圖像識別取得了較為滿意的效果,但是,這些特征的定義都是相當(dāng)復(fù)雜的,運算量很大,并且與人類認知的機理也是完全不同的,不能直觀地理解。本文提出了一種將統(tǒng)計特征與結(jié)構(gòu)特征相結(jié)合的新思路,對字符圖像進行小波多尺度分解,有效地抑制了圖像中的噪聲,充分反映了圖像結(jié)構(gòu)的精細特征;用基于判別熵最小化進行特征提取能確切地表達各類的交疊狀況,且能直接表達錯誤率,從而有效地提高識別率。
1 小波多尺度分解
為了尋找空間的L2的基,先從L2的某個子空間出發(fā),在這個子空間中先建立基底,然后利用簡單變換,把這個基底擴充到空間L2上,以形成一組基。這就是多尺度分析方法[3][4]。
對于二維的情況,設(shè){V2J}jez是一個可分離的MRA:V2J=VjVj,其中{V2j}jez是L2(R2)的一個MRA,其尺度函數(shù)為¢是一維MRA{V2j}jez的實值尺度函數(shù),小波母函數(shù)采用Dabuechies[6]小波;相應(yīng)于二維尺度函數(shù)V2j=VjVj,定義三個函數(shù):
構(gòu)成子空間W2j的正交標準基,而它們的伸縮平移系(簡寫)為:
是L2(R2)的一個標準正交基。
在本系統(tǒng)中,通過與計算機相連的手寫板及電子筆將簽名采集到計算機并顯示在屏幕上。采集并輸入到計算機中的圖像是二維,本文中設(shè)要分解的圖像為f (x,y)ΕL2(R2)。為方便,設(shè)L2(R2)-V2N,即令fN是f在V2N的正交投影。這樣關(guān)于f的有限小波分解就是對fN的分解。由于:
假定{V2j}jez上的尺度函數(shù)Φj,Φj(x,y)=2jΦ(2jx,2jy)為二維MAR{V2j}jez的尺度函數(shù),小波函數(shù)ψ(α)j, α=1,2,3已分別由式(1)和式(2)給出,并由陣列{CNk1,k2},(k1,k1ΕZ2),使得:
其中,Cn,k1,k2=
同樣,有:
式中(6),j=N-1,Λ,N-M。fj是fN在f2j上的低通濾波信號,而gαj, α=1,2,3是fN在W2j上的三個高通濾波細節(jié)。再設(shè)有限長序列{Pk1}、{Pk2}分別是平面(x,y)上x方向與y方向的高通濾波系數(shù),{gk1}與{gk2}分別是x方向與y方向的低通濾波系數(shù),則由式(6)得到:
上式中箭頭右部分是左部分的矩陣表示,其中CN是原始信號f(x,y)的分布陣列,Pr、Pc是分別對CN的行與列作低通濾波的算子,而Qr、Qc是分別對CN的行與列作高通濾波的算子。而進一步地第j次分解應(yīng)為:
式(7)中,j=N-2, Λ,N-M。式(7)便是二維信號fN或CN的有限正交小波分解的Mallat塔式算法[5]。通過實驗,選用Daubechies 8小波能達到較好的分解效果。對采集進入計算機的真實簽名與偽造簽名進行小波分解,限于遍幅,本文只給出了真實簽名的一次分解圖,如圖書1所示。
通常在實驗中,借助Matlab6.5將真假簽名的字符圖像通過兩個互補濾波器即低通濾波器和高通濾波器分別得到圖像的相似和細節(jié)部分。相似子圖主要是原始圖像的全局、低頻成分,而細節(jié)子圖通常是原始圖像的局部、高頻成分。細節(jié)子圖又包括水平子圖、斜向子圖和垂直子圖三部分。其中細節(jié)子圖經(jīng)過兩次濾波:水平方向允許低頻分量通過,而沿垂直方向允許高頻分量通過。這對橫向筆劃(灰度變化沿水平方向為低頻,沿垂直方向為高頻)是增強,而對豎筆劃(灰度變化沿水平方向為高頻,沿垂直方向為低頻)是平滑。垂直方向和斜方向的像素按同樣的道理分別在垂直子圖和斜子圖中被突出表示。這種方向選擇性與人眼視覺特性相吻合,使建立在此基礎(chǔ)上的特征提以算法具有類視覺特性。
圖2
2 零交叉邊緣算子
經(jīng)典的邊緣檢測算子有Sobel算子、Laplace算子、Marr算子等,近年來又有學(xué)者提出了廣義模糊算子[7]、形態(tài)學(xué)邊緣算[8]等。而Marr邊緣檢測算子▽2G被譽為最佳邊緣監(jiān)測器之一,所以本文采Marr算子。該算子的特點是利用高斯濾波器對圖像進行平滑。二維高斯濾波器的響應(yīng)函數(shù)。設(shè)f(x,y)為二值圖像函數(shù),由線性系統(tǒng)中卷積和微分的可交換性,得▽2{G(x,y)хI(x,y)}={ ▽2G (x,y)} хI(x,y),即:對圖像的高斯平滑濾波與拉普拉斯微分運算可結(jié)合成一個卷積子如下:
用上述算子卷積圖像,通過判斷符號的變化確定出零交叉點的位置,就是邊緣點。對小波一次分解后的真實簽名的處理結(jié)果如圖2所示。
通過圖2可以看出,Marr零交叉邊緣算子同時提取了強、弱邊緣,并且邊緣相對干凈,噪聲干擾少,連續(xù)性好。
3 基于判別熵最小化的特征提取
不同的類樣本占有不同的特征空間的區(qū)域,只要這些區(qū)域不相交疊,它們就可以分開。經(jīng)常用樣本間的平均距離作為特征提取的判據(jù)函數(shù)。重要的距離有Minkowski度量ΔM、歐氏距離δE、Chebychev距離δr、平方距離δQ和非線性度量δN等。在不考慮各類的概率分布時,不能確切地表達各類的交疊狀況,且不能直接表達錯誤率。為此,應(yīng)考慮概率距離,利用不確定性最小的分征進行分類是最有利的,故可用熵來度量后驗證概率分布的集中程序。
某此概率分布密度偏離給定標準分布的程度的度量,叫相對熵。本文假定經(jīng)小波和Marr算子處理后的圖像函數(shù)?(xi,yj)的概率分布為P(xi,yj),給定標準分布ω(xi,yj),則兩者之間的相對熵為:
求和應(yīng)在該特征所有可能的取值上進行。
相對熵越小,這兩類概率分布的差別就越大,當(dāng)兩類概率分別完全相同時,相對熵達最大值(等于零)。因此可以定義判別熵W(p,q)來表征兩類分布p(xi,yj)和q(xi,yi)的差別大小。
在多類情況下,可以用ΣnΣmW(p(n),q(m))表示各類分布之間的分離程度。這里n,m代表類別號。
對特征提取來說,在給定維數(shù)d的條件下,求得這樣d個特征,它使上述判別熵最小。為了計算方便,本文用下列函數(shù)-U(p,q)= ΣiΣj(pi,j-qij)2≤0代替W(p,q),而不影響選取d個最優(yōu)特征的結(jié)果。
在不對概率分布作估計的情況下,可以用經(jīng)過歸一化處理的樣本特征值代替上式中的概率分布。
K是第一類樣本集中的樣本號,N1是第一類的樣本總數(shù),i是特征號。由于,這樣做是合理的。而U取最小值的坐標系統(tǒng)工程是由矩陣A=G(1)-G(2)滿足一定條件的d個本征值相應(yīng)的本征向量組成的。這里G(1)和G(2)分別是第一類樣本集和第二類本集的協(xié)方差矩陣。即將矩陣A的本征向量uk對應(yīng)的本征值λk,k=1,2,ΛD排隊:
選取本征值對應(yīng)的本征向量為所要求的坐標軸系統(tǒng),在這個坐標系統(tǒng)中判別熵最小。在實驗中選取Shannon熵。表1和表2分別列出了真實簽名和偽造簽名分解后的各尺度圖像的最小判別熵。
由表1和表2的計算數(shù)據(jù)可以看出,通過小波一次分解后的最小判別熵的數(shù)據(jù)可以很明顯地對真假簽名進行鑒別。并且,相似圖形與細節(jié)圖形的最小判別熵相差甚遠,區(qū)別較大;而細節(jié)圖形中的水平子圖、斜向子圖和垂直子圖三部分的最小判別熵卻相差較小。因此,這樣提取的特征向量穩(wěn)定性好、區(qū)別性大、正確性高。
表1 真實簽名最小判別熵
相似圖形 | 水平子圖 | 斜線子圖 | 垂直子圖 | |
相似圖形 | 0.0000 | 56.7827 | 58.371 | 60.5942 |
水平子圖 | 58.371 | 0.0000 | 1.5883 | 3.8115 |
斜線子圖 | 56.7827 | 1.5883 | 0.0000 | 2.2232 |
垂直子圖 | 60.5942 | 3.8115 | 2.2232 | 0.0000 |
表2 偽造簽名最小判別熵
相似圖形 | 水平子圖 | 斜線子圖 | 垂直子圖 | |
相似圖形 | 0.0000 | 101.5640 | 126.6594 | 149.2631 |
水平子圖 | 101.5640 | 0.0000 | 25.0954 | 47.6991 |
斜線子圖 | 126.6594 | 25.0954 | 0.0000 | 22.6037 |
垂直子圖 | 149.25631 | 47.6991 | 22.6037 | 0.0000 |
4 實驗結(jié)論
對120個不同的真實簽名進行了實驗,且每份真實簽名對應(yīng)20個不同的偽造簽名,用小波分別對這些簽名圖像進行6次分解,各選取其中的256幅圖像,分別進行邊緣連接及最小化判別熵特征提取,鑒別率達到了98.7%,取得了令人滿意的結(jié)果。通過以上的理論分析和實驗驗證說明,用小波分解使原來單一的時域信號分解為不同頻率尺度下的信號不僅能獲得圖像在各尺度上的細節(jié)信息,且噪聲干擾少,邊緣清晰;在特征提取時用熵函數(shù)的期望值表征類別的分離程度,可以作為分類有效性的評價。該方法的優(yōu)越性對提高在線簽名驗證的精確性具有重要的意義。
相關(guān)推薦
ORB_FPGA單層圖像金字塔的ORB特征提取方案分析


基于卷積神經(jīng)網(wǎng)絡(luò)的雙重特征提取方法


多站低頻雷達運動人體微多普勒特征提取與跟蹤技術(shù)【論文干貨】
HOOFR-SLAM的系統(tǒng)框架及其特征提取
MATLAB中怎么對音頻信號頻譜圖中能量密度特征用數(shù)學(xué)形態(tài)學(xué)的方法進行特征提取?
分形特征的模擬電路故障診斷方法
基于局域判別基的音頻信號特征提取方法
基于聯(lián)合頻率分析的特征提取及識別過程
如何提取顏色特征?
如何將脈沖耦合神經(jīng)網(wǎng)絡(luò),體視學(xué)等結(jié)合實現(xiàn)藥材顯微圖像的特征提取?
手背靜脈特征提取算法
模擬電路故障診斷中的特征提取方法
高分辨率合成孔徑雷達圖像的直線特征多尺度提取方法
基于改進ReliefF算法的主成分特征提取方法

基于已知特征項和環(huán)境相關(guān)量的特征提取算法

基于興趣點顏色及紋理特征的圖像檢索算法

基于DDCT與TCSVD的人臉特征提取與識別算法

基于DCT和KDA的人臉特征提取新方法

主成份分析在數(shù)字圖像特征提取中的應(yīng)用

基于Fisher的Gabor特征提取方法

SISAR功率譜特征提取方法

基于廣義典型相關(guān)分析的仿射不變特征提取方法

基于融合邊緣檢測的SAR圖像線性特征提取算法

基于小波域NMF特征提取的SAR圖像目標識別方法

利用改進分形特征對SAR圖像目標檢測方法的研究

模式識別中的特征提取研究

KPL特征提取在心電識別中的應(yīng)用研究

特征提取與模板匹配結(jié)合的圖像拼接方法

基于有效性評價機制的小波包特征提取技術(shù)

非線性PCA在表面肌電信號特征提取中的應(yīng)用

基于子塊特征的遙感圖像邊緣灰提取

基于小波分析的車輛噪聲特征提取方法

故障特征提取的方法研究


小波變換在過零調(diào)制信號特征提取中的應(yīng)用


基于EMD法的語音信號特征提取

多尺度Gabor小波變換在圖像檢索中的應(yīng)用

紋理特征提取方法

基于Gabor變換的中文字符特征提取方法研究

基于奇異值分解的車牌特征提取方法研究

基于Gabor的特征提取算法在人臉識別中的應(yīng)用

基于改進SIFT的圖像拼接算法

模擬電路故障診斷中的特征提取方法

基于最優(yōu)Morlet小波自適應(yīng)包絡(luò)解調(diào)的弱故障特征提取方法

一種對野值魯棒的紋理特征提取方法

顏色特征提取方法

具有SIFT描述的多尺度角點圖像配準

激光網(wǎng)格標記圖像特征提取

基于HSV色彩空間改進的多尺度顯著性檢測方法

基于三通道全連接層的卷積神經(jīng)網(wǎng)絡(luò)特征提取

Curvelet變換用于人臉特征提取與識別


一種去冗余的SIFT特征提取方法

小波提取圖像特征方法研究


基于多尺度HOG的草圖檢索

基于眼底圖像三個彩色通道的出血特征提取方法

基于LBP的深度圖像手勢特征提取算法

基于生物視皮層機制的視頻運動特征提取方法

一種新的語音信號特征提取方法

基于主成分分析方向深度梯度直方圖的特征提取算法

無監(jiān)督行為特征提取算法

基于小波脊線的特征提取算法

基于HTM架構(gòu)的時空特征提取方法

液壓泵振動信號特征提取方法

如何提高愛好特征提取的效率詳細算法說明

圖像邊緣檢測和特征提取實驗報告的詳細資料說明

機器學(xué)習(xí)之特征提取 VS 特征選擇


改進多尺度三維殘差卷積神經(jīng)網(wǎng)絡(luò)的高光譜圖像方法

改進多尺度三維殘差卷積神經(jīng)網(wǎng)絡(luò)的高光譜圖像方法

基于注意力機制和多尺度特征融合的網(wǎng)絡(luò)結(jié)構(gòu)

融合多尺度與多層級特征的立體匹配方法

利用FCN提取特征的紅外與可見光圖像融合方法

一種面向鐵路文本分類的字符級特征提取方法

一種基于信息熵與綜合函數(shù)特征提取

卷積神經(jīng)網(wǎng)絡(luò)是怎樣實現(xiàn)不變性特征提取的?


為什么卷積神經(jīng)網(wǎng)絡(luò)可以做到不變性特征提取?


多尺度卷積特征融合的SSD目標檢測

基于特征提取和密度聚類的鋼軌識別算法

基于特征的基圖像提取和重構(gòu)方法

基于并行附加特征提取網(wǎng)絡(luò)的SSD地面小目標檢測模型

計算機視覺中不同的特征提取方法對比

高光譜圖像特征提取方法綜述


高光譜影像顯著性特征提取方法


bp神經(jīng)網(wǎng)絡(luò)的原理 用BP神經(jīng)網(wǎng)絡(luò)去識別圖片上的字符

評論