基于半監(jiān)督學(xué)習(xí)的車牌識別方法研究電子信息工程專業(yè)
《基于半監(jiān)督學(xué)習(xí)的車牌識別方法研究電子信息工程專業(yè)》由會員分享,可在線閱讀,更多相關(guān)《基于半監(jiān)督學(xué)習(xí)的車牌識別方法研究電子信息工程專業(yè)(40頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、 課題名稱: 基于半監(jiān)督學(xué)習(xí)的車牌識別方法研究 摘 要 隨著科技的發(fā)展,汽車作為交通工具也越來越普遍地被大眾應(yīng)用在日常生活當(dāng)中。雖然我國的基礎(chǔ)實(shí)施在不斷完善,越來越多的高速公路,和大型停車場被建設(shè),但其配套的車輛管理系統(tǒng)卻相對落后,可以說人為的管理已經(jīng)跟不上時(shí)代的潮流。為了解決上述問題,車牌自動識別技術(shù)應(yīng)時(shí)而生,并發(fā)展成為現(xiàn)代道路系統(tǒng)的重要組成之一。它以計(jì)算機(jī)視覺處理、數(shù)字圖像處理、模式識別等技術(shù)為基礎(chǔ),對攝像機(jī)所拍攝的車輛圖像或者視頻圖像進(jìn)行處理分析,進(jìn)而得到每輛車的車牌號碼和登記信息,可以實(shí)現(xiàn)盜搶車輛的管理、高速公路超速自動化的管理、電子警察、高速公路收費(fèi)等
2、等功能。這些對于維護(hù)交通安全和城市治安,實(shí)現(xiàn)城市交通智能化管理等都有著現(xiàn)實(shí)的意義。 本文主要研究車牌識別的最后一道工序,對給定車牌照進(jìn)行二值化處理后,然后將車牌進(jìn)行取輪廓并采用垂直投影和模版匹配技術(shù)進(jìn)行字符分割。將分割好的字符輸入到字符識別模塊。字符識別模塊提取字符的相關(guān)特征,然后和模板庫中的特征作比較,對車牌字符進(jìn)行識別。最終得出車牌識別信息。 關(guān)鍵字: 灰度化 二值化 字符分割 模板匹配 垂直投影 ABSTRACT With the development of science and technology, automobiles as
3、vehicles have become more and more widely used by the general public in daily life. Although our country’s basic implementation is constantly improving, more and more highways and large parking lots are being constructed, the supporting vehicle management systems are relatively backward. It can be s
4、aid that man-made management cannot keep up with the trend of the times.In order to solve the above problems, license plate automatic identification technology should emerge from time to time and become one of the important components of the modern road system.Based on techniques such as computer vi
5、sion processing, digital image processing, and pattern recognition, it processes and analyzes vehicle images or video images captured by the camera, and then obtains license plate numbers and registration information for each vehicle, and then adopts some follow-up processing technologies. It can re
6、alize the management of stolen vehicles, the management of highway speeding automation, the electronic police and highway toll collection and other functions. These have practical significance for maintaining traffic safety, urban security, and intelligent management of urban traffic. This paper ma
7、inly studies the last process of license plate recognition. After binarization of a given vehicle license plate, the license plate is profiled and the character segmentation is performed using vertical projection and template matching techniques. The split character is input to the character recogni
8、tion module. The character recognition module extracts the relevant features of the characters, and then compares them with the features in the template library to identify the license plate characters. The final license plate identification information. KEY WORDS: Grayscale,Binarization,Character
9、segmentation,Template matching,Vertical projection, 第 3 頁 目 錄 1 緒 論 1 1.1 課題研究背景和意義 1 1.2 車牌識別國內(nèi)外發(fā)展現(xiàn)狀 2 1.3 本文研究內(nèi)容 3 1.4 本文的組織結(jié)構(gòu) 3 2 車牌的預(yù)處理 5 2.1 顏色判斷 5 2.1.1 RGB顏色空間 5 2.1.2 HSV顏色空間 5 2.2 灰度化 6 2.3 二值化 7 2.3.1 圖像二值化的原理及作用 7 2.3.2 二值化的方法 7 2.3.3 算法思想和簡介 9 .3.4 方法的選擇判斷條件 12 圖2-4
10、 二值化圖形 13 2.4 車牌的噪聲去除 13 2.4.1 邊框和鉚釘?shù)娜コ?14 2.4.2 車牌內(nèi)部的噪聲去除 14 2.5 字符分割 18 2.5.1 字符的粗分割 20 2.5.2 字符的細(xì)分割 21 2.5.3 字符分割結(jié)果 22 3 車牌的識別 23 3.1 模板匹配的理論概述 23 3.2 車牌字符識別 23 3.2.2 統(tǒng)計(jì)模式方法 23 3.3 識別結(jié)果及分析 26 4 總結(jié) 26 4.1 研究總結(jié) 27 4.2 后期的展望 27 參考文獻(xiàn) 29 致謝 31 第iii頁 1 緒
11、 論 1.1 課題研究背景和意義 隨著中國實(shí)施科技強(qiáng)國戰(zhàn)略以來,中國的大數(shù)據(jù)計(jì)算等計(jì)算機(jī)科技技術(shù)發(fā)展迅速,人工智能也從理論走向了實(shí)踐,智能車牌識別技術(shù)同樣也在整個(gè)科技發(fā)展過程當(dāng)取得了顯著的進(jìn)步。這個(gè)技術(shù)結(jié)合了數(shù)碼相機(jī)以及計(jì)算機(jī)識別等多種技術(shù),通過采集圖像并且結(jié)合計(jì)算機(jī)的處理之后,能夠獲取到多樣化的圖片信息,進(jìn)而通過分析這些圖片達(dá)到識別車牌的目的。這個(gè)系統(tǒng)已經(jīng)在實(shí)踐中得到運(yùn)用,就現(xiàn)在的主流車牌識別系統(tǒng)都是由以下幾個(gè)步驟構(gòu)成:主要包括采集圖像,圖像的預(yù)處理,對車牌進(jìn)行定位,之后再將車牌進(jìn)行分割,追蹤識別車牌。 雖然建立起這樣一個(gè)全國性的車牌識別體系需要大量的時(shí)間和精力,但是其現(xiàn)實(shí)價(jià)值非??捎^
12、。因?yàn)殡S著中國經(jīng)濟(jì)的高速發(fā)展,越來越多的民眾開始使用汽車作為出行工具,這樣給交通管理帶來前所未有的壓力。但當(dāng)有這種車牌系統(tǒng)的時(shí)候,一個(gè)路段安裝一個(gè)攝像頭就可以實(shí)時(shí)監(jiān)控每一個(gè)路段情況,同樣可以根據(jù)需要安排人員對一些交通復(fù)雜的地段進(jìn)行疏導(dǎo),這樣大大提高了效率,也更好地疏導(dǎo)了交通。該系統(tǒng)還可以在一些比較重要的高速路進(jìn)出口進(jìn)行二十四小時(shí)的監(jiān)控以防有不法分子出入、對過往車輛的不停車收費(fèi)等等。另外這個(gè)技術(shù)應(yīng)用的范圍還有以下幾個(gè)方面: (1)交通路況的實(shí)時(shí)監(jiān)控。借助于攝像機(jī)為基礎(chǔ)的車牌識別系統(tǒng),可以對某一個(gè)路段的交通狀況,直接進(jìn)行觀察。這樣就可以獲得交通信息,例如車輛密度和擁擠規(guī)律等等,觀察或防止交通事故
13、。這種適時(shí)的交通系統(tǒng)在現(xiàn)實(shí)中的應(yīng)用,也極大地方便交通管理,節(jié)約大量的人力和物力,整體提高了交通的管理效率。 (2)流量控制和指標(biāo)參數(shù)的測量。該系統(tǒng)還能夠有效的測量交通方面的相關(guān)指標(biāo),例如車輛的總體流量大小和預(yù)計(jì)通行所花費(fèi)的時(shí)間等,此外還有車輛總流入量和流出量,車輛類型和交通流量組成,單日車流量,分鐘車流量,峰值車輛的數(shù)目,平均車速等等,為安排分流提供必要的信息。 (3)建立起安全管理體系。通過監(jiān)控對路上的車輛進(jìn)行全天時(shí)的記錄,將所檢測到的數(shù)據(jù)記錄在公安系統(tǒng)的大數(shù)據(jù)庫,這樣可以根據(jù)需要對大數(shù)據(jù)庫的進(jìn)行有選擇地調(diào)取,這樣也大大提高了破案的效率。 1.2 車牌識別國內(nèi)外發(fā)展現(xiàn)狀 最早開始研究
14、車牌識別技術(shù)的是英國,當(dāng)時(shí)主要應(yīng)用范圍是在道路交通管理方面。隨著對交通管理的要求不斷提升,車牌識別技術(shù)也受到了各個(gè)國家的重視。結(jié)合這一技術(shù)的發(fā)展歷程,目前多位學(xué)者以及對于該技術(shù)的算法進(jìn)行過多次研究。比如王偉博士借助于以馬爾卡夫模型來對車牌的特征進(jìn)行識別。并且將識別出來的問題轉(zhuǎn)化為模型的當(dāng)中。結(jié)合相關(guān)的描述建立起HMM模型。這樣就能夠識別出車牌當(dāng)中的字符。另外曹剛博士自己也研究出了一種針對于字符特征的算法。他的算法被命名為WHMTM,這一算法取得的效果也比較明顯。另外Eun Ryung Lee等這些國外的學(xué)者借助于圖片上像素的分配原理來對顏色和字符進(jìn)行識別,并且通過hv圖來對目標(biāo)區(qū)域進(jìn)行提取,最
15、后他的這一模型能夠應(yīng)用在車牌字符識別過程當(dāng)中。Mario I等學(xué)者借助于一種動態(tài)的定位算法在脈沖耦合神經(jīng)網(wǎng)絡(luò)當(dāng)中輸入脈沖的圖像,劃分車牌候選者,如果相應(yīng)的區(qū)域當(dāng)中沒有車牌那么就會在自動的對著一區(qū)域的參數(shù)進(jìn)行調(diào)整,輸入新的最新候選區(qū)域,直到成功的找到一個(gè)車牌的區(qū)域?yàn)橹?。而Kurniawan等學(xué)者基于啟發(fā)式的字符分割算法進(jìn)行詳細(xì)的對比分析,并且將啟發(fā)式的字符分割算法簡稱CBS算法應(yīng)用在了字符輪廓的特征提取方面,具體的特征是筆畫的寬度以及制服大小等。這一種啟發(fā)式的分割算法能夠?qū)嚺频倪吔邕M(jìn)行分析,另外還能夠?qū)嚺飘?dāng)中的具體筆畫和字符等進(jìn)行識別。同時(shí)CBS的方法能夠消除制服之間的分割。EHS字符間隔消
16、除了字符的過度分割。最后,通過實(shí)驗(yàn)比較獲得了CBS算法的優(yōu)點(diǎn)。 當(dāng)前我國在車牌識別系統(tǒng)的研究方面也比較完善,常見的系統(tǒng)的產(chǎn)品有例如川大智勝、亞洲視覺,文通汽車識別系統(tǒng)和漢王車牌識別系統(tǒng)等多個(gè)車牌識別系統(tǒng),發(fā)展相對來說較為完善,這些系統(tǒng)在識別方面效果也比較顯著。 與發(fā)達(dá)國家的技術(shù)比起來,相對也比較成熟,整個(gè)行業(yè)還沒有進(jìn)入價(jià)格競爭的階段,而且研究的工作主要是一些研究所負(fù)責(zé)。因此車牌識別系統(tǒng)的普及率還比較低,相比起來,國外許多發(fā)達(dá)國家在車牌識別系統(tǒng)方面已經(jīng)被廣泛應(yīng)用到實(shí)際生活當(dāng)中。比如日本的車牌識別系統(tǒng)在夜間可以很好的對車牌進(jìn)行跟蹤和識別,而且識別的效果也比較顯著。而且以色列的技術(shù)開發(fā)公司所開發(fā)
17、出來的車牌識別系統(tǒng),對于移動車輛車速在一百公里的時(shí)候也能夠進(jìn)行有效的識別。而且每一臺主機(jī)都可以連接多臺攝像機(jī),并且對每個(gè)車牌識別所花費(fèi)的時(shí)間都在一百毫秒以內(nèi)。 但是我們需要認(rèn)識到,當(dāng)前對于車牌識別方面還沒有一個(gè)系統(tǒng)能夠全面的對全世界所有國家的車牌進(jìn)行有效識別,甚至有在本國內(nèi)對于不同類型的車牌也不能夠做到全面的識別。由于車牌類型較多,并且背景顏色和字符顏色、大小等存在許多差異。并且有的還比較特殊,所以這些車牌在規(guī)格、顏色、大小等方面都有巨大的差異。在系統(tǒng)研究方面,還存在著諸多的難點(diǎn)需要克服。而且中國國內(nèi)的車牌管理方面并不是很嚴(yán)格,所以有時(shí)候可以看到很多的車牌損壞明顯,更有的車牌表面殘存著很多的
18、污漬,這都給車牌的識別帶來不小的挑戰(zhàn),另外,車牌識別系統(tǒng)還必須要結(jié)合到實(shí)際應(yīng)用的場景,例如道路情況,光照條件和拍攝角度等多種因素影響,這些實(shí)際的問題都是需要在系統(tǒng)研究過程當(dāng)中進(jìn)行依次解決的。對于我國來說,在車牌識別系統(tǒng)的研究方面還有較長的研究道路需要走下去。 1.3 本文研究內(nèi)容 本文所研究的車牌識別系統(tǒng)主要的實(shí)現(xiàn)過程包括:當(dāng)輸入已經(jīng)截取并調(diào)整好的汽車牌照時(shí),需要對圖像閾值進(jìn)行選取,并且結(jié)合相關(guān)的算法例如Bernsen、k-means算法來對車牌進(jìn)行二值化處理。得到黑白的汽車牌照圖片。然后采用findContours取輪廓的方法將車牌的七個(gè)字符分別框選出來,并對前兩個(gè)字符進(jìn)行特殊字符處理,
19、接著采用垂直投影把已經(jīng)處理過的字符一一分割出來輸入到字符識別模塊。接下來識別字符分割區(qū)域當(dāng)中的單個(gè)字符,并且將所有特征樣本進(jìn)行提取,同時(shí)利用樣本集中每個(gè)樣本的所屬類別,來建立判別函數(shù),構(gòu)造分類器,然后用該分類器對待測樣本進(jìn)行分類判別并最終識別出車牌的具體結(jié)果。 1.4 本文的組織結(jié)構(gòu) 本文按照車牌識別過程依次介紹每一過程的具體算法和運(yùn)用實(shí)例結(jié)果,具體結(jié)構(gòu)如下所示: 圖1-1 文章結(jié)構(gòu)圖 2 車牌的預(yù)處理 2.1 顏色判斷 2.1.1 RGB顏色空間 當(dāng)前RGB空間是研究最為廣泛的一個(gè)系統(tǒng)
20、功能。在RGB當(dāng)中主要包括了三個(gè)顏色的通道。通過重疊三個(gè)顏色通道的值,它們可以疊加起來,創(chuàng)造人類可以感知的所有顏色。這樣的顏色幾何模型可以用用在分析在笛卡爾坐標(biāo)當(dāng)中,從而得到一個(gè)多維立體數(shù)據(jù)的模型。其應(yīng)用時(shí),將色彩歸一化成一個(gè)單位立方體,使得所有的R,G,B值均可以定位在區(qū)間(0,1)接著就能夠形成一個(gè)便于處理的空間系統(tǒng)。 2.1.2 HSV顏色空間 在shv顏色空間當(dāng)中,對于所有圖片的顏色信息進(jìn)行了不同屬性的處理,主要包括三個(gè)方面,亮度、色調(diào)和飽和度。其中色度同時(shí)也被稱作為色相,而v代表著顏色亮度,s代表飽和度。 這個(gè)顏色空間當(dāng)中能夠通過模型的構(gòu)建,得到一個(gè)圓錐形狀的空間模型。如下所示
21、:圓錐體的頂部對應(yīng)于v=l。顏色h由v軸周圍旋轉(zhuǎn)角度決定。每種顏色與其互補(bǔ)色之間存在著180°的差異。紅色在該模型當(dāng)中對應(yīng)0度,綠色是對應(yīng)120度,藍(lán)色則對應(yīng)240度。 根據(jù)HSV的定義,結(jié)合RGB的具體指,能夠計(jì)算出HSV 的具體值,詳見如下公式參考: 對于車牌底色為藍(lán)色的而言,在HSV模型當(dāng)中,具體的參數(shù)范圍如下: 10≤H≤260 0.3≤S≤0.55 針對黃色底色車牌其H,S參數(shù)取值范圍為: 26≤H≤34 43≤H≤255 如果當(dāng)像素能夠同時(shí)的滿足車牌底色范圍特性的話,那么就能夠根據(jù)這些屬性特征在固定區(qū)域內(nèi)找到像素點(diǎn)的總和,并且計(jì)算每一個(gè)區(qū)
22、域內(nèi)固定像素所占整個(gè)區(qū)域的百分比。如果這一比例在某一范圍內(nèi),就可以判定車牌的底色具體為什么。一般而言,在實(shí)踐之后發(fā)現(xiàn)該閾值為87%。也就是在初次的檢測當(dāng)中,像素總量超過了81%就可以認(rèn)定車牌的區(qū)域,并且對它的顏色進(jìn)行確認(rèn),從而也能夠否認(rèn)該圖像區(qū)域是非車牌區(qū)域。 2.2 灰度化 圖像灰度化就是將彩色圖片轉(zhuǎn)化為灰度的圖像,這一過程也被稱為灰度過程。彩色圖像當(dāng)中,顏色像素具體是由RGB這三個(gè)量來確定的,并且每一個(gè)分量最大都能夠達(dá)到255個(gè)值。而灰度圖像是這方面的值相同的圖像,在圖像當(dāng)中,R等于G等于B。所以灰度圖像當(dāng)中只有一種顏色,一般而言該圖像當(dāng)中像素最大的地方稱為灰度值。所以實(shí)際上來說系統(tǒng)采
23、集的原始圖像是彩色的,如果將圖像進(jìn)行灰度處理的話,他所以能夠包含的信息就更多。這就需要系統(tǒng)具有較大的儲存空間,同時(shí)還要對圖像具有一個(gè)復(fù)雜的算法過程,一般來說車牌時(shí)間識別系統(tǒng)不能夠滿足這個(gè)要求,所以要將彩色的圖像在識別之后立即轉(zhuǎn)化為灰度圖像。這個(gè)過程就是對圖像處理的灰度化。 在圖像數(shù)字化處理的過程中,常用的方法一般包括以下幾種: 1.最大值法:結(jié)合彩色圖像當(dāng)中分量最大的值作為灰度值; 2.平均值法:將彩色圖像中的三分量亮度求平均得到一個(gè)灰度圖; 3.加權(quán)平均法:結(jié)合每個(gè)指標(biāo)的重要性,對不同的分量予以加權(quán),并且進(jìn)行對應(yīng)的處理。 本文采用的是加權(quán)平均法進(jìn)行灰
24、度化處理,因?yàn)檫@種方法計(jì)算準(zhǔn)確而且灰度化效果好?;叶然蟮膱D片見下圖: 圖2-1 灰度化處理圖 2.3 二值化 2.3.1 圖像二值化的原理及作用 進(jìn)行圖像二值化的處理主要的目的是為了使該圖像內(nèi)的區(qū)域內(nèi)灰度值都能夠達(dá)到255。否則,這些像素被排除在對象區(qū)域之外。在灰度值為0中,這些像素將成為背景或異常對象區(qū)域,將灰度圖像轉(zhuǎn)換成黑白二進(jìn)制圖像。圖像在處理的過程中,二值化這個(gè)步驟意義重大,這個(gè)處理有利于計(jì)算機(jī)的進(jìn)一步解析。當(dāng)圖像變得簡單時(shí),信息量就會變得簡單,而且會變得更加突出。興趣的目標(biāo)輪廓是方便下一步的處理。 2.3.2
25、 二值化的方法 一般來說車牌二值化處理的方法有兩種類型,包括全局閾值法以及局部閾值法兩種。常規(guī)來說,全局閾值法的方法包括了迭代法,最大矢法,但是隨著科技的不斷進(jìn)步,也有更多學(xué)者提出了新型的處理方法,而且在處理效率方面也很高。例如,李晨曾所提出的Lornezt信息測度的一種二值化算法,這種方法能夠應(yīng)用在車牌光照較強(qiáng)和較弱的區(qū)域,同時(shí)對車牌進(jìn)行全面的二值化處理。 對于我國實(shí)際情況來說,一般車牌都是藍(lán)色的底色以及白色的字體,因此在進(jìn)行車牌圖像處理的過程當(dāng)中,二值化處理的要點(diǎn)主要包括以下兩個(gè),首先要讓筆畫保持字符的特點(diǎn),不能夠出現(xiàn)較大的缺失。但是由于現(xiàn)實(shí)生活中有各種外界干擾因素存在。很難在二值化處
26、理當(dāng)中有效的對車牌干擾進(jìn)行處理??偟膩碚f,二值化處理所遇到的困難包括其他區(qū)域的干擾、光照干擾、字符的陰影以及噪聲影響等。往往在一種算法當(dāng)中,它只能對其中某一個(gè)干擾因素進(jìn)行控制,但是不能夠?qū)ζ渌蛩剡M(jìn)行全面的控制。比如在Otsu算法當(dāng)中,如果字符的陰影比較嚴(yán)重的話,往往在計(jì)算之后不能夠得到一個(gè)合適的閾值。往往不同干擾相混合加大了車牌二值化的難度,導(dǎo)致后續(xù)分割等步驟不能進(jìn)行??紤]到以上這些所有因素,本文結(jié)合了顏色聚類等多種二值化運(yùn)算方法,在圖像處理過程當(dāng)中,先利用Otsu全局閾值以及Bernsen局部的閾值計(jì)算方法,先第一次進(jìn)行二次化處理。接下來再判定是否要借助于顏色聚類的方法來進(jìn)行二值化。通過以
27、上多種步驟來進(jìn)行充分的處理,這樣能夠?qū)D像當(dāng)中各種的干擾進(jìn)行有效排除。而對于那部分沒有干擾條件下的車牌圖像則能夠得到較好的效果,并且這種處理方式還能夠?qū)D像進(jìn)行預(yù)處理。 本文運(yùn)用算法類型主要包括了Otsu、Bernsen和這三種類型。下面分別介紹這三種算法的原理。 1.Otsu算法 這個(gè)算法是一個(gè)比較經(jīng)典的算法,進(jìn)行二值化的處理本質(zhì)就是要對像素進(jìn)行分割,這個(gè)方法的基本思想是方法兩個(gè)閾值之間的差量,因此也稱最大類間方差法。 除了以上這個(gè)特征之外,該方法也有許多的有點(diǎn),可以在圖像的灰度方面進(jìn)行全面的計(jì)算。具體公式如下: (其中t:當(dāng)前閾值 :前景像素
28、點(diǎn)數(shù)占總像素的比例 :前景像素點(diǎn)的平均灰度 :背景像素點(diǎn)數(shù)占總像素的比例 :背景像素點(diǎn)的平均灰度)而圖像總平均灰度U:U =W*U+ W*U 從多個(gè)灰度級別不斷的進(jìn)行變化,最終結(jié)合以上的方程公式來計(jì)算出方差的大小,并且求得的最終結(jié)果t就是最佳閾值。 2.Bernsen 算法 Bernsen 算法是經(jīng)典的局部閾值法。計(jì)算之后得到的像素之間的灰度的最大值和最小值,分別表示為max(x,y)和min(x,y),最后的局部閾值就可以通過這兩個(gè)值的均值來進(jìn)行表示,最后的運(yùn)算公式表示為: 這樣的算法就能夠在圖像當(dāng)中根據(jù)不同的像素點(diǎn)來進(jìn)行計(jì)算,從而對圖像也進(jìn)行了二值化的處理。 3.k-mean
29、s聚類算法 對于二值法當(dāng)中的顏色聚類處理方法而言,基本應(yīng)用的公式為k-means算法公式。這個(gè)公式能夠?qū)υ紨?shù)據(jù)進(jìn)行歸類的劃分,并且把整個(gè)樣本數(shù)據(jù)劃分為多個(gè)區(qū)域,每一個(gè)區(qū)域代表不同的含義 。這樣的劃分方式有利于達(dá)到有利的信息處理,比如在進(jìn)行距離測算的過程中,一個(gè)分區(qū)內(nèi)部的樣本數(shù)據(jù)都是相似的,二不同的分區(qū)差別比較大。這樣的算法可以降低整體的樣本相似差異,并且讓類聚的差異變大。具體計(jì)算的公式為:(其中k為聚類數(shù)目,N為樣本點(diǎn)數(shù),則k為聚類目標(biāo)) (13) 其中為類心,是整個(gè)樣本中,n到k之間的距離。 其中k均值的基本聚類過程如下: 第一步:首先確認(rèn)k是聚類的
30、中心點(diǎn),并且按照下面公式進(jìn)行排列: ,,......................,,=0 第二步:對應(yīng)不同的樣本來說,也要確認(rèn)出他們和聚類中心之間的距離,斌給將指派給距離最小的那個(gè)類別: 參考文獻(xiàn) [1] Parisi R,Di Claudio E D,Lucarelli G,et a1.Car plate recognition by neural networks and image processing[C].INSTITUTE OF ELECTRICAL ENGINEERSINC(IEEE
31、),1998.195-198. [2] [3] [4] [5] [6] [7] [8]陳鍛生,謝志鵬,劉政凱.復(fù)雜背景下彩色圖像車牌提取與字符分割技術(shù)陰[J].小 型微型計(jì)算機(jī)系統(tǒng).2002,23(09):1144—1148. [9] 朱秀昌,劉峰,胡棟.?dāng)?shù)字圖像處理與圖像通信[M].北京:北京郵電大學(xué)出版社,2002:85-91 [10] 胡小鋒,趙輝編著。Visual C++/MATLAB圖。AB圖像處理與識別實(shí)用案例精選。北京:人民郵電出版社,2004.9 [11] [12] [13] [14] [15] [16] [17] [18] [19] [
32、20] [21] [22] [23] [24] [25] [28] [29] [30] 致 謝 論文完成之際,謹(jǐn)向研究生學(xué)習(xí)期間關(guān)心、幫助和支持過我的各位老師和同示深深的敬意和衷心的感謝。 首先要感謝李科教員的悉心指導(dǎo)與關(guān)懷,老師嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度、認(rèn)真負(fù)責(zé)的工作精神、對問題敏銳的洞察力和分析能力讓我受益匪淺。督促和鼓勵也將繼續(xù)激勵我在今后的人生道路上不斷進(jìn)取。在此,謹(jǐn)向李科教員致以崇高的敬意和最衷心的感謝! 感謝師弟師妹在平常的學(xué)習(xí)生活中對我無私的幫助,我的每一點(diǎn)進(jìn)步都離不開你們的幫助和鼓勵。感謝我身邊的每一個(gè)同學(xué),一起學(xué)習(xí)生活三年,是
33、你們給了我豐富多彩的大學(xué)生活。 感謝父母在我二十年讀書生涯中所付出的一切,你們一直以來對我的鼓勵和認(rèn)同,讓我面對困難也能信心百倍。 感謝通信系全體老師對我的培養(yǎng)與教育。 衷心的感謝在百忙之中抽出時(shí)間審閱論文和參加答辯的各位專家、老師。 第三步:重新計(jì)算每類的類心,計(jì)算方式如下; 第四步:如果當(dāng)函數(shù)達(dá)到了最大化的效果之后,就會自行停止,接下來得到二值化的圖形,如果沒有處理完畢則會繼續(xù)進(jìn)行第二步的處理。 2.3.3 算法思想和簡介 本文所選用的二值法主要分為以下兩個(gè)部分,具體可以參考下面的框架圖進(jìn)行展示??梢园l(fā)現(xiàn),首先在第一階段綜合利用了Otsu與Bernsen兩類方法
34、相互結(jié)合。在這一階段當(dāng)中,經(jīng)過全面的處理,能夠使得圖片當(dāng)中光照不良的情況得到消除,同時(shí)也能夠?qū)ψ址?dāng)中的陰影進(jìn)行有效處理。在第二階段當(dāng)中,主要是利用顏色聚類的方法進(jìn)行處理的,主要將所有像素分為三個(gè)類型,包括字符、車牌和非車牌等三個(gè)區(qū)域,這一方法能夠應(yīng)用在光照不強(qiáng)的情況下可能對后續(xù)字符的分裂帶來的影響。所以在經(jīng)過兩個(gè)階段的處理之后,第一階段完成以后,還需要判斷是否需要進(jìn)入到第二個(gè)階段。如果車牌是黃色的話,那么一般都會只采用第一個(gè)階段的處理即可完成。而對于藍(lán)色的車牌就需要再次進(jìn)入到第二階段,下圖分別展示了這兩個(gè)階段的相應(yīng)判別的條件。 圖2-2 判別條件圖 第一階
35、段:經(jīng)典二值化算法相結(jié)合 Otsu這一方法是當(dāng)前在全域全局閾值計(jì)算過程當(dāng)中一種經(jīng)典的計(jì)算方法。借助于直方圖將整個(gè)圖形分為了兩個(gè)波峰,而且這樣也有易于進(jìn)行圖像的對比。對于局部閾值計(jì)算的方法而言,Bernsen法是另一個(gè)較為經(jīng)典的方法,但是這樣的算法容易使得圖像中產(chǎn)生一些噪音影響。本文所采用的方法是將以上兩種方法進(jìn)行融合,首先借助于Otsu對全局的閾值進(jìn)行充分計(jì)算,并且得到一個(gè)灰度和全職閾值相差較大的像素點(diǎn),直接使用它來進(jìn)行二值化的處理,使得灰度在全局上都能夠與附近的像素相似。并且在這處理完畢之后,借助于Bernsen法來對于不的閾值進(jìn)行二值化號處理,從而克服由于照片光照不足等多種因素的影響。另
36、外為了使得Bernsen在進(jìn)行計(jì)算過程當(dāng)中所產(chǎn)生的一些影響,因此分別針對的不同情況來對不同部分的閾值計(jì)算進(jìn)行區(qū)分,如果像素點(diǎn)和窗口之間的像素差異較大,那么則是使用Bernsen法來進(jìn)行二值化處理的。如果他們的差別較小,那就可以使用全局閾值縮放完成之后再借助于Bernsen法來進(jìn)行局部閾值的計(jì)算。令灰度圖為 F,則該算法框圖描述如下: (1)利用 Otsu 算法計(jì)算全局參考閾值T1; (2)如果當(dāng)F(x,y)>(1+a)*T1,那么就可以默認(rèn)這個(gè)像素是白色的,并且將其取值為0.3; (3)若F(x,y)<(1-a)*T1,將該像素賦值為黑色; (4)若(1+a)*T1<=F(x,y)
37、<=(1-a)*T1,使用局部閾值二值化; 對 Bernsern的閾值進(jìn)行計(jì)算,找到T2和窗口灰度值之間的級差T3; 若T3(x,y)<=a*T1,則局部閾值T(x,y)=T1+T2(x,y)/2; 若T3(x,y)>a*T1,則將Bernsern閾值T2(x,y)直接作為局部閾值。 圖2-3 算法框圖 第二階段:基于顏色聚類的二值化方法 在對于顏色聚類這種二值化計(jì)算方法而言,核心的思想是將像素所代表的顏色值作為特征點(diǎn)的進(jìn)行計(jì)算,并且對其進(jìn)行不同分類,分為前
38、景和背景兩個(gè)方向。本文也是選擇聚類方法來識別車牌圖像當(dāng)中像素的。主要分為了三個(gè)主要類型,第一種是車牌的字符,另外還包括車牌背景以及字符的陰影等。由于我國車牌顏色是藍(lán)色底色,因此在灰度值選取方面它是作為前景的,而其他兩類是作為背景。結(jié)合實(shí)驗(yàn)的最終結(jié)果發(fā)現(xiàn),對于藍(lán)底白字的車牌而言,利用RGB顏色進(jìn)行余弦距離聚類分析所得到的結(jié)果要比歐式距離運(yùn)算結(jié)果更加優(yōu)化。其二值化公式如下: .3.4 方法的選擇判斷條件 對于大部分的車牌來講往往在經(jīng)過第一階段的處理之后都能得到很好的效果,但是有一部分車牌存在一定程度的干擾現(xiàn)象,在灰度圖形分析方面它呈現(xiàn)出來的是多個(gè)峰值。因此這
39、種情況,采取第一階段的二值化分析方法就有較多的不適用性,所以要將顏色聚類算法劃分為三個(gè)類型。如果光照情況不良的情況之下,進(jìn)行非車牌區(qū)域的分析,那么他所得到的聚類分析圖像最終得出的結(jié)果字符會有一定的斷裂情況。字符因此也就變?yōu)榱藘煞N類型,所以需要在一定的情況下判斷在圖像處理過程當(dāng)中是否要借助于距離算法來進(jìn)行二值化的處理。對于在非車牌區(qū)域存在干擾現(xiàn)象的情況而言,由于在第一階段的二值化處理是包括了前景背景等車牌區(qū)域分析的,所以應(yīng)該用前景像素的比例作為判斷條件。并且結(jié)合到車牌其他干擾因素對前景像素比例所造成閾值的影響,本文作出了下面幾個(gè)方面的判斷: (1)首先要在第一階段的二值化圖形處理結(jié)果當(dāng)中,去除
40、圖形處理之后的上下邊框。 (2)其次對于長寬比例在4以上的車牌而,。要設(shè)定一個(gè)高度為四的滑動窗口,這樣能夠在圖形處理過程當(dāng)中選取窗口區(qū)域的白色背景作為一個(gè)參考。 (3)還應(yīng)該對取景區(qū)域的前景點(diǎn)閾值進(jìn)行取值,如果當(dāng)該區(qū)域的字符占比達(dá)到20%以上,那么就應(yīng)該借助于第二階段的結(jié)論算法進(jìn)行二次化的處理。 圖2-4 二值化圖形 2.4 車牌的噪聲去除 如果進(jìn)行字符分割的進(jìn)程,當(dāng)中出現(xiàn)了許多污點(diǎn)和光線反射等干擾情況的話,最終也會對車牌字符的識別帶來一定的影響,同時(shí)還會對字符的分割產(chǎn)生較大的變動。這樣就會使得字符模塊分割不夠準(zhǔn)確。所以在進(jìn)行這些步
41、驟處理之前,需要對噪聲的干燥進(jìn)行有效的處理。 2.4.1 邊框和鉚釘?shù)娜コ? 與車牌字符相比,車牌框和鉚釘都處于垂直方向或水平方向上,而像素間的轉(zhuǎn)換數(shù)則較少。在本文當(dāng)中,對車牌框進(jìn)行去除的方法是利用自身的特點(diǎn)。下面就以水平框的消除作為實(shí)際案例來分析如何進(jìn)行處理過程的。首先要結(jié)合車牌像素值的變化情況,一般車牌四周都會有一個(gè)鉚釘和邊框,他們連接部分像素轉(zhuǎn)換的最小值為,4*2=8(次) 而對于有效的字符部分,灰度跳轉(zhuǎn)變換次數(shù)也有個(gè)最小值,計(jì)算結(jié)果是:(7(字符數(shù))*2(垂直邊框))*2=18(次) 如果部分車輛不存在邊框情況之下,那么也能夠確定以上這兩個(gè)值的具體數(shù)量。同時(shí)對比這種情況不存在的情
42、況之下,在灰度跳便次數(shù)方面相差為六次以上。所以綜合分析,要想去除在圖片當(dāng)中這兩類情況對于圖像處理的干擾。就應(yīng)該將兩個(gè)閾值之間的差值為13倍。由此我們就可以從圖像當(dāng)中對框架和鉚釘進(jìn)行移除,保留車牌字符的那一個(gè)部分。相關(guān)的算法主要包括對水平線上像素的中斷點(diǎn)數(shù)進(jìn)行掃描,如果該像素調(diào)數(shù)要比預(yù)先設(shè)定的閾值更小,那么對這些像素全部進(jìn)行清除,反之則進(jìn)行全部的保留。如果再連續(xù)三個(gè)行當(dāng)中,像素的跳數(shù)要比固定的值更大,那么就應(yīng)該對該牌照上面的字符位置進(jìn)行掃描,從而獲得在垂直方向上的區(qū)域,并對其進(jìn)行剪裁。同樣,這個(gè)方法也可以應(yīng)用在底部和左右多個(gè)方向邊框的去除過程當(dāng)中。 2.4.2 車牌內(nèi)部的噪聲去除 由于車牌圖
43、像中的光照變化、車牌本身上的污跡、車牌字符的顏色變化,車牌圖像后二值化后的內(nèi)部圖像會或多或少地干擾到噪聲干擾。如果當(dāng)圖像當(dāng)中噪聲比較大的時(shí)候,那么整個(gè)字符就會受到多種環(huán)境的污染,往往會導(dǎo)致在圖像分割的時(shí)候出現(xiàn)一定的錯誤。如果制服是出現(xiàn)在內(nèi)部的,那么是不影響整個(gè)車牌制服的分割,但是會對后續(xù)字符的識別帶來較大難度,所以必須要對車牌上的噪聲進(jìn)行污染的去除。 一般說來,字符之間的噪聲是非固定的,并且不連字符。通常采用的方法是利用濾波過濾的方法,但是在選取具體的濾波處理方法的時(shí)候,不能選用單一的方法,這樣對于特殊的細(xì)長型的字符來說處理效果不夠良好。想要得到良好的處方,是必須要多種濾波處理方法相互結(jié)合,
44、這樣也不會影響到各個(gè)字符的像素值,進(jìn)而便于后續(xù)圖像的分割。 本次系統(tǒng)設(shè)計(jì)的處理方法是采用腐蝕和膨脹這兩類方法來進(jìn)行噪聲去除的。而且該方法具有較為簡單和易行的特點(diǎn),能夠滿足在圖像噪聲去除方面的實(shí)際需要,下面就介紹這一方法的處理原理。 二值圖像形態(tài)學(xué)運(yùn)算,就是在圖像當(dāng)中對圖像的元素進(jìn)行移動,并且將結(jié)構(gòu)元素和下面的重疊部分進(jìn)行交叉的集合與綜合運(yùn)算工程。為了對元素當(dāng)中的具體位置進(jìn)行確認(rèn),一般要將形態(tài)學(xué)的結(jié)構(gòu)元素作為參考的原點(diǎn),并且結(jié)合該圓點(diǎn)能夠在整個(gè)元素中選取元素之外的因素,在利用二次圖像進(jìn)行形態(tài)處理的過程當(dāng)中,包括的運(yùn)算過程一般有腐蝕和膨脹等多個(gè)運(yùn)算階段。 1.圖像腐蝕 圖像腐蝕過程是形態(tài)學(xué)
45、運(yùn)算的一個(gè)運(yùn)算過程,它的作用是為了消除在圖片當(dāng)中的邊界,同時(shí)讓邊界向內(nèi)部進(jìn)行收縮。能夠?qū)⒔Y(jié)構(gòu)元素更小的物體進(jìn)行去除,這樣就能夠選取大小不同的結(jié)構(gòu)元素以此起到去除物體的最終作用。 基本原理 把X作為目標(biāo)的圖像結(jié)構(gòu)元素,選取為B為目標(biāo)元素,那么在目標(biāo)圖像當(dāng)中,結(jié)構(gòu)元素腐蝕相關(guān)的數(shù)學(xué)運(yùn)算公式如下表所示: XΘB=x(Bx)?X 在上面這個(gè)公司當(dāng)中,x代表平行的位移量,而Θ則代表運(yùn)算的符號。 腐蝕運(yùn)算的含義是:如果在圖像當(dāng)中找到與結(jié)構(gòu)元素相同的一個(gè)圖像的時(shí)候就,應(yīng)該將與這個(gè)原點(diǎn)位置相對應(yīng)的像素位置進(jìn)行標(biāo)注,并且將這些數(shù)標(biāo)出來的所有像素組合成一個(gè)集合。該集合就代表腐蝕預(yù)算的最終結(jié)果,它的實(shí)質(zhì)原
46、理就是要將所有與結(jié)構(gòu)元素相同的圖像原點(diǎn)位置找出。 2.圖像膨脹 在腐蝕運(yùn)算之外,膨脹也是數(shù)學(xué)運(yùn)算的另一種基本運(yùn)算公式,該公式存在的具體作用與腐蝕相反,他是為了對圖像進(jìn)行相關(guān)邊界點(diǎn)的補(bǔ)充,并且讓圖像融入到整個(gè)背景當(dāng)中。有利于邊界向外進(jìn)行擴(kuò)張。如果兩個(gè)像素點(diǎn)的距離比較接近,通過膨脹運(yùn)算就能夠?qū)⑦@兩個(gè)物體進(jìn)行聯(lián)通,在膨脹完成之后圖像中的像素就更加連貫。 基本原理 把X作為目標(biāo)圖像,設(shè)立B為結(jié)構(gòu)元素,那么它們之間的相關(guān)運(yùn)算公式表示如下。 X⊕B=xBVx∩X≠Φ 在該公式當(dāng)中,x表示該集合需要進(jìn)行平行移動的位移量,而⊕是表示進(jìn)行膨脹在運(yùn)算的專用符號。 首先將b所對應(yīng)到的反射點(diǎn)都集合到一個(gè)
47、集合系統(tǒng)當(dāng)中,然后從目標(biāo)圖像上將這些全部的目標(biāo)點(diǎn)進(jìn)行位移,位移的距離為x。而在所有目標(biāo)集合到位之后,圖像聚合至少存在一個(gè)非零的公共元素的相交點(diǎn),那么這些點(diǎn)所對應(yīng)出來的集合就是整個(gè)膨脹運(yùn)算所得到的最終結(jié)果。 3.開運(yùn)算 首先要對一個(gè)結(jié)構(gòu)元素進(jìn)行腐蝕的運(yùn)算,同時(shí)再進(jìn)行膨脹運(yùn)算,這個(gè)整個(gè)運(yùn)算的過程就被稱為開運(yùn)算過程。首先在原圖得到開預(yù)算結(jié)果之后,能夠?qū)ζ渲泄铝⒌狞c(diǎn)進(jìn)行去除,并且打通較小的點(diǎn)從而形成一個(gè)聯(lián)通。并且對小物體和較大物體的邊界進(jìn)行去除,有效的改善整個(gè)圖形的面積。 基本原理: 把x作為目標(biāo)圖像,設(shè)b為結(jié)構(gòu)元素,那么這兩者之間在進(jìn)行開運(yùn)創(chuàng)過程當(dāng)中,所涉及到的數(shù)學(xué)運(yùn)算公式如下。 X°Y=
48、(AΘB)⊕B 其中,°表示開運(yùn)算的運(yùn)算符。 這個(gè)公式表示出來的含義是:要借助于B來開啟X所得到的一個(gè)綜合集合體。而這個(gè)集合是在不小于結(jié)構(gòu)B的所有部分組成的。也就是在X當(dāng)中,與B相匹配的所有點(diǎn)。這些點(diǎn)能夠通過在X當(dāng)中結(jié)構(gòu)元素進(jìn)行平移追蹤得到。 4. 閉運(yùn)算 與開運(yùn)算相比起來,閉運(yùn)算則是一個(gè)對偶的運(yùn)算過程。它能夠?qū)Ωg和膨脹等多個(gè)運(yùn)算過程持續(xù)進(jìn)行執(zhí)行,最終才能夠得到閉運(yùn)算這一結(jié)果。首先在完成運(yùn)算過程當(dāng)中,必須要使用相應(yīng)的結(jié)構(gòu)元素來使得目標(biāo)圖像得到膨脹的運(yùn)算結(jié)果,之后再借助于腐蝕運(yùn)算過程對物體的細(xì)小孔洞進(jìn)行填充,這樣能夠使得像素較小的點(diǎn)相鄰,并且使得圖像邊界也較為平滑。同時(shí)不明顯改變目標(biāo)圖
49、像的面積。 基本原理 首先需要假設(shè)目標(biāo)圖像為X,再設(shè)定結(jié)構(gòu)元素為B。兩者之間在閉運(yùn)算過程中的公式主要表現(xiàn)為如下: X?B=(A⊕B)ΘB 其中,?表示閉運(yùn)算的運(yùn)算符。 閉運(yùn)算的含義是:通過結(jié)構(gòu)元素來對目標(biāo)圖像進(jìn)行運(yùn)算得到的一個(gè)集合,也就是說圖像目標(biāo)圖像經(jīng)過了相應(yīng)的反射和位移之后,在結(jié)構(gòu)元素當(dāng)中交集不為空的所有點(diǎn)的一個(gè)組成。 實(shí)際的應(yīng)用中,膨脹和腐蝕的運(yùn)算過程還可以有多重組合的方式,從而也會形成多重運(yùn)算的形式。連續(xù)多次的膨脹運(yùn)算使物體趨于合并在一起,可以用來填充物體和消除斷裂;連續(xù)多次的腐蝕會使物體最后趨于消失,實(shí)現(xiàn)細(xì)化或消除噪聲;最終得出以下所示的效果圖: : 圖2-5 左
50、側(cè)未處理,右側(cè)經(jīng)過降噪處理 從這個(gè)圖中也可以發(fā)現(xiàn),圖片沒有處理之前有許多的干擾信息。經(jīng)過腐蝕和擴(kuò)展處理后,車牌字符中的噪聲大多可以去除。并且字符也更加清晰了,從而也更有利于后面進(jìn)行的文字識別工作進(jìn)行。提高字符分割的準(zhǔn)確性。 2.5 字符分割 在車牌進(jìn)行過精準(zhǔn)定位之后,需要對每個(gè)字符都進(jìn)行單獨(dú)的分割,這樣才有利于后續(xù)對每一個(gè)字符進(jìn)行精確的識別。字符分割的好壞直接影響到識別的精確程度,所以為了提升分割的質(zhì)量,本文就結(jié)合了字符特征以及垂直投影這兩種方法來綜合的對字符進(jìn)行分割,這樣能夠?qū)ψ址B接的問題進(jìn)行解決,同時(shí)如果字符存在斷裂的話,還可以在字符連接之后正確的對其進(jìn)行分割。 一般在研究車牌區(qū)
51、域的時(shí)候能夠發(fā)現(xiàn)他本身有許多的特點(diǎn),因此在分割的過程中就具有良好的條件。往往在字符之間總長度一般都是40.9cm,而單個(gè)的字符寬度達(dá)到4.5cm,高度為90cm。其中相對于車牌而言,第二個(gè)和第三個(gè)字符之間距離都是固定的,他們之間的距離為3.4cm。而車牌當(dāng)中的字符小點(diǎn)在整個(gè)寬度當(dāng)中占有一厘米,做一個(gè)點(diǎn)和兩邊字符的距離達(dá)到1.2厘米,而其余的牌照都符合這一標(biāo)準(zhǔn)。對于固定的字符來說。1這個(gè)字符它的寬度為1.3cm。所以當(dāng)出現(xiàn)這個(gè)字符的時(shí)候,一般他兩邊的字符距離都會在2.8厘米。如果1是處于車牌末端的,那么它和邊界之間的距離就為2.8厘米。如果連續(xù)存在兩個(gè)字符1,他們的距離就能夠達(dá)到4.4厘米。根據(jù)
52、以上的車牌字符的研究可以得出相關(guān)結(jié)論,可以有效的利用這些字符間距的特點(diǎn)對其進(jìn)行分割,并且結(jié)合字符之間的距離以及整個(gè)牌照區(qū)域中的字符的總長度來分離整個(gè)牌照字符的每個(gè)區(qū)域。 然而,只有這種方法分割出的字符并不是很精確。如果在車牌圖像獲取的時(shí)候整體有一定傾斜度,這樣車牌的處理就會產(chǎn)生一些錯誤,導(dǎo)致字符的信息不夠完整。最終給字符的識別工作帶來較多的困難。本文提出了一種垂直投影算法。 垂直投影這一個(gè)方法是借助于圖像在垂直上的投影,從而對黑色像素點(diǎn)進(jìn)行統(tǒng)計(jì),由于在制服當(dāng)中黑色像素比較豐富,并且在字符空白的區(qū)域存在的黑色像素點(diǎn)較少。所以可以通過檢測字符與字符之間黑色像素點(diǎn)的個(gè)數(shù)所展現(xiàn)出來的波谷,最終確定
53、該字符所存在的左右邊界節(jié)。最終可以將字符的投影展現(xiàn)為以下圖2-6所示。 圖2-6 車牌區(qū)域圖像的垂直投影 結(jié)合自負(fù)的自身特征以及垂直投影這一技術(shù)的使用,本文在字符分割過程當(dāng)中,相關(guān)的處理過程如下: 首先需要對圖像進(jìn)行歸一化的處理,也就是要對原始的圖像經(jīng)過一定處理之后,獲得到多種副本的圖像內(nèi)容,這樣在經(jīng)過規(guī)劃處理之后就能夠得到一種具備相同形式的標(biāo)準(zhǔn)圖像。 在分割開始工作之前,應(yīng)該對車牌的區(qū)域進(jìn)行規(guī)劃處理,設(shè)計(jì)一個(gè)標(biāo)準(zhǔn)的長寬高,這樣在處理之后,在對車牌字符進(jìn)行匹配,找到車牌的自負(fù),并且對之后的字符識別工作也有明顯作用。 首先需要對車牌當(dāng)中第二個(gè)和第三個(gè)字符較大的空隙進(jìn)行查
54、找,借助于垂直投影,找到兩只符之間間隔,再以此作為第二字符和第三字符之間的分隔線。然后再結(jié)合這兩條分割線,分為兩個(gè)不同區(qū)域。從第二個(gè)字符結(jié)束的位置開始在投影當(dāng)中找到黑色像素為零的地方,并且確定該寬度是否達(dá)到4.5厘米。如果寬度不夠,說明分割過程存在一定的誤差,接下來就應(yīng)該對下一個(gè)字符進(jìn)行查找。以這樣的順序依次往后,確定每個(gè)字符之間的空格。接下來在從前面部分進(jìn)行查找,如果第一個(gè)字符寬度過小或者過大,這種情形都可以說明在分割過程出現(xiàn)了一定問題,需要退回到最開始進(jìn)行分析的位置重新進(jìn)行分割。直到所得到的字符寬度能夠滿足相關(guān)要求才能確認(rèn)該分割。接下來對于字符為1的情況下具體的解決方法是,借助于垂直投影當(dāng)
55、中字符的間距,如果當(dāng)任何一個(gè)字符寬度為4.3cm的時(shí)候,那么就應(yīng)該將左右的距離添加1.6cm,這樣才能夠在分割的過程當(dāng)中更加準(zhǔn)確。因此,分割出的字符寬度均勻,信息完整。 為了更好地串聯(lián)起整個(gè)分割步驟,現(xiàn)將其整理成算法的流程如下:(是目前字符的實(shí)際寬度,代表下一個(gè)字符寬度,Pre Width表示字符的先驗(yàn)值,is表示支付之間的距離,space表示字符間距先驗(yàn)值) 圖2-7 算法流程圖 該處理的過程前期需要進(jìn)行圖像的二值化處理,并且要對字符分別進(jìn)行粗分割以及次分割兩個(gè)流程完成分割。 2.5.1 字符
56、的粗分割 其字符的粗分割總共分為五步驟為: (1)將二值化的圖像首先處理為垂直方向上的投影 (2) 將最初的高度設(shè)置為0,并且還要在車牌號的第二個(gè)字符開始進(jìn)行垂直方向上的投影,如果投影的結(jié)果比設(shè)定的閾值大的話,那么就要對這個(gè)字符進(jìn)行收尾的分割線劃分。位置標(biāo)記為開始[i]和結(jié)束[i],i=1,2,n,n主要是表示的字符塊的個(gè)數(shù),如果檢測結(jié)果中出現(xiàn)了任何的新字符都會增加一個(gè)新的數(shù)量。 (3)判斷n的大小,如果 n<2,則 t=t+1,并返回步驟(2)繼續(xù)尋找;如果在2個(gè)字符的時(shí)候就停止了檢測,那么就要重新進(jìn)行圖像的掃描,最終到掃描的個(gè)數(shù)超過了車牌高度之后,如果個(gè)數(shù)還是小雨2的話,那么就表
57、示這次分割失敗。 (4)將最初的高度設(shè)置為0,并且還要在車牌號的第二個(gè)字符開始進(jìn)行垂直方向上的投影,如果投影的結(jié)果比設(shè)定的閾值大的話,那么就要對這個(gè)字符進(jìn)行收尾的分割線劃分。位置標(biāo)記為開始[i]和結(jié)束[i],i=1,2,n,n主要是表示的字符塊的個(gè)數(shù),如果檢測結(jié)果中出現(xiàn)了任何的新字符都會增加一個(gè)新的數(shù)量。 (5)判斷n的大小,如果n<5,則 t=t+1,并返回步驟(4)繼續(xù)尋找;如果掃描的字符個(gè)數(shù)是5個(gè)以上就停止了分割,那么就要重新掃描,最終的結(jié)果依舊是沒有達(dá)到車牌高度的25%的話,個(gè)數(shù)還沒有到達(dá)5個(gè),則宣告分割工作失敗。 2.5.2 字符的細(xì)分割 第一,對重疊字符塊進(jìn)行拆分。如果當(dāng)
58、一個(gè)字符塊當(dāng)中它的寬度在要比單字符固定的寬度大0.4倍之后,在圖像陰影當(dāng)中就會有較多的字符重疊。因此需要借助于垂直投影當(dāng)中最小像素值的位置,把字符分割為兩個(gè)并且完成字符重疊的分割工作。 第二,要進(jìn)行字符快的合并拆分。如果當(dāng)字符塊寬帶度小于固定寬度的0.7倍,那么下一個(gè)字符寬度也會比這個(gè)寬度更小。同時(shí)錢字符塊和下一個(gè)字符塊兩者之間距離是小于0.5倍的字符間的距離,而前字符塊和下個(gè)字符之間的間距寬度是整體模板總長的1/7,那么上一個(gè)字符塊和下一個(gè)字符塊就需要完成合并拆分的工作。 第三,如果當(dāng)字符塊擁有了特征為1的先驗(yàn)值的話,那么該字符和其他字符之間所存在的邊界距離就要比字符間距大1.5倍。如果
59、像素值是超過它的固定閾值的,那么這個(gè)字符的垂直投影就是1。如果將寬度添加到左右兩邊的話,那么字符的寬度就會類似于該制服的先驗(yàn)值。如果上面所說的各種情況都不符合實(shí)際,那么該字符中間就有一定的噪聲或者干擾,應(yīng)該在系統(tǒng)處理之后將其刪除。 2.5.3 字符分割結(jié)果 通過以上的分析,在對制服進(jìn)行全面的拆分合并以及制服一處理之后,可以使得制服模板能夠滿足實(shí)際分析的需求,這樣做法也比較快速和準(zhǔn)確,有利于后續(xù)識別工作的進(jìn)行,并且對噪聲、分割效果較高。分割后的車牌字符如圖2-8所示: 圖2-8 車牌分割效果 法兩者相結(jié)合,能夠更好的解決漢字這一
60、特定識別字符在斷線和噪聲干擾等多方面問題。從而也使得識別的效率更高,字符識別更加準(zhǔn)確,也有利于后續(xù)的進(jìn)一步處理。 3 車牌的識別 3.1 模板匹配的理論概述 進(jìn)行模糊匹配,就是要將目標(biāo)圖像和模型模板之間在特征進(jìn)行比對,而這種方法原理也比較簡單,就是找到圖像當(dāng)中所有位置,對比他和模板存在的相似點(diǎn)。如果單兩者之間相似程度較高,就可以認(rèn)為該識別目標(biāo)就是模板當(dāng)中對應(yīng)的字符。OpenCV提供了6種模板匹配算法: (1)平方差匹配法 (2)歸一化平方差匹配法 (3)相關(guān)匹配法 (4)歸一化相關(guān)匹配法 (5)相關(guān)系數(shù)匹配法 (6)歸一化相關(guān)系數(shù)匹配法 在實(shí)際使用中根據(jù)所需要的精確程度進(jìn)行
61、有選擇地使用。 3.2 車牌字符識別 與其他的字符識別軟件進(jìn)行對比而言,車牌字符識別有許多獨(dú)立的特點(diǎn)。例如它的適用范圍比較小,僅僅是對一些字母數(shù)字和全國代表文字進(jìn)行識別,整體的字符數(shù)量在一百個(gè)以下。而且識別的類型也比較小,車牌在型號方面大小也比較相似,比傳統(tǒng)的漢字識別更為容易;雖然所需要的模板庫比較少,且模板相似度高,但還有其他外界因素對字符的識別造成干擾。例如,車牌圖像一般都是在室外拍攝的,照明、相機(jī)放置和拍攝角度、自然天氣等因素會導(dǎo)致字符特征信息丟失、模糊、提高識別難度等。 3.2.2 統(tǒng)計(jì)模式方法 借助于模板和輸入量模板之間某種程度上的相似性,可以進(jìn)行模糊字符的匹配。他們之間最大
62、的相似點(diǎn)在于輸入模式之間的相似。結(jié)合字符所呈現(xiàn)出來的視覺圖像特征提取,并且利用一定的匹配原則來作為具體的識別特征。這個(gè)方法不需要特征提取。將兩者進(jìn)行直接比較,如果相似程度較高,那么就直接作為結(jié)果輸出,這個(gè)方法優(yōu)點(diǎn)在于能夠全面的處理,并且比較簡單。 在本文研究過程當(dāng)中使用到的解決方法沒有對字符的圖像進(jìn)行主點(diǎn)的檢測,匹配時(shí)候僅僅選擇了字符之間的距離以及外觀輪廓等方法來進(jìn)行匹配。并且描述了每個(gè)邊界上字符之間的最短距離。而在得到這些基本特征提取之后,將字符數(shù)組和預(yù)先的模板進(jìn)行外輪廓的比對。差異是由歐吉德距離所測量得出的?,F(xiàn)成的方法仍然是屬于字符識別當(dāng)中的模糊匹配方法類別,但是由于涉及到了拓?fù)涞冗@類型
63、的信息,基本思想是使用一個(gè)或多個(gè)平行于0,30,45或60度水平的組。這一線條對整個(gè)字符都進(jìn)行了貫穿。在識別特征提取方面,是選取字符和水平之間的交叉點(diǎn)作為識別基礎(chǔ)的。 具體的實(shí)現(xiàn)過程是在系統(tǒng)當(dāng)中對識別的圖像進(jìn)行坐標(biāo)值的提取,同時(shí)得到它的特征量。在模板坐標(biāo)當(dāng)中,與對應(yīng)的特征量進(jìn)行對比,并且進(jìn)行過計(jì)算,統(tǒng)一化處理之后得到他們之間的關(guān)系。而在這其中,相關(guān)量最大的就可以發(fā)現(xiàn)具有最大的相似程度,所以就可以將他們等同起來。在計(jì)算圖像和模板特征距離的時(shí)候,要用最小的距離算法來確定當(dāng)前圖像所屬的類別。然而,一般而言,用于匹配的圖像的成像條件存在差異,導(dǎo)致較大的噪聲干擾,或者在對圖像進(jìn)行預(yù)處理和歸一化之后,圖
64、像的灰度或像素位置改變。具體的模板應(yīng)用過程當(dāng)中,需要根據(jù)區(qū)域的特定形狀來,對各種類似區(qū)域之間的差異進(jìn)行區(qū)分。并考慮到容易由處理引起的噪音和位移等因素,根據(jù)圖像的一些不變特征。通過設(shè)計(jì)構(gòu)建模板的特征量,可以避免上述問題。 這一批方法主要的特點(diǎn)是比較簡單,如果字符比較規(guī)則,同時(shí)他能夠?qū)χ品蛨D像的缺陷具有較高的適應(yīng)能力,輸出成功率也比較高。本文綜合利用了模糊匹配的自身優(yōu)點(diǎn)來作為車牌識別過程當(dāng)中的主要方法。 基于模糊匹配的OCR的基本過程是:首先要對制服進(jìn)行二值化處理,并且放大他們的尺寸,使之能夠與字符數(shù)據(jù)庫模板大小相同。之后再與所有模板進(jìn)行比對,選擇最佳的匹配效果。它的具體步驟如圖3-1所示:
65、 圖3-1 步驟圖 所以本處主要借助于利用減法來查找與模板最為相似的字符,在他們匹配完相似度只有再次進(jìn)行輸出。車牌一般有七個(gè)字符。大多數(shù)盤子都是漢字,后面是字母和數(shù)字。車牌的組成一般都是有限的漢字和英文字母,有50多個(gè)漢字,26個(gè)英文大寫字母,10位數(shù)字。因此,創(chuàng)建一個(gè)字符模板庫是非常方便的。 同樣的模板也很重要。必須使用一個(gè)精確的模板,否則無法正確識別。為了使得本次試驗(yàn)更加有效,再結(jié)合到車牌的特征,選用了四個(gè)漢字和26個(gè)字母以及10個(gè)預(yù)用的模板進(jìn)行試驗(yàn)。其他模板的設(shè)計(jì)也是相同的。圖3-2顯示了漢字、字母、數(shù)字模板。
66、圖3-2 漢字、字母、數(shù)字模板 3.3 識別結(jié)果及分析 結(jié)合以上所述的方法。來對圖像進(jìn)行初步的檢測,結(jié)果顯示具有一定的應(yīng)用效果。下面是對三幅車牌照片的檢測,結(jié)果如圖所示: 當(dāng)輸入圖片為: 系統(tǒng)運(yùn)行結(jié)果如下: 4 總結(jié) 圖3-3 系統(tǒng)運(yùn)行圖 4 總結(jié) 4.1 研究總結(jié) 本文主要分為了四個(gè)部分,分別從當(dāng)前國內(nèi)外研究現(xiàn)狀、論文研究背景、車牌預(yù)處理以及車牌識別等各方面來進(jìn)行全面的論述。在本課題的研究背景下,本文對國內(nèi)外該課題的研究現(xiàn)狀以及研究的實(shí)踐價(jià)值進(jìn)行了論述,并列舉了整篇文章的總體結(jié)構(gòu)。在后面的技術(shù)介紹環(huán)節(jié)當(dāng)中,對車牌識別分為兩個(gè)部分進(jìn)行介紹。包括預(yù)處理以及車牌字符識別兩個(gè)方面。車牌預(yù)處理包括五個(gè)步驟:確定顏色,二子化處理,灰度化處理,消除噪聲,以及進(jìn)行字符的分割。其識別模塊使用模板匹配算法。在這個(gè)項(xiàng)目中,VS2015被用作開發(fā)工具中的開發(fā)工具。結(jié)合當(dāng)前已經(jīng)運(yùn)用的open cv等先進(jìn)的圖像處理方法。并且結(jié)合c++的語言特點(diǎn),設(shè)計(jì)和開發(fā)出了車牌識別系統(tǒng)。該系統(tǒng)也具有一定的實(shí)際應(yīng)用價(jià)值。在本文的
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。