實時的基于機器學(xué)習(xí)的檢測圖像的車的快速訓(xùn)練米洛斯 Stojmenovic收到:2005 / 23十一月接受: 2006日28 / 發(fā)表于:30 2006 施普林格出版社2006[摘要]我們的主要興趣是建立快速基于小圖像可靠的目標(biāo)識別 ING 集需要構(gòu)建大多是手動的,如我們研究的本田雅閣,識別2004從后方的看法。我們描述了一種新的變種基于 AdaBoost 的學(xué)習(xí)算法,建立了一個強分類器的弱分類增量—sifiers(WCS) ,最小的組合誤差已選定的廁所。每個 WC 訓(xùn)練只有一次,例子并不改變它們的權(quán)重。我們描述一組為考慮適當(dāng)類型的特征識別問題,包括發(fā)紅措施和占主導(dǎo)地位的邊緣取向。現(xiàn)有的邊緣定位—水平(垂直,分別)邊緣屬于同一倉。我們提出了預(yù)先消除功能的最佳的閾值附近的迷你瑣碎的位置—所有的媽媽或最大值。這是一個新的的方法,減少了訓(xùn)練集 WC 的數(shù)量不到原來的10% ,大大加快—建立培訓(xùn)時間,并沒有負(fù)面影響最終的分類器的質(zhì)量。我們還修改了實驗。表明,Viola 和瓊斯使用的功能集人臉識別是低效的和別人對我們的的問題,準(zhǔn)確和實時識別的汽車快速訓(xùn)練。我們的培訓(xùn)方法,找到一個非常準(zhǔn)確的分類只含有30廁所后1h 訓(xùn)練。與現(xiàn)有的文獻(xiàn)相比,我們的整體實現(xiàn)一個真正的設(shè)計用最少的時間目標(biāo)檢測機的例子,廁所數(shù)量最少的,最快的訓(xùn)練時間,具有競爭力的檢測和假陽性率。1引言本文的目的是分析能力—在當(dāng)前的機器學(xué)習(xí)技術(shù),解決“能力” ,我們的意思是實時性,較高的檢測率,假陽性率低,快速的訓(xùn)練和學(xué)習(xí)用在訓(xùn)練集是不容易的,和最它需要手動創(chuàng)建。我們將應(yīng)用機器學(xué)習(xí)的檢測具體地說,能夠認(rèn)識到某種類型的如本田汽車協(xié)議,2004。因此,應(yīng)該是一個任意的輸入圖像,和的結(jié)果應(yīng)該是相同的圖像一個矩形的發(fā)生在我們的車尋找。此外,檢測精度,其第二個主要的目的是實時性能。Pro—克應(yīng)迅速找到給定類型的所有汽車位置在圖像中,在相同的方式和瓊斯認(rèn)為所有的頭。定義房我們想得到一個回答測試圖像在第二個左右的響應(yīng)時間取決于。的測試圖像的大小,因此似乎是真實的對于較小的圖像的時間可能不那么大的。最后,我們的目標(biāo)是設(shè)計對象檢測—基于一個小數(shù)量的培訓(xùn)考試系統(tǒng)樣品。我們設(shè)想在訓(xùn)練的例子是不容易獲得的情況下的應(yīng)用。例如,在的情況下,我們的研究,我們必須采取的照片幾百個本田協(xié)定和其他汽車的看法創(chuàng)建訓(xùn)練集,因為幾乎沒有正面的形象在網(wǎng)上找到的。在這種情況下,它是很難的希望能有數(shù)萬成千上萬的圖像現(xiàn)成的,這是人臉檢測的情況—問題。一個小的額外訓(xùn)練集,訓(xùn)練時間減少。這使我們進(jìn)行了大量的嘗試訓(xùn)練,調(diào)整設(shè)置例子,調(diào)整設(shè)置的功能,不同的測試集弱分類器(WCS) ,否則分析通過觀察生成的類的行為過程。由于與一個小數(shù)量的訓(xùn)練的成功的例子是不清楚的,我們還必須設(shè)置快速列車—進(jìn)行了一些調(diào)整和改進(jìn)系統(tǒng)。本文的兩個主要的貢獻(xiàn),預(yù)—為滿足所有目標(biāo)。我們將在一個機器學(xué)習(xí)的方法試圖解決的問題檢測出來特殊的車型自他們似乎是適當(dāng)?shù)蔫b于問題的設(shè)置。機器學(xué)習(xí)相似圖像檢索已被證明是可靠的坐—評估的目標(biāo)對象不改變方向,一個經(jīng)典的應(yīng)用已成為檢測直立向前頭所提出的中提琴瓊斯。汽車通常是在相同的發(fā)現(xiàn)相對于道路的方向。他們可以照片—(正面,側(cè)面……)但其實很少發(fā)現(xiàn)了邊。我們是國際形勢莎莉在車輛的后部。這也是目標(biāo)對警察的交通監(jiān)控設(shè)備的選擇,因為他們的相機的位置通常是電影的許可證用于車輛識別的目的板。那里—前,硬件已經(jīng)到位,各種軟件在車輛檢測中的應(yīng)用。積極的圖像采取的,所有本田有相同的一般正交方相對于相機。一些偏差的發(fā)生在球場上,這些圖像,偏航和滾動,這可能可為什么產(chǎn)生的檢測器具有如此廣泛的有效性。這是建立機器是有效的在角以下偏差:?15?,偏航?30?30?,卷15至18。這意味著圖片本田從角度是由規(guī)定的的數(shù)量依然由程序檢測。算法用于目標(biāo)檢測問題。實驗結(jié)果給出了。4。結(jié)論會議,只討論版在我們的汽車檢測系統(tǒng)的功能設(shè)置。 任何特定類型的車后視圖。因此我們回顧了解決更一般的問題。存在—ING 的車輛檢測系統(tǒng),如那些嘗試自動駕駛汽車沿公路實際上不檢測道路上的汽車。他們只是認(rèn)為任何—事情正在高速公路上的車輛。在科學(xué)文獻(xiàn),一些汽車識別方案的存在是基于形狀的探測器?,F(xiàn)有的基于形狀的方法報道已匹配 A60–85%提高?;谧罱徠ヅ涞姆椒▽σ暯亲兓^于敏感,而方法基于 PCA(主成分分析)不一個實時系統(tǒng)。目標(biāo)檢測的最普遍的例子是人臉檢測?;緫?yīng)用為中提琴和瓊斯的實時人臉識別系統(tǒng)。是具體的機器學(xué)習(xí)方法由 Viola 和瓊斯用來實現(xiàn)他們的系統(tǒng)。在這種方法中,正和負(fù)的訓(xùn)練集通過級聯(lián)分類器分開,每個構(gòu)造采用 AdaBoost。實時性能的實現(xiàn)(一個預(yù)處理步驟后) 。的訓(xùn)練時間人臉檢測器,似乎是緩慢的,甚至用了幾個月根據(jù)一些報道。Viola 和 Joss 的臉,發(fā)現(xiàn)系統(tǒng)已經(jīng)證實在文獻(xiàn)中的一些文章。修正—陽離子包括新功能的添加。特別的,和那些基于一個特定部分的顏色圖像。機器本身的修改在幾個方面的文獻(xiàn)。我們已經(jīng)考慮到了所有的在文獻(xiàn)提出的修改,并通過思想被認(rèn)為是有助于實現(xiàn)我們的目標(biāo)。我們再次強調(diào),最成功的應(yīng)用:使用一個大的訓(xùn)練集。在中提琴瓊斯的原始的人臉檢測器,圖像用于訓(xùn)練集。已知的最小的訓(xùn)練他們開始在90%只貓實現(xiàn)的檢出率—類型時正例數(shù) reached250。負(fù)的實例數(shù)是未指定在這個階段,但作者說,他們隨機10000圖像從互聯(lián)網(wǎng)下載包含100000000子窗口。他們只是適度增加了檢測的陽性率的大小將大幅增長的對象。的大小等于或大于24×24像素(用于面搜索) , (我們有車限100×150搜索)作為輸入,并宣布是否這個地區(qū)包含搜索的對象。我們用這樣的機器整個圖像分析。我們通過每個子窗口包含的面孔。一個滑動窗口技術(shù)有—前使用。在窗口被移動后1pixel 的一個子窗口分析(我們使用的2pixel 移為了加快速度,沒有顯著的負(fù)面影響) 。子窗口的尺寸增加的長度和寬度10%每次的所有子窗口以前的大小進(jìn)行了詳盡地搜索。3中使用的特征識別一個特征是一個函數(shù)的圖像映射到一個真正的數(shù)。這里的訓(xùn)練程序。兩種類型的基本特征使用。他們是發(fā)紅的特點和優(yōu)勢邊緣方向特征。占主導(dǎo)地位的邊緣定位—、紅腫特征證明自己是多比 Viola 和 Joss 在原來的設(shè)置,為我們研究的問題,本田雅閣的檢測2004從后面進(jìn)行。3.1紅斑的特點我們指的是紅的特點是不可測的。他們致力于尋找圓形紅色在圖像中的區(qū)域。他們的目標(biāo)是發(fā)現(xiàn)和解決的紅眼睛在以人的照片。他們的大部分工作集中在紅色區(qū)域的形狀,而不是參與找到紅色技術(shù)。我們借他們的發(fā)現(xiàn)是紅色的區(qū)域觀念。我們的不同的工作事實上我們尋找紅色區(qū)域意味著本田雅閣的剎車燈,而不是人類的眼睛。因此,我們的紅色區(qū)域的方—奇異的,和更大的比他們的。圖1顯示了一個通過訓(xùn)練確定發(fā)紅特征的例子過程。一個特殊的發(fā)紅的色彩空間的過程中形成的協(xié)助在紅色區(qū)域的檢測預(yù)處理。這個色彩空間是從,和一一維度將 RGB 顏色空間的二維線性組合。所有的在訓(xùn)練集的正、負(fù)輸入 RGB 彩色圖像,這意味著他們的照片—ELS 是由三個8位數(shù)字,代表紅色的數(shù)量,在一個像素的綠色和藍(lán)色,分別—地。紅色的顏色空間的每個像素的定義如下:紅色= 4R?3G + B。積分圖像計算(該技術(shù)是在[ 13 ]提出的)應(yīng)用于紅色圖像產(chǎn)生的一個在訓(xùn)練過程中輸入。紅色的區(qū)域—確定在固定的時間進(jìn)行性培訓(xùn)的特點利用紅圖像的整體形象。3.2邊緣方向特征使用幾個占主導(dǎo)地位的邊緣方向特征在訓(xùn)練算法。一個眾所周知的灰階梯度掩模(三× 三像素)用在圖像中的邊緣位置的確定。的掩模被施加在兩個坐標(biāo)方向,和基礎(chǔ)執(zhí)行是放在門檻上的拉普拉斯值強度。我們用一個閾值80消除不暈邊有用。一個類似的閾值進(jìn)行。定位—每個像素” 是從它的強度計算在兩個方向。方向分為六整個圓分成六箱。重要的是要注意,0?,方位90?,和180?垃圾箱在識別本田是至關(guān)重要的。他們是重要的—經(jīng)常因為本田主要有水平和垂直邊緣。的垃圾箱的地方,0或90??處兩箱構(gòu)成問題,因為所有的垂直邊界和水平邊緣可以分為兩箱。我們將所有的垃圾箱。沒有提到任何本移動,所以我們相信他們用非移箱。不過他們真的,不同的箱從4到8的數(shù)字。有效數(shù)字—BER 箱不多的沖擊性能,但避免這些邊界。將所有的方向—全文為0–180?范圍,我們增加了180? 如果角小于0?,減去180如果角度大超過180?。這些變革的影響可以在圖2中看到的。在圖3中,我們看到一個本田雅閣和其在第一站相應(yīng)的邊緣方向的圖像?15? ,+ 15?,+ 165,+ 195?。檢測系統(tǒng)。從74.3提高到89.1%,而一些假陽性率從168下降到26。圖像的邊緣方向看。每個值 B(I,J)的每個方向的bin 圖像對應(yīng)—ING 拉普拉斯強度的方向是否屬于這本,3和4,在圖像中的特定區(qū)域,通常有一個方向—這是占主導(dǎo)地位的。我們利用這一事實,我們使用占主導(dǎo)地位的邊緣取向。這個主意首先發(fā)展—利用[。占主導(dǎo)地位的邊緣取向的計算同一區(qū)域。占主導(dǎo)地位的邊緣方向特征進(jìn)行訓(xùn)練。我們看到一些不區(qū)分,但盡管如此明顯的邊緣在一些其他的垃圾箱圖。一個最成功的邊緣取向是一個水平如圖3所示。所有的 POS—可能占主導(dǎo)地位的邊緣箱提供培訓(xùn)程序除了因為它視覺上沒有什么區(qū)分了。