在了解深度學(xué)習之前,我們先來(lái)說(shuō)說(shuō)目前車(chē)牌識別的核心問(wèn)題和主要困難:
不同光照條件對識別效果影響很大。比如天氣狀況不同,車(chē)牌在晴天和陰雨、下雪天氣視覺(jué)上是不一樣的,晴天車(chē)牌圖片一般都較為清晰,但是強烈光照會(huì )帶來(lái)局部反光過(guò)強的問(wèn)題,陰雨天氣圖片昏暗模糊,下雪則有可能覆蓋車(chē)牌的某些區域;另外即使在同一天由于陽(yáng)光顏色的變化也會(huì )影響成像質(zhì)量。車(chē)牌本身種類(lèi)較多,形狀、顏色、尺寸等都各有不同,而且,拍攝點(diǎn)的距離不同、拍攝角度不同都會(huì )影響到最終車(chē)牌在圖片中的呈現姿態(tài)和外觀(guān)。
這些都是影響車(chē)牌識別效果的直接因素,那么深度學(xué)習算法在車(chē)牌識別系統中的應用真能得到改進(jìn)嗎?眾所周知,機器學(xué)習的主要問(wèn)題就是讓計算機模擬人類(lèi)大腦工作,為此研發(fā)人員構建出人工神經(jīng)網(wǎng)絡(luò )模型,算法在提供初始條件后自主從數據學(xué)習新知識,不斷增強自身的學(xué)習和理解能力。深度學(xué)習的提出給神經(jīng)網(wǎng)絡(luò )的學(xué)習能力帶來(lái)了飛躍。
深度學(xué)習就是利用一些方法去構建一個(gè)含有多層隱藏層的人工神經(jīng)網(wǎng)絡(luò ),網(wǎng)絡(luò )的每一層都對應著(zhù)原始數據不同層次的數學(xué)抽象,從而達到用特征向量描述圖像的目的。這里首先要明確兩個(gè)概念:有監督學(xué)習和無(wú)監督學(xué)習。
所謂有監督學(xué)習,是指給定了訓練樣本數據(data)的同時(shí)也已知樣本經(jīng)過(guò)學(xué)習后的目標值,一般這些目標值是由人工標記或給出的真值(Ground Truth),也稱(chēng)為樣本標簽(label)。常見(jiàn)的有監督學(xué)習形式有:回歸和分類(lèi)?;貧w就是要對數據及其標簽進(jìn)行擬合;另一種方式是進(jìn)行分類(lèi),對給定標簽的數據訓練分類(lèi)器,訓練分類(lèi)器是優(yōu)化在訓練數據上分類(lèi)的正確率的過(guò)程。無(wú)監督的學(xué)習過(guò)程不需要人工標注數據的標簽,只需要估計數據的分布特性或者將數據聚成特定數目的幾類(lèi)。多數深度學(xué)習用到的算法都是屬于無(wú)監督的。
深度學(xué)習有多種學(xué)習結構,主要分為三類(lèi):
第一種是生成型的深度結構,其代表有深度置信網(wǎng)絡(luò )(DBN):它由一系列限制型玻爾茲曼機組成,主要能解決多層神經(jīng)網(wǎng)絡(luò )在學(xué)習的過(guò)程中標簽數據需求量大、收斂速度慢和陷入局部極值等問(wèn)題。由于其學(xué)習的是觀(guān)測數據和標簽的聯(lián)合概率,所以對先驗概率和后驗概率都可以進(jìn)行估計。
第二種是區分型模型,卷積神經(jīng)網(wǎng)絡(luò )就是其代表,其結構不同于第一類(lèi)模型,只能對后驗概率進(jìn)行估計,適合應用在識別和分類(lèi)問(wèn)題中。
第三種是混合型結構,它是將上述兩種結構用合適的方式組合起來(lái)。生成型結構用于分類(lèi)問(wèn)題的時(shí)候,可以在后面使用區分型的結構進(jìn)行參數優(yōu)化。
由此可見(jiàn),不同于傳統目標識別需要依賴(lài)研發(fā)人員花費大量時(shí)間和精力設計特征,深度學(xué)習的方法通過(guò)前向和后向傳播優(yōu)化深度神經(jīng)網(wǎng)絡(luò )參數,自主學(xué)習到合適的圖像描述子。深度神經(jīng)網(wǎng)絡(luò )結構很多,其中卷積神經(jīng)網(wǎng)絡(luò )適用于做區分性問(wèn)題,因此能夠應用在目標檢測和識別等計算機視覺(jué)問(wèn)題中,車(chē)牌識別就是其中很好的應用,那么前文中提到的各種識別問(wèn)題就不難解決了。
不但針對車(chē)牌,深度學(xué)習算法對于車(chē)型識別也能起到關(guān)鍵性作用。據悉停車(chē)場(chǎng)車(chē)牌識別一體機行業(yè)的引領(lǐng)者安快正在研發(fā)基于深度學(xué)習的智能相機,一經(jīng)推出又將掀起停車(chē)場(chǎng)出入口控制領(lǐng)域的重大變革。
NEWS