姓名:張剛 學(xué)號:17021210979
【嵌牛導(dǎo)讀】:將汽車內(nèi)外傳感器的數(shù)據(jù)進(jìn)行融合观腊,借此評估駕駛員情況、進(jìn)行駕駛場景分類,都要用到機(jī)器學(xué)習(xí)幔虏。本文中,我們講解了不同的自動駕駛算法贝椿。
【嵌牛提問】:機(jī)器學(xué)習(xí)算法是如何應(yīng)用在智能駕駛領(lǐng)域的想括?
【嵌牛鼻子】:目標(biāo)檢測? 目標(biāo)識別與分類? 目標(biāo)定位? 運(yùn)動預(yù)測
機(jī)器學(xué)習(xí)算法在自動駕駛領(lǐng)域的應(yīng)用大盤點(diǎn)
將汽車內(nèi)外傳感器的數(shù)據(jù)進(jìn)行融合,借此評估駕駛員情況烙博、進(jìn)行駕駛場景分類主胧,都要用到機(jī)器學(xué)習(xí)。本文中习勤,我們講解了不同的自動駕駛算法踪栋。
將汽車內(nèi)外傳感器的數(shù)據(jù)進(jìn)行融合,借此評估駕駛員情況图毕、進(jìn)行駕駛場景分類夷都,都要用到機(jī)器學(xué)習(xí)。本文中予颤,我們講解了不同的自動駕駛算法囤官。
自動駕駛汽車的設(shè)計(jì)制造面臨著諸多挑戰(zhàn),如今蛤虐,各大公司已經(jīng)廣泛采用機(jī)器學(xué)習(xí)尋找相應(yīng)的解決方案党饮。汽車中的ECU(電子控制單元)已經(jīng)整合了傳感器數(shù)據(jù)處理,如何充分利用機(jī)器學(xué)習(xí)完成新的任務(wù)驳庭,變得至關(guān)重要刑顺。潛在的應(yīng)用包括將汽車內(nèi)外傳感器的數(shù)據(jù)進(jìn)行融合氯窍,借此評估駕駛員情況、進(jìn)行駕駛場景分類蹲堂。這些傳感器包括像激光雷達(dá)狼讨,雷達(dá),攝像頭或者是物聯(lián)網(wǎng)柒竞。
車載信息娛樂系統(tǒng)所運(yùn)行的應(yīng)用政供,能從傳感器數(shù)據(jù)融合系統(tǒng)中獲取數(shù)據(jù)。舉個例子朽基,如果系統(tǒng)察覺駕駛員發(fā)生狀況布隔,有能力把車開到醫(yī)院〖诨ⅲ基于機(jī)器學(xué)習(xí)的應(yīng)用衅檀,還包括對駕駛員的語言和手勢識別以及語言翻譯。相關(guān)的算法被分類為非監(jiān)督和監(jiān)督算法渡蜻。它們兩者的區(qū)別在于學(xué)習(xí)的方式术吝。
監(jiān)督學(xué)習(xí)算法使用訓(xùn)練數(shù)據(jù)集學(xué)習(xí),并且能夠持續(xù)學(xué)習(xí)直到達(dá)到設(shè)定的置信水平(最小化出錯概率)茸苇。監(jiān)督學(xué)習(xí)算法分為回歸排苍、分類和異常檢測以及數(shù)據(jù)降維。
無監(jiān)督學(xué)習(xí)算法学密,則嘗試挖掘有限數(shù)據(jù)的價(jià)值淘衙。這意味著,算法會在可用數(shù)據(jù)內(nèi)建立關(guān)系腻暮,以檢測模式或者將數(shù)據(jù)集分成子類(取決于之間的相似度)彤守。從廣義上,無監(jiān)督算法可以可分為關(guān)聯(lián)規(guī)則學(xué)習(xí)和聚類哭靖。
增強(qiáng)學(xué)習(xí)算法是另外一種機(jī)器學(xué)習(xí)算法具垫,介于非監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)之間。對于所有訓(xùn)練的例子试幽,監(jiān)督學(xué)習(xí)中有目標(biāo)標(biāo)簽筝蚕,無監(jiān)督學(xué)習(xí)中卻完全沒有標(biāo)簽。強(qiáng)化學(xué)習(xí)有延遲的铺坞、稀疏的標(biāo)簽——未來的獎勵起宽。
根據(jù)這些獎勵,智能體學(xué)習(xí)做出恰當(dāng)行為济榨。去理解算法的局限性和優(yōu)點(diǎn)坯沪,開發(fā)更加高效的學(xué)習(xí)算法,是增強(qiáng)學(xué)習(xí)的目標(biāo)擒滑。增強(qiáng)學(xué)習(xí)可以解決大量實(shí)際應(yīng)用腐晾,從AI的問題到控制工程或操作研究——所有這些都與開發(fā)自動駕駛汽車相關(guān)叉弦。這可以被分為間接學(xué)習(xí)和直接學(xué)習(xí)。
在獨(dú)自動駕駛汽車上赴魁,機(jī)器學(xué)習(xí)算法的一個主要任務(wù)是持續(xù)渲染周圍的環(huán)境卸奉,以及預(yù)測可能發(fā)生的變化钝诚。這些任務(wù)可以分為四個子任務(wù):
目標(biāo)檢測
目標(biāo)識別或分類
目標(biāo)定位
運(yùn)動預(yù)測
機(jī)器學(xué)習(xí)算法可以簡單地分為4類:決策矩陣算法颖御、聚類算法、模式識別算法和回歸算法凝颇∨斯埃可以利用一類機(jī)器學(xué)習(xí)算法來完成兩個以上的子任務(wù)。例如拧略,回歸算法能夠用于物體定位和目標(biāo)識別或者是運(yùn)動預(yù)測芦岂。
決策矩陣算法
決策矩陣算法系統(tǒng)地分析、識別和評估信息集和值之間關(guān)系的表現(xiàn)垫蛆。這些算法主要用于決策禽最。車是否需要剎車或者左轉(zhuǎn)都是基于算法根據(jù)識別、分類和預(yù)測對象的下一個動作給出的置信水平袱饭。矩陣決策算法由各種獨(dú)立訓(xùn)練的決策模型組合而成川无。用某種方式,這些預(yù)測整合起來進(jìn)行總體預(yù)測虑乖,同時降低決策錯誤的可能性懦趋。AdaBoosting 是最常用的算法。
AdaBoosting
Adaptive Boosting或稱為AdaBoost疹味,是一種多種學(xué)習(xí)算法的融合仅叫。它可用于回歸或者分類算法。相比其他機(jī)器學(xué)習(xí)算法糙捺,它克服了過擬合诫咱,并通常對異常值和噪聲數(shù)據(jù)敏感。為了創(chuàng)建一個強(qiáng)大的復(fù)合學(xué)習(xí)器洪灯,AdaBoost使用了多次迭代坎缭。因此,它又被稱為 “Adaptive Boosting”婴渡。通過迭代添加弱學(xué)習(xí)器幻锁,AdaBoost創(chuàng)建了一個強(qiáng)學(xué)習(xí)器。一個新的弱學(xué)習(xí)器加到實(shí)體上边臼,并且調(diào)整加權(quán)向量哄尔,作為對前一輪中錯誤分類的樣例的回應(yīng)。得到的結(jié)果柠并,是一個比弱學(xué)習(xí)者分類器有更高準(zhǔn)確性的分類器岭接。
AdaBoost有助于將弱閾值的分類器提升為強(qiáng)分類器富拗。上面的圖像描述了AdaBoost的執(zhí)行,只用了簡單易于理解的代碼在一個文件中就實(shí)現(xiàn)了鸣戴。這個函數(shù)包含一個弱分類器和boosting組件啃沪。弱分類器在一維的數(shù)據(jù)中嘗試去尋找最理想的閾值來將數(shù)據(jù)分離為兩類。boosting組件迭代調(diào)用分類器窄锅,經(jīng)過每一步分類创千,它改變了錯誤分類示例的權(quán)重。因此入偷,創(chuàng)建了一個級聯(lián)的弱分類器追驴,它的行為就像一個強(qiáng)分類器。
聚類算法
有時疏之,系統(tǒng)獲取的圖片不是很清晰殿雪,使得物體難以定位檢測。有時锋爪,分類算法有丟失檢測物體的可能丙曙,這樣就不能分類和報(bào)告給系統(tǒng)。這些可能是不連續(xù)的數(shù)據(jù)造成的其骄,數(shù)據(jù)點(diǎn)太少了亏镰,或者圖片分辨率太低了。聚類算法的特點(diǎn)在于從數(shù)據(jù)點(diǎn)中發(fā)現(xiàn)模式年栓。像回歸分析一樣拆挥,聚類算法是指一類方法和問題。典型的聚類算法有層次聚類某抓,基于質(zhì)心的聚類算法纸兔。這些算法都關(guān)注數(shù)據(jù)的內(nèi)在模式,完美地把數(shù)據(jù)分解成擁有最大相似性的簇否副。K-均值汉矿,多分類神經(jīng)網(wǎng)絡(luò)(Multi-class Neural Network)是最常用的算法。
K-均值算法
K-均值是著名聚類算法备禀,它找出代表聚類結(jié)構(gòu)的k個質(zhì)心洲拇。如果有一個點(diǎn)到某一質(zhì)心的距離比到其他質(zhì)心都近,這個點(diǎn)則指派到這個最近的質(zhì)心所代表的簇曲尸。依次赋续,利用當(dāng)前已聚類的數(shù)據(jù)點(diǎn)找出一個新質(zhì)心,再利用質(zhì)心給新的數(shù)據(jù)指派一個簇另患。
K-均值算法——在上圖中用“x”表示 聚類質(zhì)心纽乱,用點(diǎn)表示訓(xùn)練樣本。(a) 原始數(shù)據(jù)集昆箕。(b) 隨機(jī)初始化聚類質(zhì)心鸦列。(c-f) k-均值迭代2次的示意圖租冠。在每次迭代中每個訓(xùn)練樣例都指派到一個最近的聚類質(zhì)心,每個聚類質(zhì)心被移動到分配給它的點(diǎn)的平均值薯嗤。
模式識別算法(分類模型)
在高級輔助駕駛系統(tǒng)(ADAS)中顽爹,利用感應(yīng)器獲取的圖像包含各種各樣的環(huán)境數(shù)據(jù)。對圖像進(jìn)行過濾變得十分必要骆姐,以剔除一些不相關(guān)的樣本得到用于分類的實(shí)例數(shù)據(jù)镜粤。在分類前,關(guān)鍵步驟是在一個數(shù)據(jù)集上的模式識別诲锹。這類算法稱為數(shù)據(jù)約簡算法繁仁。
數(shù)據(jù)約簡算法有助于降低數(shù)據(jù)集的邊緣涉馅、對象的直線(擬合出來的線段)和圓弧的邊緣归园。線段與邊緣匹配,到直角后稚矿,該匹配會產(chǎn)生一段線段庸诱。和弧線一樣,圓弧與一串直線段匹配晤揣。用不同的方式桥爽,圖像特征(圓弧和線段)組合起來形成特征,用來判斷對象昧识。
利用PCA(主成分分析)和HOG(方向梯度直方圖)钠四,SVM(支持向量機(jī))通常在ADAS中用做識別算法。也會用K-鄰近(KNN)和貝葉斯決策規(guī)則跪楞。
支持向量機(jī)(SVM)
SVM依賴于決策平面概念缀去,后者定義了決策邊界。決策平面可以把明顯有類關(guān)系的對象分隔開. 如下圖示甸祭。這張圖片中缕碎,對象分為紅色和綠色兩類。分離的邊界線把紅色和綠色的對象分離了池户。落在線左邊的新對象標(biāo)記為紅色類咏雌,落在右邊標(biāo)為綠色。
回歸算法
這類算法善于做事件預(yù)測校焦∩薅叮回歸分析評估兩個或兩個以上變量的關(guān)系,以及變量在不同尺度上的貢獻(xiàn)寨典,主要受三個指標(biāo)影響:
1氛雪、 回歸線的形狀
2、非獨(dú)立變量的類型
3凝赛、獨(dú)立變量的數(shù)量
(攝像頭或者雷達(dá)收集到的)圖像在ADAS的驅(qū)動和定位上起了重要作用注暗。對于任一算法坛缕,最大的挑戰(zhàn)是利用基于圖像的模型來做特征選擇和預(yù)測。
環(huán)境的可重復(fù)性捆昏,對回歸算法為圖像和該圖像中某物體位置之間的關(guān)系赚楚,構(gòu)建統(tǒng)計(jì)模型起了杠桿作用。利用采樣圖像的統(tǒng)計(jì)模型骗卜,可以快速在線識別和離線學(xué)習(xí)宠页。這個模型可以進(jìn)一步延伸到不需要大量人類建模的其他對象。算法返回的對象位置寇仓,作為在線階段的輸出和對象出現(xiàn)的概率举户。
回歸算法能夠用來短程預(yù)測和長程訓(xùn)練。這類回歸算法中用到自動駕駛上遍烦,有決策森林回歸俭嘁、神經(jīng)網(wǎng)絡(luò)回歸、貝葉斯回歸等等服猪。
神經(jīng)網(wǎng)絡(luò)回歸模型
神經(jīng)網(wǎng)絡(luò)可以用到回歸供填、分類或者其他無監(jiān)督學(xué)習(xí)上,來匯總沒有標(biāo)記的數(shù)據(jù)罢猪,分類這些數(shù)據(jù)近她,或者在監(jiān)督學(xué)習(xí)后預(yù)測一個連續(xù)值。神經(jīng)網(wǎng)絡(luò)常在最后一層用邏輯斯特回歸把連續(xù)值轉(zhuǎn)換成形如1或0的變量(二值變量)膳帕。
在上圖中粘捎,“x”是輸入,特征從前一層神經(jīng)元傳播而來危彩。到最后隱藏層的每個神經(jīng)元攒磨,有很多’x’會喂進(jìn)來,每個’x’,乘以相應(yīng)的權(quán)重w恬砂。對于偏置咧纠,乘積求和后加上偏置,然后輸入到激活函數(shù)泻骤。激活函數(shù)常用的是ReLU(修正線性單元)漆羔,因?yàn)樗粫駍igmoid激活函數(shù)在淺層梯度膨脹。ReLU在隱藏層輸出的激活值a狱掂,經(jīng)過求和后成為輸出層的輸出演痒。這暗示:一個神經(jīng)網(wǎng)絡(luò)用做回歸時只有一個輸出節(jié)點(diǎn)。這個節(jié)點(diǎn)把激活值求和后乘以1向量趋惨。網(wǎng)絡(luò)的估計(jì)值鸟顺,‘y帕’作為結(jié)果。‘Y帕’是所有’x’映射出來的獨(dú)立變量讯嫂。你可以這樣用神經(jīng)網(wǎng)絡(luò)得到與‘x’(多個非獨(dú)立向量)相關(guān)的函數(shù)蹦锋,可以求出你要預(yù)測的’y'(獨(dú)立變量)。