姓名:馮成 學(xué)號(hào):19021221183 學(xué)院:電子工程學(xué)院
嵌牛導(dǎo)讀
從 20 世紀(jì) 80 年代首次成功演示以來(lái)(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988))颂鸿,自動(dòng)駕駛汽車領(lǐng)域已經(jīng)取得了巨大進(jìn)展戏挡。盡管有了這些進(jìn)展,但在任意復(fù)雜環(huán)境中實(shí)現(xiàn)完全自動(dòng)駕駛導(dǎo)航仍被認(rèn)為還需要數(shù)十年的發(fā)展。原因有兩個(gè):首先慢味,在復(fù)雜的動(dòng)態(tài)環(huán)境中運(yùn)行的自動(dòng)駕駛系統(tǒng)需要人工智能歸納不可預(yù)測(cè)的情境技即,從而進(jìn)行實(shí)時(shí)推論泵肄。第二光督,信息性決策需要準(zhǔn)確的感知,目前大部分已有的計(jì)算機(jī)視覺系統(tǒng)有一定的錯(cuò)誤率疫蔓,這是自動(dòng)駕駛導(dǎo)航所無(wú)法接受的含懊。
簡(jiǎn)介
自動(dòng)駕駛汽車身冬,是無(wú)人地面載具(Unmanned ground vehicle)的一種,具有傳統(tǒng)汽車的運(yùn)輸能力岔乔。作為自動(dòng)化載具酥筝,自動(dòng)駕駛汽車不需要人為操作即能感測(cè)其環(huán)境及導(dǎo)航。完全的自動(dòng)駕駛汽車仍未全面商用化重罪,大多數(shù)均為原型機(jī)及展示系統(tǒng)樱哼,部分可靠技術(shù)才下放至量產(chǎn)車型哀九,但有關(guān)于自駕車逐漸成為現(xiàn)實(shí)剿配,已經(jīng)引起了很多有關(guān)于道德的討論。
自動(dòng)駕駛汽車能以雷達(dá)阅束、光學(xué)雷達(dá)呼胚、GPS 及計(jì)算機(jī)視覺(computer vision)等技術(shù)感測(cè)其環(huán)境。先進(jìn)的控制系統(tǒng)能將感測(cè)資料轉(zhuǎn)換成適當(dāng)?shù)膶?dǎo)航道路息裸,以及障礙與相關(guān)標(biāo)志蝇更。根據(jù)定義,自動(dòng)駕駛汽車能透過感測(cè)輸入的資料呼盆,更新其地圖資訊年扩,讓交通工具可以持續(xù)追蹤其位置,即使條件改變访圃,或汽車駛進(jìn)了未知的環(huán)境內(nèi)厨幻。
在美國(guó),美國(guó)國(guó)家公路交通安全管理局(NHTSA)已提出正式的自動(dòng)駕駛五等級(jí)分類系統(tǒng)(2016年版本):
- 等級(jí)0:即無(wú)自動(dòng)腿时。駕駛隨時(shí)掌握著車輛的所有機(jī)械况脆、物理功能,僅配備警報(bào)裝置等無(wú)關(guān)主動(dòng)駕駛的功能也算在內(nèi)批糟。
- 等級(jí)1:駕駛?cè)瞬僮鬈囕v格了,但個(gè)別的裝置有時(shí)能發(fā)揮作用,如電子穩(wěn)定程式(ESP)或防鎖死剎車系統(tǒng)(ABS)可以幫助行車安全徽鼎。
- 等級(jí)2:駕駛?cè)酥饕刂栖囕v盛末,但系統(tǒng)階調(diào)地自動(dòng)化,使之明顯減輕操作負(fù)擔(dān)否淤,例如主動(dòng)式巡航定速(ACC)結(jié)合自動(dòng)跟車和車道偏離警示满败,而自動(dòng)緊急煞停系統(tǒng)(AEB)透過盲點(diǎn)偵測(cè)和汽車防撞系統(tǒng)的部分技術(shù)結(jié)合。
- 等級(jí)3:駕駛?cè)诵桦S時(shí)準(zhǔn)備控制車輛叹括,自動(dòng)駕駛輔助控制期間算墨,如在跟車時(shí)雖然可以暫時(shí)免于操作,但當(dāng)汽車偵測(cè)到需要駕駛?cè)说那樾螘r(shí)汁雷,會(huì)立即回歸讓駕駛?cè)私庸芷浜罄m(xù)控制净嘀,駕駛必須接手因應(yīng)系統(tǒng)無(wú)力處理的狀況报咳。
- 等級(jí)4:駕駛?cè)丝稍跅l件允許下讓車輛完整自駕,啟動(dòng)自動(dòng)駕駛后挖藏,一般不必介入控制暑刃,此車可以按照設(shè)定之道路通則(如高速公路中,平順的車流與標(biāo)準(zhǔn)化的路標(biāo)膜眠、明顯的提示線)岩臣,自己執(zhí)行包含轉(zhuǎn)彎、換車道與加速等工作宵膨,除了嚴(yán)苛氣候或道路模糊不清架谎、意外,或是自動(dòng)駕駛的路段已經(jīng)結(jié)束等等辟躏,系統(tǒng)并提供駕駛?cè)恕白銐驅(qū)捲VD(zhuǎn)換時(shí)間”谷扣,駕駛應(yīng)監(jiān)看車輛運(yùn)作,但可包括有旁觀下的無(wú)人停車功能捎琐。(有方向盤自動(dòng)車)
- 等級(jí)5:駕駛?cè)瞬槐卦谲噧?nèi)会涎,任何時(shí)刻都不會(huì)控制到車輛。此類車輛能自行啟動(dòng)駕駛裝置瑞凑,全程也不須開在設(shè)計(jì)好的路況末秃,就可以執(zhí)行所有與安全有關(guān)之重要功能,包括沒有人在車上時(shí)的情形籽御,完全不需受駕駛意志所控练慕,可以自行決策。(無(wú)需方向盤自動(dòng)車)
這是根據(jù)國(guó)際自動(dòng)機(jī)工程師學(xué)會(huì)(SAE International)依據(jù)這五個(gè)不同程度(從駕駛輔助至完全自動(dòng)化系統(tǒng))發(fā)布另一種分類系統(tǒng)而編修而成篱蝇,設(shè)計(jì)理念是‘誰(shuí)在做贺待,做什么’的分類法。
自動(dòng)駕駛系統(tǒng)通常有一個(gè)非常經(jīng)典的零截、模塊化的流水線麸塞。
首先是感知模塊(perception stack),感知模塊將地圖涧衙、三維傳感器哪工、二維傳感器中的信息給到「世界模型」(world model),世界模型將上述信息弧哎,匯總在一張地圖中雁比,理解每一個(gè)時(shí)刻不同的物體相對(duì)于路面、道線等的位置撤嫩,預(yù)測(cè)下一刻的可選路徑都有哪些偎捎。隨后是一個(gè)規(guī)劃模塊(planning model),進(jìn)行決策。決策的內(nèi)容也是分層級(jí)的茴她。粗粒度的決策需要決定如何從 A 點(diǎn)到 B 點(diǎn)寻拂,完成的是類似 GPS 的工作。除此之外還有諸多細(xì)粒度的決策工作丈牢,例如決定走哪一條車道祭钉,是否要暫時(shí)占用對(duì)向車道完成超車,車速應(yīng)該設(shè)定為多少等己沛。最后是控制模塊(control module)慌核,控制模塊操縱所有的控制器,有高層的控制器申尼,比如電子穩(wěn)定系統(tǒng) ESP垮卓,也有最基層的控制器,比如控制每一個(gè)輪子進(jìn)行加速和剎車的控制器晶姊。
目前正在發(fā)展的計(jì)算機(jī)視覺技術(shù)對(duì)自動(dòng)駕駛系統(tǒng)的發(fā)展非常關(guān)鍵扒接。想要讓一個(gè)自動(dòng)駕駛系統(tǒng)作出正確的決策伪货,主要涉及到以下計(jì)算機(jī)視覺任務(wù):
首先是車輛定位:衡量車輛的運(yùn)動(dòng)并在地圖中進(jìn)行定位们衙。完成這部分工作的是視覺測(cè)距(visual odometry)系統(tǒng)和定位(localization)系統(tǒng)。二者的區(qū)別是碱呼,視覺測(cè)距估計(jì)的是車輛相對(duì)于前一時(shí)間步進(jìn)行的相對(duì)運(yùn)動(dòng)蒙挑,而定位是對(duì)車輛在地圖中的運(yùn)動(dòng)進(jìn)行全局的估計(jì)。定位是可以精確到厘米級(jí)的愚臀,車輛相對(duì)于一些地圖中固定的物體(例如電線桿)的距離已經(jīng)是已知的忆蚀,基于這些信息,車輛已經(jīng)可以進(jìn)行相當(dāng)不錯(cuò)的路徑規(guī)劃了姑裂。
然后是三維視覺重建馋袜,重建范圍通常在 50-80 米,具體需求視行駛速度而定舶斧。大部分 STOA 自動(dòng)駕駛系統(tǒng)會(huì)使用激光雷達(dá)(LiDAR)進(jìn)行三維重建欣鳖。不過也有少部分團(tuán)隊(duì)試圖直接從圖像中恢復(fù)三維信息。由于圖像中的數(shù)據(jù)相比之下更為嘈雜茴厉,因此完全基于圖像的重建是一項(xiàng)更具有挑戰(zhàn)性的工作泽台。
除了重建之外,你也需要對(duì)車輛正前方正在發(fā)生的事有充分的理解矾缓。因此怀酷,你需要進(jìn)行物體檢測(cè),也需要在理解物體是什么的基礎(chǔ)上對(duì)其進(jìn)行進(jìn)一步的分類嗜闻,而檢測(cè)和分類會(huì)幫助預(yù)測(cè)其未來(lái)軌跡蜕依。進(jìn)行檢測(cè)和分類的方式是多樣的,你可以給每一個(gè)物體畫一個(gè)邊界框(bounding box):這是最常見的方式,但是自動(dòng)駕駛需要在三維的物理世界中進(jìn)行運(yùn)動(dòng)規(guī)劃样眠,所以你至少要需要一個(gè)三維的邊界框竞滓。
更精確的是實(shí)例分割(instance segmentation)和語(yǔ)義分割(semantic segmentation)。當(dāng)物體是形狀為凹或者是隧道之類需要穿行的物體時(shí)吹缔,邊界框顯然是不夠的商佑。實(shí)例分割將圖像里屬于一些特定目標(biāo)類別的每個(gè)實(shí)例的所有像素分為一類。實(shí)例分割通常在二維圖像上進(jìn)行厢塘,但也有三維版本茶没,三維實(shí)例分割基本等同于物體重建。而語(yǔ)義分割為圖像里每一個(gè)像素分配一個(gè)語(yǔ)義標(biāo)簽晚碾,同一類別的不同實(shí)例不做區(qū)分抓半。除此之外,全景分割(panoptic segmentation)基本上可以視作實(shí)例分割和語(yǔ)義分割的結(jié)合格嘁。全景分割對(duì)那些沒有實(shí)例只有整體的類別也進(jìn)行區(qū)分笛求,例如天空和植被。天空無(wú)法用一個(gè)邊界框框柱糕簿,而植被需要在平時(shí)避開探入,但系統(tǒng)也需要知道在緊急情況下汽車沖上草坪并無(wú)大礙(相比之下撞上樹或者行人就有很大問題了)。因此語(yǔ)義信息是必要的懂诗。
接下來(lái)是運(yùn)動(dòng)估計(jì)蜂嗽。根據(jù)之前的一幀或數(shù)幀,預(yù)估視野里的每一個(gè)點(diǎn)殃恒,或者說每一個(gè)物體植旧,在下一幀的位置。一些物體离唐,例如車輛病附,它們的移動(dòng)是比較容易預(yù)判的,因此運(yùn)動(dòng)模型可以進(jìn)行準(zhǔn)確率較高的預(yù)測(cè)亥鬓。而另外一些物體完沪,例如行人,會(huì)非常突然地變更其運(yùn)動(dòng)軌跡贮竟,導(dǎo)致運(yùn)動(dòng)模型的建立更為艱難丽焊。即便如此,較短時(shí)間區(qū)間(2-3 秒)的動(dòng)作預(yù)測(cè)咕别,在動(dòng)態(tài)物體較多的擁擠場(chǎng)景下的決策過程中也仍然扮演著至關(guān)重要的角色技健。
上述任務(wù)都是各自獨(dú)立的,但是實(shí)際上惰拱,收集上述信息的系統(tǒng)并不是各自獨(dú)立運(yùn)轉(zhuǎn)的雌贱。因此情境推理(contextual reasoning)也有助于給出更準(zhǔn)確的預(yù)測(cè)啊送。例如一群行人通常會(huì)同時(shí)等紅燈、同時(shí)過馬路欣孤,一輛車試圖并線時(shí)另一輛車會(huì)剎車讓路馋没,以這些外部信息、先驗(yàn)知識(shí)做約束降传,理解復(fù)雜場(chǎng)景會(huì)變得更為容易篷朵。
最后,一個(gè)還沒有引起較多重視的領(lǐng)域是不確定性推理(reasoning under uncertainty)婆排。人類感官或者車輛傳感器拿到的數(shù)據(jù)中必然包含著不確定性声旺,因此,如何準(zhǔn)確地評(píng)估不確定性段只,并兼顧「最小化風(fēng)險(xiǎn)」和「完成任務(wù)」腮猖,是一個(gè)重要的話題。理想情況下赞枕,所有上述檢測(cè)澈缺、分割、重建炕婶、定位任務(wù)都應(yīng)該在不確定性約束下進(jìn)行姐赡,系統(tǒng)在行進(jìn)之前應(yīng)該知道它可能犯哪些錯(cuò)誤。
發(fā)展歷史
自動(dòng)駕駛汽車的展示系統(tǒng)可追溯至1920年代及1930年代間古话,第一輛真正的自動(dòng)化汽車是1977年由日本筑波機(jī)械工程實(shí)驗(yàn)室開發(fā)的雏吭。車輛使用基于模擬計(jì)算機(jī)的技術(shù)進(jìn)行信號(hào)處理锁施,通過安裝在車輛上的兩個(gè)攝像頭跟蹤白色街道標(biāo)記陪踩。原型車則出現(xiàn)在20世紀(jì)80年代,卡內(nèi)基梅隆大學(xué)的Navlab和ALV項(xiàng)目由DARPA于1984年開始資助悉抵,并于1985年發(fā)布了第一批結(jié)果肩狂。梅賽德斯 - 奔馳和慕尼黑聯(lián)邦國(guó)防軍大學(xué)的EUREKA Prometheus項(xiàng)目則于1987年開始實(shí)施。從20世紀(jì)60年代到2005年的第二次DARPA大挑戰(zhàn)姥饰,美國(guó)的自動(dòng)駕駛汽車研究主要由DARPA傻谁,美國(guó)陸軍和美國(guó)海軍資助。
在2008年的DARPA資格賽和85公里城市挑戰(zhàn)賽決賽中列粪,CMU大學(xué)開發(fā)的Boss贏得了比賽审磁,它使用車載傳感器(全球定位系統(tǒng),激光器岂座,雷達(dá)和攝像頭)來(lái)跟蹤其他車輛态蒂,檢測(cè)靜態(tài)障礙物,并相對(duì)于道路模型進(jìn)行自身定位费什。三層規(guī)劃系統(tǒng)將任務(wù)钾恢,行為和運(yùn)動(dòng)規(guī)劃相結(jié)合,以在城市環(huán)境中駕駛。任務(wù)計(jì)劃層考慮采用哪條街來(lái)實(shí)現(xiàn)任務(wù)目標(biāo)瘩蚪。行為層確定何時(shí)在交叉點(diǎn)處更改車道和優(yōu)先級(jí)并執(zhí)行錯(cuò)誤恢復(fù)操作泉懦。運(yùn)動(dòng)規(guī)劃層選擇在避免障礙的同時(shí)朝著本地目標(biāo)前進(jìn)的行動(dòng)。這一系統(tǒng)對(duì)現(xiàn)在自動(dòng)駕駛系統(tǒng)的設(shè)計(jì)產(chǎn)生了重要影響疹瘦。
2011年崩哩,Sebastian Thrun等人試圖將他們?cè)?007年DARPA城市挑戰(zhàn)賽中開發(fā)的系統(tǒng)應(yīng)用于更現(xiàn)實(shí)的環(huán)境中,他們使用三個(gè)無(wú)監(jiān)督算法自動(dòng)校準(zhǔn)64光束旋轉(zhuǎn)激光雷達(dá)言沐,其精確度優(yōu)于繁瑣的手動(dòng)測(cè)量琢锋。然后,他們生成高分辨率的環(huán)境地圖呢灶,用于厘米精度的在線定位吴超。改進(jìn)的感知和識(shí)別算法現(xiàn)在使汽車能夠跟蹤和分類障礙物,如騎自行車者鸯乃,行人和車輛鲸阻,同時(shí)也能檢測(cè)到交通燈。新的計(jì)劃系統(tǒng)使用此輸入數(shù)據(jù)每秒生成數(shù)千個(gè)候選軌跡缨睡,動(dòng)態(tài)選擇最佳路徑鸟悴。改進(jìn)后的控制器可連續(xù)選擇油門,制動(dòng)器和轉(zhuǎn)向驅(qū)動(dòng)裝置奖年,以最大限度地提高舒適度细诸。此外,這些算法都在陽(yáng)光下或雨中以及白天或夜晚等各種情況下進(jìn)行了測(cè)試陋守。他們開發(fā)的系統(tǒng)已成功地在各種現(xiàn)實(shí)條件下記錄了數(shù)百英里的自主操作震贵。
2012年,KITTI數(shù)據(jù)發(fā)布水评,主要是為了促進(jìn)視覺識(shí)別系統(tǒng)在機(jī)器人上的應(yīng)用猩系,包括自動(dòng)駕駛汽車。他們利用其自動(dòng)駕駛平臺(tái)為立體聲中燥,光流寇甸,視覺測(cè)距/ SLAM和3D物體檢測(cè)等任務(wù)創(chuàng)建了一個(gè)十分全面的數(shù)據(jù)集。這一數(shù)據(jù)集的發(fā)布對(duì)自動(dòng)駕駛的研究產(chǎn)生了極大地推動(dòng)作用疗涉。
2015年拿霉,Jianxiong Xiao等人提出直接感知方法來(lái)估計(jì)駕駛的可供性。他們建議將輸入圖像映射到與駕駛的道路/交通狀態(tài)的可供性直接相關(guān)的少量關(guān)鍵感知指示符咱扣。他們的表示提供了一組緊湊而完整的場(chǎng)景描述绽淘,使簡(jiǎn)單的控制器能夠自動(dòng)駕駛。他們使用視頻游戲中12小時(shí)人類駕駛記錄訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)偏窝,并證明他們的模型可以很好地在非常多樣化的虛擬環(huán)境中駕駛汽車收恢。他們還在KITTI數(shù)據(jù)集上訓(xùn)練汽車距離估計(jì)模型武学。結(jié)果表明,該直接感知方法可以很好地推廣到真實(shí)駕駛圖像伦意。
2016年火窒,Karol Zieba等人訓(xùn)練了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)(CNN),將來(lái)自單個(gè)前置攝像頭的原始像素直接映射到轉(zhuǎn)向命令驮肉。它還在視覺引導(dǎo)不明確的區(qū)域運(yùn)行熏矿,例如停車場(chǎng)和未鋪砌的道路。該系統(tǒng)自動(dòng)學(xué)習(xí)必要處理步驟的內(nèi)部表示离钝,例如僅用人類轉(zhuǎn)向角作為訓(xùn)練信號(hào)檢測(cè)有用的道路特征票编。與問題的顯式分解(例如車道標(biāo)記檢測(cè),路徑規(guī)劃和控制)相比卵渴,他們的端到端系統(tǒng)同時(shí)優(yōu)化所有處理步驟慧域。他們認(rèn)為這最終會(huì)帶來(lái)更好的性能,因?yàn)閮?nèi)部組件能自我優(yōu)化以最大化整體系統(tǒng)性能浪读,而不是優(yōu)化人類選擇的中間標(biāo)準(zhǔn)昔榴。
發(fā)展分析
瓶頸
目前還沒有完全不需要人類監(jiān)督的自動(dòng)系統(tǒng)可用,并且隨著一些與自動(dòng)駕駛系統(tǒng)有關(guān)的事故的發(fā)生碘橘,公眾對(duì)自動(dòng)駕駛系統(tǒng)的信任互订、相關(guān)法律法規(guī)的完善也是需要注意的問題。
未來(lái)發(fā)展方向
自動(dòng)駕駛的發(fā)展將是一個(gè)長(zhǎng)期的過程痘拆,更先進(jìn)仰禽、更成熟的系統(tǒng),以及配套設(shè)施的建設(shè)纺蛆,消費(fèi)者市場(chǎng)的準(zhǔn)備和法律法規(guī)的建立等都是需要發(fā)展的方向吐葵。