劉璐
學(xué)號(hào)19021110354T
轉(zhuǎn)載自https://mp.weixin.qq.com/s/Cvs4uLtkH-_00tSNropmKA
【嵌牛導(dǎo)讀】10月17日-19日,由CCF主辦的 CNCC 2019 在蘇州成功舉辦,本屆大會(huì)以“智能+引領(lǐng)社會(huì)發(fā)展”為主題韩脏,1000家機(jī)構(gòu)的代表耳璧、8000余人參展參會(huì)匿乃。在第三天舉辦的“計(jì)算機(jī)視覺技術(shù)賦能智慧城市”分論壇中确封,阿里巴巴自動(dòng)駕駛實(shí)驗(yàn)室主任、首席科學(xué)家王剛發(fā)表了《自動(dòng)駕駛沒有免費(fèi)的午餐》的主題演講巧号。
【嵌牛鼻子】精細(xì)化場景含衔、針對性算法煎娇、自動(dòng)化平臺(tái)
【嵌牛提問】讓小車按照規(guī)定的路線自己跑起來我們早已實(shí)現(xiàn)了,如今讓小車在復(fù)雜的真實(shí)公路上運(yùn)動(dòng)卻成為困擾我們大家的問題贪染。很多人都在分析自動(dòng)駕駛缓呛、無人駕駛所要面臨的困難與挑戰(zhàn),各行各業(yè)也在為能早日實(shí)現(xiàn)自動(dòng)駕駛而努力杭隙。顯然哟绊,無人駕駛是大勢所趨,技術(shù)也終有一天會(huì)趨于完善痰憎,那我們該如何更好的限制自動(dòng)駕駛來保障自身的安全票髓?我想攀涵,技術(shù)在限制中達(dá)到最優(yōu)化才是我們追求的目標(biāo)吧!
【嵌牛正文】
?????? 王剛認(rèn)為炬称,單用一套通用的自動(dòng)駕駛算法很難覆蓋復(fù)雜多樣化的交通場景汁果,需要將多場景問題進(jìn)行分解涡拘、細(xì)化玲躯,有針對性的解決。王剛認(rèn)為鳄乏,自動(dòng)駕駛的研發(fā)依賴于三個(gè)要素:精細(xì)化場景跷车、針對性算法和自動(dòng)化平臺(tái)。
以下為王剛演講全文橱野,雷鋒網(wǎng)新智駕進(jìn)行了不改變原意的編輯:
??????? 自動(dòng)駕駛是智慧城市里面非常重要的一個(gè)部分朽缴,也可以說是人工智能里最復(fù)雜的一個(gè)系統(tǒng),非常具有挑戰(zhàn)性水援。我今天主要想講講密强,阿里巴巴在自動(dòng)駕駛系統(tǒng)上的一些思考和觀點(diǎn)。
??????? 關(guān)于自動(dòng)駕駛蜗元,很多公司都在做載人的自動(dòng)駕駛或渤。阿里跟他們不一樣,從一開始關(guān)注的就是物流行業(yè)的自動(dòng)駕駛奕扣,怎么讓物流車變得無人化薪鹦。
??????? 阿里為什么要選擇這個(gè)行業(yè)?大家都聽說過惯豆,去年的“雙11”活動(dòng)池磁,光“天貓”一個(gè)電商平臺(tái)就產(chǎn)生了1億個(gè)包裹。未來以天貓楷兽、淘寶為代表的電商平臺(tái)地熄,包括餓了么、盒馬代表的本地生活平臺(tái)將會(huì)產(chǎn)生越來越多的包裹芯杀。有人做了一個(gè)預(yù)測:五年之后端考,物流包裹可能會(huì)突破5億個(gè)/每天。
??????? 與龐大的包裹數(shù)量形成反差的是瘪匿,我們社會(huì)的老齡化非常的嚴(yán)重跛梗,年輕人在慢慢變少。在可以預(yù)見的未來棋弥,社會(huì)將會(huì)缺乏足夠的勞動(dòng)力去運(yùn)輸這些包裹核偿。因此阿里相信,物流車的無人化是整個(gè)物流產(chǎn)業(yè)發(fā)展的必然選擇顽染,也是社會(huì)發(fā)展的必然選擇漾岳。
?????? 阿里目前專注于兩個(gè)物流場景:第一是末端物流場景轰绵,最后1~3公里的問題。這應(yīng)該是未來幾年內(nèi)最容易實(shí)現(xiàn)落地的場景尼荆,其在安全左腔、法律上的挑戰(zhàn)都相對少一些。除了末端物流之外捅儒,阿里也在做公開道路的技術(shù)研發(fā)液样,自動(dòng)駕駛必然會(huì)從末端走向開放道路。我們也在杭州街頭進(jìn)行了常態(tài)化路測以及相應(yīng)的研發(fā)工作巧还。
?????? 阿里的無人車不僅可以應(yīng)對各種復(fù)雜的開放道路路況鞭莽,包括轉(zhuǎn)彎、與非機(jī)動(dòng)車輛以及行人的交互麸祷,還能在復(fù)雜的城市道路實(shí)現(xiàn)3000公里的自動(dòng)駕駛澎怒,而不需要人工的監(jiān)管。
以場景精細(xì)化應(yīng)對交通多樣化
??????? 最近幾年阶牍,國內(nèi)外的無人駕駛公司都取得了非常大的技術(shù)進(jìn)步喷面,但從客觀來看,自動(dòng)駕駛還存在非常多的困難和挑戰(zhàn)走孽,目前還沒有能夠完全落地的產(chǎn)品惧辈。
??????? 自動(dòng)駕駛為什么這么難?不同的人有不同的看法:硬件還沒準(zhǔn)備好融求、基礎(chǔ)交通設(shè)施不夠完善咬像,但是阿里認(rèn)為智能系統(tǒng)或者軟件是最上層的內(nèi)容。多數(shù)情況下生宛,還沒落地是因?yàn)樽詣?dòng)駕駛的算法還不能夠處理道路上的復(fù)雜交通狀況县昂。
?????? 在阿里內(nèi)部,有稱之為cut-in(超車)的場景陷舅,即別的車輛跑在了自動(dòng)駕駛車的前面倒彰。很多人認(rèn)為這是一個(gè)非常簡單的場景,但我們發(fā)現(xiàn)由于車輛的側(cè)車型不一樣莱睁,cut-in的原因也不一樣待讳,導(dǎo)致的行為方式也是非常不一樣的。很多時(shí)候仰剿,自動(dòng)駕駛算法不能有效處理這么多復(fù)雜创淡、多樣化的場景。這對自動(dòng)駕駛來說是一個(gè)非常大的挑戰(zhàn)南吮。
?????? 交通場景過于復(fù)雜琳彩、多樣化,那要怎么處理這樣多樣化的場景?我認(rèn)為露乏,我們非常有必要回想人工智能里的經(jīng)典理論碧浊,比如no free lunch理論。
??????? 這個(gè)理論是講瘟仿,假如用一種通用算法來解決所有問題箱锐,是不可能在所有的問題上都取得很大成功的。相反劳较,需要針對每一個(gè)問題進(jìn)行相對應(yīng)的研發(fā)驹止,針對性的優(yōu)化可以取得更好的結(jié)果。
?????? 這個(gè)理論在自動(dòng)駕駛領(lǐng)域也是適用的兴想。交通場景眾多幢哨,很難用一套或者幾套通用的自動(dòng)駕駛算法去解決問題。相應(yīng)地嫂便,阿里希望能夠把自動(dòng)駕駛的多場景問題進(jìn)行分解、細(xì)化闸与,有針對性的解決毙替,這也是阿里稱之為的“自動(dòng)駕駛里的no free lunch”理論。
??????? 將交通場景進(jìn)行分類践樱,聽上去很簡單厂画,但仔細(xì)考慮就會(huì)發(fā)現(xiàn)這是一個(gè)非常復(fù)雜的問題。我覺得一個(gè)好的分類至少要滿足兩個(gè)標(biāo)準(zhǔn):
??????? 第一拷邢,分類必須非常精細(xì)化袱院,粗粒度的分類是不能分解問題、降低問題的難度的瞭稼;第二忽洛,分類必須為算法服務(wù),跟算法高度融合环肘,而不是為了測試和管理服務(wù)欲虚。
???????? 我們也審視了業(yè)界常用的分類方法,發(fā)現(xiàn)離這兩個(gè)標(biāo)準(zhǔn)還有非常大的距離悔雹。有人按照行駛環(huán)境來分類复哆,按高速、城市道路腌零、鄉(xiāng)村道路來分梯找,這樣粗粒度的分類,無法把問題分解為更簡單的問題益涧。
??????? 也有人按場景要素來分锈锤,按照物體類型、天氣等情況進(jìn)行組合。我們也發(fā)現(xiàn)牙咏,很多組合非常冗余并且和算法是沒有關(guān)系的臼隔。因此從這兩個(gè)角度來看,現(xiàn)有的場景分類方式都不夠理想妄壶。
??????? 基于此摔握,阿里內(nèi)部提出了自己的自動(dòng)駕駛場景庫,阿里巴巴中央場景庫丁寄。我們的場景庫有非常典型的分類氨淌。我們聯(lián)合感知和決策,有針對性地對場景類別進(jìn)行開發(fā)伊磺。比如感知到場景后盛正,決策環(huán)節(jié)可以預(yù)先做一些判斷,把速度降下來屑埋,避免事故的發(fā)生豪筝。我們的分類是針對算法來進(jìn)行開發(fā)的。
?????? 這種分類方法的一個(gè)特點(diǎn)是摘能,非常精細(xì)化续崖。還是以cut-in場景為例,我們的場景庫里cut-in分為25個(gè)子類团搞。通過精細(xì)化分類可以把非常復(fù)雜的cut-in問題降解為25個(gè)比較容易解決的問題严望。
?????? 這些分類是怎么產(chǎn)生的?過去逻恐,分類主要是由專家來設(shè)計(jì)像吻,根據(jù)對場景的理解得出結(jié)論。遺憾的是复隆,這些理解是非常粗粒度的拨匆,到不了非常精細(xì)的程度。而阿里采用的是數(shù)據(jù)驅(qū)動(dòng)的方法昏名,通過搜集大量的路測數(shù)據(jù)涮雷,從數(shù)據(jù)里挖掘、發(fā)現(xiàn)什么樣的場景是算法更應(yīng)該關(guān)注的場景轻局,從而形成精細(xì)化的分類洪鸭。
?????? 另外一個(gè)特點(diǎn)是,我們的分類包括很多動(dòng)態(tài)化的場景仑扑,比如與社會(huì)車輛览爵、行人的交互。如果路上沒有其它車輛镇饮,自動(dòng)駕駛就不是一個(gè)難題了蜓竹。因此動(dòng)態(tài)場景才是自動(dòng)駕駛最大的困難,我們也基于數(shù)據(jù)驅(qū)動(dòng)的方法得到這些動(dòng)態(tài)場景。單純的人工去設(shè)計(jì)很難描述動(dòng)態(tài)場景俱济,因此也很容易錯(cuò)失一些重要的場景分類嘶是。
基于精細(xì)化場景的算法問題
????? 基于這個(gè)自動(dòng)駕駛場景庫和no-free-lunch理論,需要針對每個(gè)場景分類做相應(yīng)的算法開發(fā)蛛碌∧衾可以想象的是,假如有1000個(gè)場景分類蔚携,我們需要開發(fā)1000個(gè)不同的算法來解決問題希太。這是一個(gè)非常巨大的災(zāi)難。因?yàn)楝F(xiàn)在算法的開發(fā)模式稱之為“人工+智能”酝蜒,算法的設(shè)計(jì)極度依賴自動(dòng)駕駛工程師的領(lǐng)域知識(shí)誊辉,包括規(guī)則、算法模型亡脑、超參數(shù)等堕澄。所以這也是自動(dòng)駕駛公司在市場上處于供不應(yīng)求狀態(tài)的原因。
??????? 這樣分類方法必然在研發(fā)效率上帶來很大的局限性远豺。阿里也在通過計(jì)算換智能的方式來研發(fā)奈偏。這個(gè)詞并不新鮮,人工智能尤其是深度學(xué)習(xí)躯护,本質(zhì)上就是計(jì)算換智能。
??????? 最開始可能需要依賴計(jì)算機(jī)視覺和圖像處理專家來進(jìn)行人工設(shè)計(jì)丽涩,但可能會(huì)喪失非常重要的信息棺滞。深度學(xué)習(xí)被發(fā)明之后,可以通過神經(jīng)網(wǎng)絡(luò)矢渊、計(jì)算去搜索继准、找到最好的設(shè)計(jì),從而提升了研發(fā)的效率和質(zhì)量矮男。
?????? 但非常遺憾是移必,這樣的方式在自動(dòng)駕駛領(lǐng)域應(yīng)用的并不多,其滲透率還遠(yuǎn)遠(yuǎn)不夠毡鉴。有以下幾個(gè)原因:一個(gè)原因是設(shè)計(jì)理念上的差別崔泵;另一個(gè)原因是基礎(chǔ)設(shè)施以及工程平臺(tái)的缺失。這兩個(gè)原因?qū)е铝宋覀冊谧詣?dòng)駕駛上對人工的依賴過于嚴(yán)重猪瞬。
數(shù)據(jù)驅(qū)動(dòng)的自動(dòng)化平臺(tái)
?????? 為解決這個(gè)問題憎瘸,阿里提出了AutoDrive平臺(tái)。希望通過這個(gè)平臺(tái)的開發(fā)陈瘦,能更多地采取數(shù)據(jù)驅(qū)動(dòng)幌甘、計(jì)算驅(qū)動(dòng)的方式,讓計(jì)算機(jī)更聰明地找到適合每個(gè)場景的算法、參數(shù)锅风、結(jié)構(gòu)等酥诽,從而提高系統(tǒng)的智能程度。
?????? 目前阿里取得了一些初步結(jié)果皱埠。
??????? 在決策規(guī)劃上肮帐,比如在非常困難的路口碰撞項(xiàng)目上,過去完全依賴人工設(shè)計(jì)規(guī)則和參數(shù)漱逸,但結(jié)果并不令人滿意泪姨。采用了數(shù)據(jù)驅(qū)動(dòng)的方式之后,AutoDrive平臺(tái)可以提高16個(gè)百分點(diǎn)饰抒。
?????? 在研發(fā)效率上肮砾,基于這個(gè)平臺(tái),研發(fā)效率也能夠獲得極大提高袋坑。
?????? 在場景精細(xì)化上仗处,我們把場景分成25個(gè)子類,再進(jìn)行針對性的優(yōu)化能把成功率提高18個(gè)百分點(diǎn)枣宫。這些初步結(jié)果婆誓,也表明了我們的方向是非常正確的。
????? 再舉一些視覺案例也颤,視覺也是自動(dòng)駕駛里非常重要的部分洋幻,它能捕捉到激光雷達(dá)無法得到的語義信息。這些語義信息對于理解場景翅娶、預(yù)測來說是非常重要的文留。
????? 對一些典型識(shí)別和檢測任務(wù),我們也用AutoDrive平臺(tái)進(jìn)行了計(jì)算化智能竭沫,在效率和效果上都有很大的提升燥翅。比如用人工來設(shè)計(jì)一個(gè)典型的檢測網(wǎng)絡(luò),由于不知道哪些部分是最核心的網(wǎng)絡(luò)部分蜕提,就可能帶來冗余森书,但經(jīng)過AutoDrive平臺(tái)的優(yōu)化之后,可以極大地降低網(wǎng)絡(luò)復(fù)雜度谎势。因?yàn)樽詣?dòng)駕駛對實(shí)時(shí)性要求非常高凛膏,降低網(wǎng)絡(luò)復(fù)雜度可以提高整個(gè)效率以及降低對硬件的依賴程度。
????? 最后講一下它浅,AutoDrive背后其實(shí)是有非常堅(jiān)實(shí)的工程支撐的译柏,它需要很多的工程電路以及工程經(jīng)驗(yàn)的。但AutoDrive平臺(tái)能夠運(yùn)行起來還有幾個(gè)要素:
??????? 第一姐霍、我們將全量的海量數(shù)據(jù)全部都放在了云上鄙麦,只有云上才有足夠多的內(nèi)存和計(jì)算資源典唇。將海量自動(dòng)駕駛數(shù)據(jù)是放在單獨(dú)的服務(wù)器,是不可能跑起來胯府。
?????? 第二介衔、我們打通了整個(gè)AutoDrive運(yùn)行起來需要的閉環(huán)。用計(jì)算換智能必須從input到output都有一個(gè)完整的結(jié)果骂因。所以我們打通了數(shù)據(jù)收集炎咖,數(shù)據(jù)標(biāo)注以及仿真、模型訓(xùn)練寒波、評(píng)價(jià)等一整套系統(tǒng)乘盼,就能知道服務(wù)器上的每一個(gè)結(jié)構(gòu)能產(chǎn)生什么樣的結(jié)果,從而達(dá)到計(jì)算換智能的效果俄烁。
?????? 總結(jié)一下绸栅,我認(rèn)為未來自動(dòng)駕駛的研發(fā)需要依賴三個(gè)要素,這三個(gè)要素會(huì)進(jìn)行協(xié)同页屠,產(chǎn)生更好的化學(xué)反應(yīng)粹胯。
?????? 1、場景(需要精細(xì)化)辰企。過去業(yè)界的場景分類過于粗獷风纠,支撐不了no free lunch理論。因此需要研發(fā)出一個(gè)更好的精細(xì)化場景分類方式帶動(dòng)整個(gè)研發(fā)體系牢贸。
?????? 2竹观、算法。需要對算法進(jìn)行相應(yīng)的優(yōu)化潜索,有的放矢地針對每個(gè)場景進(jìn)行處理栈幸。
????? 3、自動(dòng)化平臺(tái)帮辟、云平臺(tái)。為了實(shí)現(xiàn)高效的研發(fā)玩焰,需要AutoDrive自動(dòng)化平臺(tái)由驹,但AutoDrive平臺(tái)背后離不開整個(gè)云平臺(tái)的支撐,包括數(shù)據(jù)的采集昔园、回歸蔓榄、仿真、以及模型訓(xùn)練默刚、測試評(píng)價(jià)等甥郑。
????? 這三個(gè)要素結(jié)合在一起才能高效地推進(jìn)自動(dòng)駕駛技術(shù)的研發(fā)。
????? 最后再講一下阿里的芯片荤西,過去在整個(gè)AI領(lǐng)域里澜搅,討論的芯片主要是inference芯片伍俘,但我認(rèn)為訓(xùn)練芯片需要引起業(yè)界的注意。現(xiàn)在業(yè)內(nèi)認(rèn)為訓(xùn)練芯片還可以用勉躺,那是因?yàn)闃I(yè)內(nèi)還沒有廣泛地應(yīng)用計(jì)算換智能的方式癌瘾,芯片的一些方法限制了訓(xùn)練算法的大規(guī)模使用,只有解決這個(gè)問題饵溅,計(jì)算換智能才能得到普及妨退。