參考文獻(xiàn):
B. Mersch, X. Chen, J. Behley, and C. Stachniss, “Self-supervised Point Cloud Prediction Using 3D Spatio-temporal Convolutional Networks,” in Proc. of the Conf. on Robot Learning (CoRL), 2021
大多數(shù)自動駕駛汽車使用 3D 激光掃描儀驾讲,即所謂的 LiDAR骄恶,來感知周圍的 3D 世界。LiDAR 生成汽車周圍場景的局部 3D 點云圃酵。一個典型的 LiDAR 傳感器每秒生成大約 10 個這樣的點云雏门。這些 3D 點云廣泛用于眾多機(jī)器人和自動駕駛?cè)蝿?wù)嘿歌,如定位、物體檢測茁影、避障宙帝、映射、場景解釋和軌跡預(yù)測.
預(yù)測傳感器在未來可能會看到什么的能力可以增強(qiáng)自動駕駛汽車的決策募闲。一個有前途的應(yīng)用是將預(yù)測的點云用于路徑規(guī)劃任務(wù)步脓,例如避免碰撞。例如,與預(yù)測交通代理未來 3D 邊界框的方法相比沪编,點云預(yù)測不需要任何先前的推理步驟呼盆,例如定位、檢測或跟蹤來預(yù)測未來場景蚁廓。在預(yù)測的點云上運行現(xiàn)成的檢測和跟蹤系統(tǒng)會產(chǎn)生未來的 3D 對象邊界框访圃,正如去年不同研究人員在點云預(yù)測中所展示的那樣(Weng 等人在 CoRL'20;Lu 等人相嵌,通過在 arXiv上發(fā)表的文章) . 從機(jī)器學(xué)習(xí)的角度來看腿时,點云預(yù)測是一個有趣的問題,因為下一次傳入的 LiDAR 掃描總是提供地面實況數(shù)據(jù)饭宾。此屬性提供了以自我監(jiān)督的方式訓(xùn)練點云預(yù)測的潛力批糟,無需昂貴的標(biāo)記,并且還可以在線評估其性能看铆,僅在未知環(huán)境中具有很小的時間延遲.
在最近由 Benedikt Mersch 在 CoRL 2021 上展示的工作(https://www.ipb.uni-bonn.de/wp-content/papercite-data/pdf/mersch2021corl.pdf)中徽鼎,源代碼可用(https://github.com/PRBonn/point-cloud-prediction),解決了從給定的過去掃描序列中預(yù)測大型無序未來點云的問題.高維和稀疏的 3D 點云數(shù)據(jù)使點云預(yù)測成為一個尚未完全探索的具有挑戰(zhàn)性的問題.可以通過將預(yù)測的未來場景流應(yīng)用于最后接收的掃描或生成一組新的未來點來估計未來點云.默施等人專注于生成新的點云來預(yù)測未來的場景.與利用循環(huán)神經(jīng)網(wǎng)絡(luò)來建模時間對應(yīng)關(guān)系的現(xiàn)有方法相比,使用 3D 卷積來聯(lián)合編碼空間和時間信息,以上論文提出的方法采用基于連接范圍圖像的新 3D 表示作為輸入弹惦。它聯(lián)合估計未來范圍圖像和每個點的分?jǐn)?shù)否淤,以確定多個未來時間步長的有效點或無效點,該方法可以通過使用跳躍連接和使用圓形填充的水平一致性來獲取環(huán)境的結(jié)構(gòu)細(xì)節(jié)棠隐,并提供比其他最先進(jìn)的點云預(yù)測方法更準(zhǔn)確的預(yù)測.
這種方法允許使用減少的參數(shù)數(shù)量來預(yù)測不同大小的詳細(xì)未來點云以進(jìn)行優(yōu)化石抡,從而加快訓(xùn)練和推理時間.此外,該方法也是完全自我監(jiān)督的助泽,不需要對數(shù)據(jù)進(jìn)行任何手動標(biāo)記.總之啰扛,該方法可以通過使用時間 3D 卷積網(wǎng)絡(luò)的快速聯(lián)合時空點云處理,從給定的輸入序列預(yù)測一系列詳細(xì)的未來 3D 點云嗡贺,優(yōu)于最先進(jìn)的點云預(yù)測方法隐解,概括很好地適應(yīng)看不見的環(huán)境,并且比典型的旋轉(zhuǎn) 3D LiDAR 傳感器幀速率更快地在線運行.