論文名:Graph Structure-Based Simultaneous Localization and Mapping Using a Hybrid Method of 2D Laser Scan and Monocular Camera Image in Environments with Laser Scan Ambiguity
摘要
定位是機器人導航的基本問題淮阐,允許機器人自主執(zhí)行任務担孔。然而算柳,在具有激光掃描模糊的環(huán)境中引颈,例如長走廊陌兑,利用激光掃描儀的傳統(tǒng)SLAM(同時定位和映射)算法可能無法魯棒地估計機器人姿態(tài)。為了解決這個問題悯恍,我們提出了一種基于混合方法的新型定位方法微峰,該方法在基于圖形結構的SLAM的框架中結合了2D激光掃描儀和單目相機。通過混合方法獲取圖像特征點的3D坐標氓奈,假設墻壁垂直于地面并且垂直平坦翘魄。然而,這種假設可以減輕舀奶,因為隨后的特征匹配過程拒絕傾斜或非平坦壁上的異常值暑竟。通過利用混合方法生成的約束的圖優(yōu)化,估計最終的機器人姿勢育勺。為了驗證所提方法的有效性但荤,在具有長走廊的室內環(huán)境中進行了真實的實驗。將實驗結果與傳統(tǒng)的GMapping方法進行了比較涧至。結果表明腹躁,可以在具有激光掃描模糊性的環(huán)境中實時定位機器人,并且該方法的性能優(yōu)于傳統(tǒng)方法南蓬。
1.簡介
本文提出了一種基于圖形結構(graph structure-based)的SLAM纺非,它使用2D激光掃描儀和單目相機來解決上述問題。從相機獲取圖像特征數(shù)據蓖康,并且從激光掃描儀獲取深度信息。通過使用融合所獲得的傳感器數(shù)據的圖形結構來補償每個傳感器的缺點垒手。這種融合激光掃描儀和相機的混合方法使我們能夠在激光掃描模糊的環(huán)境中估計機器人姿態(tài)蒜焊,其中僅使用激光掃描儀時位姿估計是困難的。這樣的環(huán)境是長的走廊或非常大的空間科贬,其中激光掃描儀只能檢測周圍的一側泳梆,因為從機器人到墻壁的范圍大于激光掃描儀的最大可檢測范圍鳖悠。混合方法可以克服每個傳感器的缺點优妙。通過使用這些方法乘综,可以在具有激光掃描模糊的環(huán)境中準確地估計機器人的位姿。
本文的其余部分安排如下套硼。 第2節(jié)描述了室內機器人使用來自多傳感器的基于圖形結構的SLAM來最小化機器人姿態(tài)誤差的整體方法卡辰。 為了驗證所提方法的優(yōu)越性,我們描述了實驗環(huán)境和整個系統(tǒng)以及在第3節(jié)中使用我們的方法獲得的實驗結果邪意。在第4節(jié)中九妈,討論了結論和未來的工作。
2. Graph Structure-Based SLAM Using Multi-Sensors
本節(jié)詳細介紹了我們的方法雾鬼。 首先萌朱,簡要介紹了GMapping [4],基于網格的SLAM和Rao-Blackwellized粒子濾波器以及基于圖形的SLAM的制定策菜。 然后晶疼,我們詳細解釋如何融合從單目相機中提取的特征數(shù)據和來自激光掃描儀的深度數(shù)據,以進行機器人定位又憨。 最后翠霍,我們描述了位姿圖生成和優(yōu)化的方法。
2.1 Grid-Based SLAM with Rao¨CBlackwellized Particle Filters
GMapping是使用Rao-Blackwellized粒子濾波器的基于網格的SLAM竟块。通過在GMapping中使用自適應重新采樣來解決粒子耗盡壶运,即基于粒子濾波器的SLAM的長期問題。通過采用稱為改進的提議分布的方法浪秘,GMapping降低了機器人姿勢的不確定性蒋情。該方法基于最近的傳感器測量產生提議分布,假設激光掃描比測距更準確耸携。這是用于估計機器人姿勢的概率方法棵癣,并且可以通過使用激光掃描儀的深度數(shù)據來估計機器人在2D平面上的姿勢。當連續(xù)激光掃描可以匹配而沒有模糊時夺衍,可以使用GMapping算法狈谊。但是,如果在具有激光掃描模糊的環(huán)境中利用GMapping算法沟沙,則可能發(fā)生機器人位姿錯誤河劝。因此有必要應對這種情況,并在下一小節(jié)中描述用于多傳感器融合的基于圖形的SLAM矛紫。
2.2 基于圖的SLAM建模(Modeling of Graph-Based SLAM)
在本小節(jié)中赎瞎,我們描述了基于圖的SLAM公式和基于圖的SLAM的解決方案[27]。 一般的基于圖的SLAM可以使用條件概率編寫如下:通常颊咬,狀態(tài)預測是非線性的务甥,因此牡辽,為了簡化問題,可以使用泰勒級數(shù)將預測近似為一階敞临,如下所示:
2.3 單目相機和激光掃描儀的混合方法!!!!!
在該子部分中态辛,描述了用于融合相機的特征數(shù)據和激光掃描儀的深度信息的方法。 使用混合方法預測3D機器人姿勢挺尿,并且該信息用作基于圖形的SLAM的約束奏黑。 整體算法和概念分別如圖1和圖2所示。 在執(zhí)行激光掃描儀和單目相機的混合方法之前票髓,必須進行固有校準以確定相機的固有參數(shù)攀涵。 還需要知道相機和激光掃描儀之間的相對姿勢,以融合來自它們的數(shù)據洽沟。 因此以故,通過外部校準獲得兩個傳感器之間的相對姿勢信息。
讓我們假設墻壁與地面完全垂直并且垂直平坦裆操。 然后怒详,圖像平面上相同uC上的所有點將具有相同的深度值。 使用具有相同uC的重疊激光掃描線上的點來確定圖像上的特征點的深度值踪区。 由于重疊激光掃描線上的點是離散的昆烁,因此可以通過來自相鄰重疊掃描點的深度值的線性插值來獲取相應的深度值。 讓我們將線性插值的深度值表示為~z缎岗。 通過用~z替換等式(10)和(11)中的zC静尼,可以如下獲得相機坐標系中的增強3D特征點:(視覺對著墻,問題很大)
也可以使用從相機到機器人的外在校準來獲取該變換传泊。 由于可以使用這些相對姿勢確定來自地面的激光掃描的高度鼠渺,因此可以從圖像平面提取地面區(qū)段。 剩下的部分可以被認為是墻壁部分眷细,并且假設墻壁是垂直的而不是傾斜的拦盹。 之后可以減輕這種假設,因為可以通過特征匹配過程去除異常值溪椎。 然后運行特征提取算法普舆,并且在該算法中僅利用2D圖像中的墻壁上的特征點。 圖3顯示了使用所提出的算法的示例校读。 結果表明沼侣,利用激光掃描儀的深度數(shù)據可以準確地分離墻面和地面,同時也可以估算到墻面的距離歉秫,從而可以估算出從圖片中提取的特征點的三維坐標蛾洛。
2.4 從多傳感器獲取的位姿數(shù)據
在機器人上安裝多傳感器后,使用相應的傳感器估算機器人的位姿端考,然后雅潭,混合算法融合各自的結果,如圖4所示却特。使用協(xié)方差值和每個傳感器的測量值用于生成圖結構的約束扶供。通過使用所生成的約束信息組織圖形結構,通過圖優(yōu)化來獲得最終校正的機器人姿勢裂明。測距儀生成測距信息椿浓,該信息用于生成位姿約束。使用來自2D激光掃描儀的深度數(shù)據制作2D網格圖闽晦。然后使用GMapping從2D網格圖和ICP匹配生成2D機器人姿勢約束[4]扳碍。在通過相機圖像的SURF(加速魯棒特征)[29]算法提取特征點之后,通過增加來自2D激光掃描儀的深度信息來獲得每個特征點的3D坐標仙蛉。然后從特征點的3D坐標生成3D機器人位姿約束笋敞。在前面的小節(jié)中詳細描述了使用單目相機和激光掃描儀獲得機器人姿勢的混合方法。
從多傳感器生成位姿圖結構的示例如圖5所示荠瘪。每個節(jié)點表示機器人的姿勢(xi)夯巷,連接節(jié)點的邊是約束,其由測量(zi,j)組成及其協(xié)方差(Λi,j)哀墓。綠色實線表示使用來自odometry的航位推算創(chuàng)建的約束趁餐。紅色虛線表示使用GMapping的激光掃描儀產生的約束[4]。在使用GMapping時篮绰,使用2D激光掃描儀從掃描匹配方法獲得2D網格圖后雷。然后可以使用Rao-Blackwellized粒子濾波器獲得約束。由于GMapping是基于粒子濾波器的SLAM算法吠各,因此它僅提供相對于原點的當前姿勢估計臀突。因此,不能使用GMapping生成圖結構中的連續(xù)節(jié)點之間的約束走孽,并且可以僅生成原點和機器人之間的約束惧辈。藍色虛線表示使用混合方法從相機的特征點和激光掃描儀的深度數(shù)據生成的約束。僅當檢測到回環(huán)時磕瓷,混合方法才在相應節(jié)點之間生成約束盒齿。因此,可以不通過混合方法為連續(xù)節(jié)點生成約束困食。來自每個傳感器的姿勢預測和協(xié)方差值被用作圖中的約束边翁,以使用圖優(yōu)化技術來校正最終的機器人姿態(tài)估計。