非官方無(wú)責(zé)任不靠譜系列之概率機(jī)器人。
《概率機(jī)器人》出版年:2016叠纷,作者:[美] 塞巴斯蒂安 · 特龍
一、課本部分
此書(shū)每章后面都有文獻(xiàn)綜述潦嘶,很有特色涩嚣。
第一章
機(jī)器人學(xué)中的不確定性:
① 傳感器;
② 執(zhí)行器,來(lái)自如控制噪聲缓艳、磨損及機(jī)械故障的影響校摩,但是有些中型機(jī)構(gòu),如工業(yè)機(jī)器人手臂阶淘,是非常準(zhǔn)確和可靠的衙吩;
③ 機(jī)器人軟件,世界的所有內(nèi)部模型都是近似模型溪窒,模型只是部分地模擬機(jī)器人及環(huán)境的基本物理特性坤塞。最先進(jìn)的機(jī)器人系統(tǒng)使用的模型大多數(shù)是相當(dāng)粗略的。
④ 近似算法澈蚌。
概率機(jī)器人的思想是用概率的方法來(lái)表示在整個(gè)推測(cè)空間的概率分布信息摹芙。這樣做,就可以用數(shù)學(xué)上合理的方式表示模糊性和置信度宛瞄「『蹋可以根據(jù)存在的不確定性選擇相對(duì)魯棒的控制方式,當(dāng)控制方式是較好的選擇時(shí)份汗,概率機(jī)器人技術(shù)甚至可以選擇主動(dòng)減少機(jī)器人的不確定性盈电。
第二章
狀態(tài)
狀態(tài)即為環(huán)境特征,包括但不限于:
機(jī)器人位姿(pose)
關(guān)節(jié)角度等運(yùn)動(dòng)學(xué)狀態(tài)(kinematic state)
速度和角速度等動(dòng)態(tài)狀態(tài)(dynamic state)杯活。在本書(shū)中匆帚,動(dòng)態(tài)狀態(tài)的作用很小。
環(huán)境中周?chē)矬w的特征旁钧。
置信分布
bel(xt)一bar=(基于1~t時(shí)刻控制量u1:t && 1~t-1時(shí)刻觀(guān)測(cè)量z1:t-1)的狀態(tài)xt的概率吸重。
bel(xt)=(基于1~t時(shí)刻控制量u1:t && 1~t時(shí)刻觀(guān)測(cè)量z1:t)的狀態(tài)xt的概率。
計(jì)算bel(xt)一bar被稱(chēng)為預(yù)測(cè)歪今,由bel(xt)一bar計(jì)算bel(xt)被稱(chēng)為修正或測(cè)量更新嚎幸。
bel(xt)一bar是基于以前狀態(tài)的后驗(yàn),是剛剛執(zhí)行完ut的預(yù)測(cè)寄猩,而bel(xt)則是執(zhí)行完ut之后嫉晶,又“看了一眼”(觀(guān)測(cè)到了zt)。
而經(jīng)過(guò)一番數(shù)學(xué)推導(dǎo)焦影,貝葉斯濾波算法告訴我們,bel(xt)可通過(guò)遞歸得到封断,變編程方便斯辰。
馬爾可夫鏈
一個(gè)完整的狀態(tài) xt 可以預(yù)測(cè)未來(lái),其他狀態(tài)除非依賴(lài) xt坡疼,否則無(wú)法影響未來(lái)的狀態(tài)彬呻。滿(mǎn)足這些條件的暫態(tài)過(guò)程稱(chēng)為馬爾可夫鏈。
馬爾可夫假設(shè)
如果知道當(dāng)前狀態(tài)xt,馬爾科夫假設(shè)設(shè)定過(guò)去與未來(lái)的數(shù)據(jù)都是獨(dú)立的闸氮。
馬爾可夫假設(shè)是貝葉斯濾波算法的基礎(chǔ)剪况。
實(shí)際上,擾亂馬爾可夫假設(shè)的因素如下:
① xt中為包括的未建模動(dòng)態(tài)環(huán)境因素(如移動(dòng)的人對(duì)傳感器觀(guān)測(cè)到的數(shù)據(jù)的影響)蒲跨。
② 使用置信函數(shù)近似表示引起的近似誤差(如柵格或高斯)译断。
等。
第七章
馬爾可夫定位
馬爾可夫定位是貝葉斯濾波定位最簡(jiǎn)單的應(yīng)用或悲。算法與第二章類(lèi)似孙咪,也需要計(jì)算bel(xt)一bar和bel(xt),區(qū)別在于需要地圖m作為輸入之一巡语。
如果初始位姿已知其近似值翎蹈,那么置信bel(xt0)通常由位于中心x0附近的一個(gè)窄高斯分布初始化;如果初始位姿未知男公,那么bel(xt)由在地圖上所有的合法位姿空間上的均勻分布bel(xt0)=1/|X| 初始化荤堪。
擴(kuò)展卡爾曼濾波定位
擴(kuò)展卡爾曼濾波(EKF)定位算法是馬爾可夫定位的一種特定情況。
算法中所有的特征唯一地可辨認(rèn)枢赔。
物理實(shí)現(xiàn)的例子:
① 預(yù)測(cè)步驟澄阳。
運(yùn)動(dòng)之后(執(zhí)行ut之后),預(yù)測(cè)位置糠爬。
② 修正步驟:測(cè)量預(yù)測(cè)寇荧。
擴(kuò)展卡爾曼濾波算法使用已預(yù)測(cè)的機(jī)器人位置和不確定性,來(lái)預(yù)測(cè)zt一bar执隧。更新向量(innovation vector)為(zt - zt一bar)揩抡,它是觀(guān)察的預(yù)測(cè)與測(cè)量之間的差值。也就是說(shuō)镀琉,更新向量“越短”峦嗤,測(cè)量值就越有可能。
③ 修正步驟:估計(jì)更新屋摔。
擴(kuò)展卡爾曼濾波定位算法的修正步驟基于更新向量和測(cè)量預(yù)測(cè)的不確定性重新位置估計(jì)烁设。朝降低測(cè)量更新的方向移動(dòng)位置估計(jì),移動(dòng)的幅度根據(jù)卡爾曼濾波決定钓试。觀(guān)察越確定装黑,卡爾曼增益越高,因此產(chǎn)生的位置修正就越大弓熏。
估計(jì)一致性
實(shí)際上恋谭,大多數(shù)實(shí)現(xiàn)是在定位過(guò)程中確定地標(biāo)身份的,最簡(jiǎn)單的策略被稱(chēng)為極大似然一致性挽鞠,該方法首先確定一致性變量的最大可能值疚颊,然后理所當(dāng)然地使用這個(gè)值狈孔。極大似然技術(shù)會(huì)導(dǎo)致濾波器的脆弱性。
無(wú)跡卡爾曼定位
無(wú)跡卡爾曼濾波(UKF)定位是一個(gè)基于特征的使用無(wú)跡卡爾曼濾波的機(jī)器人定位算法材义。其基本步驟與擴(kuò)張卡爾曼濾波相似均抽,也是分為:① 預(yù)測(cè)步驟、② 測(cè)量預(yù)測(cè)其掂、③ 修正步驟:估計(jì)更新油挥。
第八章
移動(dòng)機(jī)器人定位:柵格與蒙特卡羅。
蒙特卡羅定位
用粒子表示置信度清寇。
容易實(shí)現(xiàn)喘漏,并且對(duì)于大范圍的局部定位問(wèn)題工作良好。
① 初始全局不確定性通過(guò)隨機(jī)抽取的位姿粒子集合取得华烟,均勻分布在整個(gè)位姿空間翩迈。
② 機(jī)器人感知到門(mén)后,蒙特卡羅定位為每個(gè)粒子分配重要性權(quán)重盔夜。
③ 重采樣并綜合了機(jī)器人運(yùn)動(dòng)后的粒子合集负饲,具有新的均勻重要性權(quán)重。在3個(gè)可能的位置附近增加了粒子數(shù)喂链。
④ 新的測(cè)量分配了非均勻的重要性權(quán)重給粒子集合返十。
⑤ 進(jìn)一步運(yùn)動(dòng)引起另一重采樣步驟和根據(jù)運(yùn)動(dòng)模型產(chǎn)生新粒子的步驟。周而復(fù)始椭微。
基本的蒙特卡羅算法用M個(gè)粒子的集合表示置信度bel(xt)洞坑。
動(dòng)態(tài)環(huán)境下的定位
第一種技術(shù):狀態(tài)曾廣技術(shù)(state augmentation),將隱藏狀態(tài)包含進(jìn)由濾波器估計(jì)的狀態(tài)蝇率。
第二種技術(shù):異常值去除技術(shù)(outlier rejection)迟杂,會(huì)預(yù)處理傳感器測(cè)量值以去除受隱藏狀態(tài)影響的測(cè)量值。
二本慕、PPT部分
RBPF(RB粒子濾波)
也就是或RPBF主要分為兩個(gè)部分排拷,一是定位,二是建圖锅尘。
粒子濾波的主要步驟:(蒙特卡羅定位)
① 畫(huà)出新一代粒子监氢;
② 為每個(gè)粒子分配重要性權(quán)值;
③ 重采樣藤违。
RBPF建圖:
每個(gè)粒子表示機(jī)器人的可能軌跡浪腐。
每個(gè)粒子維護(hù)自己的地圖,根據(jù)已知的位姿更新地圖顿乒。
每個(gè)粒子的存活率與觀(guān)測(cè)量映射到自身地圖的似然成正比议街。
問(wèn)題
每個(gè)粒子都要維持自己的地圖,因此存儲(chǔ)量和計(jì)算量很大淆游。
需要粒子數(shù)目與狀態(tài)空間的維數(shù)成指數(shù)正比關(guān)系—— 維數(shù)災(zāi)難傍睹!