寫(xiě)在前面:本文為原創(chuàng),如需轉(zhuǎn)載請(qǐng)注明出處小槐。歡迎大家留言共同探討拇派,有誤的地方也希望指出凿跳。另如果有好的SLAM控嗜、ROS等相關(guān)交流群也希望可以留言給我,在此先謝過(guò)了曾掂。
本文參考:《概率機(jī)器人》
0引言
概率是進(jìn)行機(jī)器人控制珠洗、定位與建圖的核心基礎(chǔ)知識(shí)许蓖,相信這一點(diǎn)大家都深有體會(huì)调衰。各種濾波算法都是根據(jù)貝葉斯概率公式的基礎(chǔ)所衍生出來(lái)的算法嚎莉。其實(shí)這點(diǎn)也很好理解趋箩,畢竟任何對(duì)外界的測(cè)量都是包含一定的不確定性的,而且運(yùn)行的執(zhí)行元件也不是完全精確爬早,所以通過(guò)“估計(jì)”來(lái)處理機(jī)器人的測(cè)量和運(yùn)動(dòng)是更可以提高系統(tǒng)精度和魯棒性的做法筛严。所以桨啃,理清一些關(guān)鍵的概率概念就十分必要了檬输。本文將從以下幾個(gè)方面來(lái)進(jìn)行整理丧慈,增加自己對(duì)這些概念的理解主卫,如有需求也會(huì)隨時(shí)擴(kuò)充簇搅。
- 隨機(jī)變量
- 概率密度函數(shù)
- 條件概率
- 全概率定理
- 先驗(yàn)/后驗(yàn)概率分布
- 條件獨(dú)立
- 期望與協(xié)方差
- 表征演變的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)
- 置信分布
1 隨機(jī)變量
隨機(jī)變量(random variable)表示隨機(jī)試驗(yàn)各種結(jié)果的實(shí)值單值函數(shù)瘩将。隨機(jī)事件不論與數(shù)量是否直接有關(guān)姿现,都可以數(shù)量化备典,即都能用數(shù)量化的方式表達(dá)意述。
以上是百度百科的表達(dá),說(shuō)的直白一些就是隨機(jī)變量可以成為一些值镐依,而且這些值是按照某種概率的行為來(lái)取值的槐壳。
這里用X來(lái)表示隨機(jī)變量喜每,用x來(lái)表示其取的值。那么舉個(gè)例子就可以是, X可以表示“明天的天氣”這個(gè)隨機(jī)變量枫笛,其可以取的值有“晴天”刑巧、“下雨”等等无畔。加入有30%的概率下雨浑彰,則p(X="Rain")=0.3。
在機(jī)器人中颜价,各種機(jī)器的測(cè)量值和狀態(tài)值以及環(huán)境的信息都是概率化的事實(shí),所以可以用隨機(jī)變量來(lái)表示夕春。
2 概率密度函數(shù)
概率密度函數(shù)是一個(gè)描述這個(gè)隨機(jī)變量的輸出值撇他,在某個(gè)確定的取值點(diǎn)附近的可能性的函數(shù)狈蚤。而隨機(jī)變量的取值落在某個(gè)區(qū)域之內(nèi)的概率則為概率密度函數(shù)在這個(gè)區(qū)域上的積分划纽。
這個(gè)概念比較好理解勇劣,即是把針對(duì)于不同值的隨機(jī)變量的取值用函數(shù)來(lái)表達(dá)比默。用圖片可以更方便一些:
3 條件概率
隨機(jī)變量經(jīng)常與其他不同的隨機(jī)變量可以產(chǎn)生聯(lián)系,比如今天能不能踢球跟作業(yè)留的多不多就很有關(guān)系篡九。所以條件概率用以描述已知一個(gè)隨機(jī)變量的值后另一個(gè)隨機(jī)變量取某值的概率:
p(x|y)=p(X=x|Y=y)
條件概率可以定義為:
p(x|y)=\frac{p(x,y)}{p(y)}
更進(jìn)一步榛臼,如果X和Y相互獨(dú)立沛善,則有:
p(x|y)=\frac{p(x)p(y)}{p(y)}=p(x)
很好理解塞祈,沒(méi)有什么關(guān)系的事情變成什么樣也影響不了你關(guān)心的事情议薪。
4 全概率定理
從條件概率中可以得出一個(gè)全概率定理(theorem of total probability)笙蒙,即針對(duì)另一個(gè)隨機(jī)變量的全加和可以消去這個(gè)隨機(jī)變量捅位,更確切可以表述為:
p(x)=\sum_{y}p(x|y)p(y) (離散情況)
p(x) = \int p(x|y)p(y)dy (連續(xù)情況)
5 先驗(yàn)/后驗(yàn)概率分布
在機(jī)器人控制中搂抒,如果x是一個(gè)希望由y 推測(cè)出來(lái)的數(shù)值求晶,則概率p(x)稱為先驗(yàn)概率分布 衷笋,其中y稱為數(shù)據(jù)辟宗,也就是傳感器的測(cè)量值泊脐。分布p(x)總結(jié)了在綜合數(shù)據(jù)y之前已經(jīng)有的關(guān)于x的信息。則概率p(x|y)稱為在隨機(jī)變量X上的后驗(yàn)概率分布容客。
6 條件獨(dú)立
當(dāng)有以其他變量Z為條件的相互獨(dú)立的隨機(jī)變量條件聯(lián)合概率為
p(x,y|z)=p(x|z)p(y|z)
則這種關(guān)系可以被稱為條件獨(dú)立。上式也可等價(jià)為
p(x|z)=p(x|z,y); p(y|z)=p(y|z,x)
7 期望與協(xié)方差
隨機(jī)變量X的期望可以由下式給定:
E[X]=\sum_{x}xp(x) (離散)
E[X]=\int xp(x)dx (連續(xù))
期望是隨機(jī)變量的線性函數(shù)但两,對(duì)于任意數(shù)值a,b有:
E[aX+b]=aE[X]+b
X的協(xié)方差可以由下式求得
Cov[X]={E[X-E[X]]}^2 = E[X^2] - E{[X]}^2
協(xié)方差衡量的是偏離均值的二次方期望谨湘。
8 表征演變的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)
針對(duì)于離散的控制動(dòng)作u_i與測(cè)量z_i悲关,狀態(tài)x_t的改變過(guò)程可以由以下形式的概率分布給出:
p(x_t|x_{0:t-1},z_{1:t-1},u_{1:t})
根據(jù)馬爾可夫鏈寓辱,如果狀態(tài)x是完整的赤拒,那么他是所有以前時(shí)刻發(fā)生的所有狀態(tài)的充分總結(jié)挎挖,再根據(jù)條件獨(dú)立,即上式可以簡(jiǎn)化為:
p(x_t|x_{t-1},u_t)
其也被稱為狀態(tài)轉(zhuǎn)移概率崔涂,它指出了狀態(tài)作為機(jī)器人控制量u_t的函數(shù)是如何隨著時(shí)間變化的冷蚂。
概率p(z_t|x_t)叫作測(cè)量概率蝙茶,根據(jù)該表達(dá),測(cè)量z只和環(huán)境狀態(tài)x相關(guān)钳恕。
因此忧额,這一系列狀態(tài)轉(zhuǎn)換形式可以由下圖形象表述:
這樣的時(shí)間生成模型也稱為隱式馬爾可夫模型或者動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)轴脐。
9 置信分布
因?yàn)?strong>狀態(tài)不能直接測(cè)量,所以需要用置信度來(lái)反映機(jī)器人的環(huán)境狀態(tài)信息。在概率機(jī)器人中大咱,置信度通過(guò)條件概率分布表示碴巾。對(duì)于真實(shí)的狀態(tài),置信度分布為每一個(gè)可能的假設(shè)分配一個(gè)概率提揍。置信度分布是以可以獲得的數(shù)據(jù)為條件的關(guān)于狀態(tài)變量的后驗(yàn)概率劳跃,用bel(x_t)來(lái)表示浙垫。
其代表如下后驗(yàn)概率:bel(x_t)=p(x_t|z_{1:t},u_{1:t})
該置信度是在綜合了測(cè)量z_t之后得到的夹姥,但如果在剛剛進(jìn)行過(guò)控制u_t之后,測(cè)量z_t之前轻抱,計(jì)算置信分布是有意義的祈搜,即:
\overline{bel}(x_t)=p(x_t|z_{1:t-1},u_{1:t}),在濾波的框架下夭问,上式就是熟悉的預(yù)測(cè),即在t時(shí)刻的測(cè)量前預(yù)測(cè)t時(shí)刻的狀態(tài)捧杉。由\overline{bel}(x_t)來(lái)計(jì)算bel(x_t)則稱為修正或者測(cè)量更新味抖。