3.1 為什么要用概率?
幾乎所有的活動都需要能夠在不確定性存在時進行推理隔崎。事實上,除了那些被定義為真的數(shù)學陳述荡陷,我們很難認定某個命題是千真萬確的或者確保某件事一定會發(fā)生屈呕。
不確定性有三種可能的來源:
- 被建模系統(tǒng)內(nèi)在的隨機性。
- 不完全觀測珠叔。
- 不完全建模蝎宇。
在醫(yī)生診斷病人的情況下,我們用概率來表示一種信任度 (degree of belief)祷安,其中 1 表示非忱呀妫肯定病人患有流感而 0 表示非常肯定病人沒有流感汇鞭。前面一種概率凉唐,直接與事件發(fā)生的頻率相聯(lián)系庸追,被稱為頻率概率 (frequentist probability);而后者,涉及到確定性水平台囱,被稱為貝葉斯概率 (Bayesian probability)淡溯。
3.2 隨機變量
隨機變量 (random variable) 是可以隨機地取不同值的變量。
3.3 概率分布
概率分布 (probability distribution)用來描述隨機變量或一簇隨機變量在每一個 可能取到的狀態(tài)的可能性大小簿训。
3.3.1 離散型變量和概率分布律函數(shù)
概率分布律函數(shù) (probability mass function, PMF):離散型變量的概率分布
? P 的定義域必須是 x 所有可能狀態(tài)的集合咱娶。
? ?x ∈ x, 0 ≤ P (x) ≤ 1.
聯(lián)合概率分布 (joint probability distribution):多個變量的概率分布
均勻分布:P(X=x)=1/k
3.3.2 連續(xù)型變量和概率密度函數(shù)
X為連續(xù)型隨機變量時,用概率密度函數(shù) (probability density function, PDF)來描述它的概率分布
? p 的定義域必須是 x 所有可能狀態(tài)的集合强品。
? ?x ∈ x,p(x) ≥ 0. 注意膘侮,我們并不要求 p(x) ≤ 1。
? ∫ p(x)dx = 1.
x ~ U(a,b) 表示 x 在 [a,b] 上是均勻分布的择懂,p(x)=1/(b-a)喻喳。
3.4 邊緣概率
定義在子集上的概率分布被稱為邊緣概率分布 (marginal probability distribution)。
設離散型隨機變量x和y,已知P(x,y)困曙,得到P(x):
3.5 條件概率
貝葉斯法則
3.6 條件概率的鏈式法則
3.7 獨立性和條件獨立性
相互獨立 (independent):
3.8 期望,方差和協(xié)方差
期望 (expectation):
離散型隨機變量
連續(xù)型隨機變量
方差(variance):
協(xié)方差 (covariance):兩個變量線性相關性的強度以及這些變量的尺度
兩個變量如果協(xié)方差為零,它們之間一定沒有線性關系奶赠。
獨立性表示兩個變量不僅沒有線性相關鱼填,而且也不存在非線性相關。
協(xié)方差矩陣 (covariance matrix):