大綱
內(nèi)容和意義
概率的概念:離散诀紊,連續(xù)的值的概率
例子1:每個盒子至多一個球的概率
概率公式:常見公司,貝葉斯示例
常見概率分布-離散型
-
常見概率分布-連續(xù)型
Q:概率和機器學習到底關系多大呢到推?
A: 噪聲的分布經(jīng)常都是正態(tài)分布惕澎;
指數(shù)分布是一般線性回歸的分布的主要形式唧喉;
泊松分布可以用來模擬以時間序列發(fā)送的事件,具有無記憶性董朝;
1.概率的概念
概率:P(x)∈[0,1]
- X為離散值子姜,則P(X=X
0
)表示X0
發(fā)生的概率 - X為連續(xù)值楼入,則P(X=X
0
)表示X0
發(fā)生的概率密度
累積分布函數(shù):F(a)=P(x<=X0
)
- F(X
0
)是單增的 - min(F(X
0
))=0 , max(F(X0
))=1
遇到一個函數(shù)嘉熊,若是單增,且值域為[0,1]則該函數(shù)可以看做是概率累積函數(shù)
2. 概率求解示例
解決問題的基本套路:(有效事件數(shù)量)/(總事件數(shù)量)
n個球放N個盒子凫佛,n<=N愧薛,求每個盒子最多一個球的概率
每個盒子至多一個球的概率
引出組合的概念
n個商品分為k組厚满,每組個數(shù)分別是n
1
,n2
...nk
,則不同分組方法
一共有n遵馆!/ (n1
丰榴!n2
四濒!...nk
!)種方法
簡化上述問題戈二,n個商品分為2組觉吭,第一組m個仆邓,第二組n-m個节值,則分組方法
一共有n!/ (mIつⅰ(n-m)D淠恕)種方法
這就是n個里面選m個扳埂,即組合數(shù)C(m瘤礁,n)
3.概率公式
手動版貝葉斯
8個槍,5個好的3壞的巷燥,好槍命中率0.8缰揪,壞槍0.3〈写荆現(xiàn)在隨機拿一把赞厕,射擊中靶。求是好槍的概率毫目。
已知條件整合
- P(好槍)=5/8 镀虐, P(壞槍)=3/8
- P(中 | 好槍)=0.8沟绪,P(不中 | 好槍)=0.2
-
P(中 | 壞槍)=0.3近零,P(不中 | 壞槍)=0.7
求解問題:** P(好槍 | 中)=?**
手動版貝葉斯
貝葉斯公式
先驗概率 P(θ):系統(tǒng)本身事件θ發(fā)生概率
后驗概率 P(θ|x):在數(shù)據(jù)x的條件下,事件θ發(fā)生概率
似然函數(shù) P(x|θ):給定參數(shù)θ的概率分布
4.常見概率分布-離散型
目錄
- 0-1分布
- 幾何分布
- 超幾何分布
- 多項分布
- 泊松分布
0-1分布
幾何分布
超幾何分布
貝努利分布/二項分布
多項分布
泊松分布
泊松分布補充說明
一個隨機事件桌硫,以固定平均瞬時速率隨機且獨立出現(xiàn)铆隘,呢么這個事件在單位時間內(nèi)出現(xiàn)次數(shù)就近似服從泊松分布
- 某一服務設施南用,一定時間內(nèi)到達的人數(shù)
- 電話交換機接到的呼叫次數(shù)
- 汽車站臺的候客人數(shù)
- 機器出現(xiàn)故障數(shù)
- 自然災害發(fā)生次數(shù)
- 一個產(chǎn)品的缺陷數(shù)
- 單位分區(qū)細菌分布數(shù)
- 放射性物質單位時間發(fā)出粒子數(shù)
5.常見概率分布-連續(xù)型
目錄
- 均勻分布
- 指數(shù)分布
- 正態(tài)分布