機器學習數(shù)學基礎(二)概率論(上)

目錄

  • 1.概率論基礎
  • 2.統(tǒng)計量
  • 3.大數(shù)定律
  • 4.中心極限定理
  • 5.最大似然估計

1. 概率論基礎

1.1 概率論基本概念

1.1.1 什么是概率

表示事件發(fā)生可能大小的一個量叫做概率梦重。

1.1.2 概率公式
(1)條件概率公式

P(A|B)稱為事件B發(fā)生的情況下A發(fā)生的概率兑燥,計算公式如下:

通常,條件概率P(A|B)和無條件概率P(A)是不同的琴拧。

(2)全概率公式

圖片來自《概率論與數(shù)理統(tǒng)計(浙大 第四版)》

在很多實際問題中降瞳,往往不易直接求出概率P(A),但卻容易找到S的一個劃分B1,B2,...,Bn蚓胸,且BiP(A|Bi)為已知挣饥,則根據(jù)全概率公式很容易求出P(A)

(3)貝葉斯公式

根據(jù)前面條件概率公式全概率公式可以推導出貝葉斯公式沛膳,如下:

貝葉斯公式

在這里扔枫,P(Bi)B的先驗概率,之所以稱為“先驗”锹安,是因為不需要考慮任何A方面的因素短荐。

1.2 常見概率分布

1.2.1 0-1分布

0-1分布是經(jīng)常遇到的一種分布,定義如下:

圖片來自《概率論與數(shù)理統(tǒng)計(浙大 第四版)》

并且:
期望 E(X) = 1p + 0(1-p) = p
方差 D(X) = E(X^2) - [E(X)]^2 = pq

1.2.2 二項分布

設實驗E只有兩個可能結(jié)果A和B八毯,則稱E為伯努利(Bernoulli)實驗倡勇,設P(A)=p(0<p<1)献酗,此時P(B)=1-p清酥,將E獨立重復的執(zhí)行n次购公,則稱這一串的重復實驗為n重伯努利實驗

伯努利實驗的特點:

  • 重復泊交,即每次實驗的概率是相同的
  • 獨立乳讥,各次實驗的結(jié)果互不影響
  • 每次實驗可能的結(jié)果只有兩個柱查,即A&B

二項分布即重復n次的伯努利實驗,每次實驗結(jié)果為A的概率是p云石,結(jié)果為B的概率是q(其中q=1-p)唉工,則在n次實驗中有k次為A,n-k次結(jié)果為B的概率為:


即有

顯然

觀察下面這個表達式

發(fā)現(xiàn)剛好是(p+q)^n 的展開式中出現(xiàn)p^k的那一項汹忠,我們稱隨機變量X服從參數(shù)為n,p的二項分布淋硝,并記為X~b(n,p)。

當n=1時宽菜,二項分布就是(0-1)分布

期望E(X)為



方差D(X)為


1.2.3 泊松分布

泊松分布適合描述單位時間(空間)內(nèi)隨機事件的發(fā)生次數(shù)谣膳,例如,一本書一頁中的印刷錯誤數(shù)铅乡、某地區(qū)一個時間間隔內(nèi)發(fā)生交通事故的次數(shù)等继谚。


圖片來自《概率論與數(shù)理統(tǒng)計(浙大 第四版)》

泊松分布期望

在總結(jié)以下幾個概率分布前,先解釋一下連續(xù)型隨機變量阵幸。

一般花履,如果對于隨機變量X的分布函數(shù)F(x),存在非負函數(shù)f(x)挚赊,使對于任意實數(shù)x有


則稱X連續(xù)性隨機變量诡壁,其中函數(shù)f(x)稱為X概率密度函數(shù),簡稱概率密度咬腕。

實際應用中遇到的基本上是離散型或者連續(xù)性隨機變量欢峰,本文也只討論這兩種隨機變量。

概率密度函數(shù)有以下幾個特點:

下面總結(jié)一下三種重要的連續(xù)型隨機變量的概率密度涨共。

1.2.4 均勻分布

若連續(xù)型隨機變量X具有概率密度


則稱X在區(qū)間(a,b)上服從均勻分布,記為X~U(a,b)

很容易推導出X的分布函數(shù)為

1.2.5 指數(shù)分布

若連續(xù)型隨機變量X概率密度為


其中宠漩,θ>0為常數(shù)举反,則稱X服從參數(shù)為θ的指數(shù)分布

1.2.6 正態(tài)分布

若連續(xù)型隨機變量X的概率密度為


其中μ,σ(σ>0)為常數(shù)扒吁,則稱X服從參數(shù)為μ,σ的正態(tài)分布或高斯分布(Gauss)火鼻,記為X~N(μ,σ^2)

1.2.7 Beta分布

暫時省去500字

2.統(tǒng)計量

2.1 獨立和不相關

給定A,B兩個事件,如果滿足等式
P(AB) = P(A)P(B)
則稱事件A,B相互獨立雕崩,簡稱A,B獨立魁索。

其中:
獨立一定不相關;
不相關不一定獨立盼铁;
實際上不相關就是兩者沒有線性關系粗蔚,但是不排除存在其他關系的可能性,而獨立就是不存在任何關系饶火。

2.2 期望

2.2.1 定義
  • 離散型


  • 連續(xù)型


2.2.2 性質(zhì)
  • 無條件成立

    • E(kX) = kE(X)
    • E(X + Y) = E(X) + E(Y)
  • 若X和Y相互獨立
    E(XY) = E(X)E(Y) 反之不成立

2.2 方差

2.2.1 定義

X是一個隨機變量鹏控,若E{[X-E(X)]^2}存在致扯,則稱E{ [X-E(X)]^2 }是X方差,記做D(X)或者Var(x)当辐,即
D(X)=Var(x)=E{[X-E(X)]^2}

2.2.2 性質(zhì)
  • 無條件成立

    • Var(c) = 0
    • Var(X+c) = Var(X)
    • Var(kX) = k^2Var(X)
  • X和Y相互獨立

    • Var(X+Y) = Var(X) + Var(Y)

2.3 協(xié)方差

2.3.1 定義

E{[X-E(X)][Y-E(Y)]}稱為隨機變量XY協(xié)方差抖僵,記為Cov(X,Y)

協(xié)方差是兩個變量是否具有相同變化趨勢的度量:

  • 若Cov(X,Y) > 0缘揪,他們的變化趨勢相同耍群;
  • 若Cov(X,Y) < 0,他們的變化趨勢相反找筝;
  • 若Cov(X,Y) = 0蹈垢,他們不相關;
2.3.2 性質(zhì)
  • Cov(X,Y) = Cov(Y,X)
  • Cov(aX+b, cY+d) = acCov(X,Y)
  • Cov(X1+X2,Y) = Cov(X1,Y) + Cov(X2,Y)
  • Cov(XY) = E(XY) - E(X)E(Y)


稱為隨機變量XY相關系數(shù)

參考資料:
[1] 《概率論與數(shù)理統(tǒng)計(浙大 第四版)》

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末呻征,一起剝皮案震驚了整個濱河市耘婚,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌陆赋,老刑警劉巖沐祷,帶你破解...
    沈念sama閱讀 216,651評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異攒岛,居然都是意外死亡赖临,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,468評論 3 392
  • 文/潘曉璐 我一進店門灾锯,熙熙樓的掌柜王于貴愁眉苦臉地迎上來兢榨,“玉大人,你說我怎么就攤上這事顺饮〕炒希” “怎么了?”我有些...
    開封第一講書人閱讀 162,931評論 0 353
  • 文/不壞的土叔 我叫張陵兼雄,是天一觀的道長吟逝。 經(jīng)常有香客問我,道長赦肋,這世上最難降的妖魔是什么块攒? 我笑而不...
    開封第一講書人閱讀 58,218評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮佃乘,結(jié)果婚禮上囱井,老公的妹妹穿的比我還像新娘。我一直安慰自己趣避,他們只是感情好庞呕,可當我...
    茶點故事閱讀 67,234評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著鹅巍,像睡著了一般千扶。 火紅的嫁衣襯著肌膚如雪料祠。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,198評論 1 299
  • 那天澎羞,我揣著相機與錄音髓绽,去河邊找鬼。 笑死妆绞,一個胖子當著我的面吹牛顺呕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播括饶,決...
    沈念sama閱讀 40,084評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼株茶,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了图焰?” 一聲冷哼從身側(cè)響起启盛,我...
    開封第一講書人閱讀 38,926評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎技羔,沒想到半個月后僵闯,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,341評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡藤滥,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,563評論 2 333
  • 正文 我和宋清朗相戀三年鳖粟,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片拙绊。...
    茶點故事閱讀 39,731評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡向图,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出标沪,到底是詐尸還是另有隱情榄攀,我是刑警寧澤,帶...
    沈念sama閱讀 35,430評論 5 343
  • 正文 年R本政府宣布金句,位于F島的核電站航攒,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏趴梢。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,036評論 3 326
  • 文/蒙蒙 一币他、第九天 我趴在偏房一處隱蔽的房頂上張望坞靶。 院中可真熱鬧,春花似錦蝴悉、人聲如沸彰阴。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,676評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽尿这。三九已至簇抵,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間射众,已是汗流浹背碟摆。 一陣腳步聲響...
    開封第一講書人閱讀 32,829評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留叨橱,地道東北人典蜕。 一個月前我還...
    沈念sama閱讀 47,743評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像罗洗,于是被迫代替她去往敵國和親愉舔。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,629評論 2 354

推薦閱讀更多精彩內(nèi)容