時(shí)間:2018-09-07
作者:魏文應(yīng)
一、二維隨機(jī)變量
我們?cè)凇陡戒汢:機(jī)器學(xué)習(xí)基礎(chǔ)之最大似然估計(jì)》講過什么是 隨機(jī)變量柿祈。我們的向量是這么寫的:
這個(gè)就是二維向量,有兩個(gè)變量。放在概率論里悲幅,叫做 二維隨機(jī)變量 。
二站蝠、聯(lián)合分布函數(shù)
聯(lián)合分布是相對(duì)于兩個(gè)以上(包括兩個(gè))變量的概率分析來說的汰具。比如二維隨機(jī)變量,它的 聯(lián)合分布函數(shù) 就是:
我們說過菱魔,無論什么事情留荔,都可以用數(shù)字符號(hào)代表這件事情。如果給五個(gè)人依次編號(hào) {1澜倦, 2聚蝶, 3, 4藻治, 5}碘勉,那么變量 的取值就是 {1, 2, 3, 4, 5} 中的任意一個(gè)。同時(shí)假定有4只貓桩卵,編號(hào){1验靡, 2, 3雏节, 4}胜嗓,那么變量
的取值就是{1, 2钩乍, 3辞州,4} 中的任意一個(gè)。那么
是人編號(hào)小于等于 3 的概率寥粹,
是貓編號(hào)小于等于 2 的概率变过。那么:
表示的就是,事件同時(shí)滿足上面兩個(gè)條件的概率排作。
三牵啦、聯(lián)合分布律
分布律反映的是概率分布情況,聯(lián)合分布律反映的就是有多個(gè)變量時(shí)的概率分布情況:
上式就是有兩個(gè)變量的 聯(lián)合分布律妄痪。反映了兩件事同時(shí)發(fā)生的概率哈雏。有時(shí)我們可能會(huì)感到疑惑,聯(lián)合分布函數(shù)也是可以看做是兩件事同時(shí)發(fā)生的概率,聯(lián)合分布律也是反映兩件事同時(shí)發(fā)生的概率裳瘪。其實(shí)土浸,不同的是,一個(gè)是 小于等于號(hào)彭羹,一個(gè)是
等號(hào)黄伊。
-
:表示的是單個(gè)小事件。
-
:多個(gè)小事件組成的大事件派殷。
四还最、聯(lián)合概率密度
我們說,人口密度越大毡惜,這個(gè)地區(qū)的人口越多拓轻。同樣的,概率密度越大经伙,說明這個(gè)區(qū)域的發(fā)生某件事的概率越大扶叉。聯(lián)合概率是多個(gè)事件同時(shí)發(fā)生時(shí)的概率。我們說分布函數(shù)是帕膜,把那些事件枣氧,指定一個(gè)數(shù) ,把所有編號(hào)小于
的事件的概率都加起來垮刹。聯(lián)合概率分布也是一樣的达吞,只是它的變量變多了而已。比如危纫,二維隨機(jī)變量
的分布函數(shù)是
宗挥,下面就是聯(lián)合分布函數(shù):
既然用了積分种蝶,那么 和
要求變量是連續(xù)的,而不是離散的瞒大。上式中的
就是二維隨機(jī)變量
和
的 聯(lián)合概率密度 螃征。
五、邊緣分布
我們說透敌,聯(lián)合概率分布盯滚,我們關(guān)心的是兩個(gè)變量同時(shí)發(fā)生的概率分布情況。如果我們只關(guān)心一個(gè)變量呢酗电?比如 我們只關(guān)心
的情況魄藕,不關(guān)心
的情況,那么可以這么寫:
這就是關(guān)于 的 邊緣分布函數(shù) 撵术。也就是下面這么計(jì)算:
是關(guān)于
的 邊緣分布函數(shù) 背率。
邊緣分布律
我們說,邊緣分布就是不管其他變量,我們只關(guān)心一個(gè)變量寝姿。下面計(jì)算的是當(dāng) 時(shí)的概率:
這個(gè)就是 邊緣分布律交排。如果我們只關(guān)心
,
的邊緣分布律如下:
邊緣概率密度
對(duì)于連續(xù)隨機(jī)變量 饵筑,
的邊緣分布函數(shù)可以寫成:
所以關(guān)于 的 邊緣概率密度 如下:
這個(gè)很好理解埃篓,一個(gè)變量時(shí),概率密度是 根资,現(xiàn)在有了
以后架专,而且概率密度用
來表示,當(dāng)我們
確定一個(gè)具體值時(shí)玄帕,我們要把所有當(dāng)
時(shí)的情況加起來胶征,也就是
。關(guān)于
的 邊緣概率密度 如下: