隨機(jī)變量概述
隨機(jī)變量與事件
隨機(jī)變量的本質(zhì)是一種函數(shù)(映射關(guān)系)馍乙,在古典概率模型中架诞,“事件和事件的概率”是核心概念;但是在現(xiàn)代概率論中疯溺,“隨機(jī)變量及其取值規(guī)律”是核心概念。
隨機(jī)變量的分類(lèi)
隨機(jī)變量從其可能取的值全體的性質(zhì)可以分為兩大類(lèi):離散型隨機(jī)變量和連續(xù)型隨機(jī)變量哎垦。
離散型隨機(jī)變量
離散型隨機(jī)變量的取值在整個(gè)實(shí)數(shù)軸上是間隔的囱嫩,要么只有有限個(gè)取值,要么是無(wú)限可數(shù)的漏设。
常見(jiàn)的離散型隨機(jī)變量包括以下幾種:
0-1分布(也叫兩點(diǎn)分布或伯努利分布墨闲,bernouli distribution)
又叫做0-1分布,指一次隨機(jī)試驗(yàn)郑口,結(jié)果只有兩種鸳碧。也就是一個(gè)隨機(jī)變量的取值只有0和1盾鳞。
最簡(jiǎn)單的例子就是,拋一次硬幣杆兵,預(yù)測(cè)結(jié)果為正還是反雁仲。二項(xiàng)分布(binomial distrubution)
表示n次伯努利實(shí)驗(yàn)的結(jié)果。
例子就是琐脏,求多次拋硬幣,預(yù)測(cè)結(jié)果為正面的次數(shù)缸兔。
P(X=0) = 1/32
P(X=1) = 5/32
P(X=2) = 10/32 = 5/16
P(X=3) = 10/32 = 5/16
P(X=4) = 5/32
P(X=5) = 1/32
這是隨機(jī)變量X 表示五次拋硬幣出現(xiàn)的正面的次數(shù)日裙;
二項(xiàng)分布的期望值公式:E(X) = np
-
幾何分布
泊松分布
泊松分布就是描述某段時(shí)間內(nèi),事件具體的發(fā)生概率惰蜜。
日常生活中昂拂,大量事件是有固定頻率的。
某醫(yī)院平均每小時(shí)出生3個(gè)嬰兒
某公司平均每10分鐘接到1個(gè)電話
某超市平均每天銷(xiāo)售4包xx牌奶粉
某網(wǎng)站平均每分鐘有2次訪問(wèn)
它們的特點(diǎn)就是抛猖,我們可以預(yù)估這些事件的總數(shù)格侯,但是沒(méi)法知道具體的發(fā)生時(shí)間。
泊松分布的圖形大概是下面的樣子财著。
可以看到联四,在頻率附近,事件的發(fā)生概率最高撑教,然后向兩邊對(duì)稱(chēng)下降朝墩,即變得越大和越小都不太可能。
- 超幾何分布
一個(gè)袋子中有n個(gè)球伟姐,其中r個(gè)是黑球收苏,n-r是白球,從袋中取出m個(gè)球愤兵,讓X表示取出球中的黑球的個(gè)數(shù)鹿霸,那么X是一個(gè)符合超幾何分布(hypergeometric distribution)的隨機(jī)變量。
連續(xù)型隨機(jī)變量
連續(xù)型隨機(jī)變量的取值要么包括整個(gè)實(shí)數(shù)集(?∞,+∞)秆乳,要么在一個(gè)區(qū)間內(nèi)連續(xù)懦鼠,總之這類(lèi)隨機(jī)變量的可能取值要比離散型隨機(jī)變量的取值多得多,它們的個(gè)數(shù)是無(wú)限不可數(shù)的矫夷。
常見(jiàn)的連續(xù)型隨機(jī)變量包括以下幾種:
-
均勻分布
指數(shù)分布
指數(shù)分布是事件的時(shí)間間隔的概率葛闷。下面這些都屬于指數(shù)分布。
嬰兒出生的時(shí)間間隔
來(lái)電的時(shí)間間隔
奶粉銷(xiāo)售的時(shí)間間隔
網(wǎng)站訪問(wèn)的時(shí)間間隔
指數(shù)分布的公式可以從泊松分布推斷出來(lái)双藕。
指數(shù)分布的圖形大概是下面的樣子淑趾。
可以看到,隨著間隔時(shí)間變長(zhǎng)忧陪,事件的發(fā)生概率急劇下降扣泊,呈指數(shù)式衰減近范。
-
正態(tài)分布
正態(tài)分布是比較常見(jiàn)的,最常用的分布就是正態(tài)分布(normal distribution)延蟹,也稱(chēng)為高斯分布 (Gaussian distribution)评矩,譬如學(xué)生考試成績(jī)的人數(shù)分布等。
隨機(jī)變量的基本性質(zhì)
隨機(jī)變量最主要的性質(zhì)是其所有可能取到的這些值的取值規(guī)律阱飘,即取到的概率大小斥杜。如果我們把一個(gè)隨機(jī)變量的所有可能的取值的規(guī)律都研究透徹了,那么這個(gè)隨機(jī)變量也就研究透徹了沥匈。隨機(jī)變量的性質(zhì)主要有兩類(lèi):一類(lèi)是大而全的性質(zhì)蔗喂,這類(lèi)性質(zhì)可以詳細(xì)描述所有可能取值的概率,例如累積分布函數(shù)和概率密度函數(shù)高帖;另一類(lèi)是找到該隨機(jī)變量的一些特征或是代表值缰儿,例如隨機(jī)變量的方差或期望等數(shù)字特征。