期望與方差之一:你們究竟是什么>庵灭衷?

期望值(Expectation)和方差(Variance)是統(tǒng)計(jì)學(xué)入門(mén)繞不過(guò)去的兩個(gè)指標(biāo)。許多教科書(shū)一上來(lái)就用上各種符號(hào)和公式旁涤,讓一些基礎(chǔ)不好的同學(xué)摸不著頭腦翔曲。本文試圖用最直接的例子給各位解釋一下這兩個(gè)概念。

比如劈愚,現(xiàn)在有一個(gè)數(shù)組:

0, 1, 1, 2, 2, 2, 3, 3, 3, 3

若要求這個(gè)數(shù)組的平均數(shù)瞳遍,則有:

\frac{0+1+1+2+2+2+3+3+3+3}{10} =2

這種計(jì)算辦法,我們叫作算術(shù)平均數(shù)(Arithmetic Mean)菌羽。

讓我們重新觀察一下這個(gè)數(shù)組掠械。我們發(fā)現(xiàn),里面的元素(element)有自己各自的出現(xiàn)次數(shù)。比如0出現(xiàn)了1次猾蒂,2出現(xiàn)了3次等均唉。這些出現(xiàn)次數(shù),我們稱(chēng)之為頻數(shù)(Frequency)肚菠。本數(shù)組的頻數(shù)總結(jié)如下表:

頻數(shù)表

于是舔箭,上面算術(shù)平均數(shù),也可以寫(xiě)成加權(quán)平均數(shù)(Weighted Mean)形式:

\frac{0\times 1+1\times 2+2\times 3 + 3\times 4}{10} = 2

不知道各位小時(shí)候有沒(méi)有這個(gè)困惑蚊逢。我記得我是在小學(xué)六年級(jí)左右學(xué)習(xí)加權(quán)平均數(shù)的层扶,但是加權(quán)平均數(shù)與算術(shù)平均數(shù)不就是算出同一個(gè)結(jié)果嗎?為什么要多發(fā)明出一個(gè)玩意來(lái)增加負(fù)擔(dān)呢烙荷?這個(gè)問(wèn)題直到我大一的時(shí)候?qū)W習(xí)了期望值才得以解決怒医。原來(lái)只要稍微變換一下上式,即可得:

0\times \frac{1}{10} + 1\times \frac{2}{10} +2\times \frac{3}{10} + 3\times \frac{4}{10} = 2

這時(shí)奢讨,原數(shù)組的平均數(shù)被寫(xiě)成其四個(gè)元素0稚叹,1,2拿诸,3分別乘以各自概率(Probability)再求和的形式扒袖。這種寫(xiě)法,也就是所謂期望(也稱(chēng)數(shù)學(xué)期望)的定義亩码。期望值通常用希臘字母\mu 或者概率函數(shù)形式E(X)表示:

\mu = E(X) = \sum_{i=1}^n x_{i}p(x_{i})

這里有必要解釋一下概率這個(gè)詞季率。這個(gè)詞是屬于那種日常對(duì)話(huà)經(jīng)常用到,但是要解釋起來(lái)好像說(shuō)不透的一個(gè)詞描沟。實(shí)際上飒泻,所謂概率就是占比(Portion)。比如一個(gè)班有32人吏廉,其中男生12人泞遗,女生20人,那么男生的概率(或占比)就是12/32 = 0.375席覆,女生的概率(或占比)就是20/32 = 0.625 史辙。因此,有時(shí)理解不透的話(huà)佩伤,不妨用占比甚至百分比來(lái)理解概率聊倔,會(huì)更容易一點(diǎn)。

因此生巡,上面數(shù)組的期望值可以拆分成下面表格理解:

原數(shù)組的期望值

通過(guò)上面幾種形式耙蔑,不論數(shù)組均值用哪種方法計(jì)算,最后的結(jié)果還是2 孤荣。因此甸陌,期望值實(shí)質(zhì)就是這個(gè)數(shù)組的總體均值须揣。這里需要注意的是“總體”一詞⊙悖總體(Population)是一個(gè)統(tǒng)計(jì)學(xué)術(shù)語(yǔ)返敬,指的是這個(gè)研究?jī)?nèi)容的所有對(duì)象。與它相對(duì)應(yīng)的詞是樣本(Sample)寥院,也就是這個(gè)研究?jī)?nèi)容的部分對(duì)象劲赠。

如果說(shuō)期望值描述的是一組數(shù)據(jù)的總體趨勢(shì)(Central Tendency),那么方差(Variance)則是描述這個(gè)組數(shù)據(jù)的離散程度(Dispersion)秸谢。所謂的離散程度凛澎,指的是各個(gè)數(shù)值與均值距離形成的一個(gè)度量,其計(jì)算公式為:

\sigma ^2 = Var(X) = E((X-\mu )^2)

其中估蹄,希臘字母\sigma^2 為方差塑煎,希臘字母\sigma ?(讀sigma)為標(biāo)準(zhǔn)差(本節(jié)先不討論),Var(X)是計(jì)算總體X的方差函數(shù)臭蚁。乍一看最铁,這個(gè)公式很復(fù)雜,我們先用一個(gè)最簡(jiǎn)單的數(shù)組為例垮兑。比如一組數(shù)據(jù)只有1,2,3,4四個(gè)數(shù)字冷尉。那么容易得到這四個(gè)數(shù)字的均值為2.5,寫(xiě)成期望值有:

\mu =E(X) = 2.5

而方差系枪,實(shí)際就是每一個(gè)元素與均值的差的平方求和雀哨,再取均值,即:

Var(X) = \frac{(x_{1}-\mu )^2+(x_{2}-\mu )^2+(x_{3}-\mu )^2+(x_{4}-\mu )^2}{4}

=\frac{(1-2.5)^2+(2-2.5)^2+(3-2.5)^2+( 4-2.5)^2}{4} = 0.8

這組數(shù)據(jù)之所以說(shuō)是“簡(jiǎn)單的”私爷,是因?yàn)槊恳粋€(gè)元素只出現(xiàn)了一次雾棺,因此其出現(xiàn)概率均為1/4,頻數(shù)不明顯衬浑。但是對(duì)于本文第一個(gè)數(shù)組捌浩,每個(gè)元素的頻數(shù)是不一樣的,因此嚎卫,其方差從展開(kāi)到一般嘉栓,有:

Var(X) = \frac{(0 - 2)^2 + (1 - 2)^2 + (1 - 2)^2 +....+(3 - 2)^2 +(3 - 2)^2}{10}

因?yàn)椋膫€(gè)元素的頻數(shù)不一樣拓诸,所以上式進(jìn)一步寫(xiě)成加權(quán)平均形式:

Var(X) = \frac{(1)(0 - 2)^2 + (2) (1 - 2)^2 + (3)(2 - 2)^2 + ( 4)(3 - 2)^2}{10} = 1

這個(gè)式子,也可拆分“元素乘以概率”的形式:

Var(X) = (0 - 2)^2\times \frac{1}{10}  + (1 - 2)^2\times \frac{2}{10} + (2 - 2)^2\times \frac{3}{10} + (3 - 2)^2\times \frac{4}{10} = 1

如果把每一項(xiàng)(x_{i} - 2)^2 看成一個(gè)新的數(shù)組元素a_{i} 的話(huà)麻昼,那么方差則可以寫(xiě)成下面等價(jià)的期望值形式:

E(A) = \sum_{i=1}^4 a_{i}p(a_{i}) = \sum_{i=1}^4 (x_{i} - \mu)p((x_{i}) = E((X - \mu)^2)

最后提醒一下奠支,E(X)Var(X)的x用大寫(xiě),因?yàn)樗硎镜氖沁@個(gè)數(shù)據(jù)總體抚芦,而求和展開(kāi)式的x則用小寫(xiě)倍谜,因?yàn)樗鼈兇頂?shù)據(jù)里面的每一個(gè)元素迈螟。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市尔崔,隨后出現(xiàn)的幾起案子答毫,更是在濱河造成了極大的恐慌,老刑警劉巖季春,帶你破解...
    沈念sama閱讀 211,948評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件洗搂,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡载弄,警方通過(guò)查閱死者的電腦和手機(jī)耘拇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,371評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)宇攻,“玉大人惫叛,你說(shuō)我怎么就攤上這事〕阉ⅲ” “怎么了嘉涌?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,490評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)夸浅。 經(jīng)常有香客問(wèn)我仑最,道長(zhǎng),這世上最難降的妖魔是什么题篷? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,521評(píng)論 1 284
  • 正文 為了忘掉前任词身,我火速辦了婚禮,結(jié)果婚禮上番枚,老公的妹妹穿的比我還像新娘法严。我一直安慰自己,他們只是感情好葫笼,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,627評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布深啤。 她就那樣靜靜地躺著,像睡著了一般路星。 火紅的嫁衣襯著肌膚如雪溯街。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,842評(píng)論 1 290
  • 那天洋丐,我揣著相機(jī)與錄音呈昔,去河邊找鬼。 笑死友绝,一個(gè)胖子當(dāng)著我的面吹牛堤尾,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播迁客,決...
    沈念sama閱讀 38,997評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼郭宝,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼辞槐!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起粘室,我...
    開(kāi)封第一講書(shū)人閱讀 37,741評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤榄檬,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后衔统,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體鹿榜,經(jīng)...
    沈念sama閱讀 44,203評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,534評(píng)論 2 327
  • 正文 我和宋清朗相戀三年缰冤,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了郎汪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蜒滩。...
    茶點(diǎn)故事閱讀 38,673評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出融撞,到底是詐尸還是另有隱情豌鸡,我是刑警寧澤炭剪,帶...
    沈念sama閱讀 34,339評(píng)論 4 330
  • 正文 年R本政府宣布每币,位于F島的核電站,受9級(jí)特大地震影響嗡害,放射性物質(zhì)發(fā)生泄漏焚碌。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,955評(píng)論 3 313
  • 文/蒙蒙 一霸妹、第九天 我趴在偏房一處隱蔽的房頂上張望十电。 院中可真熱鬧,春花似錦叹螟、人聲如沸鹃骂。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,770評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)畏线。三九已至,卻和暖如春良价,著一層夾襖步出監(jiān)牢的瞬間寝殴,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,000評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工明垢, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蚣常,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,394評(píng)論 2 360
  • 正文 我出身青樓痊银,卻偏偏與公主長(zhǎng)得像史隆,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子曼验,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,562評(píng)論 2 349