協(xié)方差(Covariance)

1 期望、方差棒呛、標(biāo)準(zhǔn)差

概率論與數(shù)理統(tǒng)計(jì)中聂示,最基本概念就是均值、方差簇秒、標(biāo)準(zhǔn)差,n個(gè)樣本xi的集合X。

具體公式描述為:

均值

??????? 樣本集合X的中間點(diǎn)

標(biāo)準(zhǔn)差

??????? 樣本集合的各個(gè)樣本點(diǎn)到均值的距離平方之和努潘,描述了集合的離散程度懂牧,也即樣本整體的離散幅度。

方差

??????? 標(biāo)準(zhǔn)差的平方



2 協(xié)方差

??????? 兩個(gè)特征之間的相關(guān)關(guān)系皱坛。

??????? 均值编曼、方差、標(biāo)準(zhǔn)差幾個(gè)統(tǒng)計(jì)量只描述了一維數(shù)據(jù)剩辟,現(xiàn)實(shí)中數(shù)據(jù)通常都不是簡(jiǎn)單的一個(gè)特征能夠描述灵巧,都是多個(gè)特征描述,而且不同特征之間會(huì)具有相關(guān)關(guān)系抹沪。例如一個(gè)理科學(xué)生的成績(jī)?cè)跀?shù)學(xué)物理兩方面上刻肄,就是兩個(gè)特征,而且這兩個(gè)特征是有相關(guān)關(guān)系的融欧。

??????? 取很多學(xué)生構(gòu)建成一個(gè)集合敏弃,統(tǒng)計(jì)發(fā)現(xiàn)如果數(shù)學(xué)越好,一般來說物理也就越好噪馏。從統(tǒng)計(jì)數(shù)據(jù)上看到, 數(shù)學(xué) 物理成績(jī)之間具有相關(guān)關(guān)系

怎么描述麦到?---用協(xié)方差描述

??????? 兩個(gè)特征X Y,均值為X’ Y’欠肾。 如果樣本的X高于均值, 一般Y也高于均值瓶颠。相反如果X低于均值Y也低于均值,則用如下公式描述兩個(gè)特征之間的相關(guān)關(guān)系:

1??? 在xi > x’,? yi > y’時(shí)刺桃,結(jié)果 > 0

2??? 在xi > x’,? yi < y’時(shí)粹淋,結(jié)果 < 0

3??? 在xi < x’, yi > y’時(shí),結(jié)果 < 0

4??? 在xi < x’, yi < y’時(shí),結(jié)果 > 0

??????? 如果統(tǒng)計(jì)集合所有樣本的特征 xi yi 都是同時(shí)增減的話桃移,那么1 4情況就多屋匕,cov(x, y)就會(huì)是> 0且相關(guān)性越大cov(x, y)越大。

??????? 相反如果xi yi 相反增減借杰,那么2 3情況就多, cov(x, y)就會(huì) < 0且逆相關(guān)性越大cov(x, y)越小过吻。

??????? 而如果xi yi沒有關(guān)系,那么隨意發(fā)生1 2 3 4情況蔗衡,那么cov的分子因?yàn)榍蠛途蜁?huì)逐漸趨近0那么cov絕對(duì)值就越小

這樣這個(gè)公式就描述了一個(gè)樣本的特征之間的相關(guān)關(guān)系.


3 協(xié)方差矩陣

??????? 如果理科成績(jī)還要看化學(xué)特征的關(guān)系那么就會(huì)有一個(gè)樣本是x y z纤虽。而協(xié)方差能夠描述的是兩個(gè)特征之間的關(guān)系。想要描述兩兩之間關(guān)系绞惦,

Cov(i, j) = Cov(dimi, dimj)

形成一個(gè)矩陣廓推。

??????? 描述n個(gè)特征兩兩之間的相關(guān)關(guān)系。 x-x?? x-y?? x-z?? y-z翩隧。

??????? 直接觀察就發(fā)現(xiàn)樊展,Cov 協(xié)方差矩陣一定是個(gè)對(duì)角矩陣。 cov(x, y) == cov(y, x)堆生。


??????? 今天突然發(fā)現(xiàn)专缠,原來協(xié)方差矩陣還可以這樣計(jì)算,先讓樣本矩陣中心化淑仆,即每一維度減去該維度的均值涝婉,使每一維度上的均值為0,然后直接用新的到的樣本矩陣乘上它的轉(zhuǎn)置蔗怠,然后除以(N-1)即可墩弯。其實(shí)這種方法也是由前面的公式推導(dǎo)而來,只不過理解起來不是很直觀寞射。

??????? 理解協(xié)方差矩陣的關(guān)鍵就在于牢記它計(jì)算的是一個(gè)樣本的不同特征之間的協(xié)方差渔工,而不是不同樣本之間。



4? 相關(guān)系數(shù)

??????? 相關(guān)系數(shù)= X Y的協(xié)方差/ (X標(biāo)準(zhǔn)差*Y標(biāo)準(zhǔn)差) 理解為歸一化標(biāo)準(zhǔn)化后的特殊的協(xié)方差桥温。


特點(diǎn)

? ? 1 反應(yīng)兩個(gè)特征的相關(guān)關(guān)系(同向逆向無關(guān)(貌似是線性關(guān)系))

? ? 2 由于是標(biāo)準(zhǔn)化的協(xié)方差引矩,消除了兩個(gè)變量變化幅度的影響,純凈的反應(yīng)了兩個(gè)變量的相關(guān)關(guān)系侵浸。

思考

如果數(shù)據(jù)集兩個(gè)特征x y.

??????? X是100sin(0 – 180)取其中五個(gè)點(diǎn)

??????? Y是100sin(0 – 180)取其中五個(gè)點(diǎn)

??????? (x1,y1) (x2,y2)(x3,y3) (x4,y4) (x5,y5)

??????? 這時(shí)兩者的協(xié)方差為10000(未計(jì)算).相關(guān)性很大

而如果數(shù)據(jù)集兩個(gè)特征x y.

??????? X是100sin(0 – 180)取其中五個(gè)點(diǎn)

??????? Y是1sin(0 – 180)取其中五個(gè)點(diǎn)

???????? (x1,y1) (x2,y2)(x3,y3) (x4,y4) (x5,y5)

???????? 這時(shí)兩者的協(xié)方差為1(未計(jì)算) .相關(guān)性很小

? ? ? ?? 雖然協(xié)方差相差巨大旺韭,但是實(shí)際上兩者單純相關(guān)性來說是完全一樣的,這時(shí)候如果除以自身幅值標(biāo)準(zhǔn)化一下掏觉,兩者的值就是相等的区端。

這時(shí)相關(guān)系就登場(chǎng)了, COV(X,Y) / (X標(biāo)準(zhǔn)差*Y標(biāo)準(zhǔn)差)? --- 純凈的相關(guān)性澳腹。


比較協(xié)方差與相關(guān)系數(shù)

? ? 協(xié)方差變化在正無窮到負(fù)無窮

? ? 相關(guān)系數(shù)變化在+1 -1.

? ? ? ? 如果相關(guān)系數(shù)= 1,表示完全正相關(guān)织盼,X增大一倍Y也增大一倍杨何。這就是線性相關(guān)。


參考

如何通俗易懂理解協(xié)方差與相關(guān)系數(shù)

https://www.zhihu.com/question/20852004

協(xié)方差的意義和計(jì)算公式

http://blog.csdn.net/beechina/article/details/51074750

?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末悔政,一起剝皮案震驚了整個(gè)濱河市晚吞,隨后出現(xiàn)的幾起案子延旧,更是在濱河造成了極大的恐慌谋国,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,546評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件迁沫,死亡現(xiàn)場(chǎng)離奇詭異芦瘾,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)集畅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門近弟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人挺智,你說我怎么就攤上這事祷愉。” “怎么了赦颇?”我有些...
    開封第一講書人閱讀 164,911評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵二鳄,是天一觀的道長。 經(jīng)常有香客問我媒怯,道長订讼,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,737評(píng)論 1 294
  • 正文 為了忘掉前任扇苞,我火速辦了婚禮欺殿,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘鳖敷。我一直安慰自己脖苏,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,753評(píng)論 6 392
  • 文/花漫 我一把揭開白布定踱。 她就那樣靜靜地躺著帆阳,像睡著了一般。 火紅的嫁衣襯著肌膚如雪屋吨。 梳的紋絲不亂的頭發(fā)上蜒谤,一...
    開封第一講書人閱讀 51,598評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音至扰,去河邊找鬼鳍徽。 笑死,一個(gè)胖子當(dāng)著我的面吹牛敢课,可吹牛的內(nèi)容都是我干的阶祭。 我是一名探鬼主播绷杜,決...
    沈念sama閱讀 40,338評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼濒募!你這毒婦竟也來了鞭盟?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,249評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤瑰剃,失蹤者是張志新(化名)和其女友劉穎齿诉,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體晌姚,經(jīng)...
    沈念sama閱讀 45,696評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡粤剧,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,888評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了挥唠。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片抵恋。...
    茶點(diǎn)故事閱讀 40,013評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖宝磨,靈堂內(nèi)的尸體忽然破棺而出弧关,到底是詐尸還是另有隱情,我是刑警寧澤唤锉,帶...
    沈念sama閱讀 35,731評(píng)論 5 346
  • 正文 年R本政府宣布世囊,位于F島的核電站,受9級(jí)特大地震影響腌紧,放射性物質(zhì)發(fā)生泄漏茸习。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,348評(píng)論 3 330
  • 文/蒙蒙 一壁肋、第九天 我趴在偏房一處隱蔽的房頂上張望号胚。 院中可真熱鬧,春花似錦浸遗、人聲如沸猫胁。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,929評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽弃秆。三九已至,卻和暖如春髓帽,著一層夾襖步出監(jiān)牢的瞬間菠赚,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,048評(píng)論 1 270
  • 我被黑心中介騙來泰國打工郑藏, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留衡查,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,203評(píng)論 3 370
  • 正文 我出身青樓必盖,卻偏偏與公主長得像拌牲,于是被迫代替她去往敵國和親俱饿。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,960評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容