Covariance&Matrix(協(xié)方差&矩陣)

統(tǒng)計(jì)學(xué)中均值已日、標(biāo)準(zhǔn)差砚偶、方差這些概念和例子都很常見躺酒。這些數(shù)字特征不是本文要重點(diǎn)探討的可以看看這篇對于概率論數(shù)字特征的理解

  • 均值描述的是樣本集合中平衡點(diǎn),因?yàn)樾畔⑹怯邢薜摹?/li>
  • 標(biāo)準(zhǔn)差描述的是樣本集合中各個(gè)樣本點(diǎn)到均值之間距離的平均值

eg:[0, 8, 12, 20]和[8, 9, 11, 12]冀惭,兩個(gè)集合的均值都是10震叙,但顯然兩個(gè)集合的差別是很大的,計(jì)算兩者的標(biāo)準(zhǔn)差云头,前者是8.3后者是1.8捐友,顯然后者較為集中,故其標(biāo)準(zhǔn)差小一些溃槐,標(biāo)準(zhǔn)差描述的就是這種“散布度”匣砖。之所以除以n-1而不是n,是因?yàn)檫@樣能使我們以較小的樣本集更好地逼近總體的標(biāo)準(zhǔn)差昏滴,即統(tǒng)計(jì)上所謂的“無偏估計(jì)”猴鲫。(這個(gè)例子來源于網(wǎng)絡(luò)看到的,挺好的就引用過來谣殊,湊出均值相同)

而方差則僅僅是標(biāo)準(zhǔn)差的平方拂共。方差是協(xié)方差的一種特殊情況,即當(dāng)兩個(gè)變量是相同的情況 姻几。

引出協(xié)方差

前面的標(biāo)準(zhǔn)差宜狐,方差一般用來描述一維的,現(xiàn)實(shí)中我們遇到的大多是多維的蛇捌,這時(shí)候雖然可以每一維獨(dú)立計(jì)算出方差啥的抚恒,但信息單一,這就引出協(xié)方差络拌。

簡單地說:協(xié)方差就是這樣一種用來度量兩個(gè)隨機(jī)變量關(guān)系的統(tǒng)計(jì)量
通俗的說:兩個(gè)變量之間是否同時(shí)偏離均值俭驮。

度量各個(gè)維度偏離其均值

也可以寫成和期望有關(guān):

協(xié)方差公式定義

有了上面的定義我們就看看怎么來理解

p(x,y)是x,y的二維概率分布函數(shù),顏色深淺應(yīng)該表示進(jìn)概率密度的大小春贸,p(x,y)整個(gè)區(qū)域二重積分得到1混萝,這個(gè)就是下面圓的背景知識了。下面是協(xié)方差的三種不同意義情況


來自**[http://bbs.mathchina.com/cgi-bin/topic.cgi?forum=5&topic=14444](http://bbs.mathchina.com/cgi-bin/topic.cgi?forum=5&topic=14444)**
來自**[http://bbs.mathchina.com/cgi-bin/topic.cgi?forum=5&topic=14444](http://bbs.mathchina.com/cgi-bin/topic.cgi?forum=5&topic=14444)**
來自**[http://bbs.mathchina.com/cgi-bin/topic.cgi?forum=5&topic=14444](http://bbs.mathchina.com/cgi-bin/topic.cgi?forum=5&topic=14444)**

當(dāng)X, Y 的聯(lián)合分布像上圖那樣時(shí)萍恕,我們可以看出:既不是X 越大Y 也越大逸嘀,也不是 X 越大 Y 反而越小,這種情況我們稱為“不相關(guān)”允粤。

怎樣將這3種相關(guān)情況厘熟,用一個(gè)簡單的數(shù)字表達(dá)出來呢屯蹦?

  • 在圖中的區(qū)域(1)中,有 X>EX 绳姨,Y-EY>0 ,所以(X-EX)(Y-EY)>0阔挠;
  • 在圖中的區(qū)域(2)中飘庄,有 X<EX ,Y-EY>0 购撼,所以(X-EX)(Y-EY)<0跪削;
  • 在圖中的區(qū)域(3)中,有 X<EX 迂求,Y-EY<0 碾盐,所以(X-EX)(Y-EY)>0;
  • 在圖中的區(qū)域(4)中揩局,有 X>EX 毫玖,Y-EY<0 ,所以(X-EX)(Y-EY)<0凌盯。

當(dāng)X 與Y ****正相關(guān)****時(shí)付枫,它們的分布大部分在區(qū)域(****1****)和(****3****)中,小部分在區(qū)域(****2****)和(****4****)中驰怎,所以平均來說阐滩,有E(X-EX)(Y-EY)>0

當(dāng) X與 Y負(fù)相關(guān)時(shí)县忌,它們的分布大部分在區(qū)域(2)和(4)中掂榔,小部分在區(qū)域(1)和(3)中,所以平均來說症杏,有(X-EX)(Y-EY)<0 装获。

當(dāng) X與 Y不相關(guān)時(shí),它們在區(qū)域(1)和(3)中的分布鸳慈,與在區(qū)域(2)和(4)中的分布幾乎一樣多饱溢,所以平均來說,有(X-EX)(Y-EY)=0** 走芋。

所以绩郎,我們可以定義一個(gè)表示X, Y 相互關(guān)系的數(shù)字特征,也就是協(xié)方差
cov(X, Y) = E(X-EX)(Y-EY)翁逞。

  • 當(dāng) cov(X, Y)>0時(shí)肋杖,表明** XY **正相關(guān);
  • **當(dāng) cov(X, Y)<0時(shí)挖函,表明X與Y負(fù)相關(guān)状植;
  • **當(dāng) ****cov(X, Y)=0****時(shí),表明X與Y不相關(guān)。

相關(guān)系數(shù)

如果XY統(tǒng)計(jì)獨(dú)立的津畸,那么二者之間的協(xié)方差就是0振定,這是因?yàn)?/p>

E(X \cdot Y)=E(X) \cdot E(Y)=\mu\nu
E(X \cdot Y)=E(X) \cdot E(Y)=\mu\nu

但是反過來并不成立,即如果XY 的協(xié)方差為0肉拓,二者并不一定是統(tǒng)計(jì)獨(dú)立的后频。
取決于協(xié)方差的相關(guān)性η

相關(guān)系數(shù)也可以看成協(xié)方差:一種剔除了兩個(gè)變量量綱影響、標(biāo)準(zhǔn)化后的特殊協(xié)方差暖途,它消除了兩個(gè)變量變化幅度的影響卑惜,而只是單純反應(yīng)兩個(gè)變量每單位變化時(shí)的相似程度。
協(xié)方差表示線性相關(guān)的方向驻售,相關(guān)系數(shù)不僅表示線性相關(guān)的方向露久,還表示線性相關(guān)的程度,取值[-1,1]欺栗。

協(xié)方差矩陣

協(xié)方差解決的也只是二維的問題毫痕,那么繼續(xù)維數(shù)上升呢,就要計(jì)算多個(gè)協(xié)方差纸巷,這個(gè)道理很好懂镇草。

舉個(gè)例子

協(xié)方差矩陣是一個(gè)對稱的矩陣,而且對角線是各個(gè)維度上的方瘤旨,對于機(jī)器學(xué)習(xí)領(lǐng)域的PCA來說梯啤,如果遇到的矩陣不是方陣,需要計(jì)算他的協(xié)方差矩陣來進(jìn)行下一步計(jì)算存哲,因?yàn)閰f(xié)方差矩陣一定是方陣因宇,而特征值分解針對的必須是方陣,SVD針對的可以是非方陣情況祟偷。

協(xié)方差矩陣在主成分分析中主成分分析有關(guān)鍵作用察滑。主成分分析就是把協(xié)方差矩陣做一個(gè)奇異值分解,求出最大的奇異值的特征方向修肠。

協(xié)方差矩陣計(jì)算的是不同維度之間的協(xié)方差贺辰,而不是不同樣本之間的,這點(diǎn)要記牢了嵌施。

剩下可以參考下:
[轉(zhuǎn)]淺談協(xié)方差矩陣
[線性代數(shù)] 如何求協(xié)方差矩陣
詳解協(xié)方差與協(xié)方差矩陣

另外饲化,我不是數(shù)學(xué)專業(yè)對這方面沒有過多研究,現(xiàn)階段只是簡單明白吗伤,在學(xué)習(xí)過程中會把好的精彩干練的整合起來吃靠,方便復(fù)習(xí),就醬紫了足淆,咱們可以發(fā)郵件討論巢块,博客下面就是地址了礁阁。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市族奢,隨后出現(xiàn)的幾起案子姥闭,更是在濱河造成了極大的恐慌,老刑警劉巖歹鱼,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件泣栈,死亡現(xiàn)場離奇詭異,居然都是意外死亡弥姻,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進(jìn)店門掺涛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來庭敦,“玉大人,你說我怎么就攤上這事薪缆⊙砹” “怎么了?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵拣帽,是天一觀的道長疼电。 經(jīng)常有香客問我,道長减拭,這世上最難降的妖魔是什么蔽豺? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮拧粪,結(jié)果婚禮上修陡,老公的妹妹穿的比我還像新娘。我一直安慰自己可霎,他們只是感情好魄鸦,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著癣朗,像睡著了一般拾因。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上旷余,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天绢记,我揣著相機(jī)與錄音,去河邊找鬼荣暮。 笑死庭惜,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的穗酥。 我是一名探鬼主播护赊,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼惠遏,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了骏啰?” 一聲冷哼從身側(cè)響起节吮,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎判耕,沒想到半個(gè)月后透绩,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡壁熄,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年帚豪,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片草丧。...
    茶點(diǎn)故事閱讀 38,577評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡狸臣,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出昌执,到底是詐尸還是另有隱情烛亦,我是刑警寧澤,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布懂拾,位于F島的核電站煤禽,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏岖赋。R本人自食惡果不足惜檬果,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望贾节。 院中可真熱鬧汁汗,春花似錦、人聲如沸栗涂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽斤程。三九已至角寸,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間忿墅,已是汗流浹背扁藕。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留疚脐,地道東北人亿柑。 一個(gè)月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像棍弄,于是被迫代替她去往敵國和親望薄。 傳聞我的和親對象是個(gè)殘疾皇子疟游,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內(nèi)容