協(xié)方差矩陣的幾何解釋【翻譯】

在本文中蔬螟,我們通過探索線性變換與結(jié)果數(shù)據(jù)協(xié)方差之間的關(guān)系,提供協(xié)方差直觀铁孵、幾何解釋锭硼。絕大部分教科書是基于協(xié)方差的矩陣概念來解釋數(shù)據(jù)的形狀。相反蜕劝,我們采用向后的方法檀头,用數(shù)據(jù)的形狀來解釋協(xié)方差矩陣的概念。

在之前的文章中岖沛,我們討論了方差的概念暑始,同時(shí)證明了樣本方差。圖一為標(biāo)準(zhǔn)差婴削,標(biāo)準(zhǔn)差提供了一種衡量數(shù)據(jù)在特征空間的分布程度廊镜。


圖一.高斯密度函數(shù)。對(duì)于正態(tài)分布的數(shù)據(jù)唉俗,68%的向本都分布在平均值正負(fù)標(biāo)準(zhǔn)差的區(qū)間內(nèi)嗤朴。

我們知道無偏估計(jì)的樣本方差公式可以通過如下方式獲得:
但是配椭,方差只能用于解釋數(shù)據(jù)在平行于特征空間軸上的擴(kuò)展。參考圖二中的二維特征空間:
圖二.對(duì)角線式的數(shù)據(jù)能通過協(xié)方差根號(hào)解釋雹姊。
對(duì)于這個(gè)數(shù)據(jù)股缸,我們可以用x軸方向計(jì)算出方差σ(x,x),用y軸方向計(jì)算出方差σ(y,y)吱雏。然而敦姻,數(shù)據(jù)的水平擴(kuò)展和垂直擴(kuò)展不能清晰解釋對(duì)角線上的相關(guān)性。圖二清晰表明坎背,整體而言替劈,如果數(shù)據(jù)點(diǎn)x值增加,那么y值也增加得滤,他們之間是正相關(guān)的陨献。我們將方差的概念擴(kuò)展為協(xié)方差時(shí),就能更好地解釋這種相關(guān)性懂更。

對(duì)于二維的數(shù)據(jù)眨业,我們可以得到σ(x,x),σ(y,y)沮协,σ(x,y)龄捡,σ(y,x)。這四個(gè)值可以匯總成一個(gè)矩陣慷暂,稱為協(xié)方差矩陣:
如果x正相關(guān)與y聘殖,那么y也同樣正相關(guān)與x;換句話說行瑞,σ(x,y)=σ(y,x)奸腺。因此,協(xié)方差矩陣通常都是一個(gè)對(duì)稱矩陣血久,其對(duì)角線上為方差突照,非對(duì)角線上為協(xié)方差。二維正態(tài)分布的數(shù)據(jù)完全由其均值和2x2的協(xié)方差矩陣解釋氧吐。同樣讹蘑,3x3的協(xié)方差矩陣用來解釋三維空間上的數(shù)據(jù),NxN的協(xié)方差矩陣用來解釋N維的空間數(shù)據(jù)筑舅。

圖三說明了數(shù)據(jù)的整體形狀和協(xié)方差矩陣之間的關(guān)系
圖三.協(xié)方差矩陣與數(shù)據(jù)形狀之間的關(guān)系座慰。對(duì)角線用協(xié)方差解釋,坐標(biāo)軸方向用方差解釋豁翎。

協(xié)方差矩陣的特征值特點(diǎn)

在下一節(jié)中角骤,我們將討論如何將協(xié)方差矩陣解釋為將白數(shù)據(jù)轉(zhuǎn)換為我們能夠觀察數(shù)據(jù)的線性算子。在深入研究技術(shù)細(xì)節(jié)之前心剥,重要的是要去直觀地了解特征向量和特征值如何去唯一地定義協(xié)方差矩陣邦尊,從而確定數(shù)據(jù)的形狀。

正如圖三所示优烧,協(xié)方差矩陣同時(shí)定義了我們數(shù)據(jù)的大胁踝帷(方差量)和方向(協(xié)方差量)。所以畦娄,如果我們想用一個(gè)向量及其大小來表示協(xié)方差矩陣又沾,我們應(yīng)該簡(jiǎn)單嘗試找到數(shù)據(jù)最大的擴(kuò)展方向,其大小等于在此方向上的(方差)熙卡。

【注:翻譯得不怎么好杖刷。我傾向于采用PCA的理解:找到最大的投影方差以表示整個(gè)投影矩陣】

換句話說,協(xié)方差最大的特征向量永遠(yuǎn)指向能夠使得投影方差最大的方向驳癌,其方向向量大小剛好等于對(duì)應(yīng)的特征值滑燃。第二大的特征向量總是與第一大特征向量正交,并指向數(shù)據(jù)第二大擴(kuò)展方向颓鲜。

【注:事實(shí)上表窘,我對(duì)這個(gè)方差表示不熟悉,只能推出其值與特征值相同甜滨,但是其是否是最大存疑乐严。】

下面我們將舉例說明:

如果協(xié)方差矩陣是對(duì)角矩陣衣摩,即協(xié)方差全為0昂验,這就意味著常查等于特征值λ。如圖四 艾扮,其中特征向量用綠色和品紅區(qū)分既琴,可以明顯看出特征值等于協(xié)方差矩陣的方差分量。
圖四.協(xié)方差矩陣的特征向量及特征值
然而栏渺,如果協(xié)方差矩陣不是對(duì)角矩陣呛梆,情況就會(huì)變得復(fù)雜一些。特征值依然表示在最大擴(kuò)展方向上的方差幅度磕诊,同時(shí)填物,協(xié)方差的方差分量依然表示數(shù)據(jù)關(guān)于x軸和y軸的方差幅度大小。因?yàn)檫@些數(shù)據(jù)不再是軸對(duì)稱的霎终,所以這些值不再相同滞磺。
特征值和方差

通過比較圖四和圖五,特征值表示數(shù)據(jù)隨特征向量方向的方差莱褒,同時(shí)击困,協(xié)方差的方差分量表示沿著坐標(biāo)軸的擴(kuò)散。如果不存在相關(guān)性,那么兩個(gè)值都應(yīng)該相等阅茶。

原文:A geometric interpretation of the covariance matrix

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末蛛枚,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子脸哀,更是在濱河造成了極大的恐慌蹦浦,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,378評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件撞蜂,死亡現(xiàn)場(chǎng)離奇詭異盲镶,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)蝌诡,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門溉贿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人浦旱,你說我怎么就攤上這事宇色。” “怎么了闽寡?”我有些...
    開封第一講書人閱讀 152,702評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵代兵,是天一觀的道長。 經(jīng)常有香客問我爷狈,道長植影,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,259評(píng)論 1 279
  • 正文 為了忘掉前任涎永,我火速辦了婚禮思币,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘羡微。我一直安慰自己谷饿,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,263評(píng)論 5 371
  • 文/花漫 我一把揭開白布妈倔。 她就那樣靜靜地躺著博投,像睡著了一般。 火紅的嫁衣襯著肌膚如雪盯蝴。 梳的紋絲不亂的頭發(fā)上毅哗,一...
    開封第一講書人閱讀 49,036評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音捧挺,去河邊找鬼虑绵。 笑死,一個(gè)胖子當(dāng)著我的面吹牛闽烙,可吹牛的內(nèi)容都是我干的翅睛。 我是一名探鬼主播,決...
    沈念sama閱讀 38,349評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼捕发!你這毒婦竟也來了疏旨?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,979評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤爬骤,失蹤者是張志新(化名)和其女友劉穎充石,沒想到半個(gè)月后莫换,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體霞玄,經(jīng)...
    沈念sama閱讀 43,469評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,938評(píng)論 2 323
  • 正文 我和宋清朗相戀三年拉岁,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了坷剧。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,059評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡喊暖,死狀恐怖惫企,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情陵叽,我是刑警寧澤狞尔,帶...
    沈念sama閱讀 33,703評(píng)論 4 323
  • 正文 年R本政府宣布,位于F島的核電站巩掺,受9級(jí)特大地震影響偏序,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜胖替,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,257評(píng)論 3 307
  • 文/蒙蒙 一研儒、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧独令,春花似錦端朵、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,262評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至招狸,卻和暖如春敬拓,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評(píng)論 1 262
  • 我被黑心中介騙來泰國打工濒憋, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留囱稽,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,501評(píng)論 2 354
  • 正文 我出身青樓翰意,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子冀偶,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,792評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容