(機器學習)PCA 具體怎么做 Principal Components Analysis

1 PCA步驟

PCA指的是給定一組數(shù)據(jù)白对,對數(shù)據(jù)進行降維
它分5步:

  1. 計算特征的協(xié)方差矩陣
  2. 計算協(xié)方差矩陣的特征值
  3. 計算特征值對應的特征向量
  4. 選取最大的k個特征值(k是你要降到的維度)對應的特征向量組成一個新矩陣
  5. 數(shù)據(jù)矩陣先進行中心化(center)再乘特征向量矩陣,構成一個新矩陣,即為降維后的數(shù)據(jù)

2 一個例子

假設我們現(xiàn)在拿到的數(shù)據(jù)一共有3個數(shù)據(jù),分別是x_{1}, x_{2}, x_{3}, 其中每個數(shù)據(jù)有兩個特征:
x_{1} = \left[ \begin{matrix} -1 \\ 1 \end{matrix} \right], x_{2} = \left[ \begin{matrix} -1 \\ -1 \end{matrix} \right], x_{3} = \left[ \begin{matrix} 2 \\ 0 \end{matrix} \right]
那么,我們的特征可以構成一個新矩陣:
X = \left[ \begin{matrix} -1 & 1 \\ -1 & -1 \\ 2 & 0 \end{matrix} \right]

2.1 計算協(xié)方差矩陣

我們首先計算協(xié)方差矩陣:
cov = \frac {1}{n} X^{T}X
其中能真,n是樣本個數(shù),可得:
cov = \left[ \begin{matrix} 2 & 0 \\ 0 & \frac {2}{3} \end{matrix} \right]

2.2 計算特征值

接下來扰柠,計算特征向量粉铐, 令:
det(cov- \lambda E) = 0
其中E是單位陣,則有:
det\left[ \begin{matrix} 2-\lambda & 0 \\ 0 & \frac {2}{3}-\lambda \end{matrix} \right] = 0
解得:
\lambda_{1} = 2, \lambda_{2} = \frac {2}{3}

2.3 計算特征向量

求特征向量卤档,利用公式:
cov \times e_{1} = \lambda_{1} \times e_{1}
解得:
e_{1} = \left[ \begin{matrix} 1 \\ 0 \end{matrix} \right], e_{2} = \left[ \begin{matrix} 0 \\ 1 \end{matrix} \right]

2.4 選取k個特征向量

這里蝙泼,我們只能選1個特征向量了,因為數(shù)據(jù)本來是2維的劝枣,只能降到1維汤踏,所以就選擇
e_{1} = \left[ \begin{matrix} 1 \\ 0 \end{matrix} \right]

2.5 計算PCA后的數(shù)據(jù)

先對原始數(shù)據(jù)進行中心化织鲸,每個元素都減去它本列的均值,可得(和原來一樣溪胶,因為每一列均值是1)
X' = \left[ \begin{matrix} -1 & 1 \\ -1 & -1 \\ 2 & 0 \end{matrix} \right]
那么搂擦,PCA后的數(shù)據(jù):
P = X'e_{1}^{T} = \left[ \begin{matrix} -1 & 1 \\ -1 & -1 \\ 2 & 0 \end{matrix} \right] \left[ \begin{matrix} 1 \\ 0 \end{matrix} \right] = \left[ \begin{matrix} -1 \\ -1 \\ 2 \end{matrix} \right]

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市哗脖,隨后出現(xiàn)的幾起案子瀑踢,更是在濱河造成了極大的恐慌,老刑警劉巖才避,帶你破解...
    沈念sama閱讀 211,290評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件橱夭,死亡現(xiàn)場離奇詭異,居然都是意外死亡工扎,警方通過查閱死者的電腦和手機徘钥,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評論 2 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來肢娘,“玉大人呈础,你說我怎么就攤上這事〕鹘。” “怎么了而钞?”我有些...
    開封第一講書人閱讀 156,872評論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長拘荡。 經(jīng)常有香客問我臼节,道長,這世上最難降的妖魔是什么珊皿? 我笑而不...
    開封第一講書人閱讀 56,415評論 1 283
  • 正文 為了忘掉前任网缝,我火速辦了婚禮,結果婚禮上蟋定,老公的妹妹穿的比我還像新娘粉臊。我一直安慰自己,他們只是感情好驶兜,可當我...
    茶點故事閱讀 65,453評論 6 385
  • 文/花漫 我一把揭開白布扼仲。 她就那樣靜靜地躺著,像睡著了一般抄淑。 火紅的嫁衣襯著肌膚如雪屠凶。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,784評論 1 290
  • 那天肆资,我揣著相機與錄音矗愧,去河邊找鬼。 笑死迅耘,一個胖子當著我的面吹牛贱枣,可吹牛的內容都是我干的监署。 我是一名探鬼主播颤专,決...
    沈念sama閱讀 38,927評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼纽哥,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了栖秕?” 一聲冷哼從身側響起春塌,我...
    開封第一講書人閱讀 37,691評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎簇捍,沒想到半個月后只壳,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,137評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡暑塑,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,472評論 2 326
  • 正文 我和宋清朗相戀三年吼句,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片事格。...
    茶點故事閱讀 38,622評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡惕艳,死狀恐怖,靈堂內的尸體忽然破棺而出驹愚,到底是詐尸還是另有隱情远搪,我是刑警寧澤,帶...
    沈念sama閱讀 34,289評論 4 329
  • 正文 年R本政府宣布逢捺,位于F島的核電站谁鳍,受9級特大地震影響,放射性物質發(fā)生泄漏劫瞳。R本人自食惡果不足惜倘潜,卻給世界環(huán)境...
    茶點故事閱讀 39,887評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望志于。 院中可真熱鬧涮因,春花似錦、人聲如沸恨憎。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽憔恳。三九已至瓤荔,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間钥组,已是汗流浹背输硝。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留程梦,地道東北人点把。 一個月前我還...
    沈念sama閱讀 46,316評論 2 360
  • 正文 我出身青樓橘荠,卻偏偏與公主長得像,于是被迫代替她去往敵國和親郎逃。 傳聞我的和親對象是個殘疾皇子哥童,可洞房花燭夜當晚...
    茶點故事閱讀 43,490評論 2 348

推薦閱讀更多精彩內容