(轉(zhuǎn))奇異值分解(SVD)和主成分分析法(PCA)

奇異值分解(Singular Value Decomposition)

? ? 1.奇異值分解是矩陣分解的一種方法

? ? 2.特征值和特征向量:Ax=λx.矩陣的乘法最后可以用特征值來代替使用列粪,可以簡化很多運算梢褐。

? ? ? ? ①A必須是n×n的方陣狸捕;

? ? ? ? ②正常對方陣進行分解

? ? ? ? ③分解形式:A = W∑W的轉(zhuǎn)置

? ? 3.機器學習中大量數(shù)據(jù)集的行列不相同务嫡,即不是方陣,而是一個m×n的矩陣。SVD可以對矩陣進行分解键科。

? ? ? ? ①分解形式:A=UΣV的轉(zhuǎn)置浇衬,其中,A是m×n的矩陣十兢,U是m×m的矩陣趣竣,Σ是m×n的矩陣,V是n×n的矩陣旱物。

? ? ? ? ②U稱為左奇異變量遥缕,根據(jù)特征向量的求法,要求U特征向量必須是方陣宵呛,所以湊方陣,如下圖所示

? ? ? ? ③V稱為左奇異變量单匣,根據(jù)特征向量的求法,要求V特征向量必須是方陣宝穗,所以湊方陣,如下圖所示

? ? ? ? ? ? ④求解Σ特征值矩陣

? ? 4.矩陣的奇異值分解有什么意義户秤?

? ? ? ? ? ? ①SVD可以用于PCA降維,來做數(shù)據(jù)壓縮和去噪逮矛。也可以用于推薦算法鸡号,將用戶和喜好對應的矩陣做特征分解,進而得到隱含的用戶需求來做推薦须鼎。同時也可以用于NLP中的算法鲸伴,比如潛在語義索引(LSI)。

? ? 5.PCA降維晋控,需要找到樣本協(xié)方差矩陣XTX的最大的d個特征向量汞窗,然后用這最大的d個特征向量張成的矩陣來做低維投影降維。當樣本數(shù)多樣本特征數(shù)也多的時候糖荒,這個計算量是很大的杉辙。而SVD中求解非方陣矩陣,就是要求這個值,有一些SVD的實現(xiàn)算法可以不求先求出協(xié)方差矩陣XTX蜘矢,也能求出我們的右奇異矩陣V狂男。也就是說,我們的PCA算法可以不用做特征分解品腹,而是做SVD來完成岖食。這個方法在樣本量很大的時候很有效。實際上舞吭,scikit-learn的PCA算法的背后真正的實現(xiàn)就是用的SVD泡垃,而不是我們我們認為的暴力特征分解。

? ? 6.在處理數(shù)據(jù)集中左右奇異矩陣的作用:左奇異矩陣可以用于行數(shù)的壓縮羡鸥。相對的蔑穴,右奇異矩陣可以用于列數(shù)即特征維度的壓縮,也就是我們的PCA降維惧浴。

? ? 7.奇異值分解的優(yōu)點:SVD作為一個很基本的算法存和,在很多機器學習算法中都有它的身影,特別是在現(xiàn)在的大數(shù)據(jù)時代衷旅,由于SVD可以實現(xiàn)并行化捐腿,因此更是大展身手。

? ? 8.奇異值分解的缺點:分解出的矩陣解釋性往往不強柿顶,有點黑盒子的味道茄袖,不過這不影響它的使用.


主成分分析法(PCA)

? ? 1.概念:主成分分析(Principal components analysis,以下簡稱PCA)是最重要的降維方法之一嘁锯。在數(shù)據(jù)壓縮消除冗余和數(shù)據(jù)噪音消除等領域都有廣泛的應用宪祥。一般我們提到降維最容易想到的算法就是PCA.

? ? 2.作用:PCA顧名思義,就是找出數(shù)據(jù)里最主要的方面猪钮,用數(shù)據(jù)里最主要的方面來代替原始數(shù)據(jù)品山。具體的胆建,假如我們的數(shù)據(jù)集是n維的烤低,共有m個數(shù)據(jù)(x(1),x(2),...,x(m))(x(1),x(2),...,x(m))。我們希望將這m個數(shù)據(jù)的維度從n維降到n'維笆载,希望這m個n'維的數(shù)據(jù)集盡可能的代表原始數(shù)據(jù)集扑馁。我們知道數(shù)據(jù)從n維降到n'維肯定會有損失,但是我們希望損失盡可能的小

? ? 3.基于小于投影距離

? ? 4.基于最大投影方差



知識點補充:

? ? 1.協(xié)方差矩陣度量了兩個矩陣之間的相關性多大

? ? 2.方差度量了數(shù)據(jù)集的信息度凉驻,方差越大表示信息量越大腻要,數(shù)據(jù)比較隨機,信息熵越大涝登;方差越小表示信息量小雄家,數(shù)據(jù)比較統(tǒng)一,信息熵姓凸觥趟济;

? ? 3.特征值和特征向量求解方法:

????????????①定義:設A是n階矩陣乱投,如果數(shù)λ和n維非零列向量x使得關系式Ax=λx成立,那么顷编,這樣的數(shù)λ就稱為方陣A的特征值戚炫,非零向量x稱為A對應于特征值λ的特征向量

? ? ? ? ? ? ②對關系式進行變換:(A-λE)x=0 其中E為單位矩陣媳纬。這是n個未知數(shù)n個方程齊次線性方程組双肤,它有非零解充要條件系數(shù)行列式為0,即|A-λE|=0钮惠。帶入具體的數(shù)字或者符號茅糜,可以看出該式是以λ為未知數(shù)的一元n次方程,稱為方陣A的特征方程素挽,左端 |A-λE|是λ的n次多項式限匣,也稱為方陣A的特征多項式;



參考文獻

[1]?奇異值分解(SVD)原理與在降維中的應用

[2]?主成分分析(PCA)原理總結

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末毁菱,一起剝皮案震驚了整個濱河市米死,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌贮庞,老刑警劉巖峦筒,帶你破解...
    沈念sama閱讀 206,482評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異窗慎,居然都是意外死亡物喷,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,377評論 2 382
  • 文/潘曉璐 我一進店門遮斥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來峦失,“玉大人,你說我怎么就攤上這事术吗∥炯” “怎么了?”我有些...
    開封第一講書人閱讀 152,762評論 0 342
  • 文/不壞的土叔 我叫張陵较屿,是天一觀的道長隧魄。 經(jīng)常有香客問我,道長隘蝎,這世上最難降的妖魔是什么购啄? 我笑而不...
    開封第一講書人閱讀 55,273評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮嘱么,結果婚禮上狮含,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好几迄,可當我...
    茶點故事閱讀 64,289評論 5 373
  • 文/花漫 我一把揭開白布表蝙。 她就那樣靜靜地躺著,像睡著了一般乓旗。 火紅的嫁衣襯著肌膚如雪府蛇。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,046評論 1 285
  • 那天屿愚,我揣著相機與錄音汇跨,去河邊找鬼。 笑死妆距,一個胖子當著我的面吹牛穷遂,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播娱据,決...
    沈念sama閱讀 38,351評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼蚪黑,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了中剩?” 一聲冷哼從身側響起忌穿,我...
    開封第一講書人閱讀 36,988評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎结啼,沒想到半個月后掠剑,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,476評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡郊愧,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,948評論 2 324
  • 正文 我和宋清朗相戀三年朴译,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片属铁。...
    茶點故事閱讀 38,064評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡眠寿,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出焦蘑,到底是詐尸還是另有隱情盯拱,我是刑警寧澤,帶...
    沈念sama閱讀 33,712評論 4 323
  • 正文 年R本政府宣布喇肋,位于F島的核電站坟乾,受9級特大地震影響迹辐,放射性物質(zhì)發(fā)生泄漏蝶防。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,261評論 3 307
  • 文/蒙蒙 一明吩、第九天 我趴在偏房一處隱蔽的房頂上張望间学。 院中可真熱鬧,春花似錦、人聲如沸低葫。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,264評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽嘿悬。三九已至实柠,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間善涨,已是汗流浹背窒盐。 一陣腳步聲響...
    開封第一講書人閱讀 31,486評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留钢拧,地道東北人蟹漓。 一個月前我還...
    沈念sama閱讀 45,511評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像源内,于是被迫代替她去往敵國和親葡粒。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,802評論 2 345

推薦閱讀更多精彩內(nèi)容