SVD奇異值分解

奇異值分解(Singular Value Decomposition鉴裹,簡(jiǎn)稱為SVD)是機(jī)器學(xué)習(xí)中非尘独螅基礎(chǔ)的算法猖凛,主要用于數(shù)據(jù)降維绪穆,推薦系統(tǒng)以及自然語(yǔ)言處理等方面,本節(jié)內(nèi)容先來(lái)介紹其數(shù)學(xué)原理玖院。

特征值和特征向量

大學(xué)學(xué)過(guò)線性代數(shù),貌似我對(duì)奇異值分解也沒(méi)有什么印象试溯。奇異值究竟是個(gè)什么鬼遇绞,我們還得先從特征值和特征向量說(shuō)起燎窘。

Ax = \lambda x

其中是n\times n實(shí)對(duì)稱矩陣,為n維向量付鹿。實(shí)數(shù)\lambda 稱為矩陣蚜迅,而x稱為矩陣A的特征值\lambda對(duì)應(yīng)的特征向量。

求出特征值和特征向量有什么好處呢坐梯?我們就可以對(duì)矩陣進(jìn)行分解了刹帕。假設(shè)矩陣有n個(gè)特征值分別是\lambda_1\le \lambda_2 \le \cdots \le \lambda_n,對(duì)應(yīng)的特征向量為w_1, w_2, \cdots, w_n,記W = (w_1, w2, \cdots, w_n).

A = W \Sigma W^{-1}

如果W是正交矩陣,也就是說(shuō)其逆矩陣與轉(zhuǎn)置相等践瓷,那么矩陣分解可以寫成下面這樣:
A = W \Sigma W^{T}

前提是這個(gè)矩陣必須是方陣才能做這樣的分解院喜,如果這個(gè)矩陣不是方陣呢晕翠?那么這個(gè)時(shí)候就需要奇異值分解了。

奇異值分解

假設(shè)M是一個(gè)m×n階矩陣硫麻,其中的元素全部屬于實(shí)數(shù)域(不考慮復(fù)數(shù)域)拿愧。如此則存在一個(gè)分解使得

M=U\Sigma V^{T}

其中Um×m階酉矩陣浇辜;\Sigmam×n階非負(fù)實(shí)數(shù)對(duì)角矩陣唾戚;而V^T,即V的轉(zhuǎn)置叹坦,是n×n階酉矩陣熊镣。這樣的分解就稱作M的奇異值分解。\Sigma 對(duì)角線上的元素即為M的奇異值募书。常見(jiàn)的做法是將奇異值由大而小排列绪囱。如此\Sigma便能由M唯一確定了。(雖然U和V仍然不能確定)[1]

接下來(lái)就是計(jì)算這幾個(gè)矩陣了莹捡。我們知道M是一個(gè)m×n階矩陣鬼吵,那么M^T M就是n\times n階矩陣了

(M^T M)v_i = \lambda_i v_i

對(duì)M^TM 進(jìn)行分解,得到的特征值\lambda_i 組成的特征向量v_i.就得到了V=(v_1, v_2, \cdots, v_n)矩陣, 我們把這個(gè)矩陣每個(gè)向量記做矩陣M的右奇異向量。

同樣的操作我們分解M M^T這個(gè)矩陣
(M M^T)u_i = \lambda_i u_i

對(duì)MM^T 進(jìn)行分解,得到的特征值\lambda_i 組成的特征向量u_i.就得到了U=(u_1, u_2, \cdots, u_n)矩陣, 我們把這個(gè)矩陣每個(gè)向量記做矩陣M的左奇異向量道盏。

現(xiàn)在就差計(jì)算奇異值了,也就是這個(gè)對(duì)角矩陣\Sigma而柑。由于M=U\Sigma V^T那么
MV = U\Sigma V^TV=U\Sigma

M v_i= \sigma_i u_i

\sigma_i= M v_i/u_i

將這些奇異值\sigma _i按照大小排列得到的對(duì)角矩陣即為\Sigma=diag(\sigma_1, \sigma_2,\cdots,\sigma_n)

討論

對(duì)于矩陣M, 我們接下來(lái)討論一下它的秩rank(M)=r \le min(m,n),對(duì)于這種分解M=U_r\Sigma_rV_r^T稱為緊奇異值分解文捶;如果0<k<r稱為這種分解M=U_k\Sigma_k V_k ^T截?cái)嗥娈愔捣纸?/strong>,在應(yīng)用中提到的奇異值分解通常都是截?cái)嗥娈愔捣纸?sup>[2]种远。

對(duì)于數(shù)據(jù)壓縮來(lái)說(shuō)坠敷,緊奇異值分解是一種無(wú)損壓縮,而截?cái)嗥娈愔捣纸馐且环N有損壓縮粥帚,顧名思義芒涡,截?cái)嗥鋵?shí)就是舍棄了部分奇異值费尽,也就損失了部分特征旱幼。

歡迎關(guān)注我的微信公眾號(hào)“數(shù)學(xué)編程

參考


  1. 維基百科-奇異值分解 ?

  2. 李航.統(tǒng)計(jì)學(xué)習(xí)方法[M].第二版.北京:清華大學(xué)出版社,2019:271-277 ?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市闷旧,隨后出現(xiàn)的幾起案子忙灼,更是在濱河造成了極大的恐慌该园,老刑警劉巖里初,帶你破解...
    沈念sama閱讀 207,248評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異刁品,居然都是意外死亡浩姥,警方通過(guò)查閱死者的電腦和手機(jī)勒叠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,681評(píng)論 2 381
  • 文/潘曉璐 我一進(jìn)店門拌汇,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)噪舀,“玉大人傅联,你說(shuō)我怎么就攤上這事蒸走”茸ぃ” “怎么了别惦?”我有些...
    開封第一講書人閱讀 153,443評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵氯庆,是天一觀的道長(zhǎng)堤撵。 經(jīng)常有香客問(wèn)我羽莺,道長(zhǎng)盐固,這世上最難降的妖魔是什么刁卜? 我笑而不...
    開封第一講書人閱讀 55,475評(píng)論 1 279
  • 正文 為了忘掉前任溪北,我火速辦了婚禮之拨,結(jié)果婚禮上蚀乔,老公的妹妹穿的比我還像新娘吉挣。我一直安慰自己睬魂,他們只是感情好氯哮,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,458評(píng)論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著肠虽,像睡著了一般税课。 火紅的嫁衣襯著肌膚如雪伯复。 梳的紋絲不亂的頭發(fā)上啸如,一...
    開封第一講書人閱讀 49,185評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音妇汗,去河邊找鬼。 笑死寞焙,一個(gè)胖子當(dāng)著我的面吹牛辽狈,可吹牛的內(nèi)容都是我干的刮萌。 我是一名探鬼主播娘扩,決...
    沈念sama閱讀 38,451評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼着茸,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了琐旁?” 一聲冷哼從身側(cè)響起涮阔,我...
    開封第一講書人閱讀 37,112評(píng)論 0 261
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎灰殴,沒(méi)想到半個(gè)月后澎语,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,609評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡验懊,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,083評(píng)論 2 325
  • 正文 我和宋清朗相戀三年擅羞,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片义图。...
    茶點(diǎn)故事閱讀 38,163評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡减俏,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出娃承,到底是詐尸還是另有隱情,我是刑警寧澤怕篷,帶...
    沈念sama閱讀 33,803評(píng)論 4 323
  • 正文 年R本政府宣布廊谓,位于F島的核電站,受9級(jí)特大地震影響匿沛,放射性物質(zhì)發(fā)生泄漏抡笼。R本人自食惡果不足惜蔫缸,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,357評(píng)論 3 307
  • 文/蒙蒙 一炭玫、第九天 我趴在偏房一處隱蔽的房頂上張望裙犹。 院中可真熱鬧,春花似錦衔憨、人聲如沸叶圃。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,357評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)掺冠。三九已至,卻和暖如春码党,著一層夾襖步出監(jiān)牢的瞬間赫舒,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,590評(píng)論 1 261
  • 我被黑心中介騙來(lái)泰國(guó)打工闽瓢, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留接癌,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,636評(píng)論 2 355
  • 正文 我出身青樓扣讼,卻偏偏與公主長(zhǎng)得像缺猛,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,925評(píng)論 2 344