從投影、正交補(bǔ)角度證明(推導(dǎo))最小二乘法公式

學(xué)習(xí)線性回歸的時(shí)候蒋失,會(huì)教我們X\theta=y可以直接用最小二乘法直接把\theta求出來(lái):

\theta=(X^TX)^{-1}X^Ty

并且還在我之前的博文里直接應(yīng)用了一番(那是根據(jù)公式來(lái)應(yīng)用,即如何構(gòu)建正確的A和y桐玻,從而應(yīng)用公式直接求解\theta)篙挽,里面還引了一篇詳實(shí)的證明文章。

首先镊靴,在吳恩達(dá)的教材里铣卡,這個(gè)并不叫最小二乘(least suqare),而是叫Normal Equation method偏竟,這個(gè)不重要煮落,畢竟在可汗學(xué)院的教材里,又叫最小二乘了^^踊谋。今天補(bǔ)充的內(nèi)容蝉仇,就是在回顧之前的筆記的時(shí)候,發(fā)現(xiàn)了大量的證明和應(yīng)用這個(gè)公式的地方,而且全是在引入了投影(Projection)概念之后轿衔。因?yàn)槟莻€(gè)時(shí)候并沒(méi)有接觸機(jī)器學(xué)習(xí)沉迹,看了也就看了,現(xiàn)在看到了應(yīng)用場(chǎng)景害驹,那就閉環(huán)了鞭呕,回顧一下:

首先,預(yù)備知識(shí)

子空間

image.png

筆記很清楚了宛官,對(duì)于一個(gè)矩陣
A= \begin{bmatrix} -2 & -1 & -3 \\ 4 & 2 & 6 \\ \end{bmatrix} 它的列空間是自然是C(A)葫松,行空間自然是A的轉(zhuǎn)置的后的列空間,然后各自擁有一個(gè)對(duì)應(yīng)的零空間(即求解Ax=0, A^Tx=0)

上圖用紅框框出來(lái)的部分即是具體這個(gè)矩陣A的四個(gè)子空間底洗。同時(shí)进宝,擁有如下性質(zhì):

  1. C(A)N(A^T)正交(orthogonal),即列空間與左零空間正交
  2. C(A^T)N(A)正交枷恕,即行空間與零空間正交

正交補(bǔ)

V^\bot = \{\vec x \in \R^n | \vec x \cdot \vec{v} = 0\; for\; every\ \vec{v} \in V \text{\}} 即V的正交補(bǔ)為垂直于V內(nèi)任意一個(gè)向量的所有向量党晋。

那么:

  • C(A) = (N(A^T))^\bot
  • C(A^T) = (N(A))^\bot

投影是一個(gè)線性變換

image.png

這里已經(jīng)看到我們熟悉的(A^TA)^{-1}A^Tx了,我們來(lái)看一下推導(dǎo)過(guò)程:

  1. \vec xV \in \R^n上的投影Proj_V^{\vec x} = \vec v必然能表示成該空間的basis{\vec b_1, \vec b_2, \vec b_3, \dots}的線性變換:\vec v \in V = y_1\vec b_1 + y_2\vec b_2 + \cdots + y_k \vec b_k = A\vec y
  2. 求出\vec y則求出了這個(gè)投影在哪里
  3. \vec x能向V投影徐块,自然也能向V^\bot投影(\vec w)
  • 這里是故意這么說(shuō)的未玻,強(qiáng)調(diào)都是投影,其實(shí)在向V投影時(shí)胡控,在V^\bot的投影(\vec w)就是那條垂線
  1. V \Rightarrow C(A),\; V^\bot \Rightarrow N(A^T), \vec v \in V, \vec w \in V^\bot
  2. 左零空間只不過(guò)是轉(zhuǎn)置的零空間扳剿,那么零空間的特性是什么呢?即A\vec x = 0的空間昼激,那么\vec w在左零空間里庇绽,意味著: A^T\vec w = 0
  3. \vec w = \vec x - \vec v = \vec x - A\vec y \Rightarrow A^T(\vec x - A\vec y) = 0 \Rightarrow A^T \vec x = A^TA\vec y
  4. 只要A^TA可逆的話: \Rightarrow \vec y= (A^TA)^{-1}A^T\vec x
  5. \therefore Proj_V^{\vec x} = A\vec y = A(A^TA)^{-1}A^T\vec x
  6. 得證\vec xV上的投影就是一個(gè)線性變換
  7. \vec y即是機(jī)器學(xué)習(xí)中我們需要學(xué)習(xí)到的系數(shù) = (A^TA)^{-1}A^T

最小二乘逼近

由此到了下一課,the lease squares approximation橙困,講的就是A\vec x = \vec b無(wú)解時(shí)瞧掺,意思就是在\vec b不存在A的張成子空間中,所以無(wú)論進(jìn)行怎樣的線性變換凡傅,都是不可能得到\vec b的辟狈,則取\vec xC(A)中的投影作為近似的解(證明就不再展開了)

image.png

仍然用的是同一個(gè)思路,即"垂線在左零空間中"夏跷,來(lái)構(gòu)造A^T\cdot \vec w = \vec 0

應(yīng)用最小二乘擬合一條回歸線

這里終于講到了與機(jī)器學(xué)習(xí)最接近的內(nèi)容:regression

image.png

可以看到哼转,毫無(wú)業(yè)務(wù)思維的花花腸子,很多機(jī)器學(xué)習(xí)課程里會(huì)花大量工夫從感性到理性上給你講這些內(nèi)容槽华,因?yàn)樗钠谕麖?跟你講清楚壹蔓,而在循序漸進(jìn)的數(shù)學(xué)理論體系里,這些根本就不需要關(guān)聯(lián)感性認(rèn)識(shí)的猫态,什么每年的房?jī)r(jià)啊佣蓉,數(shù)學(xué)關(guān)注的只是建模披摄。

這個(gè)回歸實(shí)例里,因?yàn)樾枰獢M合的是一條直線:y = b + ax偏螺,那么既有的數(shù)據(jù)就成了機(jī)器學(xué)習(xí)里的“樣本”行疏,但我們這里不需要這么理解,而是直接理解為矩陣套像,得到
方程組:
\begin{cases} b + a = 1 \\ b + 2a = 2 \\ b + 3a = 2 \end{cases}
提取矩陣:
A = \begin{bmatrix}1&1\\1& 2\\ 1& 3\end{bmatrix}, \vec b = \begin{bmatrix}1\\2\\ 2\end{bmatrix} \Rightarrow A\vec x = \vec b

好了酿联,在上面提到的這篇博文里,我們不明就里地直接用了公式夺巩,已知A和b求變換矩陣M(即這里的\vec x)贞让,還當(dāng)成是機(jī)器學(xué)習(xí)的內(nèi)容,而現(xiàn)在我們已經(jīng)知道自己是在做什么柳譬,就是找b在A的張成子空間里的投影喳张,就能得到最近似的解

\vec x \approx (A^TA)^{-1}A^T\vec b

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市美澳,隨后出現(xiàn)的幾起案子销部,更是在濱河造成了極大的恐慌,老刑警劉巖制跟,帶你破解...
    沈念sama閱讀 217,907評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件舅桩,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡雨膨,警方通過(guò)查閱死者的電腦和手機(jī)擂涛,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,987評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)聊记,“玉大人撒妈,你說(shuō)我怎么就攤上這事∨偶啵” “怎么了狰右?”我有些...
    開封第一講書人閱讀 164,298評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)社露。 經(jīng)常有香客問(wèn)我挟阻,道長(zhǎng),這世上最難降的妖魔是什么峭弟? 我笑而不...
    開封第一講書人閱讀 58,586評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮脱拼,結(jié)果婚禮上瞒瘸,老公的妹妹穿的比我還像新娘。我一直安慰自己熄浓,他們只是感情好情臭,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,633評(píng)論 6 392
  • 文/花漫 我一把揭開白布省撑。 她就那樣靜靜地躺著,像睡著了一般俯在。 火紅的嫁衣襯著肌膚如雪竟秫。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,488評(píng)論 1 302
  • 那天跷乐,我揣著相機(jī)與錄音肥败,去河邊找鬼。 笑死愕提,一個(gè)胖子當(dāng)著我的面吹牛馒稍,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播浅侨,決...
    沈念sama閱讀 40,275評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼纽谒,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了如输?” 一聲冷哼從身側(cè)響起鼓黔,我...
    開封第一講書人閱讀 39,176評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎不见,沒(méi)想到半個(gè)月后澳化,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,619評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡脖祈,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,819評(píng)論 3 336
  • 正文 我和宋清朗相戀三年肆捕,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片盖高。...
    茶點(diǎn)故事閱讀 39,932評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡慎陵,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出喻奥,到底是詐尸還是另有隱情席纽,我是刑警寧澤,帶...
    沈念sama閱讀 35,655評(píng)論 5 346
  • 正文 年R本政府宣布撞蚕,位于F島的核電站润梯,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏甥厦。R本人自食惡果不足惜纺铭,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,265評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望刀疙。 院中可真熱鬧舶赔,春花似錦、人聲如沸谦秧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,871評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至锥累,卻和暖如春缘挑,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背桶略。 一陣腳步聲響...
    開封第一講書人閱讀 32,994評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工语淘, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人删性。 一個(gè)月前我還...
    沈念sama閱讀 48,095評(píng)論 3 370
  • 正文 我出身青樓亏娜,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親蹬挺。 傳聞我的和親對(duì)象是個(gè)殘疾皇子维贺,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,884評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 在很多時(shí)候,我們?cè)谇蠼夥匠虝r(shí)巴帮,如果A的列數(shù)太多溯泣,混入一些不準(zhǔn)確的數(shù)據(jù),此時(shí)方程時(shí)無(wú)解的榕茧,我們需要求解出最優(yōu)解垃沦。這時(shí)...
    AlbertLiDesign閱讀 4,945評(píng)論 0 8
  • 1. 預(yù)備知識(shí) 1.1從矩陣子空間角度理解矩陣向量乘 定義:設(shè)矩陣為的實(shí)數(shù)矩陣,則它的列空間為其所有列向量為基向量...
    Cvier閱讀 6,237評(píng)論 0 3
  • 首先給結(jié)論:對(duì)于樣本矩陣X用押,XXT肢簿;還是X的右奇異矩陣VT的前k近似VkT 一、PCA的實(shí)現(xiàn)過(guò)程 具體實(shí)施及推導(dǎo)過(guò)...
    ADO_AI閱讀 2,549評(píng)論 0 0
  • 投影矩陣: ① 如果向量 在的列空間里蜻拨,則投影結(jié)果 ② 如果垂直于的列空間(可買想象成一個(gè)平面)池充,此時(shí)離最近,即的...
    rascalpotato閱讀 305評(píng)論 0 2
  • 轉(zhuǎn)自:(數(shù)學(xué)概念)矩陣的逆咽瓷、偽逆、左右逆舰讹,最小二乘忱详,投影矩陣 - AndyJee - 博客園 主要內(nèi)容: 矩陣的逆...
    horu閱讀 6,232評(píng)論 1 4