【機(jī)器學(xué)習(xí)筆記(一)】之線性回歸公式推導(dǎo)

一. 線性回歸

? ? ? ?舉例:以年齡和工資為參數(shù)堵泽,預(yù)測可以從銀行貸款的金額修己。假設(shè)θ1是年齡的參數(shù)暇矫,θ2是工資的參數(shù)悍赢。通過提供的年齡和工資參數(shù)构资,對貸款額度進(jìn)行預(yù)測泵殴。x是輸入的年齡和工資值巷折,通過線性回歸來擬合平面炭庙。
h_{\theta }(x) = \theta_{0} + \theta_{1}x_{1}+ \theta_{2}x_{2}(\theta_{0}是偏置項)

? ? ? ?可以看到先嬉,上式中存在著偏置項,它與另外兩項的格式不太相符光督,為了便于之后的矩陣運(yùn)算阳距,我們可以將偏置項對應(yīng)的x值全都設(shè)為1,這樣结借,三項的格式就統(tǒng)一了筐摘,也方便于后面矩陣的計算。
h_{\theta}(x) = \sum_{i=0}^{n}\theta_{i}x_{i} = \theta^{T}x

二. 誤差

? ? ? ?真實(shí)值和預(yù)測值之間肯定是存在著差異的船老。誤差如下:
對于每個樣本:y^{(i)} = \theta^{T}x^{(i)} + \varepsilon ^{(i)}

? ? ? ?誤差是獨(dú)立并且具有相同的分布咖熟,并且服從高斯分布
? ? ? ?以下式子是誤差的高斯分布概率:
p(\varepsilon ^{(i)}) = \frac{1}{\sqrt{2\pi}\sigma }exp(-\frac{(\epsilon ^{(i)})^{2}}{2\sigma ^{2}})
? ? ? ?思考:我們的需求是提供年齡和工資的值柳畔,系統(tǒng)將我們可以貸款的金額預(yù)測出來馍管。而要實(shí)現(xiàn)這一過程,需要地就是年齡和工資的參數(shù)值θ薪韩,這是我們要求的參數(shù)确沸。而如何將上式與θ聯(lián)系起來呢?將預(yù)測值與誤差的式子(下式)左右相減代入誤差的高斯分布式子中躬存,便可以得到θ相關(guān)的式子:
y^{(i)} = \theta^{T}x^{(i)} + \varepsilon ^{(i)}

? ? ? ?將上式代入高斯分布概率式子可以得到以下式子:
p(y^{(i)}|x^{(i)};\theta) = \frac{1}{\sqrt{2\pi}\sigma }exp(-\frac{(y^{(i)} - \theta^{T}x^{(i)})^2}{2\sigma ^{2}})

三. 似然函數(shù)

? ? ? ?得到上式后张惹,我們就要思考我們想要獲得的結(jié)果是對y值的準(zhǔn)測估計,即預(yù)測值與真實(shí)值越接近越好岭洲,而這需要的是對參數(shù)的求解宛逗。即什么樣的參數(shù)和數(shù)據(jù)組合才能更加接近真實(shí)的輸出?這時盾剩,我們就想到了似然函數(shù)雷激。似然函數(shù),做的就是這樣一類事情告私,通過數(shù)據(jù)樣本來推導(dǎo)出什么樣的參數(shù)能夠預(yù)測出真實(shí)值屎暇。
L(\theta) = \prod_{i=1}^{m}p(y^{(i)}|x^{(i)};\theta) = \prod_{i=1}^{m}\frac{1}{\sqrt{2\pi}\sigma }exp(-\frac{(y^{(i)} - \theta^Tx^{(i)})^{2}}{2\sigma ^{2}})

? ? ? ?上式即是θ參數(shù)的似然函數(shù),由于誤差是服從高斯分布的驻粟,分布在真實(shí)值的兩邊根悼,那么誤差的p值越大,誤差就越趨近于0蜀撑,即預(yù)測值與真實(shí)值的差距越小挤巡。這是我們所希望得到的結(jié)果,因此似然函數(shù)中p值的連乘當(dāng)然是越大越好酷麦,即極大似然估計矿卑。

(一). 如何求解極大似然估計呢?

1. 先求對數(shù)

? ? ? ?由于似然函數(shù)中都是連乘沃饶,很難計算母廷,想到求對數(shù)后式子變?yōu)榧臃ㄟ\(yùn)算更加簡單轻黑。
logL(\theta) = log\prod_{i=1}^{m}\frac{1}{\sqrt{2\pi}\sigma }exp(-\frac{(y^{(i)} - \theta^Tx^{(i)})^{2}}{2\sigma ^{2}})

? ? ? ?展開化簡后的式子如下:
\sum_{i=1}^{m}log\frac{1}{\sqrt{2\pi}\sigma }exp(-\frac{(y^{(i)} - \theta^{T}x^{(i)})^{2}}{2\sigma ^{2}}) = mlog\frac{1}{\sqrt{2\pi}\sigma } - \frac{1}{\sigma ^{2}}\cdot \frac{1}{2}\sum_{i=1}^{m}(y^{(i)} - \theta^{T}x^{(i)})^{2}

2. 我們的目標(biāo)時讓似然函數(shù)的值越大越好

? ? ? ?從上式可以看出,前面一段是常數(shù)琴昆,因此只要后面一段的值越小越好氓鄙。可以從后一段式子看出椎咧,除去常數(shù)值玖详,可以簡化為下式:
J(\theta) = \frac{1}{2}\sum_{i=1}^{m}(y^{(i)} - \theta^{T}x^{(i)})^{2}

? ? ? ?這個式子可以用最小二乘法來求解。
首先勤讽,將平方項的求和轉(zhuǎn)換為矩陣的乘積,即矩陣的轉(zhuǎn)置乘以矩陣自身拗踢,平方項即誤差值脚牍。
\frac{1}{2}(X\theta - y)^{T}(X\theta - y)

? ? ? ?然后將矩陣的轉(zhuǎn)置展開

\frac{1}{2}(\theta^{T}X^{T} - y^{T})(X\theta - y)
? ? ? ?將兩個乘式展開,
\frac{1}{2}(\theta^{T}X^{T}X\theta - \theta^{T}X^{T}y - y^{T}X\theta + y^{T}y)

? ? ? ?要想求式子的最小值巢墅,一般是求式子的極值點(diǎn)诸狭,參數(shù)為θ,因此對θ求偏導(dǎo)君纫。

\frac{1}{2}(2X^{T}X\theta - X^{T}y - (y^{T}X)^{T}) = X^{T}X\theta - X^{T}y
? ? ? ?偏導(dǎo)等于0驯遇,可求出θ的值為
\theta = (X^{T}X)^{-1}X^{T}y

? ? ? ?至此,θ這個參數(shù)的值已被求出蓄髓,線性回歸的式子也因此求出叉庐。這就是去求解線性回歸參數(shù)的全過程
不過会喝,求得參數(shù)后我們需要對線性回歸的效果進(jìn)行評估陡叠,最常用的評估方法如下:
R^{2}:1- \frac{\sum_{i=1}^{m}(\hat{y_{i}} - y_{i})^{2}(殘差平方和)}{\sum_{i=1}^{m}(y_{i} - \bar{y})^{2}(類似方差項)}

? ? ? ?上式右邊的分子為預(yù)測值與真實(shí)值的差距的平方和分母為真實(shí)值與平均值的差距的平方和肢执,所以上式評估的取值越接近于1枉阵,可以認(rèn)為模型擬合效果越好。



? ? ? ?關(guān)注公號【開發(fā)小鴿】预茄,獲取海量計算機(jī)視覺與深度學(xué)習(xí)資源兴溜,實(shí)戰(zhàn)項目源碼,最新論文下載耻陕,大廠面試經(jīng)驗(yàn)W净铡!淮蜈!?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末斋攀,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子梧田,更是在濱河造成了極大的恐慌淳蔼,老刑警劉巖侧蘸,帶你破解...
    沈念sama閱讀 210,914評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異鹉梨,居然都是意外死亡讳癌,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,935評論 2 383
  • 文/潘曉璐 我一進(jìn)店門存皂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來晌坤,“玉大人,你說我怎么就攤上這事旦袋≈璨ぃ” “怎么了?”我有些...
    開封第一講書人閱讀 156,531評論 0 345
  • 文/不壞的土叔 我叫張陵疤孕,是天一觀的道長商乎。 經(jīng)常有香客問我,道長祭阀,這世上最難降的妖魔是什么鹉戚? 我笑而不...
    開封第一講書人閱讀 56,309評論 1 282
  • 正文 為了忘掉前任,我火速辦了婚禮专控,結(jié)果婚禮上抹凳,老公的妹妹穿的比我還像新娘。我一直安慰自己伦腐,他們只是感情好赢底,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,381評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著蔗牡,像睡著了一般颖系。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上辩越,一...
    開封第一講書人閱讀 49,730評論 1 289
  • 那天嘁扼,我揣著相機(jī)與錄音,去河邊找鬼黔攒。 笑死趁啸,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的督惰。 我是一名探鬼主播不傅,決...
    沈念sama閱讀 38,882評論 3 404
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼赏胚!你這毒婦竟也來了访娶?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,643評論 0 266
  • 序言:老撾萬榮一對情侶失蹤觉阅,失蹤者是張志新(化名)和其女友劉穎崖疤,沒想到半個月后秘车,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,095評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡劫哼,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,448評論 2 325
  • 正文 我和宋清朗相戀三年叮趴,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片权烧。...
    茶點(diǎn)故事閱讀 38,566評論 1 339
  • 序言:一個原本活蹦亂跳的男人離奇死亡眯亦,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出般码,到底是詐尸還是另有隱情妻率,我是刑警寧澤,帶...
    沈念sama閱讀 34,253評論 4 328
  • 正文 年R本政府宣布侈询,位于F島的核電站舌涨,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏扔字。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,829評論 3 312
  • 文/蒙蒙 一温技、第九天 我趴在偏房一處隱蔽的房頂上張望革为。 院中可真熱鬧,春花似錦舵鳞、人聲如沸震檩。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,715評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽抛虏。三九已至,卻和暖如春套才,著一層夾襖步出監(jiān)牢的瞬間迂猴,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,945評論 1 264
  • 我被黑心中介騙來泰國打工背伴, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留沸毁,地道東北人。 一個月前我還...
    沈念sama閱讀 46,248評論 2 360
  • 正文 我出身青樓傻寂,卻偏偏與公主長得像息尺,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子疾掰,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,440評論 2 348