線性回歸是機(jī)器學(xué)習(xí)中最基礎(chǔ)的算法砰粹,它研究的是樣本目標(biāo)和特征變量之間是否存在線性關(guān)系觅廓。
現(xiàn)在我們有506條有關(guān)波士頓房子的綜合數(shù)據(jù)兼搏,包括房子的價(jià)格巨缘、房子所在區(qū)的犯罪率秘症、黑人比例中姜、高速公路條數(shù)等宏粤。每條數(shù)據(jù)就是一個(gè)樣本删壮,房?jī)r(jià)就是目標(biāo)變量铐拐,其他數(shù)據(jù)可看作特征變量徘键。
線性回歸的步驟:
1,建立模型:確定目標(biāo)和特征變量遍蟋,建立方程
其中Y代表目標(biāo)(因變量)吹害,X為特征(自變量),W為需要計(jì)算的參數(shù)虚青。數(shù)學(xué)符號(hào)便利性:將Y=W*X+b中的b去掉它呀,X中增加一個(gè)值為1的特征變量
2,求解模型:正規(guī)方程法或者最小梯度法求解目標(biāo)函數(shù)
的最小值棒厘。
3纵穿,模型評(píng)估:計(jì)算決定系數(shù)。其計(jì)算公式為:
下面給出求解上述式子最小值的2種推導(dǎo)方法:正規(guī)方程和梯度下降奢人。
實(shí)例:波士頓房?jī)r(jià)預(yù)測(cè)
下面給出線性回歸模型谓媒,預(yù)測(cè)值和真實(shí)值的對(duì)比圖,其中模型的決定系數(shù)位0.7576何乎,說(shuō)明線性關(guān)系可以解釋房?jī)r(jià)的75.76%句惯。
源碼下載土辩,掃描關(guān)注微信訂閱號(hào)pythonfan, 獲取更多實(shí)例和代碼宗弯。