3.1 基本形式
給定由d個(gè)屬性的示例x=沪悲,其中是x在第i個(gè)屬性上的取值穷当,線性模型試圖學(xué)習(xí)一個(gè)通過屬性的線性組合來進(jìn)行預(yù)測的函數(shù):
?
或者
?
其中.
3.2 線性回歸
給定數(shù)據(jù)集,其中,線性回歸試圖學(xué)得:
我們采用均方誤差作為回歸任務(wù)的性能度量提茁,即
基于均方誤差最小化求解的方法稱為“最小二乘法"[c++實(shí)現(xiàn)],對w和b求導(dǎo):
令(3.5)和(3.6)為零可得到w和b的最優(yōu)解的閉式解
其中為x的均值
類似的馁菜,對于“多元線性回歸”同樣可以用最小二乘法求解
3.3 對數(shù)線性回歸
我們可以把線性回歸模型寫成甘凭,其中y代表由模型預(yù)測出的值,如果我們使模型去預(yù)測y的衍生物火邓,例如
這就是“對數(shù)線性回歸”丹弱,實(shí)際上就相當(dāng)于讓逼近y,實(shí)質(zhì)上是輸入空間的線性組合對輸出空間的一個(gè)映射铲咨,即
以上都在進(jìn)行回歸學(xué)習(xí)躲胳,如果要進(jìn)行分類的話,例如二分類任務(wù)纤勒,其輸出標(biāo)記為坯苹,如果要將轉(zhuǎn)換為0/1值,可以用階躍函數(shù):
如圖所示:
但階躍函數(shù)不連續(xù)摇天,于是我們用一個(gè)“替代函數(shù)”粹湃,例如對數(shù)幾率函數(shù):
上式可以寫為
其中,y表示x為正例的概率泉坐,1-y為x為反例的概率为鳄,則稱為“幾率”,為“對數(shù)幾率”