機器學習_最小二乘法,線性回歸與邏輯回歸

1. 線性回歸

?線性回歸是利用數(shù)理統(tǒng)計中回歸分析疏唾,來確定兩種或兩種以上變量間相互依賴的定量關系的一種統(tǒng)計分析方法蓄氧。
?直觀地說,在二維情況下槐脏,已知一些點的X,Y坐標喉童,統(tǒng)計條件X與結果Y的關系,畫一條直線顿天,讓直線離所有點都盡量地近(距離之和最刑寐取),用直線抽象地表達這些點露氮,然后對新的X預測新的Y祖灰。具體實現(xiàn)一般使用最小二乘法。

線性回歸

?線性回歸的優(yōu)點是理解和計算都相對簡單畔规,缺點是無法解決非線性問題局扶。

2. 最小二乘法

1) 原理

?最小二乘法(ordinary least squares,簡稱OLS)的核心就是保證所有數(shù)據(jù)偏差的平方和最腥ā(“平方”的在古時侯的稱謂為“二乘”)三妈。
?我們用直線擬合一些點,直線方程是 y’=ax+b 莫绣,每點偏差是y-y’畴蒲,其中y是實際值,y’是估計值对室。sum((y-y’)^2) 最小時模燥,直線擬合最好。上試代入y’掩宜,可得 M=sum((y-(ax+b))^2) 蔫骂,對它求導取極值。此時牺汤,x,y是已知的辽旋,未知的是a和b,所以分別求M對a和b的偏導檐迟,解出的a,b即回歸系數(shù)补胚,記作W。線性回歸就是計算參數(shù)W的過程追迟。有了W溶其,就能將Y表示成多屬性的加權線性組合。
?假設有兩個變量(多元回歸)y’=w0+w1x1+w2x2怔匣,就變成了一個三維的問題握联,同樣也用誤差平方最小的方法M=sum((y’-(w0+w1x1+w2x2))^2)桦沉,M對w0,w1,w2的偏導為0處是極值,然后解出w0,w1,w2金闽。更多元的情況見下面的公式推導纯露。
?預測時,用回歸系數(shù)乘以輸入值代芜,再將結果加在一起就得到了預測值埠褪,一般用矩陣乘法實現(xiàn)。

2) 公式推導

?通過矩陣運算求解回歸系數(shù)的W={w0,w1,w2…}


3. 線性回歸代碼實現(xiàn)

# -*- coding: utf-8 -*-

import numpy as np
import matplotlib.pyplot as plt

# 訓練
def standRegres(xArr,yArr):  
    m,n = np.shape(xArr)
    xMat = np.mat(np.ones((m, n+1))) # 加第一列設為1挤庇,為計算截距
    x = np.mat(xArr)
    xMat[:,1:n+1] = x[:,0:n];
    yMat = np.mat(yArr).T  
    xTx = xMat.T*xMat  
    if np.linalg.det(xTx) == 0.0:  
        print("This matrix is sigular, cannot do inverse") #行列式的值為0钞速,無逆矩陣
        return  
    ws = xTx.I*(xMat.T*yMat)  
    return ws  

# 預測
def predict(xArr, ws):
    m,n = np.shape(xArr)
    xMat = np.mat(np.ones((m, n+1))) # 加第一列設為1, 為計算截距
    x = np.mat(xArr)
    xMat[:,1:n+1] = x[:,0:n];
    return xMat*ws

if __name__ == '__main__':
    x = [[1], [2], [3], [4]]
    y = [4.1, 5.9, 8.1, 10.1]
    ws = standRegres(x,y)
    print(ws)
    print(predict([[5]], ws))

    # 畫圖
    plt.scatter(x, y, s=20)
    yHat = predict(x, ws)
    plt.plot(x, yHat, linewidth=2.0, color='red') 
    plt.show()

?注意:回歸系數(shù)的個數(shù)應該比屬性多一個,用于表示截距嫡秕,在sklearn中也是這樣渴语,只不過截距相關的放在intercept_中,其它放在coef_中昆咽。

4. 邏輯回歸

?邏輯回歸驾凶,也叫邏輯斯蒂回歸,logistic regression掷酗。
?有監(jiān)督學習常分成:分類和回歸调违,不要一聽xx回歸,以為就是預測具體值了泻轰,這里的“邏輯回歸”其實是個分類的方法技肩。之所以叫邏輯回歸,是因為最常見用它處理二分類問題浮声,即分類為0或1(邏輯值)虚婿。如圖所示,它是用一條直線泳挥,將實例分類雳锋。

邏輯回歸

?與線性回歸不同的只是這里的Y是分類0或1,而不是具體數(shù)值羡洁。所以它叫廣義線性模型。
?把具體數(shù)據(jù)對應成0,1的方法是sigmoid爽丹,sigmoid函數(shù)只能分兩類筑煮,而softmax能分多類,softmax是sigmoid的擴展粤蝎。

5. Sigmoid函數(shù)

?Sigmoid函數(shù)真仲,就是S型函數(shù),這就是一個數(shù)值和邏輯值間轉換的工具初澎,如下圖示秸应,它把X從負無窮到正無窮映射到Y的0-1之間虑凛。很多時候需要求極值,而0,1分類不是連續(xù)的软啼,不可導桑谍,所以用一個平滑的函數(shù)擬合邏輯值,因為用了它祸挪,所以這叫邏輯回歸锣披。


Sigmoid
最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市贿条,隨后出現(xiàn)的幾起案子雹仿,更是在濱河造成了極大的恐慌,老刑警劉巖整以,帶你破解...
    沈念sama閱讀 218,525評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件胧辽,死亡現(xiàn)場離奇詭異,居然都是意外死亡公黑,警方通過查閱死者的電腦和手機邑商,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,203評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來帆调,“玉大人奠骄,你說我怎么就攤上這事》” “怎么了含鳞?”我有些...
    開封第一講書人閱讀 164,862評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長芹务。 經(jīng)常有香客問我蝉绷,道長,這世上最難降的妖魔是什么枣抱? 我笑而不...
    開封第一講書人閱讀 58,728評論 1 294
  • 正文 為了忘掉前任熔吗,我火速辦了婚禮,結果婚禮上佳晶,老公的妹妹穿的比我還像新娘桅狠。我一直安慰自己,他們只是感情好轿秧,可當我...
    茶點故事閱讀 67,743評論 6 392
  • 文/花漫 我一把揭開白布中跌。 她就那樣靜靜地躺著,像睡著了一般菇篡。 火紅的嫁衣襯著肌膚如雪漩符。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,590評論 1 305
  • 那天驱还,我揣著相機與錄音嗜暴,去河邊找鬼凸克。 笑死,一個胖子當著我的面吹牛闷沥,可吹牛的內(nèi)容都是我干的萎战。 我是一名探鬼主播,決...
    沈念sama閱讀 40,330評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼狐赡,長吁一口氣:“原來是場噩夢啊……” “哼撞鹉!你這毒婦竟也來了?” 一聲冷哼從身側響起颖侄,我...
    開封第一講書人閱讀 39,244評論 0 276
  • 序言:老撾萬榮一對情侶失蹤鸟雏,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后览祖,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體孝鹊,經(jīng)...
    沈念sama閱讀 45,693評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,885評論 3 336
  • 正文 我和宋清朗相戀三年展蒂,在試婚紗的時候發(fā)現(xiàn)自己被綠了又活。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,001評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡锰悼,死狀恐怖柳骄,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情箕般,我是刑警寧澤耐薯,帶...
    沈念sama閱讀 35,723評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站丝里,受9級特大地震影響曲初,放射性物質發(fā)生泄漏。R本人自食惡果不足惜杯聚,卻給世界環(huán)境...
    茶點故事閱讀 41,343評論 3 330
  • 文/蒙蒙 一臼婆、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧幌绍,春花似錦颁褂、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,919評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至主儡,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間惨缆,已是汗流浹背糜值。 一陣腳步聲響...
    開封第一講書人閱讀 33,042評論 1 270
  • 我被黑心中介騙來泰國打工丰捷, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人寂汇。 一個月前我還...
    沈念sama閱讀 48,191評論 3 370
  • 正文 我出身青樓病往,卻偏偏與公主長得像,于是被迫代替她去往敵國和親骄瓣。 傳聞我的和親對象是個殘疾皇子停巷,可洞房花燭夜當晚...
    茶點故事閱讀 44,955評論 2 355

推薦閱讀更多精彩內(nèi)容