一元線性回歸——最小二乘法

從只含一個自變量X的情況開始,成為一元線性回歸。假定回歸模型為
Y=b0+b1X+e
b0,b1為未知參數(shù)视搏,b0為常數(shù)項或截距亥啦,b1為回歸系數(shù),e為隨機(jī)誤差喷鸽。實(shí)際工作中,也常使用變量變換法。即在散點(diǎn)圖與直線趨勢差距較大時异吻,設(shè)法對自變量乃至因變量進(jìn)行適當(dāng)?shù)淖儞Q,使變換后的散點(diǎn)圖更加接近與直線喜庞。這樣對變化后的新變量進(jìn)行線性回歸分析诀浪,再回到原變量。
假定Y = b0+b1X+e
л和э分別為x和y的算術(shù)平均延都,故可以改寫為Yi=β0+β1(Xi-л)+ei (i = 1,....,n)
其關(guān)系是β0=b0+b1л,β1=b1雷猪,故如估計了β0和β1,可以得到b0和b1的估計晰房。
當(dāng)X=Xi處取值為Yi,估計值我們有Γ表示求摇,這樣我們就有偏離Yi-Γ,我們當(dāng)然希望偏離越小越好殊者。衡量這種偏離大小的一個合理的單一指標(biāo)為他們的平方和(通過平方去掉符號的影響与境,若簡單求和,則正負(fù)偏離抵消了)

最優(yōu)猖吴,即導(dǎo)數(shù)等于0.

我們將這個平方和求導(dǎo)摔刁,且認(rèn)定該導(dǎo)數(shù)為0,得到的β0海蔽,β1,使得偏離最小共屈。

用線性代數(shù)的思想就是,假定輸入數(shù)據(jù)存在矩陣X中党窜,而回歸系數(shù)存放在向量w中拗引。那么對于給定的數(shù)據(jù)X1,預(yù)測結(jié)果將會通過Y1=(X.transpose)w給出。偏差的平方為


Paste_Image.png

如果對w求導(dǎo)幌衣,得到


Paste_Image.png

為求最優(yōu)矾削,令其等于0,則

Paste_Image.png

上述公式中包含


Paste_Image.png

因此這個方程只在逆矩陣存在的情況使用。因為矩陣的逆矩陣可能不存在怔软,因此必須要在代碼中對此作出判斷垦细。

用python進(jìn)行代碼的實(shí)現(xiàn)

from numpy import *
def loadDataSet(filename):
    numFeat = len(open(filename).readline().split(','))-1
    datMat = []; labelMat = []
    fr = open(filename)
    for line in fr.readlines():
        lineArr = []
        curLine = line.strip().split(',')
        for i in range(numFeat):
            lineArr.append(float(curLine[i]))
        datMat.append(lineArr)
        labelMat.append(float(curLine[-1]))
    return datMat,labelMat
def standRegres(xArr,yArr):
    xMat = mat(xArr);yMat = mat(yArr).T
    xTx = xMat.T*xMat
    if linalg.det(xTx) == 0.0:
        print("This matrix is singular, can not inverse")
        return
    ws = xTx.I * (xMat.T*yMat)
    return ws

xArr,yArr = loadDataSet('gmvusers3.csv')
print("xArr is ",xArr)
print("yArr is ",yArr)
ws = standRegres(xArr,yArr)
print(ws)
xMat = mat(xArr)
yMat = mat(yArr)
yHat =xMat*ws

import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_subplot(111)
ax.scatter(xMat[:,1].flatten().A[0],yMat.T[:,0].flatten().A[0])

xCopy = xMat.copy()
xCopy.sort(0)
yHat=xCopy*ws
ax.plot(xCopy[:,1],yHat,'b-')
print(corrcoef(yHat.T,yMat))
plt.show()

感謝高斯,或者勒讓德挡逼,歷史無法評說括改,但這種思想是一種用于數(shù)據(jù)擬合的霸氣方法。這個事情的精妙之處就是將數(shù)理統(tǒng)計和矩陣完美的結(jié)合在了一起家坎,通過矩陣對最小二乘法的描述嘱能,為數(shù)據(jù)擬合找到了簡單粗暴的路徑,線性回歸虱疏。

下面簡要列出梯度下降法和最小二乘法的主要區(qū)別

梯度下降法 最小二乘法
必須指定learning rate 無需指定learning rate
必須訓(xùn)練多次 無需訓(xùn)練多次
必須可逆XTX
對多維度數(shù)據(jù)效果好 多維度數(shù)據(jù)效果差(維度>1000)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末惹骂,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子做瞪,更是在濱河造成了極大的恐慌对粪,老刑警劉巖,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件装蓬,死亡現(xiàn)場離奇詭異著拭,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)牍帚,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進(jìn)店門儡遮,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人暗赶,你說我怎么就攤上這事鄙币。” “怎么了蹂随?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵十嘿,是天一觀的道長。 經(jīng)常有香客問我岳锁,道長绩衷,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任浸锨,我火速辦了婚禮,結(jié)果婚禮上版姑,老公的妹妹穿的比我還像新娘柱搜。我一直安慰自己,他們只是感情好剥险,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布聪蘸。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪健爬。 梳的紋絲不亂的頭發(fā)上控乾,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天,我揣著相機(jī)與錄音娜遵,去河邊找鬼蜕衡。 笑死,一個胖子當(dāng)著我的面吹牛设拟,可吹牛的內(nèi)容都是我干的慨仿。 我是一名探鬼主播,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼纳胧,長吁一口氣:“原來是場噩夢啊……” “哼镰吆!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起跑慕,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤万皿,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后核行,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體牢硅,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年钮科,在試婚紗的時候發(fā)現(xiàn)自己被綠了唤衫。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,161評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡绵脯,死狀恐怖佳励,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蛆挫,我是刑警寧澤赃承,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布,位于F島的核電站悴侵,受9級特大地震影響瞧剖,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜可免,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一抓于、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧浇借,春花似錦捉撮、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽肉康。三九已至,卻和暖如春灼舍,著一層夾襖步出監(jiān)牢的瞬間吼和,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工骑素, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留炫乓,地道東北人。 一個月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓砂豌,卻偏偏與公主長得像厢岂,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子阳距,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容