線性回歸及梯度下降法

  • 回歸分析:用來建立方程模擬兩個(gè)或者多個(gè)變量之間如何關(guān)聯(lián)
    被預(yù)測的變量叫:因變量,輸出
    用來進(jìn)行預(yù)測的變量叫:自變量持际,輸入


    hθ(x) = θ01x
    這個(gè)方程對應(yīng)的圖像是一條直線杰扫,稱為回歸線戴涝。其中,θ1為回歸線的斜率斋竞,θ0為回歸線的截距

  • 代價(jià)函數(shù)(cost Function)

  • 最小二乘法:

  • 真實(shí)值y倔约,預(yù)測值hθ(x),則誤差為(y-hθ(x))2

  • 找到合適的參數(shù)坝初,使得誤差平方和:
    \quad\quad\quad\quad\quad J(θ_0浸剩,θ_1) =\frac{1}{2m} \textstyle\sum_{i=1}^{m}(y^i-h_θ(x^i))^2 最小
    \quad\quad\quad\quad\quad【注:\frac{1}{2}可有可無钾军,主要是為了求導(dǎo)和平方的2抵消】

    線性回歸


  • 相關(guān)系數(shù)
    我們使用相關(guān)系數(shù)去衡量線性相關(guān)性的強(qiáng)弱
    \quad\quad\quad\quad\quad r_{xy} = \frac{\textstyle\sum(X_i-\bar{X})(Y_i-\bar{Y})}{\sqrt{\textstyle\sum(X_i-\bar{X})^2 \textstyle\sum(Y_i-\bar{Y})^2}}

  • 決定系數(shù)
    相關(guān)系數(shù)R(coefficient of determination)是用來描述兩個(gè)變量之間的線性關(guān)系的,但決定系數(shù)的適用范圍更廣绢要,可以用于描述非線性或者有兩個(gè)及兩個(gè)以上的相關(guān)關(guān)系吏恭。它可以用來評價(jià)模型的效果

\quad總平方和(SST) : \textstyle\sum_{i=1}^{n}(y_i-\bar{y})^2y_i是真實(shí)值,\bar{y}是真實(shí)值的平均值】
\quad回歸平方和(SSR) :\textstyle\sum_{i=1}^{n}(\hat{y}-\bar{y})^2\hat{y}是預(yù)測值】
\quad殘差平方和(SSE):\textstyle\sum_{i=1}^{n}(y_i-\hat{y})^2
\quad它們?nèi)叩年P(guān)系是:SST=SSR+SSE

\quad決定系數(shù): R^2 = \frac{SSR}{SST} = 1-\frac{SSE}{SST}R^2的值越接近1重罪,說明它們之間的關(guān)系越接近于線性的關(guān)系樱哼,越接近0就越不接近于線性關(guān)系】

  • 梯度下降法:
    有這么一個(gè)函數(shù) J(θ_0,θ_1)minJ(θ_0剿配,θ_1)
    \quad1. 初始化θ_0搅幅,θ_1
    \quad2. 不斷改變θ_0,θ_1呼胚,直到J(θ_0茄唐,θ_1) 到達(dá)全局最小值,或局部極小值
    圖1
圖2

θ_0砸讳,θ_1 取不同初始值的變化結(jié)果琢融,如圖1取值界牡,然后不斷改變θ_0簿寂,θ_1,直到J(θ_0宿亡,θ_1) 到達(dá)全局最小值常遂,如圖2取值,然后不斷改變θ_0挽荠,θ_1克胳,直到J(θ_0,θ_1) 到達(dá)局部極小值

repeat until convergence {
θ_j:= θ_j- α\frac{?}{?θ_j}J(θ_0圈匆,θ_1) (j=0 漠另,j=1)【α指的是學(xué)習(xí)率】
}

正確做法 :同步更新
temp0:= θ_j- α\frac{?}{?θ_j}J(θ_0,θ_1) (j=0 跃赚,j=1)
temp1:= θ_j- α\frac{?}{?θ_j}J(θ_0笆搓,θ_1) (j=0 ,j=1)
θ_0:=temp0
θ_1:=temp1

不正確做法:
temp0:= θ_j- α\frac{?}{?θ_j}J(θ_0纬傲,θ_1) (j=0 满败,j=1)
θ_0:=temp0
temp1:= θ_j- α\frac{?}{?θ_j}J(θ_0,θ_1) (j=0 叹括,j=1)
θ_1:=temp1

\quad現(xiàn)在假設(shè)只有一個(gè)參數(shù)θ_1算墨,公式如下,現(xiàn)在看圖3中的曲線汁雷,當(dāng)我們的染秽帧①處的θ_1值报咳,那么我們計(jì)算出來的斜率是負(fù)數(shù),α學(xué)習(xí)率為正數(shù)面粮,相乘就為負(fù)數(shù)少孝,則θ_1減去這個(gè)負(fù)值以后就變大了,賦給θ_1熬苍,θ_1的取值大了稍走,現(xiàn)在到了②處乏苦,計(jì)算出來的斜率還是負(fù)數(shù)兴枯,α學(xué)習(xí)率為正數(shù)累盗,相乘就為負(fù)數(shù)雏蛮,則θ_1減去這個(gè)負(fù)值以后又變大了爽撒,接下來到了③處县习,計(jì)算出來的斜率還是正數(shù)沟启,α學(xué)習(xí)率為正數(shù)三娩,相乘就為正數(shù)鸿脓,則θ_1減去這個(gè)正值以后變小了抑钟,則下次取值一定在③的左側(cè),都會忘最小值靠近野哭≡谒【學(xué)習(xí)率的值不能太小(變化會太慢)拨黔,也不能太大(變化會太大)蛔溃,可以多嘗試,找到比較合適的 0.1篱蝇,0.03贺待,0.003,0.001........等等】

圖3

  • 用梯度算法來求解線性回歸:

\quad\quad\quad\quad\quad\quad\quad j=0: α\frac{?}{?θ_0}J(θ_0零截,θ_1) = \frac{1}{m}\textstyle\sum_{i=1}^{m}(h_θ(x^i)- y^i)
\frac{?}{?θ_j}J(θ_0麸塞,θ_1) =
\quad\quad\quad\quad\quad\quad\quad j=1: α\frac{?}{?θ_1}J(θ_0,θ_1) = \frac{1}{m}\textstyle\sum_{i=1}^{m}(h_θ(x^i)- y^i)
repeat until convergence {
θ_0:= θ_0- α \frac{1}{m}\textstyle\sum_{i=1}^{m}(h_θ(x^i)- y^i)
θ_1:= θ_1- α \frac{1}{m}\textstyle\sum_{i=1}^{m}(h_θ(x^i)- y^i)·x^i
}


梯度算法可能會陷入局部最小值:



梯度下降算法的代價(jià)函數(shù)是凸函數(shù)涧衙,所以會一直往最小值走

梯度下降算法的代價(jià)函數(shù)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末哪工,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子绍撞,更是在濱河造成了極大的恐慌正勒,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件傻铣,死亡現(xiàn)場離奇詭異章贞,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進(jìn)店門鸭限,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蜕径,“玉大人,你說我怎么就攤上這事败京《涤鳎” “怎么了?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵赡麦,是天一觀的道長朴皆。 經(jīng)常有香客問我,道長泛粹,這世上最難降的妖魔是什么遂铡? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮晶姊,結(jié)果婚禮上扒接,老公的妹妹穿的比我還像新娘。我一直安慰自己们衙,他們只是感情好钾怔,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著蒙挑,像睡著了一般宗侦。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上脆荷,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天凝垛,我揣著相機(jī)與錄音懊悯,去河邊找鬼蜓谋。 笑死,一個(gè)胖子當(dāng)著我的面吹牛炭分,可吹牛的內(nèi)容都是我干的桃焕。 我是一名探鬼主播,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼捧毛,長吁一口氣:“原來是場噩夢啊……” “哼观堂!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起呀忧,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤师痕,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后而账,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體胰坟,經(jīng)...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年泞辐,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了笔横。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片竞滓。...
    茶點(diǎn)故事閱讀 39,965評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖吹缔,靈堂內(nèi)的尸體忽然破棺而出商佑,到底是詐尸還是另有隱情,我是刑警寧澤厢塘,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布茶没,位于F島的核電站,受9級特大地震影響晚碾,放射性物質(zhì)發(fā)生泄漏礁叔。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一迄薄、第九天 我趴在偏房一處隱蔽的房頂上張望琅关。 院中可真熱鬧,春花似錦讥蔽、人聲如沸涣易。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽新症。三九已至,卻和暖如春响禽,著一層夾襖步出監(jiān)牢的瞬間徒爹,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工芋类, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留隆嗅,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓侯繁,卻偏偏與公主長得像胖喳,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子贮竟,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,914評論 2 355