機器學習(2)單變量線性回歸

2.1 模型表示

我們學習的第一個算法是線性回歸算法玛痊。
在監(jiān)督學習中传趾,我們有一個數(shù)據(jù)集晤郑,這個數(shù)據(jù)集被稱為訓練集(Training Set)。

我們用小寫字母m來表示訓練樣本的數(shù)目袍辞。

監(jiān)督學習算法的工作方式

以房屋價格的訓練為例徽缚,將訓練集里房屋價格喂給學習算法,學習算法工作后輸出一個函數(shù)h革屠,h代表hypothesis(假設)。
函數(shù)h輸入為房屋尺寸大小x排宰,h根據(jù)輸入來得出y值似芝,y值對應房子的價格。因此板甘,h是一個從x到y(tǒng)的函數(shù)映射党瓮。

h該如何表達呢?
一種可能的表達方式為
h_\theta(x)=\theta_0+\theta_1x
因為只含有一個特性(輸入變量)盐类,因此這樣的問題叫做單變量線性回歸問題寞奸。

2.2 代價函數(shù)

我們現(xiàn)在要做的是為我們的模型h_\theta(x)=\theta_0+\theta_1x

選擇合適的參數(shù)\theta_0\theta_1

建模誤差(modeling error):模型所預測的值與訓練集中實際值之間的差距在跳。

我們的目標是選擇出可以使得建模誤差的平方和能夠最小的模型參數(shù)枪萄。
即使得代價函數(shù):

代價函數(shù)

最小。

剛才的代價函數(shù)也稱作平方誤差函數(shù)(平方誤差代價函數(shù))猫妙。之所以求出誤差的平方和瓷翻,是因為誤差平方代價函數(shù)對于大多數(shù)問題尤其回歸問題,都是一個合理的選擇割坠。

平方誤差代價函數(shù)是解決回歸問題最常用的手段齐帚。

2.3 代價函數(shù)的直觀理解

2.4 第一個機器學習算法——梯度下降

使用梯度下降來求函數(shù)最小值(代價函數(shù)的最小值)。
思想:開始時隨機選擇一個參數(shù)的組合

計算代價函數(shù)彼哼,然后尋找一下個能讓代價函數(shù)值下降最多的參數(shù)組合对妄,持續(xù)這么做直到一個局部最小值(local minimum)。

由于沒有嘗試完所有的參數(shù)組合敢朱,所以不能確定我們得到的是否為全局最小值(global minimum)剪菱,選擇不同的初始參數(shù)組合,可能會得到不同的局部最小值拴签。

其中\alpha是學習率(learning rate)琅豆,決定了讓代價函數(shù)下降程度最大的方向向下邁出的步長。

在批量梯度下降中篓吁,每一次都同時讓所有的參數(shù)減去學習速率乘以代價函數(shù)的導數(shù)茫因。

注意一個微妙的問題:
梯度下降算法實現(xiàn)時需要同步對各個參數(shù)進行更新,因此需要先將各個參數(shù)的更新值計算出來暫時保存杖剪,當所有更新值都計算完畢后同時更新新一輪參數(shù)冻押。

同步更新是更自然的實現(xiàn)方法

梯度下降的直觀理解

對于這個問題驰贷,求導目的是取切線。

如果\alpha太小了洛巢,挪動會很慢括袒,需要很多步才能到達全局最低點。
如果\alpha太大了稿茉,可能會越過最低點锹锰,甚至無法收斂,一次一次越過最低點漓库,實際上離最低點越來越遠恃慧。

我們可以發(fā)現(xiàn),隨著每一步的梯度下降渺蒿,圖線越來越趨近于平緩痢士,斜率越來越小,最終移動幅度非常小茂装,已經(jīng)收斂到局部極小值怠蹂。

2.6 梯度下降的線性回歸

將梯度下降和代價函數(shù)結(jié)合,應用于具體的擬合直線的線性回歸算法里少态。

批量梯度下降城侧,指在梯度下降的每一步中,我們都用到了所有的訓練樣本彼妻,在梯度下降中赞庶,計算微分求導項時,我們需要進行求和運算澳骤。

此外歧强,在計算代價函數(shù)J最小值的時候有一種數(shù)值解法,不需要梯度下降這種迭代算法为肮,是一種成為正規(guī)方程(normal equations)的方法摊册。

實際上,在數(shù)據(jù)量較大時颊艳,梯度下降發(fā)比正規(guī)方程要更適用一些茅特。

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市棋枕,隨后出現(xiàn)的幾起案子白修,更是在濱河造成了極大的恐慌,老刑警劉巖重斑,帶你破解...
    沈念sama閱讀 211,376評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件兵睛,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機祖很,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評論 2 385
  • 文/潘曉璐 我一進店門笛丙,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人假颇,你說我怎么就攤上這事胚鸯。” “怎么了笨鸡?”我有些...
    開封第一講書人閱讀 156,966評論 0 347
  • 文/不壞的土叔 我叫張陵姜钳,是天一觀的道長。 經(jīng)常有香客問我形耗,道長哥桥,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,432評論 1 283
  • 正文 為了忘掉前任趟脂,我火速辦了婚禮,結(jié)果婚禮上例衍,老公的妹妹穿的比我還像新娘昔期。我一直安慰自己,他們只是感情好佛玄,可當我...
    茶點故事閱讀 65,519評論 6 385
  • 文/花漫 我一把揭開白布硼一。 她就那樣靜靜地躺著,像睡著了一般梦抢。 火紅的嫁衣襯著肌膚如雪般贼。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,792評論 1 290
  • 那天奥吩,我揣著相機與錄音哼蛆,去河邊找鬼。 笑死霞赫,一個胖子當著我的面吹牛腮介,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播端衰,決...
    沈念sama閱讀 38,933評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼叠洗,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了旅东?” 一聲冷哼從身側(cè)響起灭抑,我...
    開封第一講書人閱讀 37,701評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎抵代,沒想到半個月后腾节,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,143評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,488評論 2 327
  • 正文 我和宋清朗相戀三年禀倔,在試婚紗的時候發(fā)現(xiàn)自己被綠了榄融。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,626評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡救湖,死狀恐怖愧杯,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情鞋既,我是刑警寧澤力九,帶...
    沈念sama閱讀 34,292評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站邑闺,受9級特大地震影響跌前,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜陡舅,卻給世界環(huán)境...
    茶點故事閱讀 39,896評論 3 313
  • 文/蒙蒙 一抵乓、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧靶衍,春花似錦灾炭、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至涛酗,卻和暖如春铡原,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背商叹。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工燕刻, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人剖笙。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓酌儒,卻偏偏與公主長得像,于是被迫代替她去往敵國和親枯途。 傳聞我的和親對象是個殘疾皇子忌怎,可洞房花燭夜當晚...
    茶點故事閱讀 43,494評論 2 348

推薦閱讀更多精彩內(nèi)容