機(jī)器學(xué)習(xí)(2)——線性回歸

線性回歸

函數(shù)模型

??線性回歸函數(shù)想必大家在高中的學(xué)習(xí)中就已經(jīng)學(xué)習(xí)過了蛀骇,這一篇文章中我們并不會(huì)很詳細(xì)的介紹。首先,如同下面這張散點(diǎn)圖:
??我們會(huì)怎么去用函數(shù)擬合夺颤?
??我們一眼就會(huì)發(fā)現(xiàn),用一條直線穿過數(shù)據(jù)會(huì)很好的擬合這些數(shù)據(jù)胁勺,這些數(shù)據(jù)很均勻的分布在直線的兩側(cè)世澜。看到這里我們就可以直接寫出我們線性函數(shù)的表達(dá)式了:
f(x,\omega)=\sum_{i=0}^{m}\omega_ix_i
??不過通常我們認(rèn)為x_0=1,所以這個(gè)式子展開之后就是:
f(x,\omega)=\omega_0+\omega_1x_1+...+\omega_ix_i
??在機(jī)器學(xué)習(xí)中姻几,我們常常使用線性代數(shù)去描繪數(shù)據(jù)宜狐,因此我們寫成下面這種形式
\omega=\begin{bmatrix}\omega_0\\\omega_1\\\vdots\\\omega_n \end{bmatrix} \qquad x= \begin{bmatrix}x_0\\x_1\\\vdots\\x_n \end{bmatrix} \qquad b= \begin{bmatrix}b_0\\b_1\\\vdots\\b_n \end{bmatrix}
??也就是說,將表達(dá)式寫成矩陣的形式,就成了:
f(x,\omega)=wx^T+b
??這只是最簡(jiǎn)單的一種線性函數(shù)蛇捌,還有一些廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)的線性函數(shù)是一層一層的嵌套函數(shù)抚恒,例如:
??f_1(x,\omega)=\alpha f(w_if(wx))+...
??目前我們并不去討論非線性的函數(shù)模型,對(duì)于非線性的函數(shù)模型,我們往往需要進(jìn)行正則化進(jìn)行調(diào)整络拌,這里我會(huì)在后面進(jìn)行詳細(xì)的介紹俭驮。

代價(jià)函數(shù)

??代價(jià)函數(shù)又稱為損失函數(shù),在這里我們可以試著來推導(dǎo)一下春贸。我們的代價(jià)函數(shù)主要就是用于衡量預(yù)測(cè)數(shù)據(jù)和真實(shí)數(shù)據(jù)之間的誤差混萝。很容易的我們會(huì)想到直接用他們之間的差值作為衡量。
J(\omega)=\sum_{i=0}^{m}(y-f(x_i))
??不過這個(gè)函數(shù)存在一個(gè)問題萍恕,就是y-f(x_i)的符號(hào)是不確定的逸嘀,因此即使誤差很大,J(\omega)甚至可以為0允粤,因此我們需要改進(jìn)這個(gè)函數(shù)崭倘。
??那么,加一個(gè)絕對(duì)值怎么樣呢类垫?
J(\omega)=\sum_{i=0}^{m}\left|y-f(x_i)\right |
??這樣顯然我們的代價(jià)函數(shù)有了更好的性能司光,不過還是存在一些問題,就是絕對(duì)值是無法求導(dǎo)的悉患。那么我們會(huì)想残家,有什么方法既可以不影響函數(shù)的代數(shù)性質(zhì)又不會(huì)造成誤差的失誤呢?很明顯售躁,二次函數(shù)是一個(gè)不錯(cuò)的想法坞淮。
J(\omega)=\sum_{i=0}^{m}(y-f(x_i))^2
??這個(gè)時(shí)候我們已經(jīng)完成了我們的函數(shù)設(shè)計(jì),不過還有一點(diǎn)點(diǎn)小問題陪捷,就是j(\omega)有可能出現(xiàn)過大的情況碾盐,我們需要對(duì)它進(jìn)行求平均值,同時(shí)揩局,為了方便我們后續(xù)的求導(dǎo)計(jì)算,我們通常還會(huì)乘以一個(gè)參數(shù)\frac{1}{2}掀虎,當(dāng)然你不做處理也不會(huì)有問題凌盯。最終的函數(shù)解析式就成了:
J(\omega)=\frac{1}{2m}\sum_{i=0}^{m}(y-f(x_i))^2
??相信很多數(shù)學(xué)底子好一些的朋友付枫,肯定發(fā)現(xiàn)了一件事,這不就是我們常常使用的方差的變形嗎驰怎?是的阐滩,這個(gè)函數(shù)我們稱為均方誤差函數(shù),你可以理解為廣義上的方差县忌,我們記得方差是減去數(shù)據(jù)的平均值掂榔,這里也是類似的,因?yàn)槲覀兯玫臄M合函數(shù)就已經(jīng)充當(dāng)了平均值的作用症杏。

極大似然估計(jì)

??這個(gè)玩意名字取得總是讓人覺得怪怪的装获,一眼看不出這是干嘛的。極大似然估計(jì)有點(diǎn)類似文言文的一種說法厉颤,似然穴豫,也就是可能性的意思。極大似然估計(jì)也就是最大可能性的估計(jì)逼友。
??構(gòu)造極大似然估計(jì)的條件很容易精肃,也就是i.i.d條件,數(shù)據(jù)獨(dú)立同分布條件帜乞。我們給出一個(gè)概率函數(shù)P(y|x,\omega)司抱。如何評(píng)判函數(shù)的好壞呢?我們知道黎烈,對(duì)于給定的數(shù)據(jù)习柠,概率達(dá)到最大值就是最好的,那么針對(duì)整個(gè)數(shù)據(jù)集來說怨喘,我們應(yīng)當(dāng)對(duì)概率函數(shù)進(jìn)行求積:
L(\omega)=\prod_{i=1}^{m}P(y|x,\omega)
??L(\omega)就是我們的似然函數(shù)了津畸,而求出函數(shù)最大值所對(duì)應(yīng)的\omega也就是我們所討論的極大似然估計(jì)了。
??大部分情況下必怜,我們不喜歡求連積肉拓,我們要想辦法將L(\omega)變成一個(gè)求和的函數(shù),這樣我們的計(jì)算會(huì)方便許多梳庆。很容易想到對(duì)數(shù)的性質(zhì)暖途。我們對(duì)L(\omega)進(jìn)行求對(duì)數(shù),得到:
lnL(\omega)=\sum_{i=1}^mlnP(y|x,\omega)
??同樣的我們防止數(shù)據(jù)過大膏执,對(duì)它求一個(gè)平均值驻售,不過這里的平均值應(yīng)該是負(fù)平均值比較好,為什么更米?看一看對(duì)數(shù)函數(shù)的圖像欺栗,概率是衡在[0,1]之間,對(duì)應(yīng)的對(duì)數(shù)始終為負(fù)值,所以我們應(yīng)該用負(fù)數(shù)好迟几。
lnL(\omega)=\frac{-1}{m}\sum_{i=1}^mlnP(y|x,\omega)
??對(duì)數(shù)函數(shù)也有缺點(diǎn)消请,就是遇上0的時(shí)候,對(duì)數(shù)函數(shù)就顯得無能為力了类腮,在一些分類問題中臊泰,假設(shè)真實(shí)標(biāo)記是0,那么極大似然估計(jì)出的概率函數(shù)也應(yīng)該是0蚜枢,或者是接近0缸逃,這樣就會(huì)導(dǎo)致對(duì)它求對(duì)數(shù)的時(shí)候數(shù)值會(huì)變得巨大。這里我們引入一個(gè)概念——厂抽。我們將在下一節(jié)信息論中進(jìn)行詳細(xì)的介紹需频。

我的掘金:WarrenRyan

我的簡(jiǎn)書:WarrenRyan

歡迎關(guān)注我的博客獲得第一時(shí)間更新 https://blog.tity.xyz

我的Github:StevenEco

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市修肠,隨后出現(xiàn)的幾起案子贺辰,更是在濱河造成了極大的恐慌,老刑警劉巖嵌施,帶你破解...
    沈念sama閱讀 216,591評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件饲化,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡吗伤,警方通過查閱死者的電腦和手機(jī)吃靠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,448評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來足淆,“玉大人巢块,你說我怎么就攤上這事∏珊牛” “怎么了族奢?”我有些...
    開封第一講書人閱讀 162,823評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)丹鸿。 經(jīng)常有香客問我越走,道長(zhǎng),這世上最難降的妖魔是什么靠欢? 我笑而不...
    開封第一講書人閱讀 58,204評(píng)論 1 292
  • 正文 為了忘掉前任廊敌,我火速辦了婚禮,結(jié)果婚禮上门怪,老公的妹妹穿的比我還像新娘骡澈。我一直安慰自己,他們只是感情好掷空,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,228評(píng)論 6 388
  • 文/花漫 我一把揭開白布肋殴。 她就那樣靜靜地躺著囤锉,像睡著了一般。 火紅的嫁衣襯著肌膚如雪护锤。 梳的紋絲不亂的頭發(fā)上嚼锄,一...
    開封第一講書人閱讀 51,190評(píng)論 1 299
  • 那天晨雳,我揣著相機(jī)與錄音煤傍,去河邊找鬼链方。 笑死,一個(gè)胖子當(dāng)著我的面吹牛修陡,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播可霎,決...
    沈念sama閱讀 40,078評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼魄鸦,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了癣朗?” 一聲冷哼從身側(cè)響起拾因,我...
    開封第一講書人閱讀 38,923評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎旷余,沒想到半個(gè)月后绢记,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,334評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡正卧,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,550評(píng)論 2 333
  • 正文 我和宋清朗相戀三年蠢熄,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片炉旷。...
    茶點(diǎn)故事閱讀 39,727評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡签孔,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出窘行,到底是詐尸還是另有隱情饥追,我是刑警寧澤,帶...
    沈念sama閱讀 35,428評(píng)論 5 343
  • 正文 年R本政府宣布罐盔,位于F島的核電站但绕,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏翘骂。R本人自食惡果不足惜壁熄,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,022評(píng)論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望碳竟。 院中可真熱鬧草丧,春花似錦、人聲如沸莹桅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,672評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至懂拾,卻和暖如春煤禽,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背岖赋。 一陣腳步聲響...
    開封第一講書人閱讀 32,826評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工檬果, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人唐断。 一個(gè)月前我還...
    沈念sama閱讀 47,734評(píng)論 2 368
  • 正文 我出身青樓选脊,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親脸甘。 傳聞我的和親對(duì)象是個(gè)殘疾皇子恳啥,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,619評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容