5.gitchat訓(xùn)練營(yíng)-線性回歸——從模型函數(shù)到目標(biāo)函數(shù)

1.從數(shù)據(jù)反推公式

????????假設(shè)獲得下面一張表格冲粤,列舉了美國(guó)紐約若干程序員職位的年薪亮隙。


美國(guó)程序猿年薪

????????根據(jù)表格中的特征,我們把Experience與Salary抽取出來(lái)危纫,用x和y來(lái)分別指代它們。


經(jīng)驗(yàn)與薪水

????????我們可以先在二維坐標(biāo)系里通過(guò)畫圖來(lái)看一下x與y的關(guān)系:
x與y的關(guān)系圖

????????把這6個(gè)點(diǎn)連起來(lái)乌庶,基本上就成了一條直線种蝶。那么假設(shè)存在y = a + bx,是合理的瞒大。
????????既然認(rèn)為xy滿足線性相關(guān)關(guān)系螃征,那么線性函數(shù):y = a + bx,就是我們的模型函數(shù)透敌。其中y也可以用f(x)來(lái)表示盯滚。
????????我們要做的是綜合利用所有的訓(xùn)練數(shù)據(jù)求出y = a + bx中常數(shù)a和常數(shù)b的值踢械。

2.線性回歸的目標(biāo)函數(shù)

????????綜合利用的原則就是我們要求的這個(gè)ab,在將訓(xùn)練樣本的x逐個(gè)帶入后魄藕,得出的預(yù)測(cè)年薪y' = a + bx與真實(shí)年薪y整體的差異最小内列。
????????具體的一個(gè)樣本的yy'的差異用(y' - y)^2來(lái)表示。
????????怎么衡量這個(gè)整體差距呢泼疑?我們用下面這個(gè)公式,我們把它叫做為Cost Function荷荤,形式如下(其中m為樣本的個(gè)數(shù)退渗,在本例中m為6):
J(a,b) = \frac{1}{2m}\sum^m_{i=1}(y'^{(i)}-y^{i})^2=\frac{1}{2m}\sum^m_{i=1}(a+bx^{(i)}-y^{(i)})^2
????????在y=a+bx這個(gè)模型函數(shù)中,ab是常量參數(shù)蕴纳,x是自變量会油,而y是因變量。
????????但到了J(a,b)中古毛,x^{(i)}y^{(i)}是常量參數(shù)(也就是m個(gè)樣本各自的xy值)翻翩,而ab成了自變量,J(a,b)是因變量稻薇。能夠讓因變量J(a,b)取值最小的自變量ab嫂冻,就是最好的ab
????????我們要做的就是找到最好的ab塞椎。

3.線性的定義

????????線性回歸模型是:利用線性函數(shù)對(duì)一個(gè)活多個(gè)自變量(x(x_1, x_2,...x_k))和因變量(y)之間的關(guān)系進(jìn)行擬合的模型桨仿。
????????也就是說(shuō),線性回歸模型構(gòu)建成功后案狠,這個(gè)模型表現(xiàn)為線性函數(shù)的形式服傍。
????????線性函數(shù)的定義是:一階(或更低階)多項(xiàng)式,或零多項(xiàng)式骂铁。
????????當(dāng)線性函數(shù)只有一個(gè)自變量時(shí)吹零,y=f(x)

f(x)的函數(shù)形式是:

f(x)=a+bx(a拉庵、b為常數(shù)灿椅,且b\neq0)——一階多項(xiàng)式

或者f(x)=c(c為常數(shù),且c\neq0)——零階多項(xiàng)式

或者f(x)=0——零多項(xiàng)式

????????但如果有多個(gè)獨(dú)立自變量钞支,y=f(x_1,x_2,...,x_k)的函數(shù)形式則是:

f(x_1,x_2,...,x_k)=a+b_1x_1+b_2x_2+...+b_kx_k

????????換言之阱扬,直角坐標(biāo)系中,除了平行于y軸的那些直線之外伸辟,所有的直線都可以對(duì)應(yīng)一個(gè)一維特征(自變量)的線性回歸模型(一元多項(xiàng)式函數(shù))麻惶。
????????但如果樣本特征本身是多維的,則最終的線性模型函數(shù)是一個(gè)多維空間內(nèi)的[一階|零階|零]多項(xiàng)式信夫。
????????總結(jié):特征是一維的窃蹋,線性模型在二維空間構(gòu)成一條直線卡啰;特征是二維的,線性模型在三維空間中構(gòu)成一個(gè)平面警没;若特征是三維的匈辱,則最終模型在四維空間中構(gòu)成一個(gè)體,以此類推杀迹。

線性模型在二維三維空間中的表現(xiàn)

4.用線性回歸模型擬合非線性關(guān)系

????????在輸入特征只有一個(gè)的情況下亡脸,是不是只能在二維空間擬合直線呢?其實(shí)也不一定树酪。
????????線性模型并非完全不可能擬合自變量和因變量之間的非線性關(guān)系浅碾。
????????比如有一個(gè)樣本,只有一個(gè)特征续语,我們把特征和結(jié)果作圖以后發(fā)現(xiàn)垂谢,是下圖這樣的:


樣本和關(guān)系走勢(shì)圖

????????上圖樣本和結(jié)果的關(guān)系走勢(shì)根本不是直線,更像是二階曲線疮茄。
????????這個(gè)時(shí)候滥朱,我們完全可以把特征從一個(gè)“變成”兩個(gè):

設(shè)X=(x_1,x_2)(其中x_1=x^2;x_2=x),有:
????????f(x_1,x_2)=a+b_1x^2+b_2x=a+b_1x_1+b_2x_2

????????這就相當(dāng)于擬合了一條二階多項(xiàng)式對(duì)應(yīng)的曲線力试。

再設(shè)B=(b_1,b_2)徙邻,則:
????????f(X)=a+BX

????????這樣一來(lái),我們只需要在二維向量空間里訓(xùn)練f(X)=a+BX畸裳,就可以了鹃栽。
????????當(dāng)然,這種操作也不限于在一維到二維之間的轉(zhuǎn)換躯畴,一維也可以轉(zhuǎn)為三維民鼓、四維、n維蓬抄;或者原本的k維也可以每一維都求平方后作為新特征引入丰嘉,轉(zhuǎn)為2k維,如此種種......依需要而取就好嚷缭。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末饮亏,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子阅爽,更是在濱河造成了極大的恐慌路幸,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,888評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件付翁,死亡現(xiàn)場(chǎng)離奇詭異简肴,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)百侧,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,677評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門砰识,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)能扒,“玉大人,你說(shuō)我怎么就攤上這事辫狼〕醢撸” “怎么了?”我有些...
    開封第一講書人閱讀 168,386評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵膨处,是天一觀的道長(zhǎng)见秤。 經(jīng)常有香客問(wèn)我,道長(zhǎng)真椿,這世上最難降的妖魔是什么鹃答? 我笑而不...
    開封第一講書人閱讀 59,726評(píng)論 1 297
  • 正文 為了忘掉前任,我火速辦了婚禮瀑粥,結(jié)果婚禮上挣跋,老公的妹妹穿的比我還像新娘三圆。我一直安慰自己狞换,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,729評(píng)論 6 397
  • 文/花漫 我一把揭開白布舟肉。 她就那樣靜靜地躺著修噪,像睡著了一般。 火紅的嫁衣襯著肌膚如雪路媚。 梳的紋絲不亂的頭發(fā)上黄琼,一...
    開封第一講書人閱讀 52,337評(píng)論 1 310
  • 那天,我揣著相機(jī)與錄音整慎,去河邊找鬼脏款。 笑死,一個(gè)胖子當(dāng)著我的面吹牛裤园,可吹牛的內(nèi)容都是我干的撤师。 我是一名探鬼主播,決...
    沈念sama閱讀 40,902評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼拧揽,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼剃盾!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起淤袜,我...
    開封第一講書人閱讀 39,807評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤痒谴,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后铡羡,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體积蔚,經(jīng)...
    沈念sama閱讀 46,349評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,439評(píng)論 3 340
  • 正文 我和宋清朗相戀三年烦周,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了库倘。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片临扮。...
    茶點(diǎn)故事閱讀 40,567評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖教翩,靈堂內(nèi)的尸體忽然破棺而出杆勇,到底是詐尸還是另有隱情,我是刑警寧澤饱亿,帶...
    沈念sama閱讀 36,242評(píng)論 5 350
  • 正文 年R本政府宣布蚜退,位于F島的核電站,受9級(jí)特大地震影響彪笼,放射性物質(zhì)發(fā)生泄漏钻注。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,933評(píng)論 3 334
  • 文/蒙蒙 一配猫、第九天 我趴在偏房一處隱蔽的房頂上張望幅恋。 院中可真熱鬧,春花似錦泵肄、人聲如沸捆交。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,420評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)品追。三九已至,卻和暖如春冯丙,著一層夾襖步出監(jiān)牢的瞬間肉瓦,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,531評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工胃惜, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留泞莉,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,995評(píng)論 3 377
  • 正文 我出身青樓船殉,卻偏偏與公主長(zhǎng)得像鲫趁,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子捺弦,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,585評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容