Day 3 -- 線性模型(上篇)

第三章線性模型

本節(jié)文章主要討論線性模型的回歸炭剪,屬于線性模型上篇,主要介紹線性模型的基本形式脸侥,線性模型的回歸原理以及線性模型的分類用法(對數(shù)幾率回歸)

3.1線性模型的基本形式

假設(shè)一個某個數(shù)據(jù)集中的每個示例由d維屬性表示蒙兰,則其中每個示例均可以表示為X =(x1; x2; ...;xd),其中xi表示示例x在第i個屬性上的屬性值敏晤,則我們可以構(gòu)建如下的線性模型

f(x)? =?? w1*x1 + w2*x2 + ...... + wd*xd +b

若使用 W?? =(w1; w2;? ... ;wd),則上面的模型可以表示為

f(x) = ? transfer(W· X? + b

在此基礎(chǔ)上缅茉,只要確定了W 和 b嘴脾,這個模型便確認下來。

?????? 線性模型 形式簡單蔬墩,易于建模译打,卻蘊涵著機器學(xué)習(xí)中一些重要的基本思想,許多功能強大的非線性模型,都是受線性基本模型的啟發(fā),通過引入層級結(jié)構(gòu)或高維映射而得拢军。同時,線性模型又有很好的可解釋性韵洋,W各維的相對大小就代表了各個屬性對結(jié)果的影響大小

3.2 線性回歸

??????? 在創(chuàng)建基礎(chǔ)模型之前黄锤,通常需要確定各個屬性值的值域問題搪缨,此問題在此不做詳解,下面主要介紹如何在 已有 (X鸵熟,y)的情況下利用最小二乘法得出W和b的方法副编。

?????? 首先需要理解的是,我們希望求得的W和b需要滿足什么樣的條件流强。不難理解的痹届,我們希望通過f(x) = ? transfer(W· X? + b 求得的f(x)與y的差值最小,即希望通過模型得出的結(jié)果與真實情況無限接近打月,這個誤差為0是我們追求的目標(biāo)短纵;然而,大多數(shù)情況下僵控,這個誤差難以達到0。

???????? 在有m個訓(xùn)練樣本的情況下鱼冀,我們希望使得∑((f(xi)- yi)^2)取得最小值报破。這里我們使用了每個樣本的預(yù)測誤差的平方作為求和的元素悠就,因為如果不加平凡,就可能存在一部分誤差為正而另外一些為負的情況充易,直接求和會使結(jié)果比真實值小很多梗脾,造成很大的誤差。這也就是均方誤差的概念盹靴,均方誤差有很好的集合意義炸茧,對應(yīng)了集合上的歐氏距離。因此我們得知稿静,能使均方誤差最小的W和b梭冠,就是我們希望求得的W和b,即

利用最小二乘法可以求得


? ? ? ?有關(guān)于最小二乘法的具體實現(xiàn)改备,請讀者參考其他資料控漠,這里提供一下計算思路:設(shè)出均方誤差E關(guān)于W和b的映射,然后將E對W和b分別求導(dǎo)悬钳,令導(dǎo)數(shù)為0盐捷,即可解出W和b。這里的依據(jù)是函數(shù)的導(dǎo)數(shù)意義默勾,體現(xiàn)在幾何上就是函數(shù)值變化率為0的點碉渡,函數(shù)在此處的導(dǎo)數(shù)為0。

? ? ? ?上面討論的是單屬性樣例數(shù)據(jù)集的情況母剥,相應(yīng)的滞诺,可以將屬性維數(shù)延伸到d維,此時的線性模型可以表示為

f(Xi) = ?transfer(W·?Xi + b

? ? ? ? ?類似的媳搪,最小二乘法同樣可以確定出W和b铭段,需要運用一點線性代數(shù)的功能,有興趣的讀者可以推算一下秦爆。

? ? ? ? ? 線性模型雖簡單序愚,卻有豐富的變化〉认蓿基本線性模型我們希望預(yù)測值f(x)逼近真實標(biāo)記y爸吮,為便于觀察,我們將模型改寫為 y = transfer(WX + b望门,嘗試令模型逼近 y 的衍生物形娇,比如ln(y),這就是“對數(shù)線性回歸”(log-linear regression)ln(y) =??transfer(WX?+ b筹误。它實際上是試圖讓e^(transfer(WX+b)逼近y桐早。形式上仍是線性回歸,但實質(zhì)上已是在求取輸入空間到輸出空間的非線性函數(shù)映射。更一般的哄酝,可以考慮單調(diào)可微函數(shù) g(·)友存,令

這樣得到的廣義線性模型,其中??g(·)稱為“聯(lián)系函數(shù)”(link function)陶衅。

3.3 對數(shù)幾率回歸

? ? ? ? 上一節(jié)討論的是線性模型屡立,在連續(xù)值域上的逼近,那這一節(jié)我們主要討論的是線性模型的分類用法搀军。這里要考慮的問題其實就是如何將連續(xù)值域上的值映射到離散值域上的問題膨俐;上一節(jié)末尾我們討論的聯(lián)系函數(shù),聯(lián)系函數(shù)可以將線性值域的輸入空間映射到非線性空間的輸出空間罩句,那是不是也可以用來將聯(lián)系值域的輸入空間映射到離散值域的輸出空間呢焚刺?

? ? ? ? 答案是肯定的。 單位階躍函數(shù)就具有我們希望的性質(zhì)

? ? ? ? 這里需要介紹一下單位階躍函數(shù)以及對數(shù)幾率函數(shù)

單位階躍函數(shù)


單位階躍函數(shù)與對數(shù)幾率函數(shù)

? ? ? ? 由于上一節(jié)討論的聯(lián)系函數(shù)需要單調(diào)可微的止,在此條件下單位階躍函數(shù)便不適用檩坚,因此我們引入的對數(shù)幾率函數(shù)

logistic function

? ? ? ? ? 可以看出,對數(shù)幾率函數(shù)是一種“Sigmoid”函數(shù)诅福,它將z值轉(zhuǎn)化為一個接近0或1的值匾委。將對數(shù)幾率函數(shù)作為聯(lián)系函數(shù)帶入線性模型,得到

? ? ? ? ?轉(zhuǎn)化為

? ? ? ? ?若將y視為樣本x為正例的可能性氓润,則1-y為樣本x為反例的可能性赂乐。兩者的比值y/(1-y)稱為“幾率”(odds),反映了x作為正例的相對可能性咖气,對幾率取對數(shù) ln(y/(1-y))挨措,則得到對數(shù)幾率。

? ? ? ? 同樣崩溪,具體求得W和b的方法在此不做詳解浅役,筆者在此提供一個方法--“極大似然法”,這里使用到的數(shù)學(xué)原理較為高深(至少筆者認為 -_-|||)伶唯,有興趣的讀者可以嘗試嘗試觉既。


后記:

? ? ? ? 開始本系列文章已經(jīng)有些時日,開始進入機器學(xué)習(xí)的主要范圍乳幸。大部分內(nèi)容都只是為大家提供一個解決問題的思路瞪讼,較為詳細的數(shù)學(xué)推導(dǎo)都被讀者略過(諒解諒解,不提供數(shù)學(xué)公式編輯粹断,這樣寫實在麻煩符欠,寫出來也估計很難看懂。瓶埋。)這里要向大家道個歉希柿,但是歡迎大家私聊筆者一起學(xué)習(xí)诊沪,一起進步。

? ? ? ? 筆者寫這些文章的目的狡汉,不僅在于給讀者加深自己的印象娄徊,還在于和眾多機器學(xué)習(xí)愛好者一起探討、學(xué)習(xí)盾戴,筆者自身也有很多不明白的領(lǐng)域,只希望與大家共同學(xué)習(xí)兵多,共同進步尖啡!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市剩膘,隨后出現(xiàn)的幾起案子衅斩,更是在濱河造成了極大的恐慌,老刑警劉巖怠褐,帶你破解...
    沈念sama閱讀 221,888評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件畏梆,死亡現(xiàn)場離奇詭異,居然都是意外死亡奈懒,警方通過查閱死者的電腦和手機奠涌,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,677評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來磷杏,“玉大人溜畅,你說我怎么就攤上這事〖觯” “怎么了慈格?”我有些...
    開封第一講書人閱讀 168,386評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長遥金。 經(jīng)常有香客問我浴捆,道長,這世上最難降的妖魔是什么稿械? 我笑而不...
    開封第一講書人閱讀 59,726評論 1 297
  • 正文 為了忘掉前任选泻,我火速辦了婚禮,結(jié)果婚禮上溜哮,老公的妹妹穿的比我還像新娘滔金。我一直安慰自己,他們只是感情好茂嗓,可當(dāng)我...
    茶點故事閱讀 68,729評論 6 397
  • 文/花漫 我一把揭開白布餐茵。 她就那樣靜靜地躺著,像睡著了一般述吸。 火紅的嫁衣襯著肌膚如雪忿族。 梳的紋絲不亂的頭發(fā)上锣笨,一...
    開封第一講書人閱讀 52,337評論 1 310
  • 那天,我揣著相機與錄音道批,去河邊找鬼错英。 笑死,一個胖子當(dāng)著我的面吹牛隆豹,可吹牛的內(nèi)容都是我干的椭岩。 我是一名探鬼主播,決...
    沈念sama閱讀 40,902評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼璃赡,長吁一口氣:“原來是場噩夢啊……” “哼判哥!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起碉考,我...
    開封第一講書人閱讀 39,807評論 0 276
  • 序言:老撾萬榮一對情侶失蹤塌计,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后侯谁,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體锌仅,經(jīng)...
    沈念sama閱讀 46,349評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,439評論 3 340
  • 正文 我和宋清朗相戀三年墙贱,在試婚紗的時候發(fā)現(xiàn)自己被綠了热芹。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,567評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡嫩痰,死狀恐怖剿吻,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情串纺,我是刑警寧澤丽旅,帶...
    沈念sama閱讀 36,242評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站纺棺,受9級特大地震影響榄笙,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜祷蝌,卻給世界環(huán)境...
    茶點故事閱讀 41,933評論 3 334
  • 文/蒙蒙 一茅撞、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧巨朦,春花似錦米丘、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,420評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至棚蓄,卻和暖如春堕扶,著一層夾襖步出監(jiān)牢的瞬間碍脏,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,531評論 1 272
  • 我被黑心中介騙來泰國打工稍算, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留典尾,地道東北人。 一個月前我還...
    沈念sama閱讀 48,995評論 3 377
  • 正文 我出身青樓糊探,卻偏偏與公主長得像钾埂,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子科平,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,585評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 101.深度學(xué)習(xí)(CNN RNN Attention)解決大規(guī)模文本分類問題勃教。 用深度學(xué)習(xí)(CNN RNN Att...
    大黃大黃大黃閱讀 13,823評論 2 42
  • 原文章為scikit-learn中"用戶指南"-->"監(jiān)督學(xué)習(xí)的第一節(jié):Generalized Linear Mo...
    HabileBadger閱讀 9,323評論 1 19
  • 1.線性方程與非線性方程 線性方程:代數(shù)方程如y = 2x + 5,其中任何一個變量都為1次冪,這種方程的圖像為一...
    賓克斯的美酒_fb4c閱讀 3,734評論 0 0
  • 日本游戲街霸中匠抗,有一個角色,是巴西還是北美的人物污抬,會從胸口托出一個球汞贸,然后推給對方,遠程攻擊印机,口里會說“阿都咳”矢腻。...
    親密數(shù)閱讀 149評論 0 1
  • 「我們又見面了」那熟悉的聲音說著,轉(zhuǎn)頭發(fā)現(xiàn)是剛剛的少年 「你是剛剛的……」我不斷的想著剛剛的少年和現(xiàn)在看到的射赛,簡直...
    d723bb10402e閱讀 323評論 0 0