線性回歸、邏輯回歸

線性回歸

解決問題

先上一個例子

人們?nèi)ツ骋患毅y行貸款存炮,貸款額度與工資和年齡的關(guān)系如下:

工資 年齡 額度
4000 25 20000
8000 30 70000
5000 28 35000
7500 33 50000
12000 40 85000

預(yù)測炬搭,下一個人去銀行貸款的額度是多少?

工資和年齡對貸款額度的影響有多大穆桂?

思路推理

工資和年齡是我們的兩個特征宫盔,額度是我們想預(yù)測的結(jié)果,這個結(jié)果是一個具體的數(shù)值享完。

1.png

對于每一個樣本灼芭,都存在誤差,記做:

2.png

我們應(yīng)該要讓誤差越小般又,那我們的參數(shù)就越好彼绷,我們的目的還是要求參數(shù) \theta巍佑。

gif.latex.gif

這時,我們作出一個假設(shè)寄悯,所有樣本數(shù)據(jù)的誤差是獨立且具有相同分布萤衰,服從高斯分布的。

3.png

高斯分布的y坐標(biāo)是概率值猜旬,x坐標(biāo)是各個樣本的誤差腻菇。這里可以看出我們的假設(shè)就是誤差越大的概率會比較小,大部分的誤差都接近于0昔馋,這樣的分布才是我們所希望的分布情況。

下面是高斯分布的公式:

屏幕快照 2018-01-19 21.42.01.png

中間的公式就是高斯分布的公式糖耸。

這時我們想秘遏,由于誤差是服從高斯分布的,是不是只有當(dāng)每次誤差的概率越大嘉竟,那誤差就越接近于0啊邦危,也是我們想要的情況。

所以我們把所有誤差的概率相乘舍扰,以便讓此結(jié)果最大倦蚪,這樣就它的似然函數(shù):

屏幕快照 2018-01-19 21.46.57.png

乘法想求最大值難解,我們轉(zhuǎn)換為對數(shù)似然以便就加法最大值边苹。

屏幕快照 2018-01-19 21.49.51.png

化簡過程略過若干步驟陵且,最后上面試子,要想讓最上面那個式子最大个束,由于它前半部分是個常數(shù)慕购,后面是減去一個數(shù),這樣我們讓最后那個數(shù)最小就行了茬底。 就是讓這個最小二乘法的式子最小沪悲。

這個式子是一個方程,在數(shù)學(xué)中阱表,我們想求一個函數(shù)的的最低點殿如,我們是不是需要求這個函數(shù)的偏導(dǎo)等于0的情況就是啊最爬? 是的:

屏幕快照 2018-01-19 21.56.01.png

上面的化簡需要注意的是涉馁,無論X還是theta還是y,都是矩陣爱致,需要用矩陣的算法來化簡谨胞。

這樣我們就求得theta的一個具體值。哇蒜鸡?胯努?牢裳?

是的,特殊情況(線性回歸)就是能求出來叶沛。

結(jié)果

不過我們一般都不是這樣去直接求得一個theta蒲讯,而是用梯度下降的方法去慢慢找一個最優(yōu)的theta。

梯度下降

當(dāng)我們得到最小二乘法的目標(biāo)函數(shù)之后灰署,我們需要去求什么樣的theta可以讓這個函數(shù)的值是最小的判帮。

屏幕快照 2018-01-19 22.03.28.png

首先,我們可以隨意定義一個theta矩陣溉箕,比如{1晦墙,1,1肴茄,1 … 晌畅,1} 里面的元素都是1。

然后我們求出現(xiàn)在的目標(biāo)函數(shù)的值是多少寡痰。

然后我們更新theta的值抗楔,在次求出目標(biāo)函數(shù)的值。這樣兩次求出的值看誰最小拦坠。

當(dāng)我們更新n次之后连躏,我們可以從這n次里面挑一個能使目標(biāo)函數(shù)的值最小的theta矩陣。

怎么更新theta參數(shù)

我們可以先求得在原theta點上贞滨,目標(biāo)函數(shù)的導(dǎo)數(shù)入热,數(shù)學(xué)中,函數(shù)在某點的導(dǎo)數(shù)就是晓铆,函數(shù)在這個點上才顿,往下一個方向移動的方向。這樣的話我們可以讓theta往這個方向上移動一定的距離尤蒿,得到theta更新后的值郑气。

這個更新一定的距離,我們稱為學(xué)習(xí)率(步長)腰池。

導(dǎo)數(shù)需要我們?nèi)デ笪沧椋厦娴暮瘮?shù)中,導(dǎo)數(shù)為示弓。

屏幕快照 2018-01-19 22.18.17.png

學(xué)習(xí)率(步長)我們自己定義, 一般很小讳侨,不行就更小。

CodeCogsEqn.gif

alpha為學(xué)習(xí)率(步長)

梯度下降的常用方式

  • 批量梯度下降: 就是考慮所有的樣本奏属,上式中的m為全部樣本個數(shù)(這樣容易得到最優(yōu)解跨跨,但是樣本非常多速度非常慢)
  • 隨機梯度下降: 就是每次就考慮1個樣本,m=1(這樣速度快,但是不一定每次都朝著收斂方向移動)
  • 小批量梯度下降: 每次考慮一部分樣本勇婴,m=10(實用)

邏輯回歸

解決問題

邏輯回歸解決的是分類問題忱嘹。

另一個例子,某次考試的成績出來了耕渴,學(xué)生們考了2個科目拘悦,每個科目的分?jǐn)?shù)為x1和x2,是否通過的結(jié)果為y橱脸,y的取值為0或1础米。

預(yù)測,下一個人的成績出來后添诉,能否通過考試屁桑?

科目1和科目2對考試結(jié)果的影響有多大?

CodeCogsEqn-2.gif

y的取值為0或者1栏赴。

思路推理

這里我們引入Sigmoid函數(shù)

  • Sigmoid函數(shù)
屏幕快照 2018-01-19 22.44.57.png

將y帶入函數(shù)有:

屏幕快照 2018-01-19 22.54.23.png

我們假設(shè)(y==1時)通過考試的概率服從Sigmoid函數(shù)的分布蘑斧,那么沒有通過考試(y==0時)的概率就是1減去通過考試的概率。

推理有:

屏幕快照 2018-01-19 22.55.46.png

我們將式子進行整合艾帐,當(dāng)y=0時,只有右邊的式子盆偿;當(dāng)y=1時柒爸,只有左邊的式子,恰好是左邊分類任務(wù)的情況事扭。這樣得一個式子可以表達前面的分類任務(wù)的兩個式子捎稚,這兩部分是等價的。

這樣求橄,就得到了事件發(fā)生的概率函數(shù)今野。

回到了概率問題,我們希望當(dāng)x的取某個值時罐农,通過和未通過的概率都越大越好(就是概率越接近100%最好)条霜,這樣才最接近我們現(xiàn)實的情況。

這樣就得到似然函數(shù):

屏幕快照 2018-01-19 23.46.28.png

轉(zhuǎn)換為梯度下降任務(wù)后求導(dǎo):

屏幕快照 2018-01-19 23.47.57.png

結(jié)果

這樣涵亏,我們使用梯度下降的方法宰睡,先定義一個theta矩陣,

求對數(shù)似然函數(shù)變換的(損失函數(shù))的值气筋。

然后定義步長拆内,更新theta矩陣,繼續(xù)求損失函數(shù)的值宠默。

從這n次迭代中挑選使損失函數(shù)最小的theta矩陣麸恍。

屏幕快照 2018-01-19 23.53.10.png

邏輯回歸實踐

https://github.com/yyllove123/StudyMachineLearning

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市搀矫,隨后出現(xiàn)的幾起案子抹沪,更是在濱河造成了極大的恐慌刻肄,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件采够,死亡現(xiàn)場離奇詭異肄方,居然都是意外死亡,警方通過查閱死者的電腦和手機蹬癌,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門权她,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人逝薪,你說我怎么就攤上這事隅要。” “怎么了董济?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵步清,是天一觀的道長。 經(jīng)常有香客問我虏肾,道長廓啊,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任封豪,我火速辦了婚禮谴轮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘吹埠。我一直安慰自己第步,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布缘琅。 她就那樣靜靜地躺著粘都,像睡著了一般。 火紅的嫁衣襯著肌膚如雪刷袍。 梳的紋絲不亂的頭發(fā)上翩隧,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天,我揣著相機與錄音呻纹,去河邊找鬼鸽心。 笑死,一個胖子當(dāng)著我的面吹牛居暖,可吹牛的內(nèi)容都是我干的顽频。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼太闺,長吁一口氣:“原來是場噩夢啊……” “哼糯景!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤蟀淮,失蹤者是張志新(化名)和其女友劉穎最住,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體怠惶,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡涨缚,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了策治。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片脓魏。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖通惫,靈堂內(nèi)的尸體忽然破棺而出茂翔,到底是詐尸還是另有隱情,我是刑警寧澤履腋,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布珊燎,位于F島的核電站,受9級特大地震影響遵湖,放射性物質(zhì)發(fā)生泄漏悔政。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一延旧、第九天 我趴在偏房一處隱蔽的房頂上張望谋国。 院中可真熱鬧,春花似錦垄潮、人聲如沸烹卒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至逢勾,卻和暖如春牡整,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背溺拱。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工逃贝, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人迫摔。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓沐扳,卻偏偏與公主長得像,于是被迫代替她去往敵國和親句占。 傳聞我的和親對象是個殘疾皇子沪摄,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容

  • AI人工智能時代,機器學(xué)習(xí),深度學(xué)習(xí)作為其核心杨拐,本文主要介紹機器學(xué)習(xí)的基礎(chǔ)算法祈餐,以詳細(xì)線介紹 線性回歸算法 及其 ...
    erixhao閱讀 13,854評論 0 36
  • 機器學(xué)習(xí)是做NLP和計算機視覺這類應(yīng)用算法的基礎(chǔ),雖然現(xiàn)在深度學(xué)習(xí)模型大行其道哄陶,但是懂一些傳統(tǒng)算法的原理和它們之間...
    在河之簡閱讀 20,500評論 4 65
  • 注:題中所指的『機器學(xué)習(xí)』不包括『深度學(xué)習(xí)』帆阳。本篇文章以理論推導(dǎo)為主,不涉及代碼實現(xiàn)屋吨。 前些日子定下了未來三年左右...
    我偏笑_NSNirvana閱讀 39,968評論 12 145
  • 該文章個人主頁文章鏈接蜒谤,圖片與公式在這里可顯示 [這里少通汽車,每天只有幾班車通往外界离赫,卻是自我歸零的佳地芭逝。—— ...
    瀟慕雨閱讀 609評論 0 0
  • 我夢見一座新蓋的學(xué)院 樓上龍飛鳳舞地寫著“菲力浦” 不是人名菲利普 也不是電器飛利浦 就是這幾個字:菲力浦 有人在...
    藍(lán)柿閱讀 215評論 5 1