數(shù)據(jù)挖掘干貨總結(jié)(七)-- LR回歸算法

本文共計(jì)1234字慨蓝,預(yù)計(jì)閱讀時(shí)長(zhǎng)八分鐘



回歸算法

?

疚顷、回歸的本質(zhì)

發(fā)現(xiàn)y和x的規(guī)律跋核,以預(yù)測(cè)新情況下的y值

除抛、回歸算法的分類

1. 線性回歸(Linear Regression)

1)一元線性回歸

? 輸入

一元自變量x,一元因變量y

? 回歸模型

模型輸出:y= wx + b

模型參數(shù):w, b

? 損失函數(shù)

對(duì)每個(gè)樣本半沽,預(yù)測(cè)值y' = wx?+ b, 誤差:ε?= y?- y'

損失函數(shù)身诺,即最小化誤差平方和:minΣε=minΣ(wx+b-y)

令導(dǎo)數(shù)等于0,求出上式的w, b?即可

2)多元線性回歸

? 輸入

自變量是一個(gè)向量x抄囚,因變量數(shù)值y

? 回歸模型

模型輸出:

模型參數(shù):w(向量)

? 損失函數(shù)

對(duì)每個(gè)樣本,預(yù)測(cè)值y' = wx?, 誤差:ε?= y?- y'

損失函數(shù)橄务,即最小化誤差平方和:

令導(dǎo)數(shù)等于0幔托,則?


2. 非線性回歸(none-Linear Regression)

如果回歸模型的因變量是自變量的非一次函數(shù)形式,回歸規(guī)律在圖形上表現(xiàn)為形態(tài)各異的各種曲線,稱為非線性回歸重挑。下面主要介紹機(jī)器學(xué)習(xí)中常見(jiàn)的一種非線性回歸——邏輯回歸(Logistic Regression)

? 輸入

自變量x嗓化,因變量y

注:y不再是連續(xù)值,而是離散值{0,1}

目標(biāo):根據(jù)特征x谬哀,預(yù)測(cè)發(fā)生概率p(y=1|x)和p(y=0|x)刺覆,哪個(gè)概率大,y就取哪個(gè)值

? 回歸模型

模型輸出:此時(shí)不能再設(shè)y= wx史煎,因?yàn)閥只能為0或1谦屑,所以我們需要換個(gè)思路

令:

因?yàn)樽笥覂蛇叺闹涤蚨际?[0,+∞),左邊的可以這么理解篇梭,

那么氢橙,

得到形似sigmoid的函數(shù):


故,將模型設(shè)為:

模型的參數(shù):w(向量)

? 損失函數(shù)(本篇的精華)

①?因?yàn)槟P偷慕Y(jié)果是兩個(gè)概率恬偷,無(wú)法計(jì)算y的誤差悍手。關(guān)于概率的問(wèn)題我們需要換個(gè)思路——最大似然估計(jì)當(dāng)從模型總體隨機(jī)抽取n組樣本觀測(cè)后,最合理的參數(shù)估計(jì)量應(yīng)該使得從模型中抽取該n組樣本觀測(cè)值的概率最大袍患。

看不懂對(duì)吧坦康?我的理解,就是通過(guò)后驗(yàn)概率求先驗(yàn)概率的原理诡延。

一個(gè)袋子中有20個(gè)球滞欠,只有黑白兩色,有放回的抽取十次孕暇,取出8個(gè)黑球和2個(gè)白球仑撞,計(jì)算袋子里有白球黑球各幾個(gè)。那么我會(huì)認(rèn)為我所抽出的這個(gè)樣本是被抽取的事件中概率最大的妖滔。p(黑球=8)=p* (1-p), 讓這個(gè)值最大隧哮。求導(dǎo)便得到p=0.8,即我們認(rèn)為袋子中黑球占了80%座舍。


②?最大似然對(duì)數(shù)似然

????因?yàn)樵谒惴ㄉ蟽绾瓦B乘不好處理(聚合函數(shù)里沒(méi)有連乘沮翔,只有連加sum),我們可以加個(gè)對(duì)數(shù)曲秉,巧妙地避開(kāi)了這個(gè)麻煩采蚀。


對(duì)數(shù)似然負(fù)對(duì)數(shù)似然

在機(jī)器學(xué)習(xí)需要迭代的算法中,都會(huì)有個(gè)損失函數(shù)承二,當(dāng)損失函數(shù)小于某個(gè)值時(shí)榆鼠,停止迭代,剛才的對(duì)數(shù)似然是在求最大值亥鸠,此時(shí)加個(gè)負(fù)號(hào)就變成最小值妆够。這樣识啦,又巧妙地滿足了這個(gè)套路。

注:這里負(fù)對(duì)數(shù)似然原則上不再叫損失函數(shù)神妹,而是有另外一個(gè)專有名詞——代理函數(shù)颓哮。


④?梯度下降法求解

為了計(jì)算得到這個(gè)負(fù)對(duì)數(shù)似然函數(shù)L(w)的最小值,需要借助梯度下降法


我們可以模擬這樣的一個(gè)過(guò)程:你來(lái)到一個(gè)盆地鸵荠,剛好晚上起霧了冕茅,能見(jiàn)度很差,如果規(guī)定不能坐纜車蛹找,只能步行下山姨伤,想要盡快到達(dá)盆地底部,正常人都會(huì)遵循的三個(gè)原則:

1.每次選擇坡度最陡的方向前進(jìn)(即梯度的反方向)熄赡;

2.越接近底部姜挺,步頻會(huì)越小,否則很有可能錯(cuò)過(guò)最低點(diǎn)彼硫;

3.連續(xù)走了幾步發(fā)現(xiàn)在海拔上并沒(méi)有太大的變化炊豪,基本就可以判斷到達(dá)了盆地底部。

所以梯度下降法的核心類似:

1.設(shè)置初始w拧篮,計(jì)算L(w)

2.計(jì)算梯度d = ▽L(w)

得到下降方向選擇:dir = -d

3.調(diào)用line search得到下降后的w'和L(w')

i)?設(shè)定初始步長(zhǎng)c>0词渤,容許度0<b<1,折半因子0<a<1

ii) w' = w+c*dir,?計(jì)算得到L(w')

4.迭代與停止條件

i) ?令w = w', L(w) = L(w'), c = a*c,?繼續(xù)第2步串绩;

ii)?如果L(w') - L(w) < b*c缺虐,停止(為了避免死循環(huán),設(shè)置一個(gè)迭代次數(shù)k礁凡,達(dá)到k次也可以停止)高氮。



(個(gè)人總結(jié),歡迎指正)


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末顷牌,一起剝皮案震驚了整個(gè)濱河市剪芍,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌窟蓝,老刑警劉巖罪裹,帶你破解...
    沈念sama閱讀 218,122評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異运挫,居然都是意外死亡状共,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)谁帕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)峡继,“玉大人,你說(shuō)我怎么就攤上這事匈挖∧肱疲” “怎么了颠猴?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,491評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)小染。 經(jīng)常有香客問(wèn)我,道長(zhǎng)贮折,這世上最難降的妖魔是什么裤翩? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,636評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮调榄,結(jié)果婚禮上踊赠,老公的妹妹穿的比我還像新娘。我一直安慰自己每庆,他們只是感情好筐带,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,676評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著缤灵,像睡著了一般伦籍。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上腮出,一...
    開(kāi)封第一講書(shū)人閱讀 51,541評(píng)論 1 305
  • 那天帖鸦,我揣著相機(jī)與錄音,去河邊找鬼胚嘲。 笑死作儿,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的馋劈。 我是一名探鬼主播攻锰,決...
    沈念sama閱讀 40,292評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼妓雾!你這毒婦竟也來(lái)了娶吞?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,211評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤君珠,失蹤者是張志新(化名)和其女友劉穎寝志,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體策添,經(jīng)...
    沈念sama閱讀 45,655評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡材部,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,846評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了唯竹。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片乐导。...
    茶點(diǎn)故事閱讀 39,965評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖浸颓,靈堂內(nèi)的尸體忽然破棺而出蔚约,到底是詐尸還是另有隱情薪丁,我是刑警寧澤价说,帶...
    沈念sama閱讀 35,684評(píng)論 5 347
  • 正文 年R本政府宣布,位于F島的核電站蛾狗,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏仪媒。R本人自食惡果不足惜沉桌,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,295評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望算吩。 院中可真熱鬧留凭,春花似錦、人聲如沸偎巢。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,894評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)压昼。三九已至求冷,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間巢音,已是汗流浹背遵倦。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,012評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留官撼,地道東北人梧躺。 一個(gè)月前我還...
    沈念sama閱讀 48,126評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像傲绣,于是被迫代替她去往敵國(guó)和親掠哥。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,914評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容