線性回歸

線性模型:對(duì)于每個(gè)i有:y_{i}=w^{\top} x_{i}+\varepsilon_{i}

排成一個(gè)矩陣的形式:

Y=X w+\varepsilon

其中?X  是\quad n \times d

直接解就得到:w^{*}=\left(X^{T} X\right)^{-1} X^{T} y

=====

這里有幾個(gè)問(wèn)題:1睛竣,X^{T} X不可逆的話就只能取廣義逆

? ? ? ? ? ? ? ? ? ? ? ? ? ? ?2晰房,如果X^{T} X不可逆,那么求出來(lái)的w還是無(wú)偏估計(jì)射沟,但是會(huì)有大的方差(這樣的話有時(shí)候估計(jì)出來(lái)的w就會(huì)很大殊者。)

? ? ? ? ? ? ? ? ? ? ? ? ? ? ?3,X有共線性的時(shí)候验夯,也是不可逆

=====


解決方案:考慮加入顯示正則項(xiàng):

\min _{\theta} \frac{1}{N} \sum_{i=1}^{N} l\left(f\left(x_{i} ; \theta\right), y_{i}\right)+R(\theta)

R的選擇是兩方面決定的:1猖吴,本身參數(shù)應(yīng)該有的統(tǒng)計(jì)特征。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?2挥转,應(yīng)當(dāng)減少參數(shù)的復(fù)雜度海蔽。

=====

嶺回歸:可以有閉合解小方差估計(jì)绑谣,但是有偏差党窜。

=====

LASSO:可以有稀疏解,但是不閉合借宵。是一個(gè)很好的變量選擇的方法幌衣。一般在d遠(yuǎn)大于n的時(shí)候很好用。這時(shí)候最多選擇出n個(gè)非零的元壤玫。

用ISTA解決LASSO:通常我們的梯度下降公式\boldsymbol{w}^{(t+1)}=\boldsymbol{w}^{(t)}-\eta \nabla f\left(\boldsymbol{w}^{(t)}\right)可以用下面的方法得到:

\boldsymbol{w}^{(t+1)}=\underset{\boldsymbol{w}}{\operatorname{argmin}} f\left(\boldsymbol{w}^{(t)}\right)+\nabla f\left(\boldsymbol{w}^{(t)}\right)^{\mathrm{T}}\left(\boldsymbol{w}-\boldsymbol{w}^{(t)}\right)+\frac{1}{2 \eta}\left\|\boldsymbol{w}-\boldsymbol{w}^{(t)}\right\|_{2}^{2}

如果我們把上面的式子寫的更加一般:

\begin{aligned} \boldsymbol{w}^{(t+1)} &=\underset{\boldsymbol{w}}{\operatorname{argmin}} f\left(\boldsymbol{w}^{(t)}\right)+\nabla f(\boldsymbol{w})^{\mathrm{T}}\left(\boldsymbol{w}-\boldsymbol{w}^{(t)}\right)+\frac{1}{2 \eta}\left\|\boldsymbol{w}-\boldsymbol{w}^{(t)}\right\|_{2}^{2}+g(\boldsymbol{w}) \\ &=\underset{\boldsymbol{w}}{\operatorname{argmin}} g(\boldsymbol{w})+\frac{1}{2 \eta}\left\|\boldsymbol{w}-\left(\boldsymbol{w}^{(t)}-\eta \nabla f\left(\boldsymbol{w}^{(t)}\right)\right)\right\|_{2}^{2} \end{aligned}

那么就相當(dāng)于是把原來(lái)的要優(yōu)化的f+g函數(shù)豁护,的f在xt二次展開了,二次用一個(gè)東西近似垦细。

在LASSO中我們讓f(\boldsymbol{w})=\frac{1}{2}\|\boldsymbol{y}-\boldsymbol{X} \boldsymbol{w}\|_{2}^{2} \quad g(\boldsymbol{w})=\lambda\|\boldsymbol{w}\|_{1}

=====

為什么LASSO更容易得到稀疏解:


看這張圖择镇。norm邊界和等高線的交點(diǎn)應(yīng)該是最優(yōu)解挡逼,在二維中尚看不清楚括改,但是在多維中,l1的邊界家坎,是很多角的嘱能,所以等高線會(huì)先碰到角上。這也就是為什么會(huì)有稀疏解虱疏。

=====

正則化路跡(lambda逐漸增大惹骂,估算的參數(shù)結(jié)果)可以檢查共線性程度(嶺回歸),如果很接近0且穩(wěn)定做瞪,或者震蕩著趨于0对粪,這樣的特征可以去掉右冻。

LASSO和嶺回歸的分別:


左邊是LASSO,可以看到雖然兩張圖著拭。隨著lambda變大纱扭,這些回歸系數(shù)都趨近0.但是趨近于0的速度不同(LASSO),所以LASSO可以用來(lái)變量選擇。

=====

兩個(gè)變種:

彈性LASSOJ(\boldsymbol{w})=\|\boldsymbol{y}-\boldsymbol{X} \boldsymbol{w}\|_{2}^{2}+\lambda_{1}\|\boldsymbol{w}\|_{1}+\lambda_{2}\|\boldsymbol{w}\|_{2}^{2}

LASSO的缺點(diǎn)就是儡遮,有時(shí)候兩個(gè)特征都很重要乳蛾,但是因?yàn)橄嚓P(guān)性強(qiáng)烈,就被LASSO剔除了其中一個(gè)鄙币。而我們希望都能保留:

Group LASSO

有時(shí)候變量是一組一組的肃叶,一組一組地保留或者丟棄。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末十嘿,一起剝皮案震驚了整個(gè)濱河市因惭,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌绩衷,老刑警劉巖筛欢,帶你破解...
    沈念sama閱讀 219,270評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異唇聘,居然都是意外死亡版姑,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門迟郎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)剥险,“玉大人,你說(shuō)我怎么就攤上這事宪肖”碇疲” “怎么了?”我有些...
    開封第一講書人閱讀 165,630評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵控乾,是天一觀的道長(zhǎng)顶别。 經(jīng)常有香客問(wèn)我豌骏,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,906評(píng)論 1 295
  • 正文 為了忘掉前任脾歧,我火速辦了婚禮祭衩,結(jié)果婚禮上所坯,老公的妹妹穿的比我還像新娘晒骇。我一直安慰自己,他們只是感情好镰吆,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,928評(píng)論 6 392
  • 文/花漫 我一把揭開白布帘撰。 她就那樣靜靜地躺著,像睡著了一般万皿。 火紅的嫁衣襯著肌膚如雪摧找。 梳的紋絲不亂的頭發(fā)上核行,一...
    開封第一講書人閱讀 51,718評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音蹬耘,去河邊找鬼钮科。 笑死,一個(gè)胖子當(dāng)著我的面吹牛婆赠,可吹牛的內(nèi)容都是我干的绵脯。 我是一名探鬼主播,決...
    沈念sama閱讀 40,442評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼休里,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼蛆挫!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起妙黍,我...
    開封第一講書人閱讀 39,345評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤悴侵,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后拭嫁,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體可免,經(jīng)...
    沈念sama閱讀 45,802評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,984評(píng)論 3 337
  • 正文 我和宋清朗相戀三年做粤,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了浇借。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,117評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡怕品,死狀恐怖妇垢,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情肉康,我是刑警寧澤闯估,帶...
    沈念sama閱讀 35,810評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站吼和,受9級(jí)特大地震影響涨薪,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜炫乓,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,462評(píng)論 3 331
  • 文/蒙蒙 一刚夺、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧厢岂,春花似錦光督、人聲如沸阳距。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,011評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)筐摘。三九已至卒茬,卻和暖如春船老,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背圃酵。 一陣腳步聲響...
    開封第一講書人閱讀 33,139評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工柳畔, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人郭赐。 一個(gè)月前我還...
    沈念sama閱讀 48,377評(píng)論 3 373
  • 正文 我出身青樓薪韩,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親捌锭。 傳聞我的和親對(duì)象是個(gè)殘疾皇子俘陷,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,060評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 如上篇文章, 嶺回歸观谦、Lasso回歸和ElasticNet 回歸都是以普通的線性回歸為基礎(chǔ)拉盾,先列舉下線性回歸的模型...
    wujustin閱讀 2,561評(píng)論 2 0
  • “廣義線性模型”,是指線性模型及其簡(jiǎn)單的推廣豁状,包括嶺回歸捉偏,lasso,LAR泻红,logistic回歸夭禽,感知器等等。 ...
    龍鷹圖騰223閱讀 1,851評(píng)論 1 2
  • 本次推文介紹用線性模型處理回歸問(wèn)題谊路。 從簡(jiǎn)單問(wèn)題開始驻粟,先處理一個(gè)響應(yīng)變量和一個(gè)解釋變量的一元問(wèn)題。 然后凶异,介紹多元...
    wyrover閱讀 44,147評(píng)論 3 49
  • 1.表達(dá)形式: 一個(gè)示例有 個(gè)屬性:蜀撑,其表達(dá)形式為:其中 2.標(biāo)準(zhǔn)線性回歸 令預(yù)測(cè)值與真實(shí)值的均方根誤差最小化 2...
    To_QT閱讀 1,308評(píng)論 0 4
  • 線性回歸算法 注:本文所有代碼和數(shù)據(jù)均在個(gè)人github下click me 回歸算法一般是針對(duì)預(yù)測(cè)是連續(xù)的情況下,...
    leeliang閱讀 1,732評(píng)論 0 5