Least Square和Maximum Likelihood及他們的關(guān)系

引言

不論是優(yōu)化以及統(tǒng)計學(xué)學(xué)習(xí)荆永,還是在生活中,因為固有的‘平均思維’般渡,最小二乘法是最直觀的理解懒豹。假設(shè)\hat{y}是想要估計的值,學(xué)習(xí)過數(shù)學(xué)的同學(xué)首先想到的是找到一個\hat{y}驯用,使手上數(shù)據(jù)的殘差最小脸秽。

  • 一次殘差 : e_i = y_i - \hat{y}
  • 二次殘差:e_i = (y_i - \hat{y})^{2}
  • 高次殘差:e_i = (y_i - \hat{y})^k,k>2

一次殘差會因為正負(fù)而抵消掉,二次則很好地保留了每一個數(shù)據(jù)的殘差信息晨汹,而為什么不用高次豹储,可能源于奧卡姆剃須刀吧贷盲。(最小二乘法的最優(yōu)性質(zhì)討論不在本文討論范圍)


圖片來源于網(wǎng)絡(luò)淘这,侵刪

進入正題剥扣,因為上課老師總是說,線性回歸中铝穷,最小二乘法和極大似然法在正態(tài)殘差的條件下是等價的钠怯,本文的目的是想記錄下具體數(shù)學(xué)推導(dǎo)。

線性回歸的矩陣標(biāo)記法

Matrix Notation

如果數(shù)據(jù)滿足(Gauss-Markov conditions):

  • E(\varepsilon) = 0: 殘差之和為零
  • \varepsilon_i 獨立且同方差(Var(\varepsilon) = \sigma^2

剛剛提到曙聂,最小二乘法是要優(yōu)化二次殘差使其最小晦炊,因此對目標(biāo)函數(shù)\sum_{i=0}^n e^2_i(\beta) 求導(dǎo)然后令倒數(shù)等于零即可得到\beta的(全局)最優(yōu)解。
上面的全局之所以打括號宁脊,是因為對數(shù)據(jù)断国,也就是Xy有一定要求。同學(xué)門都知道榆苞,一階導(dǎo)數(shù)需要滿足單調(diào)稳衬,才能使一階導(dǎo)數(shù)等于0所計算得出的參數(shù)為全局最小(倒數(shù)為單調(diào)遞增且過x軸)或者最大(倒數(shù)為單調(diào)遞減且過x軸)坐漏。
回到倒數(shù)求解薄疚,可以轉(zhuǎn)換成矩陣表示方法,最小二次殘差下的\beta滿足 X^tX\beta = X^ty. 因此赊琳,如果 Rank(X) = p \leq n街夭,即等價于前述的單調(diào)條件,可以求得最優(yōu)解躏筏。

LS Estimator

從公式可以看出板丽,最小二乘估計利用了數(shù)據(jù)的所有信息(Xy)。
另外插播一段寸士,如果為非奇異矩陣(同X不滿秩)檐什,則目標(biāo)函數(shù)存在許多局部最小值,我們成為存在多重共線性弱卡,具體本文不做討論乃正。這也牽涉到為什么比如神經(jīng)網(wǎng)絡(luò)的優(yōu)化需要用搜索目標(biāo)函數(shù)最小值的辦法,因為如果要更精確地求出最優(yōu)解需要使用到更高次求導(dǎo)婶博,給計算機程序設(shè)計帶來了許多挑戰(zhàn)瓮具。
Local minima

極大似然法

極大似然法是典型的參數(shù)模型(也就是不是非參數(shù)模型),使用前需要假設(shè)數(shù)據(jù)分布凡人。同樣名党,假設(shè)殘差\varepsilon滿足正態(tài),期望為零挠轴,獨立且同方差的條件传睹,那么Y也服從正態(tài)分布。
(直觀解釋也就是重復(fù)實驗使用相同的X值岸晦,會得到服從正態(tài)分布的Y欧啤,且對于所有X都滿足睛藻,標(biāo)準(zhǔn)差都為\sigma

Y服從正態(tài)分布

因此,可以得到似然函數(shù)為
正態(tài)似然函數(shù)

注意:如果方差不相同邢隧,似然函數(shù)累乘則不能化簡為上式店印。可見假設(shè)的重要性倒慧。
對對數(shù)似然函數(shù)(log-likelihood function)中的求導(dǎo)取零按摘,得到等式為,
優(yōu)化函數(shù)

有木有似曾相識H伊隆l畔汀!
沒錯付秕,可以看出極大似然下的估計值\hat{\beta}_{ML}\hat{\beta}_{LS}完全一致照激。

回到兩種方法的對比,里面都對數(shù)據(jù)做了正態(tài)殘差假設(shè)盹牧。對于最小二乘法俩垃,是希望給定X的情況下得到Y(jié)的期望為回歸所得值,即E(y_i|X=x_i)=\beta x_i汰寓;而對于極大似然估計口柳,是為了使用正態(tài)分布的概率密度函數(shù)(正態(tài)殘差可以推導(dǎo)出y服從正態(tài)分布)。隱約可以感受到正態(tài)分布所帶來的強大力量有滑。(統(tǒng)計推斷更能體現(xiàn))


最后作為附錄跃闹,給出估計值\hat{\beta}_{LS}的推導(dǎo)過程。(其中用到了對矩陣求倒數(shù)的公式毛好,具體請參考Wiki: Matrix_calculus望艺。下面給出使用了的三個公式,截圖自wiki肌访。注意第三列為行向量表示結(jié)果找默,第四列為列向量表示結(jié)果。下面的證明(也是習(xí)慣)使用的是列向量表示方法吼驶。

matrix calculus

LS參數(shù)估計矩陣推導(dǎo)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末惩激,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子蟹演,更是在濱河造成了極大的恐慌风钻,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,252評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件酒请,死亡現(xiàn)場離奇詭異骡技,居然都是意外死亡,警方通過查閱死者的電腦和手機羞反,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評論 3 399
  • 文/潘曉璐 我一進店門布朦,熙熙樓的掌柜王于貴愁眉苦臉地迎上來毛萌,“玉大人,你說我怎么就攤上這事喝滞。” “怎么了膏秫?”我有些...
    開封第一講書人閱讀 168,814評論 0 361
  • 文/不壞的土叔 我叫張陵右遭,是天一觀的道長。 經(jīng)常有香客問我缤削,道長窘哈,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,869評論 1 299
  • 正文 為了忘掉前任亭敢,我火速辦了婚禮滚婉,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘帅刀。我一直安慰自己让腹,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 68,888評論 6 398
  • 文/花漫 我一把揭開白布扣溺。 她就那樣靜靜地躺著骇窍,像睡著了一般。 火紅的嫁衣襯著肌膚如雪锥余。 梳的紋絲不亂的頭發(fā)上腹纳,一...
    開封第一講書人閱讀 52,475評論 1 312
  • 那天,我揣著相機與錄音驱犹,去河邊找鬼嘲恍。 笑死,一個胖子當(dāng)著我的面吹牛雄驹,可吹牛的內(nèi)容都是我干的佃牛。 我是一名探鬼主播,決...
    沈念sama閱讀 41,010評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼医舆,長吁一口氣:“原來是場噩夢啊……” “哼吁脱!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起彬向,我...
    開封第一講書人閱讀 39,924評論 0 277
  • 序言:老撾萬榮一對情侶失蹤兼贡,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后娃胆,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體遍希,經(jīng)...
    沈念sama閱讀 46,469評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,552評論 3 342
  • 正文 我和宋清朗相戀三年里烦,在試婚紗的時候發(fā)現(xiàn)自己被綠了凿蒜。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片禁谦。...
    茶點故事閱讀 40,680評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖废封,靈堂內(nèi)的尸體忽然破棺而出州泊,到底是詐尸還是另有隱情,我是刑警寧澤漂洋,帶...
    沈念sama閱讀 36,362評論 5 351
  • 正文 年R本政府宣布遥皂,位于F島的核電站,受9級特大地震影響刽漂,放射性物質(zhì)發(fā)生泄漏演训。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,037評論 3 335
  • 文/蒙蒙 一贝咙、第九天 我趴在偏房一處隱蔽的房頂上張望样悟。 院中可真熱鬧,春花似錦庭猩、人聲如沸窟她。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽礁苗。三九已至,卻和暖如春徙缴,著一層夾襖步出監(jiān)牢的瞬間试伙,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評論 1 274
  • 我被黑心中介騙來泰國打工于样, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留疏叨,地道東北人。 一個月前我還...
    沈念sama閱讀 49,099評論 3 378
  • 正文 我出身青樓穿剖,卻偏偏與公主長得像蚤蔓,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子糊余,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,691評論 2 361

推薦閱讀更多精彩內(nèi)容