ML基本理念

線性回歸

通俗地說就是讓機器畫條線礁遣,使盡量多的點落在這個直線上,新的數(shù)據(jù)便可根據(jù)這條曲線獲得對應預測值

f(x)=ax+b為例肿仑,數(shù)學上通過最小二乘法計算真實與估測的誤差:\frac{∑(樣本預測值f(x_i)-真實值y_i)^2}{樣本總數(shù)m}

開平方使負數(shù)為正坑律,因為誤差概念上是個正數(shù)。當然使用絕對值伯襟,不過絕對值非連續(xù)可導猿涨,數(shù)學性質(zhì)不好,最小二乘法是滿足問題最經(jīng)典的解決方式逗旁。我們的目標就是調(diào)節(jié)a嘿辟、b使誤差具有最小值:J=\frac{1}{2m} ∑(f(x_i)-y_i)^2

上述函數(shù)稱為代價函數(shù)或損失函數(shù),原f(x)為需要求解的目標函數(shù)片效。損失函數(shù)的\frac{1}{2} 僅是剛好抵消后續(xù)求平方導數(shù)的常數(shù)2

邏輯回歸

通俗地說就是讓機器畫條線红伦,使兩類數(shù)據(jù)離這條線越遠越好。因為離得越遠的數(shù)據(jù)越具備明顯的分類特征淀衣,假設一個樣本剛好在曲線上昙读,你說它是圓還是叉?

邏輯回歸是解決分類問題膨桥,主流解決思想是最大似然估計:已知結果蛮浑,推測概率唠叛。以擲硬幣為例,100次試驗得到70次正面沮稚,則似然函數(shù)為L(p)=p^{70}(1-p)^{30}艺沼,p=0.7時獲得最大值,似然函數(shù)代表一種公信力:正面概率為0.7時蕴掏,最可能產(chǎn)生10次投擲出現(xiàn)7次正面的情況障般。對于只有2種結果(伯努利分布)的分類問題,邏輯回歸中的損失函數(shù)使用似然函數(shù):f(x)代表機器預測概率盛杰,y代表真實概率

L=∏f(x_i)^{y_i}(1-f(x_i))^{1-y_i}??y_i=0,1

由于小數(shù)連乘易下溢(過多小數(shù)0.0...0導致計算機設置為0)挽荡,使用對數(shù)簡化

J=ln∏f(x_i)^{y_i}(1-f(x_i))^{1-y_i}=∑(y_ilnf(x_i)+(1-y_i)ln(1-f(x_i)))

求解函數(shù)最大值即可滿足目標:正樣本y_i=1f(x_i)預測值盡量為1、負樣本y_i=0f(x_i)預測值盡量為0即供。以圖識貓為例定拟,一張貓圖的真實結果應為(1,0),而實際預測為(0.8,0.2)逗嫡,雖說80%是貓大概率可認定是貓圖青自,但我們還是希望預測值盡量為(1,0)

f(x)是預測概率,那么需要尋找一個能將任意輸出值轉(zhuǎn)化為區(qū)間在0-1的函數(shù)

Sigmoid值域∈(0,1)且求導方便驱证,剛好滿足要求性穿,從而成為邏輯回歸問題中的御用函數(shù)。將Sigmoid的x換成f(x)雷滚,即回到線性回歸:定義目標函數(shù)f(x),求最優(yōu)參數(shù)使得損失函數(shù)值最大

對于多分類問題吗坚,轉(zhuǎn)化為單分類問題即可:先識別是不是三角形祈远、再識別是不是正方形...

Softmax

對于多分類問題,常使用P_i=\frac{e^{p_i}}{∑e^{p_j}} =\frac{e^{f(x_i)}}{∑e^{f(x_j)}} 進行預測

如識別貓升級為識別貓商源、狗车份、馬,一張貓圖的真實結果應為(1,0,0)牡彻,通過上述函數(shù)可預測為(0.88,0.12,0)

注:以上結果將最大值直接置為1扫沼,其他置為0的手段為Hardmax

Softmax由于指數(shù)運算,可能造成數(shù)據(jù)上溢(分子過大數(shù)據(jù)溢出)或下溢(分母過小被計算機置為0)庄吼,取M=max(f(x_i))缎除,則P_i=\frac{e^{f(x_i)-M}}{∑e^{f(x_j)-M}} ,則有f(x_i)-M≤0

①分子相當于(\frac{1}{2.7} )^a≈0.37^a总寻,不會造成上溢

②分母相當于e^0+e^a+...+e^b=1+0.37^a+...0.37^b器罐,不會造成下溢(e^0是具有最大值的那個樣本)

梯度下降

線性回歸、邏輯回歸中渐行,我們需要確定最終參數(shù)使得損失函數(shù)最大或最小轰坊。實際情況下待解方程式?jīng)]有閉式解或閉式求解復雜度較高(正規(guī)方程)铸董,梯度下降是解決函數(shù)最小值下最優(yōu)解的經(jīng)典方法(最大值則對應梯度上升)。以圖為例肴沫,小明站在山頂粟害,要求每走一步必須向下山的方向走

如果是二次函數(shù),則只會有一個山底颤芬,對應全局最優(yōu)解悲幅。就不會出現(xiàn)上圖中走到某個局部山谷里

以線性回歸中的參數(shù)w為例,則w=w-α \frac{dJ}{dw}

①導數(shù)大于0時驻襟,代表此時是上山方向夺艰,參數(shù)需往反方向移動下山

②導數(shù)小于0時,代表此時是下山方向沉衣,參數(shù)需保持該方向繼續(xù)下山

α是學習率郁副,需人工定義,過小運算次數(shù)會增多豌习,過大會逃離最優(yōu)解(越接近最優(yōu)解存谎,導數(shù)越趨近于0,α乘以導數(shù)后值變大肥隆,再乘以一次會越來越大既荚,導致離最優(yōu)解越來越遠)

實際運用,會從龐大的數(shù)據(jù)樣本中選取一個或部分進行梯度下降

批量梯度下降法 BGD:使用所有樣本進行參數(shù)更新

隨機梯度下降法 SGD:選擇一個樣本進行參數(shù)更新

小批量梯度下降法MBGD:選取部分樣本進行參數(shù)更新

正則化

過擬合(應試能力強栋艳,應用能力差)會造成曲線波動劇烈恰聘,某些部分的導數(shù)絕對值會過大。以線性回歸f(x)=w_mx^M_m+...w_1x_1+w_0為例吸占,w是特征向量的參數(shù)集合晴叨、M代表最高冪項,越復雜的多項式能實現(xiàn)越復雜的曲線(一次冪是直線矾屯、二次冪是凹凸曲線...)兼蕊,從而更加完美的擬合數(shù)據(jù)。因此M=3的擬合公式較為合適件蚕、M=9則實際應用效果不穩(wěn)定

簡化目標函數(shù)外優(yōu)化過擬合的另外一個方式則是正則化孙技。一個簡單的方法是約束所有參數(shù)和的范圍,使其不能超過這個范圍∑|w_i|≤C或∑w_i^2≤C排作。以兩個參數(shù)為例牵啦,藍色圓點為最優(yōu)解可完美擬合所有數(shù)據(jù),限定參數(shù)范圍即可使其無法達到最優(yōu)解纽绍。如∑w_i^2≤C代表參數(shù)僅能在半徑為C的圓圈內(nèi)尋找最優(yōu)解

C過大可使最優(yōu)解落在約束區(qū)間內(nèi)蕾久,假設最優(yōu)解未在約束區(qū)間g(w)內(nèi),則約束空間內(nèi)的最優(yōu)解將位于兩者梯度相反、切線平行的部分:▽J(w)=-k▽g(w)\rightarrow ▽J(w)+k▽g(w)=0

注:切線平行如向量\vec{a} =(2,4)僧著、\vec履因=(1,2),則有\vec{a}=k\vec盹愚栅迄,其中k=2

那么求導J=原損失函數(shù)+g(w)等于0時的最小值即為正則后的最優(yōu)解:

∑|w_i|≤C,則g(w)=k(∑|w_i|-C)

由于是求w最小值皆怕,則可簡化為g(w)=k∑|w_i|

此為LASSO回歸毅舆,損失函數(shù)形如f(x)=(x-c)^2+k|x|

當k達到一定大小時,會使最小值落在原點(相當于多項式函數(shù)中高階冪在變量較小時無法壓制低階冪愈腾,從而導致該區(qū)間內(nèi)展示低階冪曲線)憋活。這個屬性會導致部分特征參數(shù)為0,代表這個特征不是必要特征虱黄,可以考慮直接去掉此特征

∑w_i^2≤C悦即,則g(w)=k(∑w_i^2-C)

同理可簡化為g(w)=k∑w_i^2

此為RIDGE回歸,相對LASSO回歸會更加接近樣本真實情況

注:正則化一般不對常數(shù)項w_0進行懲罰橱乱,主要是對相關特征進行約束辜梳,實際使用中對w_0進行約束也沒有影響

ElasticNet回歸結合兩者優(yōu)勢,可表達為:

g(w)=k∑(αw_i^2+(1-α)|w_i|)泳叠,α可定義為0.5

g(w)=k_1∑w_i^2+k_2∑|w_i|

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末作瞄,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子危纫,更是在濱河造成了極大的恐慌宗挥,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,383評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件种蝶,死亡現(xiàn)場離奇詭異属韧,居然都是意外死亡,警方通過查閱死者的電腦和手機蛤吓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,522評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來糠赦,“玉大人会傲,你說我怎么就攤上這事∽驹螅” “怎么了淌山?”我有些...
    開封第一講書人閱讀 157,852評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長顾瞻。 經(jīng)常有香客問我泼疑,道長,這世上最難降的妖魔是什么荷荤? 我笑而不...
    開封第一講書人閱讀 56,621評論 1 284
  • 正文 為了忘掉前任退渗,我火速辦了婚禮移稳,結果婚禮上,老公的妹妹穿的比我還像新娘会油。我一直安慰自己个粱,他們只是感情好,可當我...
    茶點故事閱讀 65,741評論 6 386
  • 文/花漫 我一把揭開白布翻翩。 她就那樣靜靜地躺著都许,像睡著了一般。 火紅的嫁衣襯著肌膚如雪嫂冻。 梳的紋絲不亂的頭發(fā)上胶征,一...
    開封第一講書人閱讀 49,929評論 1 290
  • 那天,我揣著相機與錄音桨仿,去河邊找鬼睛低。 笑死,一個胖子當著我的面吹牛蹬敲,可吹牛的內(nèi)容都是我干的暇昂。 我是一名探鬼主播,決...
    沈念sama閱讀 39,076評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼伴嗡,長吁一口氣:“原來是場噩夢啊……” “哼急波!你這毒婦竟也來了?” 一聲冷哼從身側響起瘪校,我...
    開封第一講書人閱讀 37,803評論 0 268
  • 序言:老撾萬榮一對情侶失蹤澄暮,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后阱扬,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體泣懊,經(jīng)...
    沈念sama閱讀 44,265評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,582評論 2 327
  • 正文 我和宋清朗相戀三年麻惶,在試婚紗的時候發(fā)現(xiàn)自己被綠了馍刮。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,716評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡窃蹋,死狀恐怖卡啰,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情警没,我是刑警寧澤匈辱,帶...
    沈念sama閱讀 34,395評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站杀迹,受9級特大地震影響亡脸,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,039評論 3 316
  • 文/蒙蒙 一浅碾、第九天 我趴在偏房一處隱蔽的房頂上張望大州。 院中可真熱鬧,春花似錦及穗、人聲如沸摧茴。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,798評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽苛白。三九已至,卻和暖如春焚虱,著一層夾襖步出監(jiān)牢的瞬間购裙,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,027評論 1 266
  • 我被黑心中介騙來泰國打工鹃栽, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留躏率,地道東北人。 一個月前我還...
    沈念sama閱讀 46,488評論 2 361
  • 正文 我出身青樓民鼓,卻偏偏與公主長得像山林,于是被迫代替她去往敵國和親焕阿。 傳聞我的和親對象是個殘疾皇子狈癞,可洞房花燭夜當晚...
    茶點故事閱讀 43,612評論 2 350

推薦閱讀更多精彩內(nèi)容