機(jī)器學(xué)習(xí)——線性模型

  1. 基本概念
  2. 線性回歸
  3. 對數(shù)幾率回歸 (邏輯回歸)
  4. 線性判別分析(Fisher判別回歸) 重要
  5. 多分類學(xué)習(xí)
  6. 類別不平衡問題
  7. 梯隊下降法

1. 基本概念

1.1 問題描述

給定數(shù)據(jù)集D = {(x_1,y_1), (x_1,y_1),......, (x_m,y_m)},其中x_i = (x_{i1}; x_{i2 }; x_{id}, y_i ∈ R)
通過線性模型盡可能準(zhǔn)確預(yù)測實(shí)值輸出標(biāo)志猖毫。

1.2 函數(shù)形式

1.3 向量形式

2. 線性回歸

2.1 問題描述

3.2 一元線性回歸

  • 只有一個屬性 d = 1,w, b是單個的數(shù)
  • 目標(biāo)函數(shù):w, b為參數(shù),是未知的。如何去確定w, b洒试?均值誤差最小化。
    目標(biāo)函數(shù)求解:即線性回歸模型的對最小二乘“參數(shù)估計”朴上。
    對w和b求導(dǎo)垒棋。

2.3 多元線性回歸

  • 關(guān)系式 f(x_i) = w^Tx_i +b, 使得f(x_i) ≈ y_i

2.4 對數(shù)線性回歸

  • 用線性關(guān)系實(shí)現(xiàn)非線性關(guān)系
    原型:y = w^Tx +b
    對數(shù):ln y = w^Tx +b
    對數(shù)線性回歸示意圖.png

2.5 廣義線性回歸

  • link function
    y = g + (w^Tx +b)

3. 對數(shù)幾率回歸 (邏輯回歸)

3.1 問題描述

  • 分類問題。
  • 對于簡單的二分類問題痪宰,實(shí)際上是樣本點(diǎn)到一個值域y∈{0,1}y∈{0,1}的函數(shù)叼架,表示這個點(diǎn)分在正類(postive)或者反類(negtive)的概率,若該樣本非骋虑耍可能是正類乖订,那么輸出的概率值越接近1;反之具练,若該樣本非痴Ч梗可能是負(fù)類,則輸出的概率值越接近0扛点。
    而線性回歸模型產(chǎn)生的預(yù)測值y = w^Tx +b是實(shí)數(shù)值哥遮,于是需要一個理想的函數(shù)來實(shí)現(xiàn)輸出實(shí)數(shù)值z到0/1值的轉(zhuǎn)化。
  • 最理想的是單位階躍函數(shù)(uint-step function)占键。
  • Sigmoid 函數(shù)


    單位階躍函數(shù)與對數(shù)幾率函數(shù).png

參考資料:機(jī)器學(xué)習(xí)方法(三):Logistic Regression 對數(shù)幾率回歸 | HowardWang的博客 (wanghao15536870732.github.io)

3.2 二分類任務(wù)

3.3 代碼

代碼塊

4. 線性判別分析(Fisher判別回歸)

5. 多分類學(xué)習(xí)

6. 類別不平衡問題

7. 梯隊下降法

7.1 基本思想

image.png
  • 梯度下降的目的昔善,就是為了最小化損失函數(shù)。尋找損失函數(shù)的最低點(diǎn)畔乙,就像我們在山谷里行走君仆,希望找到山谷里最低的地方。那么如何尋找損失函數(shù)的最低點(diǎn)呢牲距?在這里返咱,我們使用了微積分里導(dǎo)數(shù),通過求出函數(shù)導(dǎo)數(shù)的值牍鞠,從而找到函數(shù)下降的方向或者是最低點(diǎn)(極值點(diǎn))咖摹。
    損失函數(shù)里一般有兩種參數(shù),一種是控制輸入信號量的權(quán)重(Weight, w)难述,另一種是調(diào)整函數(shù)與真實(shí)值距離的偏差 (Bias, b)萤晴。通過梯度下降方法不斷地調(diào)整權(quán)重 w和偏差b吐句,使得損失函數(shù)的值變得越來越小。

  • 算法詳細(xì)過程:
    確定定參數(shù)的初始值店读,計算損失函數(shù)的偏導(dǎo)數(shù)嗦枢。
    將參數(shù)代入偏導(dǎo)數(shù)計算出梯度。若梯度為 0屯断,結(jié)束文虏;否則轉(zhuǎn)到 3。
    用步長乘以梯度殖演,并對參數(shù)進(jìn)行更新氧秘。

7.2 批量梯度下降

7.3 代碼

7.4 學(xué)習(xí)率問題

解決方法:1. 網(wǎng)格搜索:限制迭代次數(shù);2. 梯度限制:設(shè)置大量迭代

參考資料:機(jī)器學(xué)習(xí)方法(二):線性回歸 | HowardWang的博客 (wanghao15536870732.github.io)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末趴久,一起剝皮案震驚了整個濱河市丸相,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌朋鞍,老刑警劉巖已添,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異滥酥,居然都是意外死亡更舞,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進(jìn)店門坎吻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來缆蝉,“玉大人,你說我怎么就攤上這事瘦真】罚” “怎么了?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵诸尽,是天一觀的道長原杂。 經(jīng)常有香客問我,道長您机,這世上最難降的妖魔是什么穿肄? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮际看,結(jié)果婚禮上咸产,老公的妹妹穿的比我還像新娘。我一直安慰自己仲闽,他們只是感情好脑溢,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著赖欣,像睡著了一般屑彻。 火紅的嫁衣襯著肌膚如雪验庙。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天酱酬,我揣著相機(jī)與錄音壶谒,去河邊找鬼云矫。 笑死膳沽,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的让禀。 我是一名探鬼主播挑社,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼巡揍!你這毒婦竟也來了痛阻?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤腮敌,失蹤者是張志新(化名)和其女友劉穎阱当,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體糜工,經(jīng)...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡弊添,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了捌木。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片油坝。...
    茶點(diǎn)故事閱讀 40,424評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖刨裆,靈堂內(nèi)的尸體忽然破棺而出澈圈,到底是詐尸還是另有隱情,我是刑警寧澤帆啃,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布瞬女,位于F島的核電站,受9級特大地震影響努潘,放射性物質(zhì)發(fā)生泄漏诽偷。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一慈俯、第九天 我趴在偏房一處隱蔽的房頂上張望渤刃。 院中可真熱鬧,春花似錦贴膘、人聲如沸卖子。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽洋闽。三九已至玄柠,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間诫舅,已是汗流浹背羽利。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留刊懈,地道東北人这弧。 一個月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像虚汛,于是被迫代替她去往敵國和親匾浪。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,435評論 2 359

推薦閱讀更多精彩內(nèi)容