稀疏學(xué)習(xí)
帶約束的LS+交叉驗(yàn)證組合是非常有效的回歸方法, 缺點(diǎn)是參數(shù)太多時(shí)求解耗時(shí).
稀疏學(xué)習(xí)將大部分參數(shù)置0, 大大加速參數(shù)求解.
L1約束的LS
稀疏學(xué)習(xí)使用L1條件約束:
其中,
L1和L2對比:
以對于參數(shù)的線性模型為例對上圖做分析:
- 訓(xùn)練誤差是關(guān)于的向下的二次凸函數(shù), 因此在參數(shù)空間內(nèi)有橢圓狀等高線, 底部是最小二乘解
- :橢圓等高線和圓周交點(diǎn)是L2約束LS的解, 即-Constrained Least Squares
- :橢圓等高線和菱形的角的焦點(diǎn)是L1約束LS的解, L1約束LS的解一定位于參數(shù)的軸上
L1CLS的解在參數(shù)軸上, 很容易用稀疏的方式求解.
L1約束的LS求解
利用拉格朗日對偶問題求解, 考慮L1正則化的最優(yōu)化問題:
L1范數(shù)原點(diǎn)不能微分, 用微分的二次函數(shù)控制:
函數(shù)如圖:
L2正則化LS一般表達(dá)式:
線性模型
幾個(gè)解的函數(shù)圖像:
高斯核模型
分別用L1,L2約束求解:
求解結(jié)果:
結(jié)論: 結(jié)果無太大差異, 但L2約束的LS的50個(gè)參數(shù)全部非0; L1約束LS的50個(gè)參數(shù), 有37個(gè)為0, 學(xué)習(xí)結(jié)果是是13個(gè)核函數(shù)的線性擬合.
Lp約束的LS
L1,L2范數(shù)的更廣義定義, 范數(shù):
時(shí)稱最大值范數(shù):
范數(shù)表示非零向量元素個(gè)數(shù):
范數(shù)的單位球(R=1):
分析:
稀疏解存在的特殊條件:
如此, 只有范數(shù)滿足條件, L1約束的LS是非常特殊的學(xué)習(xí)方法
滿足范數(shù)約束條件的空間性質(zhì):
L1+L2約束的LS
約束的LS也稱為彈性網(wǎng)絡(luò)
先回顧兩個(gè)模型.
-
線性模型
是基函數(shù)向量, 基函數(shù)舉例:
-
核模型
高斯核函數(shù):
回顧約束:
-
約束
轉(zhuǎn)化為拉格朗日對偶問題:
不考慮參數(shù)空間圓的半徑R時(shí)化簡為:
-
約束:
轉(zhuǎn)化為拉格朗日對偶問題:
-
的參數(shù)空間:
L1約束的限制:
- 參數(shù)b比訓(xùn)練樣本n多時(shí), 線性模型可選擇的最大特征數(shù)被局限為n
- 線性模型中形成集群構(gòu)造(有多個(gè)基函數(shù)相似的集合)時(shí), LS選擇一個(gè)忽略其它, 核模型輸入樣本是簇構(gòu)造是更易形成集群構(gòu)造
- 參數(shù)b比樣本n少時(shí), 的通用性比更差
解決方案是:
范數(shù)單位球:
范數(shù)的單位球:
結(jié)論:
- 單位球凸, 角部呈尖形, 故和一樣易求得稀疏解
- 可學(xué)得n個(gè)以上非零參數(shù)
- 基函數(shù)為集合構(gòu)造時(shí), 常以集合為單位對基函數(shù)選擇
- 比約束的LS具有更高的精度