作為損失函數(shù):
L1 也被稱為最小絕對(duì)值偏差(LAD)涣易,最小絕對(duì)值誤差(LAE)。它是使目標(biāo)值與預(yù)測(cè)值的絕對(duì)值總和最小化
L2范數(shù)損失函數(shù),也被稱為最小平方誤差(LSE)枉圃。它是目標(biāo)值和預(yù)測(cè)值平方差的最小化芜壁。
作為損失函數(shù) L1和L2的區(qū)別如下:
轉(zhuǎn)自http://www.reibang.com/p/d4c6f7b48928
作為正則化:
在機(jī)器學(xué)習(xí)中礁凡,正規(guī)化是防止過(guò)擬合的一種重要技巧。從數(shù)學(xué)上講慧妄,它會(huì)增加一個(gè)正則項(xiàng)顷牌,防止系數(shù)擬合得過(guò)好以至于過(guò)擬合。L1與L2的區(qū)別只在于塞淹,L2是權(quán)重的平方和窟蓝,而L1就是權(quán)重的和。如下:
他們的性質(zhì)和區(qū)別:
內(nèi)置特征選擇是L1范數(shù)被經(jīng)常提及的有用的性質(zhì)饱普,而L2范數(shù)并不具備运挫。這是L1范數(shù)的自然結(jié)果,它趨向于產(chǎn)生稀疏的系數(shù)(在后面會(huì)解釋)套耕。假設(shè)模型有100個(gè)系數(shù)谁帕,但是僅僅只有其中的10個(gè)是非零的,這實(shí)際上是說(shuō)“其余的90個(gè)系數(shù)在預(yù)測(cè)目標(biāo)值時(shí)都是無(wú)用的”冯袍。L2范數(shù)產(chǎn)生非稀疏的系數(shù)雇卷,因此它不具備這個(gè)性質(zhì)。
??稀疏性指的是一個(gè)矩陣(或向量)中只有少數(shù)的項(xiàng)是非零的颠猴。L1范數(shù)具備性質(zhì):產(chǎn)生許多0或非常小的系數(shù)和少量大的系數(shù)关划。
??計(jì)算效率。L1范數(shù)沒(méi)有一個(gè)解析解翘瓮,但是L2范數(shù)有贮折。這就允許L2范數(shù)在計(jì)算上能高效地計(jì)算。然而资盅,L1范數(shù)的解具備稀疏性调榄,這就允許它可以使用稀疏算法踊赠,以使得計(jì)算更加高效。
作者:但盼風(fēng)雨來(lái)_jc
鏈接:http://www.reibang.com/p/d4c6f7b48928
來(lái)源:簡(jiǎn)書(shū)
(說(shuō)明:僅作為筆記使用 如有侵權(quán) 必當(dāng)刪之)