AI瘋狂進(jìn)階——激活函數(shù)篇

本文作者專注于AI進(jìn)階算法貌矿,正在推出AI瘋狂進(jìn)階之基礎(chǔ)理論進(jìn)階篇,如有興趣可持續(xù)關(guān)注我黑低。

核心導(dǎo)讀:

1. 神經(jīng)網(wǎng)絡(luò)激活函數(shù)的作用是什么克握?

2. 如何評價(jià)激活函數(shù)的好壞枷踏?

3. ReLU存在哪些問題旭蠕?

4. 存在替換萬年ReLU的激活函數(shù)嗎?

1. 激活函數(shù)的作用是什么掏熬?

激活函數(shù)對于人工神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)孽江、理解非常復(fù)雜的數(shù)據(jù)來說具有十分重要的作用岗屏。激活函數(shù)給神經(jīng)元引入了非線性因素,使得神經(jīng)網(wǎng)絡(luò)可以逼近任何非線性函數(shù)婉烟,這樣神經(jīng)網(wǎng)絡(luò)就可以應(yīng)用到眾多的非線性模型中暇屋。目前最常見的激活函數(shù)當(dāng)屬ReLU以及在其基礎(chǔ)上改進(jìn)的如PReLU咐刨,RReLU,LeakyReLU等而涉。本文在激活函數(shù)上進(jìn)行了進(jìn)階總結(jié)联予,下面一一闡述:

2.如何評價(jià)激活函數(shù)的好壞?

目前學(xué)術(shù)界總計(jì)有50+類型的激活函數(shù)余蟹,但沒有統(tǒng)一的或者明確的標(biāo)準(zhǔn)去衡量激活函數(shù)的好壞威酒,最根本的原因是因?yàn)樯窠?jīng)網(wǎng)絡(luò)通過訓(xùn)練本質(zhì)上是去擬合訓(xùn)練數(shù)據(jù)的非線性分布话告,然而現(xiàn)實(shí)中數(shù)據(jù)的分布是無法統(tǒng)計(jì)的,所以采用哪種激活函數(shù)能擬合的更好是無法通過理論去推導(dǎo)出來佛呻,因此大部分論文都是通過在幾十種不同的任務(wù)上做實(shí)驗(yàn)去看準(zhǔn)確率以及準(zhǔn)確率浮動(dòng)的范圍(穩(wěn)定性)來評判激活函數(shù)的好壞吓著。從最近研究出的一些比較好的激活函數(shù)中可以總結(jié)出好的激活函數(shù)必須擁有以下三個(gè)特點(diǎn):

(1) Unboundedness(x>0無飽和區(qū)域):傳統(tǒng)的激活函數(shù)如sigmoid和tanh函數(shù)都有飽和區(qū)域送挑,所以必須依賴較好的初始化讓輸入數(shù)據(jù)處于非飽和區(qū)域惕耕,否則飽和區(qū)域產(chǎn)生的梯度過小會(huì)影響收斂速度,而Relu系列都是x>0無飽和區(qū)域欺缘。

(2)NegativeOutputs(x<0產(chǎn)生非0值):Relu在x<0的值全都是0,而PReLU谚殊,RReLU嫩絮,LeakyReLU最大的共同改進(jìn)點(diǎn)就是在x<0產(chǎn)生非0值围肥,少量的NegativeOutputs能減少神經(jīng)元訓(xùn)練過程中出現(xiàn)"die"的概率虐先,提升模型的魯棒性蛹批。

(3)Smoothness(平滑性):Relu,PReLU差导,RReLU都是在x=0點(diǎn)都是不連續(xù)的猪勇,最明顯的現(xiàn)象是在特征響應(yīng)圖上產(chǎn)生斷層泣刹,平滑的激活函數(shù)更利于梯度信息的回傳。

3.ReLU存在哪些問題外冀?

(1)Dead ReLU Problem:《Applying Deep Learning to Airbnb Search》中解釋了這個(gè)問題雪隧,神經(jīng)網(wǎng)絡(luò)接受異于常值范圍的輸入時(shí)员舵,在反向傳播過程中會(huì)產(chǎn)生大的梯度马僻,這種大的梯度韭邓,會(huì)因梯度消失而永久關(guān)閉諸如 ReLU 的激活函數(shù)仍秤,這主要是ReLU沒有NegativeOutputs所帶來的問題。下面舉了個(gè)簡單的例子說明這個(gè)現(xiàn)象凰浮。

(2)High-Confidence Predictions:《Why ReLU Networks Yield High-Confidence Predictions Far Away From the Training Dataand How to Mitigate》中針對例如將一個(gè)在CIFAR 10數(shù)據(jù)集(10類普通物體)上訓(xùn)練的神經(jīng)網(wǎng)絡(luò)袜茧,放到SVHN數(shù)據(jù)集(街景門牌)上做測試笛厦,該模型竟然能夠以100%的置信度將門牌識別為狗裳凸、鳥和飛機(jī)等這種現(xiàn)象贱鄙,通過理論建模逗宁,解釋ReLU帶來的高置信度問題瞎颗,并提出CEDA和ACET來緩解這種不良情況捌议。

4.存在替換萬年ReLU的激活函數(shù)嗎倦逐?

答案是肯定的弄捕。本文作者在這里給大家推薦2個(gè)激活函數(shù)。這2個(gè)激活函數(shù)在自己的工程項(xiàng)目中都嘗試過穿铆,相比Relu均有穩(wěn)定0.5%左右的提升斋荞。僅僅改變激活函數(shù)就能帶來白給的提升平酿,何樂而不為蜈彼?第一個(gè)是Google Brain提出的Swish函數(shù)幸逆,其形式為f(x) = x · sigmoid(x) 棍辕,《SWISH: A SELF-GATED ACTIVATION FUNCTION 》論文在多個(gè)任務(wù)上實(shí)驗(yàn)精度都超過Relu,同時(shí)在2019年推出的端側(cè)引擎MobilenetV3中还绘,也是直接用Swish替換掉Relu楚昭。另一個(gè)是Mish函數(shù),其形式為f(x) = x? tanh(ln(1 + exp(x))拍顷,《Mish: A Self Regularized Non-Monotonic Neural Activation Function 》也是在多個(gè)任務(wù)上實(shí)驗(yàn)最終準(zhǔn)確度上比Swish(+.494%)和ReLU(+ 1.671%)都有提高抚太。從下圖可以看出Swish和Mish在特征圖上數(shù)據(jù)分布比Relu更加平滑。由于激活函數(shù)替換的成本較低,所以當(dāng)你看到這篇文章的時(shí)候尿贫,可以嘗試在自己的項(xiàng)目中采用這2個(gè)激活函數(shù)試一試电媳,說不定就能帶來一定的提升。

5.小結(jié)

激活函數(shù)一直是神經(jīng)網(wǎng)絡(luò)研究中的一個(gè)重要方向帅霜,未來也會(huì)有更多更好的激活函數(shù)出現(xiàn)匆背,如果不知道采用哪個(gè)激活函數(shù)好呼伸,可以采用Auto ML進(jìn)行搜索搂根。

如需轉(zhuǎn)載,請注明出處。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌橙垢,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,635評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件载慈,死亡現(xiàn)場離奇詭異琳要,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,543評論 3 399
  • 文/潘曉璐 我一進(jìn)店門放仗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人棍郎,你說我怎么就攤上這事粮揉。” “怎么了狱从?”我有些...
    開封第一講書人閱讀 168,083評論 0 360
  • 文/不壞的土叔 我叫張陵与涡,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么井誉? 我笑而不...
    開封第一講書人閱讀 59,640評論 1 296
  • 正文 為了忘掉前任奔则,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘匕垫。我一直安慰自己偶惠,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,640評論 6 397
  • 文/花漫 我一把揭開白布皆的。 她就那樣靜靜地躺著,像睡著了一般楞抡。 火紅的嫁衣襯著肌膚如雪账胧。 梳的紋絲不亂的頭發(fā)上败潦,一...
    開封第一講書人閱讀 52,262評論 1 308
  • 那天闷板,我揣著相機(jī)與錄音县遣,去河邊找鬼元旬。 笑死,一個(gè)胖子當(dāng)著我的面吹牛探越,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播喷市,決...
    沈念sama閱讀 40,833評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼镀岛,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起姓言,我...
    開封第一講書人閱讀 39,736評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎皂吮,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,280評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,369評論 3 340
  • 正文 我和宋清朗相戀三年狞谱,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了伶跷。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片雇初。...
    茶點(diǎn)故事閱讀 40,503評論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡绞愚,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出僚祷,到底是詐尸還是另有隱情佛致,我是刑警寧澤,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布辙谜,位于F島的核電站俺榆,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏装哆。R本人自食惡果不足惜罐脊,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,870評論 3 333
  • 文/蒙蒙 一定嗓、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧萍桌,春花似錦宵溅、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,340評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至藕施,卻和暖如春寇损,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背裳食。 一陣腳步聲響...
    開封第一講書人閱讀 33,460評論 1 272
  • 我被黑心中介騙來泰國打工矛市, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人胞谈。 一個(gè)月前我還...
    沈念sama閱讀 48,909評論 3 376
  • 正文 我出身青樓尘盼,卻偏偏與公主長得像,于是被迫代替她去往敵國和親烦绳。 傳聞我的和親對象是個(gè)殘疾皇子卿捎,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,512評論 2 359

推薦閱讀更多精彩內(nèi)容