反向傳播的迭代公式為
其中f是激活函數(shù),常用sigmoid激活函數(shù)求導為
導數(shù)值域都小于1,誤差經(jīng)過每一層傳遞都會減小绢陌,層數(shù)很深的時候,梯度就會不停衰減熔恢,甚至消失脐湾,使網(wǎng)絡很難訓練,這就是梯度消失問題叙淌。
解決方法:BN秤掌,ResNet,權(quán)重正則(爆炸)凿菩,換激活函數(shù)
反向傳播的迭代公式為
其中f是激活函數(shù),常用sigmoid激活函數(shù)求導為
導數(shù)值域都小于1,誤差經(jīng)過每一層傳遞都會減小绢陌,層數(shù)很深的時候,梯度就會不停衰減熔恢,甚至消失脐湾,使網(wǎng)絡很難訓練,這就是梯度消失問題叙淌。
解決方法:BN秤掌,ResNet,權(quán)重正則(爆炸)凿菩,換激活函數(shù)