回歸問題常用:均值平方差損失函數(shù)(MSE)砚作;交叉熵問題常用交叉熵損失函數(shù)(CE)。
那為啥禁荸?
1.從原理上來講右蒲,CE就是分類問題的極大似然估計,并不適用于連續(xù)變量的回歸問題赶熟。
2.對于分類問題瑰妄,若采用邏輯回歸算法,MSE一般是非凸函數(shù)映砖,不能取得全局最優(yōu)解间坐,且MSE容易發(fā)生梯度消失;而CE是凸函數(shù),能取得全局最優(yōu)解竹宋。所以分類問題一般用CE劳澄。
回歸問題常用:均值平方差損失函數(shù)(MSE)砚作;交叉熵問題常用交叉熵損失函數(shù)(CE)。
那為啥禁荸?
1.從原理上來講右蒲,CE就是分類問題的極大似然估計,并不適用于連續(xù)變量的回歸問題赶熟。
2.對于分類問題瑰妄,若采用邏輯回歸算法,MSE一般是非凸函數(shù)映砖,不能取得全局最優(yōu)解间坐,且MSE容易發(fā)生梯度消失;而CE是凸函數(shù),能取得全局最優(yōu)解竹宋。所以分類問題一般用CE劳澄。