非線性激活函數(shù)

1 為什么需要非線性激活函數(shù)白胀？

如果使用線性激活函數(shù)箱沦，那么這個模型的輸出不過是你輸入特征x的線性組合陈醒。神經(jīng)網(wǎng)絡(luò)只是把輸入線性組合再輸出惕橙。
所以即使你有很多個隱含層，但是你如果使用線性激活函數(shù)或者不用激活函數(shù)孵延，一直在做的只是計(jì)算線性激活函數(shù)吕漂，所以還不如直接去掉全部隱藏層。所以除非引入非線性尘应，那么無法計(jì)算更有趣的函數(shù)惶凝。
只有一個地方可以使用線性激活函數(shù)，那就是回歸問題犬钢〔韵剩或者在輸出層用也是可以的。

2 四個非線性激活函數(shù)

四個激活函數(shù).png

Sigmoid（左上角）：
現(xiàn)在吳恩達(dá)幾乎從來不用sigmoid激活函數(shù)了玷犹，但是吳恩達(dá)會用sigmoid的一個例外場合是進(jìn)行二元分類時混滔。
缺點(diǎn)：
1、Sigmoid容易飽和，并且當(dāng)輸入非常大或者非常小的時候坯屿，神經(jīng)元的梯度就接近于0了油湖，從圖中可以看出梯度的趨勢。這就使得我們在反向傳播算法中反向傳播接近于0的梯度领跛，導(dǎo)致最終權(quán)重基本沒什么更新乏德，我們就無法遞歸地學(xué)習(xí)到輸入數(shù)據(jù)了。另外吠昭，你需要尤其注意參數(shù)的初始值來盡量避免saturation的情況喊括。如果你的初始值很大的話，大部分神經(jīng)元可能都會處在saturation的狀態(tài)而把gradient kill掉矢棚，這會導(dǎo)致網(wǎng)絡(luò)變的很難學(xué)習(xí)郑什。容易飽和這個問題叫做 “梯度飽和” ，也可以叫 “梯度彌散” 蒲肋。
2蘑拯、Sigmoid 的輸出不是0均值的，這是我們不希望的肉津，因?yàn)檫@會導(dǎo)致后層的神經(jīng)元的輸入是非0均值的信號强胰，這會對梯度產(chǎn)生影響：假設(shè)后層神經(jīng)元的輸入都為正(e.g. x>0 elementwise in ),那么在反向傳播的過程中對w求梯度要么都為正，要么都為負(fù)（取決于整個表達(dá)式 f 的梯度）妹沙。這可能會在權(quán)重的梯度更新中引入不受歡迎的zig-zagging動態(tài)偶洋。導(dǎo)致有一種捆綁的效果，使得收斂緩慢距糖。當(dāng)然了玄窝，如果你是按batch去訓(xùn)練，那么每個batch可能得到不同的符號（正或負(fù)）悍引，那么相加一下這個問題還是可以緩解恩脂。因此，非0均值這個問題雖然會產(chǎn)生一些不好的影響趣斤，不過跟上面提到的 kill gradients 問題相比還是要好很多的俩块。

Relu（左下角）：
Relu：a = max(0,z)，但是當(dāng)z = 0時浓领，導(dǎo)數(shù)是沒有定義的玉凯，但如果編程實(shí)現(xiàn)，你得到的z剛好等于0.000000000000的概率很低联贩，所以不必?fù)?dān)心漫仆。
Relu已經(jīng)變成激活函數(shù)的默認(rèn)選擇了，當(dāng)你不知道因隱層到底該用哪個激活函數(shù)時泪幌，就可以用relu盲厌。雖然有人也會用tanh署照。Relu的一個缺點(diǎn)：當(dāng)z為負(fù)時，導(dǎo)數(shù)等于0吗浩。但在實(shí)際中卻沒有什么問題建芙。雖然對于z的一半范圍來說，relu的斜率為0拓萌，但在實(shí)踐中岁钓，有足夠多的隱藏單元令z大于0升略，所以對于大多數(shù)訓(xùn)練樣本來說還是很快的微王。

3 實(shí)戰(zhàn)一 —— 輸入tensor觀察非線性激活函數(shù)的作用

import torch
from torch import nn
from torch.nn import ReLU,Sigmoid
input = torch.tensor([[1, -0.5],
                      [-1, 3]])
input = torch.reshape(input,(-1, 1, 2, 2))
print((input.shape))
class Linyu(nn.Module):
    def __init__(self):
        super(Linyu, self).__init__()
        self.relu1 = ReLU()

    def forward(self,input):
        output = self.relu1(input)
        return output

linyu = Linyu()
output = linyu(input)
print(output)

輸出：

torch.Size([1, 1, 2, 2])
tensor([[[[1., 0.],
          [0., 3.]]]])

實(shí)戰(zhàn)二 —— 非線性激活函數(shù)在圖像處理中的使用

import torch
from torch import nn
import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
from torch.nn import ReLU,Sigmoid

dataset = torchvision.datasets.CIFAR10("../dataset",train=False,download=True,
                                       transform=torchvision.transforms.ToTensor())
dataloader = DataLoader(dataset,batch_size=64,drop_last=True)
class Linyu(nn.Module):
    def __init__(self):
        super(Linyu, self).__init__()
        self.relu1 = ReLU()
        self.sigmoid1 = Sigmoid()

    def forward(self,input):
        # output = self.relu1(input)
        output = self.sigmoid1(input)
        return output


linyu = Linyu()
writer = SummaryWriter("../logs/P16_logs")
step = 0
for data in dataloader:
    imgs, targets = data
    writer.add_images("input",imgs,step)
    # output = linyu(imgs)
    # writer.add_images("output",output,step)
    sigmoid1 = linyu(imgs)
    writer.add_images("sigmoid",sigmoid1,step)
    step += 1
writer.close()

輸出：

激活函數(shù).png

第一張是原始數(shù)據(jù)，第二張是經(jīng)過ReLU激活函數(shù)的結(jié)果品嚣，第三張是經(jīng)過sigmoid激活函數(shù)的結(jié)果炕倘。

參考資料：
1.https://blog.csdn.net/NIGHT_SILENT/article/details/80806644

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市翰撑，隨后出現(xiàn)的幾起案子罩旋，更是在濱河造成了極大的恐慌，老刑警劉巖眶诈，帶你破解...
沈念sama閱讀 222,183評論 6贊 516
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件涨醋，死亡現(xiàn)場離奇詭異，居然都是意外死亡逝撬，警方通過查閱死者的電腦和手機(jī)浴骂，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,850評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來宪潮，“玉大人溯警，你說我怎么就攤上這事〗葡啵” “怎么了梯轻？”我有些...
開封第一講書人閱讀 168,766評論 0贊 361
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長尽棕。經(jīng)常有香客問我喳挑，道長，這世上最難降的妖魔是什么滔悉？我笑而不...
開封第一講書人閱讀 59,854評論 1贊 299
?港島之戀（遺憾婚禮）
正文為了忘掉前任伊诵，我火速辦了婚禮，結(jié)果婚禮上氧敢，老公的妹妹穿的比我還像新娘日戈。我一直安慰自己，他們只是感情好孙乖，可當(dāng)我...
茶點(diǎn)故事閱讀 68,871評論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布浙炼。她就那樣靜靜地躺著份氧，像睡著了一般。火紅的嫁衣襯著肌膚如雪弯屈。梳的紋絲不亂的頭發(fā)上蜗帜，一...
開封第一講書人閱讀 52,457評論 1贊 311
城市分裂傳說
那天，我揣著相機(jī)與錄音资厉，去河邊找鬼厅缺。笑死，一個胖子當(dāng)著我的面吹牛宴偿，可吹牛的內(nèi)容都是我干的湘捎。我是一名探鬼主播，決...
沈念sama閱讀 40,999評論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼窄刘，長吁一口氣：“原來是場噩夢啊……” “哼窥妇！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起娩践，我...
開封第一講書人閱讀 39,914評論 0贊 277
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤活翩，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后翻伺，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體材泄，經(jīng)...
沈念sama閱讀 46,465評論 1贊 319
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,543評論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年吨岭，在試婚紗的時候發(fā)現(xiàn)自己被綠了拉宗。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,675評論 1贊 353
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出弥咪，到底是詐尸還是另有隱情，我是刑警寧澤族檬，帶...
沈念sama閱讀 36,354評論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站化戳，受9級特大地震影響单料，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜点楼，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,029評論 3贊 335
男人毒藥：我在死后第九天來索命
文/蒙蒙一扫尖、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧掠廓，春花似錦换怖、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,514評論 0贊 25
一樁弒父案沉颂，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽条摸。三九已至，卻和暖如春铸屉，著一層夾襖步出監(jiān)牢的瞬間钉蒲，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,616評論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工彻坛，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留顷啼，地道東北人。一個月前我還...
沈念sama閱讀 49,091評論 3贊 378
代替公主和親
正文我出身青樓昌屉，卻偏偏與公主長得像钙蒙，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子怠益，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,685評論 2贊 360

非線性激活函數(shù)

1 為什么需要非線性激活函數(shù)白胀？

2 四個非線性激活函數(shù)

3 實(shí)戰(zhàn)一 —— 輸入tensor觀察非線性激活函數(shù)的作用

推薦閱讀更多精彩內(nèi)容