《動(dòng)手學(xué)深度學(xué)習(xí)》學(xué)習(xí)筆記(一)

一获洲、pytouch

1.torch.nn.Linear(in_features, out_features, bias=True)

其中:in_features指的是輸入的張量的大小锹雏,即輸入的[batch_size, size]中的size或粮。

?? ? out_features指的是輸出的張量的大小,即輸出的二維張量的形狀為[batch_size亡呵,output_size]晕讲,當(dāng)然,它也代表了該全連接層的神經(jīng)元個(gè)數(shù)率拒。

2.torch.nn.init.normal_(tensor, mean=0, std=1)

? ?? 正態(tài)分布:服從~N(mean,std)N(mean,std)? ? ? N(mean, std)N(mean,std)

3.torch.nn.init.constant_(tensor, val)

? ?? 初始化整個(gè)矩陣為常數(shù)val

4.torch.nn.MSELoss(size_average=None, reduce=None, reduction='mean')損失函數(shù)

參數(shù): reduce(bool)- 返回值是否為標(biāo)量,默認(rèn)為True

? ? ? ? ?? size_average(bool)- 當(dāng)reduce=True時(shí)有效禁荒。為True時(shí)猬膨,返回的loss為平均值;為False時(shí)呛伴,返回的各樣本的loss之和勃痴。

5.torch.optim.SGD(params, lr=, momentum=0, dampening=0, weight_decay=0, nesterov=False)優(yōu)化函數(shù)

? ? ? ? ? ? params (iterable) – 待優(yōu)化參數(shù)的iterable或者是定義了參數(shù)組的dict

????????????lr (float) – 學(xué)習(xí)率

????????????momentum (float, 可選) – 動(dòng)量因子(默認(rèn):0)

????????????weight_decay (float, 可選) – 權(quán)重衰減(L2懲罰)(默認(rèn):0)

????????????dampening (float, 可選) – 動(dòng)量的抑制因子(默認(rèn):0)

? ? ? ? ? ? nesterov (bool, 可選) – 使用Nesterov動(dòng)量(默認(rèn):False)

6.torch.nn.CrossEntropyLoss(weight=None, size_average=None, ignore_index=-100, reduce=None, reduction='mean')

參數(shù):

weight(Tensor)- 為每個(gè)類別的loss設(shè)置權(quán)值,常用于類別不均衡問(wèn)題热康。weight必須是float類型的tensor沛申,其長(zhǎng)度要于類別C一致,即每一個(gè)類別都要設(shè)置有weight姐军。帶weight的計(jì)算公式:

size_average(bool)- 當(dāng)reduce=True時(shí)有效铁材。為True時(shí),返回的loss為平均值奕锌;為False時(shí)著觉,返回的各樣本的loss之和。

reduce(bool)- 返回值是否為標(biāo)量惊暴,默認(rèn)為True

ignore_index(int)- 忽略某一類別饼丘,不計(jì)算其loss,其loss會(huì)為0辽话,并且肄鸽,在采用size_average時(shí)卫病,不會(huì)計(jì)算那一類的loss,除的時(shí)候的分母也不會(huì)統(tǒng)計(jì)那一類的樣本典徘。

二忽肛、文本知識(shí)

文本是一類序列數(shù)據(jù),一篇文章可以看作是字符或單詞的序列烂斋,本節(jié)將介紹文本數(shù)據(jù)的常見(jiàn)預(yù)處理步驟,預(yù)處理通常包括四個(gè)步驟:

1.讀入文本

2.分詞

3.建立字典础废,將每個(gè)詞映射到一個(gè)唯一的索引(index)

4.將文本從詞的序列轉(zhuǎn)換為索引的序列汛骂,方便輸入模型

三、循環(huán)神經(jīng)網(wǎng)絡(luò)

1.one-hot向量

我們需要將字符表示成向量评腺,這里采用one-hot向量帘瞭。假設(shè)詞典大小是N,每次字符對(duì)應(yīng)一個(gè)從0到N?1的唯一的索引蒿讥,則該字符的向量是一個(gè)長(zhǎng)度為N的向量蝶念,若字符的索引是i,則該向量的第i個(gè)位置為1芋绸,其他位置為0媒殉。下面分別展示了索引為0和2的one-hot向量,向量長(zhǎng)度等于詞典大小摔敛。

2.裁剪梯度

循環(huán)神經(jīng)網(wǎng)絡(luò)中較容易出現(xiàn)梯度衰減或梯度爆炸廷蓉,這會(huì)導(dǎo)致網(wǎng)絡(luò)幾乎無(wú)法訓(xùn)練。裁剪梯度(clip gradient)是一種應(yīng)對(duì)梯度爆炸的方法马昙。假設(shè)我們把所有模型參數(shù)的梯度拼接成一個(gè)向量g桃犬,并設(shè)裁剪的閾值是θ。裁剪后的梯度min(θ‖g‖,1)g的L2范數(shù)不超過(guò)θ行楞。

3.困惑度

我們通常使用困惑度(perplexity)來(lái)評(píng)價(jià)語(yǔ)言模型的好壞攒暇。困惑度是對(duì)交叉熵?fù)p失函數(shù)做指數(shù)運(yùn)算后得到的值。特別地子房,

最佳情況下形用,模型總是把標(biāo)簽類別的概率預(yù)測(cè)為1,此時(shí)困惑度為1池颈;

最壞情況下尾序,模型總是把標(biāo)簽類別的概率預(yù)測(cè)為0,此時(shí)困惑度為正無(wú)窮躯砰;

基線情況下每币,模型總是預(yù)測(cè)所有類別的概率都相同,此時(shí)困惑度為類別個(gè)數(shù)琢歇。

顯然兰怠,任何一個(gè)有效模型的困惑度必須小于類別個(gè)數(shù)梦鉴。在本例中,困惑度必須小于詞典大小vocab_size揭保。

具體代碼詳見(jiàn):https://www.kesci.com/org/boyuai/workspace/project

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末肥橙,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子秸侣,更是在濱河造成了極大的恐慌存筏,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,657評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件味榛,死亡現(xiàn)場(chǎng)離奇詭異椭坚,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)搏色,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門善茎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人频轿,你說(shuō)我怎么就攤上這事垂涯。” “怎么了航邢?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,057評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵耕赘,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我膳殷,道長(zhǎng)鞠苟,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,509評(píng)論 1 293
  • 正文 為了忘掉前任秽之,我火速辦了婚禮当娱,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘考榨。我一直安慰自己跨细,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,562評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布河质。 她就那樣靜靜地躺著冀惭,像睡著了一般。 火紅的嫁衣襯著肌膚如雪掀鹅。 梳的紋絲不亂的頭發(fā)上散休,一...
    開(kāi)封第一講書(shū)人閱讀 51,443評(píng)論 1 302
  • 那天,我揣著相機(jī)與錄音乐尊,去河邊找鬼戚丸。 笑死,一個(gè)胖子當(dāng)著我的面吹牛扔嵌,可吹牛的內(nèi)容都是我干的限府。 我是一名探鬼主播夺颤,決...
    沈念sama閱讀 40,251評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼胁勺!你這毒婦竟也來(lái)了世澜?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,129評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤署穗,失蹤者是張志新(化名)和其女友劉穎寥裂,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體案疲,經(jīng)...
    沈念sama閱讀 45,561評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡抚恒,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,779評(píng)論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了络拌。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,902評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡回溺,死狀恐怖春贸,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情遗遵,我是刑警寧澤萍恕,帶...
    沈念sama閱讀 35,621評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站车要,受9級(jí)特大地震影響允粤,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜翼岁,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,220評(píng)論 3 328
  • 文/蒙蒙 一类垫、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧琅坡,春花似錦悉患、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,838評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至茴晋,卻和暖如春陪捷,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背诺擅。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,971評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工市袖, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人烁涌。 一個(gè)月前我還...
    沈念sama閱讀 48,025評(píng)論 2 370
  • 正文 我出身青樓凌盯,卻偏偏與公主長(zhǎng)得像付枫,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子驰怎,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,843評(píng)論 2 354