Ubuntu下caffe使用記錄

some questions

1.使用pycharm遠(yuǎn)程連接服務(wù)器的python解釋器進(jìn)行調(diào)試時(shí)喊暖，如何調(diào)用遠(yuǎn)程的caffe惫企？

在pycharm的run-->edit configurations-->Environment variables中，設(shè)置環(huán)境變量：
Name: PYTHONPATH
Value: 遠(yuǎn)程python解釋器使用的caffe路徑

2.caffe訓(xùn)練時(shí)loss=87.3365

原因分析
在softmax_loss_layer.cpp的源碼中陵叽，是由label的非零維直接計(jì)算loss的

loss -= log(std::max(prob_data[i * dim + label_value * inner_num_ + j], Dtype(FLT_MIN)));

loss的最大值由FLT_MIN得到雅任，F(xiàn)LT_MIN定義為1.17549435E-38F，這個(gè)數(shù)字的自然對(duì)數(shù)正好就是-87.3356咨跌，算loss時(shí)需要取負(fù)值沪么，結(jié)果就得到87.3356。

這說(shuō)明softmax計(jì)算得到的概率值出現(xiàn)了零（由于float類型所能表示的最小數(shù)值是10?38锌半，比這個(gè)值還小的無(wú)法表示禽车，只能是零）

而softmax是用指數(shù)函數(shù)計(jì)算的，指數(shù)函數(shù)的值都是大于零的刊殉。因此殉摔，我們有理由相信，計(jì)算過(guò)程中出現(xiàn)了float溢出等異常记焊，出現(xiàn)了inf逸月，nan等異常數(shù)值導(dǎo)致softmax輸出為零
最后我們發(fā)現(xiàn)，當(dāng)softmax之前的feature值過(guò)大時(shí)遍膜，由于softmax先求指數(shù)碗硬，會(huì)超出float數(shù)據(jù)范圍，成為inf瓢颅。inf與其他任何數(shù)值的和都是inf恩尾，softmax在做除法時(shí)任何正常范圍的數(shù)值除以inf都會(huì)變?yōu)?。然后求loss時(shí)log一下就出現(xiàn)了87.3356這樣的值挽懦。

解決方案1
總體上看翰意，softmax輸入的feature由兩部分計(jì)算得到：一部分是輸入數(shù)據(jù)，另部分是各層權(quán)重參數(shù)信柿。
1冀偶、觀察數(shù)據(jù)中是否有異常樣本或異常label導(dǎo)致數(shù)據(jù)讀取異常
2、調(diào)小初始化權(quán)重渔嚷，以便使softmax輸入的feature盡可能變小
3进鸠、降低學(xué)習(xí)率，這樣就能減小權(quán)重參數(shù)的波動(dòng)范圍圃伶，從而減小權(quán)重變大的可能性堤如。這條也是網(wǎng)上出現(xiàn)較多的方法蒲列。
4、如果有BN（batch normalization）層搀罢，finetune時(shí)最好不要凍結(jié)BN的參數(shù)蝗岖，否則數(shù)據(jù)分布不一致時(shí)很容易使輸出值變的很大。
解決方案2
可以在solver里面設(shè)置：debug_info: true
打印出各個(gè)層的data和diff是什么值榔至，一般這個(gè)時(shí)候那些值不是NAN（無(wú)效數(shù)字）就是INF（無(wú)窮大）抵赢。
可以嘗試以下解決辦法：
1、數(shù)據(jù)問(wèn)題唧取，檢查數(shù)據(jù)的標(biāo)簽是否從0開(kāi)始且連續(xù)
2铅鲤、把學(xué)習(xí)率base_lr調(diào)低，然后batchsize也調(diào)高
3枫弟、中間層沒(méi)有歸一化邢享，導(dǎo)致經(jīng)過(guò)幾層后，輸出的值已經(jīng)很小了淡诗，這個(gè)時(shí)候再計(jì)算梯度就會(huì)發(fā)散骇塘，所以可以在各個(gè)卷積層加入了BN層和SCALE層。
4韩容、把data層的輸入圖片進(jìn)行歸一化款违，就是從0-255歸一化到0-1，使用的參數(shù)是：

     transform_param {  
        scale: 0.00390625//像素歸一化群凶，1/255
      }

5插爹、網(wǎng)絡(luò)參數(shù)太多，網(wǎng)絡(luò)太深请梢，刪掉幾層看看赠尾，可能因?yàn)閿?shù)據(jù)少，需要減少中間層的num_output
6溢陪、記得要shuffle數(shù)據(jù)萍虽，否則數(shù)據(jù)不夠隨機(jī)睛廊，幾個(gè)batch之間的數(shù)據(jù)差異很小形真，一旦連續(xù)幾個(gè)batch把loss調(diào)很小，然后就會(huì)導(dǎo)致loss突然變大超全。
7咆霜、如果是自己寫(xiě)的loss，查看loss寫(xiě)的對(duì)不對(duì)
8嘶朱、更換不同顯卡訓(xùn)練蛾坯，排除顯卡問(wèn)題

3. pycharm調(diào)試caffe，加載模型時(shí)報(bào)錯(cuò)：`Process finished with exit code 139 (interrupted by signal 11: SIGSEGV)`

原因：修改了將pycaffe重新編譯了疏遏，而Pycharm運(yùn)行時(shí)所使用的python package環(huán)境與pycaffe編譯時(shí)不一樣脉课，導(dǎo)致出現(xiàn)這個(gè)錯(cuò)誤
解決方案：調(diào)整pycharm使用的python環(huán)境救军，使其與pycaffe編譯時(shí)一致即可，問(wèn)題解決倘零。

2.some tricks

caffe在測(cè)試和訓(xùn)練階段唱遭，最好建立不同的prototxt文件

訓(xùn)練時(shí)需要：net_train.prototxt, net_solver.prototxt
測(cè)試時(shí)需要：net_inference.prototxt

solver.prototxt中參數(shù)在文件：/home/yangshuai/projects/zhiji/caffe-segnet/src/caffe/proto/caffe.proto中查看
不要用./build/tools/caffe train --solver=xxx這種方式來(lái)跑代碼, github上有一些原因,說(shuō)是因?yàn)槟氵@樣子做的話,后面的deconvolution層是沒(méi)有辦法初始化的,會(huì)造成這些層的參數(shù)都為0,從而導(dǎo)致你的loss一直保持一個(gè)很大很大的數(shù)值不變動(dòng)。
如果你遇到loss的數(shù)值不變化的情況,請(qǐng)改用solve.py文件來(lái)調(diào)用caffe訓(xùn)練,里面會(huì)有一些初始化這些參數(shù)的過(guò)程呈驶。
自己修改好的源碼和配置文件拷泽、網(wǎng)絡(luò)結(jié)構(gòu)等，最好用pascal voc數(shù)據(jù)先跑一遍袖瞻，確定代碼沒(méi)有問(wèn)題司致，再在自己的數(shù)據(jù)上訓(xùn)練。
caffe prototxt模型結(jié)構(gòu)可視化的網(wǎng)址
http://ethereon.github.io/netscope/#/editor
caffe中的BN
在BVLC的Caffe實(shí)現(xiàn)中聋迎，BN層需要和Scale層配合使用脂矫。
BN層專門(mén)用來(lái)做“Normalization”操作，而后續(xù)的線性變換層霉晕，交給Scale層去做羹唠。

batchnorm與scale配合使用實(shí)現(xiàn)bn的功能：

layer {
bottom: "conv1"
top: "conv1"
name: "bn_conv1"
type: "BatchNorm"
batch_norm_param {
use_global_stats: true
}
}
layer {
bottom: "conv1"
top: "conv1"
name: "scale_conv1"
type: "Scale"
scale_param {
bias_term: true
}
}

BN層的use_global_stats參數(shù)設(shè)置
（1）設(shè)置為False的話，更新全局統(tǒng)計(jì)量娄昆，對(duì)當(dāng)前的mini-batch進(jìn)行規(guī)范化時(shí)佩微，不使用全局統(tǒng)計(jì)量，而使用當(dāng)前batch的均值和方差萌焰。
（2）設(shè)置為T(mén)rue哺眯，使用全局統(tǒng)計(jì)量做規(guī)范化。
（3）這個(gè)變量默認(rèn)隨著當(dāng)前網(wǎng)絡(luò)在train或test phase而變化扒俯。當(dāng)train時(shí)為false奶卓，當(dāng)test時(shí)為true。

3.solver.txt的參數(shù)

參考

github：Caffe中的BatchNorm實(shí)現(xiàn)
CSDN：Caffe 訓(xùn)練時(shí)loss等于87.33的原因及解決方法
CSDN：關(guān)于caffe訓(xùn)練出現(xiàn)loss=87.3365

最后編輯于：2020.04.03 10:12:59

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末撼玄，一起剝皮案震驚了整個(gè)濱河市夺姑，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌掌猛，老刑警劉巖盏浙，帶你破解...
沈念sama閱讀 218,858評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異荔茬，居然都是意外死亡废膘，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,372評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)慕蔚，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)丐黄，“玉大人椭蹄，你說(shuō)我怎么就攤上這事送爸《攴剑” “怎么了堕义？”我有些...
開(kāi)封第一講書(shū)人閱讀 165,282評(píng)論 0贊 356
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)桂对。經(jīng)常有香客問(wèn)我园细，道長(zhǎng)，這世上最難降的妖魔是什么接校？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,842評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任猛频，我火速辦了婚禮，結(jié)果婚禮上蛛勉，老公的妹妹穿的比我還像新娘鹿寻。我一直安慰自己，他們只是感情好诽凌，可當(dāng)我...
茶點(diǎn)故事閱讀 67,857評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布毡熏。她就那樣靜靜地躺著，像睡著了一般侣诵。火紅的嫁衣襯著肌膚如雪痢法。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 51,679評(píng)論 1贊 305
城市分裂傳說(shuō)
那天杜顺，我揣著相機(jī)與錄音财搁，去河邊找鬼。笑死躬络，一個(gè)胖子當(dāng)著我的面吹牛尖奔，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播穷当，決...
沈念sama閱讀 40,406評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼提茁，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了馁菜？” 一聲冷哼從身側(cè)響起茴扁，我...
開(kāi)封第一講書(shū)人閱讀 39,311評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎汪疮，沒(méi)想到半個(gè)月后峭火，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,767評(píng)論 1贊 315
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡铲咨，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,945評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年躲胳，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片纤勒。...
茶點(diǎn)故事閱讀 40,090評(píng)論 1贊 350
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖隆檀，靈堂內(nèi)的尸體忽然破棺而出摇天，到底是詐尸還是另有隱情粹湃，我是刑警寧澤，帶...
沈念sama閱讀 35,785評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布泉坐，位于F島的核電站为鳄，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏腕让。R本人自食惡果不足惜孤钦，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,420評(píng)論 3贊 331
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望纯丸。院中可真熱鬧偏形，春花似錦、人聲如沸觉鼻。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,988評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)坠陈。三九已至萨惑，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間仇矾，已是汗流浹背庸蔼。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,101評(píng)論 1贊 271
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留贮匕，地道東北人朱嘴。一個(gè)月前我還...
沈念sama閱讀 48,298評(píng)論 3贊 372
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像粗合，于是被迫代替她去往敵國(guó)和親萍嬉。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,033評(píng)論 2贊 355