源碼實現(xiàn):DenseCap: Fully Convolutional Localization Networks for Dense Captioning

本篇博文是對論文DenseCap的源碼實現(xiàn)缸棵,作者是斯坦福的Justin Johnson
項目地址:https://cs.stanford.edu/people/karpathy/densecap/
源碼地址:https://github.com/jcjohnson/densecap
論文地址:http://arxiv.org/abs/1511.07571

注意事項:源碼是15寫的钻趋,所以使用的是比較老版本的cuda和cudnn(8.0 v5.1),并且作者也沒有在繼續(xù)更新代碼了苦酱,所以如果你想成功運行起來的話,盡量不要用太高版本的cuda宠漩,否則可能會出現(xiàn)文件丟失錯誤(libcudnn (R5) not found in library path.)

安裝

安裝以下依賴:

luarocks install torch
luarocks install nn
luarocks install image
luarocks install lua-cjson
luarocks install https://raw.githubusercontent.com/qassemoquab/stnbhwd/master/stnbhwd-scm-1.rockspec
luarocks install https://raw.githubusercontent.com/jcjohnson/torch-rnn/master/torch-rnn-scm-1.rockspec

(可選)安裝GPU相關(guān)依賴(如果你不使用GPU跑代碼磨澡,可以不裝這里)

luarocks install cutorch
luarocks install cunn
luarocks install cudnn

下載預(yù)訓練模型

在命令行中鍵入下面的指令,運行腳本下載預(yù)訓練模型(注意笔宿,下面的腳本文件在github上的項目代碼里犁钟,所以你要先把github上的源代碼下載下來棱诱,然后進入到項目目錄里面)

 sh scripts/download_pretrained_model.sh

用圖片來測試模型

源碼中自帶了一張大象的圖片,你可以用下面的指令來對大象圖片進行測試涝动,如果你想測試自己的圖片迈勋,把圖片放到項目中的imgs文件里,然后修改指令后面的圖片名稱為你自己圖片的名稱就可

th run_model.lua -input_image imgs/elephant.jpg

如果你沒有GPU醋粟,記得要加上-gpu -1指令來告訴模型在cpu上指令(CPU上的指令速度較慢靡菇,我自己的執(zhí)行情況是:GTX980Ti:0.3s 酷睿i5/7:5~10min)

以上指令會生成vis/data文件夾,這就是模型的運行結(jié)果昔穴,可以用下面的方式查看結(jié)果,

cd vis
python -m SimpleHTTPServer 8181(或者python -m http.server 8181)

然后提前,在瀏覽器中打開http://localhost:8181/view_results.html.

當然吗货,如果你想一次運行數(shù)張圖片,可以使用下面的指令狈网,該指令會將指定路徑下的圖片全部執(zhí)行

th run_model.lua -input_dir /path/to/my/image/folder

問題:

我遇到了以下問題宙搬,這里列出我自己的解決方法,如果你還遇到了其他不同的問題拓哺,可以留言勇垛,我會盡快答復(fù)你

問題1:cutorch問題
提示找不到cutorch,或者其他什么相關(guān)的錯誤

解決辦法:重新安裝cutorch

luarocks install cutorch

不幸的是士鸥,這個解決方法對我并沒有用闲孤,我最后發(fā)現(xiàn)是因為代碼運行的cutorch版本是5.1,而由于此時我安裝了高版本的cuda(9)烤礁,所以在使用上面的指令安裝時讼积,安裝的是cutorch 5.2,所以提示找不多5.1的cutorch脚仔,最后勤众,我重新?lián)Q回了的cuda8.0,并重新安裝cutorch鲤脏,解決了問題们颜,切換cuda版本的方法可以看這里:https://blog.csdn.net/ksws0292756/article/details/80120561

問題2:libcudd.5.so.5 找不到
主要原因還是cuda和cudnn的版本問題,我切換了cuda和cudnn的相關(guān)版本猎醇,換到cuda8.0和cudnn_v5.1以后窥突, 解決了問題

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市硫嘶,隨后出現(xiàn)的幾起案子波岛,更是在濱河造成了極大的恐慌,老刑警劉巖音半,帶你破解...
    沈念sama閱讀 221,576評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件则拷,死亡現(xiàn)場離奇詭異贡蓖,居然都是意外死亡,警方通過查閱死者的電腦和手機煌茬,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,515評論 3 399
  • 文/潘曉璐 我一進店門斥铺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人坛善,你說我怎么就攤上這事晾蜘。” “怎么了眠屎?”我有些...
    開封第一講書人閱讀 168,017評論 0 360
  • 文/不壞的土叔 我叫張陵剔交,是天一觀的道長。 經(jīng)常有香客問我改衩,道長岖常,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,626評論 1 296
  • 正文 為了忘掉前任葫督,我火速辦了婚禮竭鞍,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘橄镜。我一直安慰自己偎快,他們只是感情好,可當我...
    茶點故事閱讀 68,625評論 6 397
  • 文/花漫 我一把揭開白布洽胶。 她就那樣靜靜地躺著晒夹,像睡著了一般。 火紅的嫁衣襯著肌膚如雪姊氓。 梳的紋絲不亂的頭發(fā)上惋戏,一...
    開封第一講書人閱讀 52,255評論 1 308
  • 那天,我揣著相機與錄音他膳,去河邊找鬼响逢。 笑死,一個胖子當著我的面吹牛棕孙,可吹牛的內(nèi)容都是我干的舔亭。 我是一名探鬼主播,決...
    沈念sama閱讀 40,825評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼蟀俊,長吁一口氣:“原來是場噩夢啊……” “哼钦铺!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起肢预,我...
    開封第一講書人閱讀 39,729評論 0 276
  • 序言:老撾萬榮一對情侶失蹤矛洞,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體沼本,經(jīng)...
    沈念sama閱讀 46,271評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡噩峦,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,363評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了抽兆。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片识补。...
    茶點故事閱讀 40,498評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖辫红,靈堂內(nèi)的尸體忽然破棺而出凭涂,到底是詐尸還是另有隱情,我是刑警寧澤贴妻,帶...
    沈念sama閱讀 36,183評論 5 350
  • 正文 年R本政府宣布切油,位于F島的核電站,受9級特大地震影響名惩,放射性物質(zhì)發(fā)生泄漏澎胡。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,867評論 3 333
  • 文/蒙蒙 一绢片、第九天 我趴在偏房一處隱蔽的房頂上張望滤馍。 院中可真熱鬧岛琼,春花似錦底循、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,338評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至困檩,卻和暖如春祠挫,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背悼沿。 一陣腳步聲響...
    開封第一講書人閱讀 33,458評論 1 272
  • 我被黑心中介騙來泰國打工等舔, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人糟趾。 一個月前我還...
    沈念sama閱讀 48,906評論 3 376
  • 正文 我出身青樓慌植,卻偏偏與公主長得像,于是被迫代替她去往敵國和親义郑。 傳聞我的和親對象是個殘疾皇子蝶柿,可洞房花燭夜當晚...
    茶點故事閱讀 45,507評論 2 359

推薦閱讀更多精彩內(nèi)容