使用PyTorch及ResNet構(gòu)建簡(jiǎn)單手勢(shì)分類器

項(xiàng)目地址

我的github地址

目的

對(duì)手勢(shì)數(shù)字?jǐn)?shù)據(jù)集進(jìn)行分類。數(shù)據(jù)采用./data/images/中的數(shù)據(jù)著恩。其中院尔,訓(xùn)練集4324張,測(cè)試集484張喉誊,手勢(shì)數(shù)字類別:0-5邀摆,圖像大小均為64*64。

Update

  • 180521:增加多GPU支持
    • 設(shè)置classifier_train.pyclassifier_test.py文件中的params.gpus變量設(shè)定使用的GPU序號(hào)(與nvidia-smi命令顯示的GPU需要對(duì)應(yīng))伍茄。例如:params.gpus = [2,3]栋盹。
    • CPU模式:設(shè)定params.gpus = []
    • 由于目前測(cè)試部分計(jì)算量小,因此當(dāng)前代碼執(zhí)行測(cè)試步驟(classifier_test.py)時(shí)敷矫,僅使用指定的第一個(gè)GPU(params.gpus[0]

步驟

使用Pytorch為工具例获,以ResNet34或者ResNet101為基礎(chǔ),實(shí)現(xiàn)手勢(shì)識(shí)別曹仗。

  • 數(shù)據(jù)準(zhǔn)備:
    • 訓(xùn)練:將image文件夾放在./data/路徑下榨汤。image文件下載
    • 測(cè)試:將訓(xùn)練好的模型放在./models/路徑下。 模型下載
  • 訓(xùn)練步驟:
    • 首先使用nohup python -m visdom.server &打開Visdom服務(wù)器
    • 然后運(yùn)行classifier_train.py即可怎茫。
    • 訓(xùn)練好的模型將以.pth文件的形式保存在./models/文件夾下件余。
    • 注意:需根據(jù)GPU情況調(diào)整代碼中的batch_size參數(shù),確保顯存不溢出遭居。
      • ResNet34,1GPU旬渠,batch_size=120俱萍,顯存占用<7G
      • ResNet101,1GPU告丢,batch_size=60枪蘑,顯存占用<10G
  • 測(cè)試步驟:
    • 修改classifier_test.py文件相關(guān)參數(shù),其中ckpt表示模型加載位置岖免,testdata_dir表示待測(cè)試圖片文件夾岳颇。注意ckpt需要與model選擇相對(duì)應(yīng)。
    • 然后運(yùn)行classifier_test.py即可颅湘。在控制臺(tái)輸出每張圖片的預(yù)測(cè)結(jié)果话侧。

方法

  • 使用的庫(kù):PIL、torch闯参、torchvision瞻鹏、numpy悲立、visdom

  • ResNet:

    對(duì)ResNet34及ResNet101兩種網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn)。為了節(jié)省較深網(wǎng)絡(luò)中的參數(shù)新博,ResNet34及ResNet101分別具有兩種不同的基本“shortcut connection”結(jié)構(gòu)薪夕。ResNet34使用BasicBlock,ResNet101使用 Bottleneck作為“shortcut connection”赫悄。

BasicBlock_Bottleneck
ResNet34_ResNet101

訓(xùn)練代碼流程

  1. Hyper-params: 設(shè)置數(shù)據(jù)加載路徑原献、模型保存路徑、初始學(xué)習(xí)率等參數(shù)埂淮。
  2. Training parameters: 用于定義模型訓(xùn)練中的相關(guān)參數(shù)姑隅,例如最大迭代次數(shù)、優(yōu)化器同诫、損失函數(shù)粤策、是否使用GPU等、模型保存頻率等
  3. load data: 定義了用于讀取數(shù)據(jù)的Hand類误窖,在其中實(shí)現(xiàn)了數(shù)據(jù)叮盘、標(biāo)簽讀取及預(yù)處理過程。預(yù)處理過程在__getitem__中霹俺。
  4. models: 從定義的ResNet類柔吼,實(shí)例化ResNet34及ResNet101網(wǎng)絡(luò)模型。
  5. optimizer丙唧、criterion愈魏、lr_scheduler: 定義優(yōu)化器為SGD優(yōu)化器,損失函數(shù)為CrossEntropyLoss想际,學(xué)習(xí)率調(diào)整策略采用ReduceLROnPlateau培漏。
  6. trainer: 定義了用于模型訓(xùn)練和驗(yàn)證的類Trainer,trainer為Trainer的實(shí)例化胡本。在Trainer的構(gòu)造函數(shù)中根據(jù)步驟二中的參數(shù)設(shè)定牌柄,對(duì)訓(xùn)練過程中的參數(shù)進(jìn)行設(shè)置,包括訓(xùn)練數(shù)據(jù)侧甫、測(cè)試數(shù)據(jù)珊佣、模型、是否使用GPU等披粟。
    Trainer中定義了訓(xùn)練和測(cè)試函數(shù)咒锻,分別為train()_val_one_epoch()train()函數(shù)中守屉,根據(jù)設(shè)定的最大循環(huán)次數(shù)進(jìn)行訓(xùn)練惑艇,每次循環(huán)調(diào)用_train_one_epoch()函數(shù)進(jìn)行單步訓(xùn)練。訓(xùn)練過程中的loss保存在loss_meter中拇泛,confusion_matrix中保存具體預(yù)測(cè)結(jié)果敦捧。_val_one_epoch()函數(shù)對(duì)測(cè)試集在當(dāng)前訓(xùn)練模型上的表現(xiàn)進(jìn)行測(cè)試须板,具體預(yù)測(cè)結(jié)果保存在val_cm中,預(yù)測(cè)精度保存在val_accuracy中兢卵。
    最后习瑰,通過Visdom工具對(duì)結(jié)果進(jìn)行輸出,包括loss和accuracy以及訓(xùn)練日志秽荤√鹧伲可以在瀏覽器地址 http://localhost:8097 中查看結(jié)果。

測(cè)試代碼流程

  1. Test parameters: 用于定義模型測(cè)試中的相關(guān)參數(shù)
  2. models: 從定義的ResNet類窃款,實(shí)例化ResNet34及ResNet101網(wǎng)絡(luò)模型课兄。
  3. tester: 對(duì)測(cè)試類Tester實(shí)例化,Tester中主要進(jìn)行模型加載函數(shù)與預(yù)測(cè)函數(shù)晨继。
    _load_ckpt()函數(shù)加載模型烟阐;
    test()函數(shù)進(jìn)行預(yù)測(cè),其中定義了對(duì)單張圖片進(jìn)行預(yù)處理的過程紊扬,并輸出預(yù)測(cè)結(jié)果蜒茄。

Result

  • Loss


    loss
  • accuracy


    accuracy
  • 預(yù)測(cè)結(jié)果:

Processing image: img_0046.png
Prediction number: 0
Processing image: img_0000.png
Prediction number: 1
Processing image: img_0072.png
Prediction number: 2
Processing image: img_0080.png
Prediction number: 4
Processing image: img_0100.png
Prediction number: 5
Processing image: img_0014.png
Prediction number: 3

Reference

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市餐屎,隨后出現(xiàn)的幾起案子檀葛,更是在濱河造成了極大的恐慌,老刑警劉巖腹缩,帶你破解...
    沈念sama閱讀 217,826評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件屿聋,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡藏鹊,警方通過查閱死者的電腦和手機(jī)润讥,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,968評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來盘寡,“玉大人楚殿,你說我怎么就攤上這事⊙绺В” “怎么了?”我有些...
    開封第一講書人閱讀 164,234評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵甫煞,是天一觀的道長(zhǎng)菇曲。 經(jīng)常有香客問我,道長(zhǎng)抚吠,這世上最難降的妖魔是什么常潮? 我笑而不...
    開封第一講書人閱讀 58,562評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮楷力,結(jié)果婚禮上喊式,老公的妹妹穿的比我還像新娘孵户。我一直安慰自己,他們只是感情好岔留,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,611評(píng)論 6 392
  • 文/花漫 我一把揭開白布夏哭。 她就那樣靜靜地躺著,像睡著了一般献联。 火紅的嫁衣襯著肌膚如雪竖配。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,482評(píng)論 1 302
  • 那天里逆,我揣著相機(jī)與錄音进胯,去河邊找鬼。 笑死原押,一個(gè)胖子當(dāng)著我的面吹牛胁镐,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播诸衔,決...
    沈念sama閱讀 40,271評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼盯漂,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了署隘?” 一聲冷哼從身側(cè)響起宠能,我...
    開封第一講書人閱讀 39,166評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎磁餐,沒想到半個(gè)月后违崇,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,608評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡诊霹,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,814評(píng)論 3 336
  • 正文 我和宋清朗相戀三年羞延,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片脾还。...
    茶點(diǎn)故事閱讀 39,926評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡伴箩,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出鄙漏,到底是詐尸還是另有隱情嗤谚,我是刑警寧澤,帶...
    沈念sama閱讀 35,644評(píng)論 5 346
  • 正文 年R本政府宣布怔蚌,位于F島的核電站巩步,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏桦踊。R本人自食惡果不足惜椅野,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,249評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧竟闪,春花似錦离福、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,866評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至鲸湃,卻和暖如春赠涮,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背暗挑。 一陣腳步聲響...
    開封第一講書人閱讀 32,991評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工笋除, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人炸裆。 一個(gè)月前我還...
    沈念sama閱讀 48,063評(píng)論 3 370
  • 正文 我出身青樓垃它,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親烹看。 傳聞我的和親對(duì)象是個(gè)殘疾皇子国拇,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,871評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容