pytorch之保存與加載模型

本篇筆記譯自pytorch官網(wǎng)tutorial检柬，用于方便查看。
pytorch與保存咸作、加載模型有關(guān)的常用函數(shù)3個(gè)：

torch.save(): 保存一個(gè)序列化的對象到磁盤浙值，使用的是Python的pickle庫來實(shí)現(xiàn)的羔巢。
torch.load(): 解序列化一個(gè)pickled對象并加載到內(nèi)存當(dāng)中萝映。
torch.nn.Module.load_state_dict(): 加載一個(gè)解序列化的state_dict對象

1. state_dict

在PyTorch中所有可學(xué)習(xí)的參數(shù)保存在model.parameters()中吴叶。state_dict是一個(gè)Python字典。保存了各層與其參數(shù)張量之間的映射序臂。torch.optim對象也有一個(gè)state_dict蚌卤，它包含了optimizer的state，以及一些超參數(shù)奥秆。

2. 保存&加載模型來`inference`(recommended)

save

torch.save(model.state_dict(), PATH)

load

model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH))
model.eval()  # 當(dāng)用于inference時(shí)不要忘記添加

保存的文件名后綴可以是.pt或.pth
當(dāng)用于inference時(shí)不要忘記添加model.eval()

3. 保存&加載整個(gè)模型(not recommended)

save

torch.save(model, PATH)

load

# Model class must be defined somewhere
model = torch.load()
model.eval()

4. 保存&加載帶`checkpoint`的模型用于`inference`或`resuming training`

save

torch.save({
  'epoch': epoch,
  'model_state_dict': model.state_dict(),
  'optimizer_state_dict': optimizer.state_dict(),
  'loss': loss,
  ...
  }, PATH)

load

model = TheModelClass(*args, **kwargs)
optimizer = TheOptimizerClass(*args, **kwargs)

checkpoint = torch.load(PATH)
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']

model.eval()
# or
model.train()

5. 保存多個(gè)模型到一個(gè)文件中

save

torch.save({
  'modelA_state_dict': modelA.state_dict(),
  'modelB_state_dict': modelB.state_dict(),
  'optimizerA_state_dict': optimizerA.state_dict(),
  'optimizerB_state_dict': optimizerB.state_dict(),
  ...
  }, PATH)

load

modelA = TheModelAClass(*args, **kwargs)
modelB = TheModelAClass(*args, **kwargs)
optimizerA = TheOptimizerAClass(*args, **kwargs)
optimizerB = TheOptimizerBClass(*args, **kwargs)

checkpoint = torch.load(PATH)
modelA.load_state_dict(checkpoint['modelA_state_dict']
modelB.load_state_dict(checkpoint['modelB_state_dict']
optimizerA.load_state_dict(checkpoint['optimizerA_state_dict']
optimizerB.load_state_dict(checkpoint['optimizerB_state_dict']

modelA.eval()
modelB.eval()
# or
modelA.train()
modelB.train()

此情況可能在GAN逊彭，Sequence-to-sequence，或ensemble models中使用
保存checkpoint常用.tar文件擴(kuò)展名

6. Warmstarting Model Using Parameters From A Different Model

save

torch.save(modelA.state_dict(), PATH)

load

modelB = TheModelBClass(*args, **kwargs)
modelB.load_state_dict(torch.load(PATH), strict=False)

在遷移訓(xùn)練時(shí)构订，可能希望只加載部分模型參數(shù)侮叮，此時(shí)可置strict參數(shù)為False來忽略那些沒有匹配到的keys

7. 保存&加載模型跨設(shè)備

(1) Save on GPU, Load on CPU
save

torch.save(model.state_dict(), PATH)

load

device = torch.device("cpu")
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH, map_location=device))

(2) Save on GPU, Load on GPU
save

torch.save(model.state_dict(), PATH)

load

device = torch.device("cuda")
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH))
model.to(device)

(3) Save on CPU, Load on GPU
save

torch.save(model.state_dict(), PATH)

load

device = torch.device("cuda")
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH, map_location="cuda:0"))
model.to(device)

8. 保存torch.nn.DataParallel模型

save

torch.save(model.module.state_dict(), PATH)

load

# Load to whatever device you want

最后編輯于：2019.01.15 20:59:28

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市悼瘾，隨后出現(xiàn)的幾起案子囊榜，更是在濱河造成了極大的恐慌，老刑警劉巖亥宿，帶你破解...
沈念sama閱讀 216,591評論 6贊 501
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件卸勺，死亡現(xiàn)場離奇詭異，居然都是意外死亡烫扼，警方通過查閱死者的電腦和手機(jī)曙求，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,448評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來材蛛，“玉大人圆到，你說我怎么就攤上這事”翱裕” “怎么了芽淡？”我有些...
開封第一講書人閱讀 162,823評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長豆赏。經(jīng)常有香客問我挣菲，道長，這世上最難降的妖魔是什么掷邦？我笑而不...
開封第一講書人閱讀 58,204評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任白胀，我火速辦了婚禮，結(jié)果婚禮上抚岗，老公的妹妹穿的比我還像新娘或杠。我一直安慰自己，他們只是感情好宣蔚，可當(dāng)我...
茶點(diǎn)故事閱讀 67,228評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布向抢。她就那樣靜靜地躺著认境，像睡著了一般。火紅的嫁衣襯著肌膚如雪挟鸠。梳的紋絲不亂的頭發(fā)上叉信，一...
開封第一講書人閱讀 51,190評論 1贊 299
城市分裂傳說
那天，我揣著相機(jī)與錄音艘希，去河邊找鬼硼身。笑死，一個(gè)胖子當(dāng)著我的面吹牛覆享，可吹牛的內(nèi)容都是我干的佳遂。我是一名探鬼主播，決...
沈念sama閱讀 40,078評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼淹真，長吁一口氣：“原來是場噩夢啊……” “哼讶迁！你這毒婦竟也來了连茧？” 一聲冷哼從身側(cè)響起核蘸，我...
開封第一講書人閱讀 38,923評論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎啸驯，沒想到半個(gè)月后客扎，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,334評論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡罚斗，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,550評論 2贊 333
?白月光啟示錄
正文我和宋清朗相戀三年徙鱼，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片针姿。...
茶點(diǎn)故事閱讀 39,727評論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡袱吆，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出距淫，到底是詐尸還是另有隱情绞绒，我是刑警寧澤，帶...
沈念sama閱讀 35,428評論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布榕暇，位于F島的核電站蓬衡，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏彤枢。R本人自食惡果不足惜狰晚，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,022評論 3贊 326
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望缴啡。院中可真熱鬧壁晒，春花似錦、人聲如沸业栅。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,672評論 0贊 22
一樁弒父案换棚，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至反镇，卻和暖如春固蚤，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背歹茶。一陣腳步聲響...
開封第一講書人閱讀 32,826評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工夕玩，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人惊豺。一個(gè)月前我還...
沈念sama閱讀 47,734評論 2贊 368
代替公主和親
正文我出身青樓燎孟，卻偏偏與公主長得像，于是被迫代替她去往敵國和親尸昧。傳聞我的和親對象是個(gè)殘疾皇子揩页，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,619評論 2贊 354

pytorch之保存與加載模型

pytorch之保存與加載模型

1. state_dict

2. 保存&加載模型來inference(recommended)

3. 保存&加載整個(gè)模型(not recommended)

4. 保存&加載帶checkpoint的模型用于inference或resuming training

5. 保存多個(gè)模型到一個(gè)文件中

6. Warmstarting Model Using Parameters From A Different Model

7. 保存&加載模型跨設(shè)備

8. 保存torch.nn.DataParallel模型

推薦閱讀更多精彩內(nèi)容

2. 保存&加載模型來`inference`(recommended)

4. 保存&加載帶`checkpoint`的模型用于`inference`或`resuming training`