torchvision指南

本筆記引用自PyTorch中文文檔

1. torchvision介紹

torchvision包含了目前流行的數(shù)據(jù)集，模型結(jié)構(gòu)和常用的圖片轉(zhuǎn)換工具愕贡。

1.1 torchvision.datasets

torchvision.datasets中包含以下數(shù)據(jù)集：
- MNIST
- COCO
- LSUN Classification
- ImageFolder
- Imagenet-12
- CIFAR10 and CIFAR100
- STL10
dataset擁有以下API：__getitem__, __len__
這些datasets都是torch.utils.data.Dataset的子類

1.1.1 MNIST

dest.MNIST(root, train=True, transform=None, target_transform=None, download=False)
-download: 是否聯(lián)網(wǎng)下載

1.1.2 COCO

圖像標(biāo)注
dest.CocoCaptions(root="dir where images are", annFile="json annotation file", [transform, target_transform, transform])

# sample
import torchvision.datasets as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = 'dir where images are',
          annFile = 'json annotation file',
          transform=transforms.ToTensor())
print(Number of sample: ', len(cap))
img, target = cap[3]
print('Image size:', img.size())
print(target)

'''
output
Number of samples: 82783
Image Size: (3L, 427L, 640L)
[u'A plane emitting smoke stream flying over a mountain.',
u'A plane darts across a bright blue sky behind a mountain covered in snow',
u'A plane leaves a contrail above the snowy mountain top.',
u'A mountain that has a plane flying overheard in the distance.',
u'A mountain view with a plume of smoke in the background']
'''

檢測
`dset.CocoDetection(root='dir where images are', annFile='json annotation file', [transform, target_transform])

1.1.3 ImageFolder

一個通用的數(shù)據(jù)加載器孵运，數(shù)據(jù)集中數(shù)據(jù)以以下方式組織：

root/dog/xxx.png
root/dog/xxy.png
root/dog/xxz.png

root/cat/123.png
root/cat/nsdf3.png
root/cat/asd932_.png

dset.ImageFolder(root='root folder path', [transform, target_transform])
- self.classes: 用一個list保存類名
- self.class_to_idx: 類名對應(yīng)的索引
- self.imgs: 保存(img_path, class)tuple的list

1.1.4 CIFAR

dset.CIFAR10(root, train=True, transform=None, target_transform=None, download=False)
dset.CIFAR100(root, train=True, transform=None, target_transform=None, download=False)

1.2 torchvision.models

torchvision.models模塊的子模塊中包含以下模型結(jié)構(gòu)：
- AlexNet
- VGG
- ResNet
- SqueezeNet
- DenseNet
可使用預(yù)訓(xùn)練模型螟够，如：

torchvision.models.alexnet(pretrained=False, **kwargs)
torchvision.models.resnet18(pretrained=False, **kwargs)
torchvision.models.resnet34(pretrained=False, ** kwargs)
torchvision.models.resnet50(pretrained=False, ** kwargs)
torchvision.models.resnet101(pretrained=False, ** kwargs)
torchvision.models.resnet152(pretrained=False, ** kwargs)
torchvision.models.vgg11(pretrained=False, ** kwargs)
torchvision.models.vgg11_bn(** kwargs)
torchvision.models.vgg13(pretrained=False, ** kwargs)
torchvision.models.vgg13_bn(** kwargs)
torchvision.models.vgg16(pretrained=False, ** kwargs)
torchvision.models.vgg16_bn(** kwargs)
torchvision.models.vgg19(pretrained=False, ** kwargs)
torchvision.models.vgg19_bn(** kwargs)

1.3 torchvision.transforms

對PIL.Image進(jìn)行變換
使用torchvision.transforms.Compose(transforms)將多個transform組合起來使用
transforms.CenterCrop(size)：將給定PIL.Image進(jìn)行中心切割彤断，得到給定的size怕品，size可以是tuple或Integer
transforms.RandomCrop(size, padding=0)：切割中心點(diǎn)位置隨機(jī)選取妇垢，size可以是tuple或Integer
transforms.RandomHorizontalFlip(p=0.5)：隨機(jī)水平翻轉(zhuǎn)
transforms.RandomSizedCrop(size, interpolation=2)：先隨機(jī)切，再resize成給定size大小肉康。
transforms.Pad(padding, fill=0)：給所有邊用給定的值填充闯估。padding：要填充多少像素
transforms.ToTensor()：將一個取值范圍是[0, 255]的PIL.Image或shape為(H, W, C)的numpy.ndarray，轉(zhuǎn)換成形狀為[C, H, W]吼和，取值范圍是[0, 1.0]的torch.FloatTensor
transforms.Normalize(mean, std)：給定均值與方差睬愤，正則化，即Normalized_image=(image-mean)/std
通用變換：使用lambda作為轉(zhuǎn)換器纹安，transforms.Lambda(lambda)

1.4 torchvision.utils

utils.make_grid(tensor, nrow=8, padding=2, normalize=False, range=None, scale_each=False)
給定4D-mini-batch Tensor尤辱，形狀為(B*C*H*W)，或者一個a list of image厢岂，做成一個size為(B / nrow, nrow)的子圖集
- normalize=True, 對圖像像素歸一化
- range=(min, max)光督，min和max是數(shù)字，則min, max用來規(guī)范化image
- scale_each=True, 每個圖片獨(dú)立規(guī)范化塔粒。
utils.save_image(tensor, filename, nrow=8, padding=2, normalize=False, range=None, scale_each=False)
將給定的Tensor保存成image文件结借，如果是mini-batch tensor，就用make-grid做成子圖集再保存卒茬。

最后編輯于：2018.07.23 14:27:17

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末船老，一起剝皮案震驚了整個濱河市咖熟，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌柳畔，老刑警劉巖馍管，帶你破解...
沈念sama閱讀 218,546評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異薪韩，居然都是意外死亡确沸，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,224評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門俘陷，熙熙樓的掌柜王于貴愁眉苦臉地迎上來罗捎，“玉大人，你說我怎么就攤上這事拉盾〗安耍” “怎么了？”我有些...
開封第一講書人閱讀 164,911評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵捉偏，是天一觀的道長倒得。經(jīng)常有香客問我，道長告私，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,737評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任承桥，我火速辦了婚禮驻粟，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘凶异。我一直安慰自己蜀撑，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,753評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布剩彬。她就那樣靜靜地躺著酷麦，像睡著了一般。火紅的嫁衣襯著肌膚如雪喉恋。梳的紋絲不亂的頭發(fā)上沃饶，一...
開封第一講書人閱讀 51,598評論 1贊 305
城市分裂傳說
那天，我揣著相機(jī)與錄音轻黑，去河邊找鬼糊肤。笑死，一個胖子當(dāng)著我的面吹牛氓鄙，可吹牛的內(nèi)容都是我干的馆揉。我是一名探鬼主播，決...
沈念sama閱讀 40,338評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼抖拦，長吁一口氣：“原來是場噩夢啊……” “哼升酣！你這毒婦竟也來了舷暮？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,249評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤噩茄，失蹤者是張志新（化名）和其女友劉穎下面，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體巢墅，經(jīng)...
沈念sama閱讀 45,696評論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡诸狭，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,888評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了君纫。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片驯遇。...
茶點(diǎn)故事閱讀 40,013評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖蓄髓，靈堂內(nèi)的尸體忽然破棺而出叉庐，到底是詐尸還是另有隱情，我是刑警寧澤会喝，帶...
沈念sama閱讀 35,731評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布陡叠，位于F島的核電站，受9級特大地震影響肢执，放射性物質(zhì)發(fā)生泄漏枉阵。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,348評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一预茄、第九天我趴在偏房一處隱蔽的房頂上張望兴溜。院中可真熱鬧，春花似錦耻陕、人聲如沸拙徽。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,929評論 0贊 22
一樁弒父案诗宣，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽膘怕。三九已至，卻和暖如春召庞，著一層夾襖步出監(jiān)牢的瞬間岛心，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,048評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工篮灼，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留鹉梨，地道東北人。一個月前我還...
沈念sama閱讀 48,203評論 3贊 370
代替公主和親
正文我出身青樓穿稳，卻偏偏與公主長得像存皂，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,960評論 2贊 355

torchvision指南

torchvision指南

1. torchvision介紹

1.1 torchvision.datasets

1.1.1 MNIST

1.1.2 COCO

1.1.3 ImageFolder

1.1.4 CIFAR

1.2 torchvision.models

1.3 torchvision.transforms

1.4 torchvision.utils

推薦閱讀更多精彩內(nèi)容