Flower102的鮮花分類數(shù)據(jù)準(zhǔn)備及處理教程

Flower102的鮮花分類數(shù)據(jù)準(zhǔn)備及處理


flower102數(shù)據(jù)集

寫在前面

寫這篇文章的初衷是想幫助像我一樣疑惑在flower102分類中數(shù)據(jù)處理階段的小朋友。

不知大家發(fā)現(xiàn)沒(méi)有突勇,現(xiàn)有的網(wǎng)絡(luò)資源中装盯,大部分博主都詳細(xì)記載了分類過(guò)程,但是對(duì)于數(shù)據(jù)準(zhǔn)備階段甲馋,都輕描淡寫的說(shuō)“簡(jiǎn)單處理一下”埂奈。如下圖所示,只告訴了數(shù)據(jù)的組織方式定躏,卻沒(méi)有告知如何生成這種數(shù)據(jù)的組織方式账磺。

項(xiàng)目組織目錄1
項(xiàng)目組織目錄2

當(dāng)然啦芹敌,博主們熱心的提供了已做好處理的數(shù)據(jù)收費(fèi)鏈接,而我呢垮抗,就不想花錢氏捞。

如果你也有上述疑惑和需求,那就繼續(xù)往下看吧~

1冒版、數(shù)據(jù)下載

flower102數(shù)據(jù)集鏈接地址為:http://www.robots.ox.ac.uk/~vgg/data/flowers/102/

數(shù)據(jù)鏈接主頁(yè)面

看到上圖的Downloads液茎,下載1,4,5。其中1為全部數(shù)據(jù)集圖片辞嗡,下載后解壓豁护,備用。4和5都為mat文件欲间,他們標(biāo)記了整個(gè)數(shù)據(jù)集的label。其中4文件總共有8189列断部,每列上的數(shù)字代表類別號(hào)猎贴。5文件總共有3個(gè)字段,分別為trnid:1020列蝴光;valid:1020列她渴;tstid:6149列。

需下載的數(shù)據(jù)選項(xiàng)

2蔑祟、數(shù)據(jù)預(yù)處理編碼

經(jīng)歷過(guò)上一步下載數(shù)據(jù)之后趁耗,我們已經(jīng)把需要的物料都準(zhǔn)備好了,接下來(lái)就是將數(shù)據(jù)分成訓(xùn)練集疆虚、測(cè)試集以進(jìn)行訓(xùn)練苛败。我們理想狀態(tài)下需要將數(shù)據(jù)組織成下面形式:

data_prepare/

? ? pic/

? ? ? ? train/

? ? ? ? ? ? class1/

? ? ? ? ? ? ? ? img1

? ? ? ? ? ? ? ? img2

? ? ? ? ? ? ? ? ...

? ? ? ? ? ? class2

? ? ? ? ? ? ? ? img1

? ? ? ? ? ? ? ? img2

? ? ? ? ? ? ? ? ...

? ? ? ? validation/

? ? ? ? ? ? class1/

? ? ? ? ? ? ? ? img1

? ? ? ? ? ? ? ? img2

? ? ? ? ? ? ? ? ...

? ? ? ? ? ? class2

? ? ? ? ? ? ? ? img1

? ? ? ? ? ? ? ? img2

? ? ? ? ? ? ? ? ...

為了將數(shù)據(jù)組織成上述形式,我們要先將下載好的1,4,5文件存放在項(xiàng)目目錄里径簿,下圖為我存放的數(shù)據(jù)地址罢屈,將4和5文件存放在項(xiàng)目直系目錄下,將1源數(shù)據(jù)放在flower_data目錄下篇亭,這里的jpg里面包含了所有數(shù)據(jù)圖片缠捌。jpg文件夾來(lái)自下載好數(shù)據(jù)壓縮包解壓后得到的文件名,我沒(méi)有去掉译蒂,你也可以去掉曼月,直接將全部數(shù)據(jù)圖片放到flower_data文件夾中。

項(xiàng)目組織目錄3

在項(xiàng)目中新建文件夾prepare_pic柔昼,再在prepare_pic下新建文件夾test哑芹、train、validation岳锁。

實(shí)現(xiàn)數(shù)據(jù)集劃分的編碼:
# encoding:utf-8

import scipy.io

import numpy as np

import os

from PIL import Image

import shutil

labels = scipy.io.loadmat('D:\\felicity\\code\\flower102\\imagelabels.mat')#該地址為imagelabels.mat的絕對(duì)地址

labels = np.array(labels['labels'][0]) - 1

print("labels:", labels)

setid = scipy.io.loadmat('D:\\felicity\\code\\flower102\\setid.mat')#該地址為setid.mat的絕對(duì)地址

validation = np.array(setid['valid'][0]) - 1

np.random.shuffle(validation)

train = np.array(setid['trnid'][0]) - 1

np.random.shuffle(train)

test = np.array(setid['tstid'][0]) - 1

np.random.shuffle(test)

flower_dir = list()

for img in os.listdir("D:\\felicity\\code\\flower102\\flower_data\\jpg"):#該地址為源數(shù)據(jù)圖片的絕對(duì)地址? ? ?????flower_dir.append(os.path.join("D:\\felicity\\code\\flower102\\flower_data\\jpg", img))

flower_dir.sort()

# print(flower_dir)

des_folder_train = "D:\\felicity\\code\\flower102\\prepare_pic\\train"#該地址為新建的訓(xùn)練數(shù)據(jù)集文件夾的絕對(duì)地址

for tid in train:

? ? #打開(kāi)圖片并獲取標(biāo)簽

? ? img = Image.open(flower_dir[tid])

? ? print(img)

? ? # print(flower_dir[tid])

? ? img = img.resize((256, 256), Image.ANTIALIAS)

? ? lable = labels[tid]

? ? # print(lable)

? ? path = flower_dir[tid]

? ? print("path:", path)

? ? base_path = os.path.basename(path)

? ? print("base_path:", base_path)

? ? classes = "c" + str(lable)

? ? class_path = os.path.join(des_folder_train, classes)

? ? # 判斷結(jié)果

? ? if not os.path.exists(class_path):

? ? ? ? os.makedirs(class_path)

? ? print("class_path:", class_path)

? ? despath = os.path.join(class_path, base_path)

? ? print("despath:", despath)

? ? img.save(despath)

des_folder_validation = "D:\\felicity\\code\\flower102\\prepare_pic\\validation"#該地址為新建的驗(yàn)證數(shù)據(jù)集文件夾的絕對(duì)地址

for tid in validation:

? ? img = Image.open(flower_dir[tid])

? ? # print(flower_dir[tid])

? ? img = img.resize((256, 256), Image.ANTIALIAS)

? ? lable = labels[tid]

? ? # print(lable)

? ? path = flower_dir[tid]

? ? print("path:", path)

? ? base_path = os.path.basename(path)

? ? print("base_path:", base_path)

? ? classes = "c" + str(lable)

? ? class_path = os.path.join(des_folder_validation, classes)

? ? # 判斷結(jié)果

? ? if not os.path.exists(class_path):

? ? ? ? os.makedirs(class_path)

? ? print("class_path:", class_path)

? ? despath = os.path.join(class_path, base_path)

? ? print("despath:", despath)

? ? img.save(despath)

des_folder_test = "D:\\felicity\\code\\flower102\\prepare_pic\\test"#該地址為新建的測(cè)試數(shù)據(jù)集文件夾的絕對(duì)地址

for tid in test:

? ? img = Image.open(flower_dir[tid])

? ? # print(flower_dir[tid])

? ? img = img.resize((256, 256), Image.ANTIALIAS)

? ? lable = labels[tid]

? ? # print(lable)

? ? path = flower_dir[tid]

? ? print("path:", path)

? ? base_path = os.path.basename(path)

? ? print("base_path:", base_path)

? ? classes = "c" + str(lable)

? ? class_path = os.path.join(des_folder_test, classes)

? ? # 判斷結(jié)果

? ? if not os.path.exists(class_path):

? ? ? ? os.makedirs(class_path)

? ? print("class_path:", class_path)

? ? despath = os.path.join(class_path, base_path)

? ? print("despath:", despath)

? ? img.save(despath)

將所有涉及的地址部分修改正確后绩衷,就可以運(yùn)行該文件蹦魔,我將該文件命名為data_prepare.py。

運(yùn)行之后咳燕,就可以看到項(xiàng)目目錄里面有了已經(jīng)劃分好的數(shù)據(jù)集了勿决。

分好類別的數(shù)據(jù)集

好啦,恭喜你招盲,你可以繼續(xù)做分類了低缩,另外,如果你覺(jué)得有用請(qǐng)給我點(diǎn)贊曹货,哈哈哈咆繁,讓它獲得流量,幫助更多的人顶籽。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末玩般,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子礼饱,更是在濱河造成了極大的恐慌坏为,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,602評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件镊绪,死亡現(xiàn)場(chǎng)離奇詭異匀伏,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)蝴韭,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,442評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門够颠,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人榄鉴,你說(shuō)我怎么就攤上這事履磨。” “怎么了牢硅?”我有些...
    開(kāi)封第一講書人閱讀 152,878評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵蹬耘,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我减余,道長(zhǎng)综苔,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 55,306評(píng)論 1 279
  • 正文 為了忘掉前任位岔,我火速辦了婚禮如筛,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘抒抬。我一直安慰自己杨刨,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,330評(píng)論 5 373
  • 文/花漫 我一把揭開(kāi)白布擦剑。 她就那樣靜靜地躺著妖胀,像睡著了一般芥颈。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上赚抡,一...
    開(kāi)封第一講書人閱讀 49,071評(píng)論 1 285
  • 那天爬坑,我揣著相機(jī)與錄音,去河邊找鬼涂臣。 笑死盾计,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的赁遗。 我是一名探鬼主播署辉,決...
    沈念sama閱讀 38,382評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼岩四!你這毒婦竟也來(lái)了哭尝?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 37,006評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤剖煌,失蹤者是張志新(化名)和其女友劉穎刚夺,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體末捣,經(jīng)...
    沈念sama閱讀 43,512評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,965評(píng)論 2 325
  • 正文 我和宋清朗相戀三年创橄,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了箩做。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,094評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡妥畏,死狀恐怖邦邦,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情醉蚁,我是刑警寧澤燃辖,帶...
    沈念sama閱讀 33,732評(píng)論 4 323
  • 正文 年R本政府宣布,位于F島的核電站网棍,受9級(jí)特大地震影響黔龟,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜滥玷,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,283評(píng)論 3 307
  • 文/蒙蒙 一氏身、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧惑畴,春花似錦蛋欣、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,286評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)到踏。三九已至,卻和暖如春尚猿,著一層夾襖步出監(jiān)牢的瞬間窝稿,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,512評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工谊路, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留讹躯,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,536評(píng)論 2 354
  • 正文 我出身青樓缠劝,卻偏偏與公主長(zhǎng)得像潮梯,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子惨恭,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,828評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容