ImageNet數(shù)據(jù)集下載、解壓

本文處理對象為 ILSVRC2012 分類數(shù)據(jù)集茉兰。

一、下載:

首先進(jìn)入ImageNet 官網(wǎng):

ImageNet 官網(wǎng)鏈接

用學(xué)生郵箱注冊并登錄后才能免費下載脆淹,因此如果沒有注冊的話,需要首先用學(xué)生郵箱注冊賬戶沽一。

這里需要注意的是:

  • 不翻墻的話會導(dǎo)致注冊失敻悄纭!>饴辍咐柜!

PS:可能有人因為想找迅雷下載鏈接而點進(jìn)了這篇帖子兼蜈,為了避免你們空手離開攘残,我就貼一個下載鏈接吧,如果有用的話就麻煩點個贊和關(guān)注吧~
訓(xùn)練集迅雷種子文件:提取碼:46aw
驗證集百度云:提取碼:7bt4
標(biāo)簽映射文件百度云:提取碼:axte

下載以下3個文件即可:

ILSVRC2012_img_train.tar
ILSVRC2012_img_val.tar
ILSVRC2012_devkit_t12.tar.gz

二为狸、解壓:

假設(shè)3個文件所在目錄為:

/home/data/imagenet

1.解壓訓(xùn)練集:

執(zhí)行命令:

cd /home/data/imagenet

進(jìn)入該文件目錄下歼郭。執(zhí)行命令:

mkdir train && tar -xvf ILSVRC2012_img_train.tar -C train && for x in `ls train/*tar`; do fn=train/`basename $x .tar`; mkdir $fn; tar -xvf $x -C $fn; rm -f $fn.tar; done

將訓(xùn)練集解壓到文件夾 train 目錄下。執(zhí)行命令:

cd train

進(jìn)入 train 目錄下辐棒。執(zhí)行命令:

ls -lR|grep "^d"|wc -l

查看該目錄下的文件夾數(shù)量病曾,若解壓成功,則返回1000漾根。執(zhí)行命令:

ls -lR|grep "^-"|wc -l

查看 train 目錄下所有文件(圖片)的數(shù)量泰涂,若解壓成功,則返回1281167辐怕。

2.解壓驗證集:

執(zhí)行命令:

cd /home/data/imagenet

進(jìn)入3個文件所在的根目錄逼蒙。執(zhí)行命令:

mkdir val

創(chuàng)建解壓驗證集的文件夾。執(zhí)行命令:

tar xvf ILSVRC2012_img_val.tar -C ./val

將驗證集圖像解壓到 val 目錄下寄疏。此時 val 目錄下是50000張圖像是牢,并沒有被分類到1000個文件夾下。因此需要將驗證集中的圖像進(jìn)行分類存放陕截。
執(zhí)行命令:

tar -xzf ILSVRC2012_devkit_t12.tar.gz

解壓下載的第3個文件驳棱,該文件中記錄著驗證集中的圖像名及其類別標(biāo)簽之間的映射關(guān)系。
在 '/home/data/imagenet' 目錄下創(chuàng)建 Python 腳本农曲,假設(shè)命名為“unzip.py”社搅,其內(nèi)容如下:

from scipy import io
import os
import shutil

def move_valimg(val_dir='./val', devkit_dir='./ILSVRC2012_devkit_t12'):
    """
    move valimg to correspongding folders.
    val_id(start from 1) -> ILSVRC_ID(start from 1) -> WIND
    organize like:
    /val
       /n01440764
           images
       /n01443537
           images
        .....
    """
    # load synset, val ground truth and val images list
    synset = io.loadmat(os.path.join(devkit_dir, 'data', 'meta.mat'))
    
    ground_truth = open(os.path.join(devkit_dir, 'data', 'ILSVRC2012_validation_ground_truth.txt'))
    lines = ground_truth.readlines()
    labels = [int(line[:-1]) for line in lines]
    
    root, _, filenames = next(os.walk(val_dir))
    for filename in filenames:
        # val image name -> ILSVRC ID -> WIND
        val_id = int(filename.split('.')[0].split('_')[-1])
        ILSVRC_ID = labels[val_id-1]
        WIND = synset['synsets'][ILSVRC_ID-1][0][1][0]
        print("val_id:%d, ILSVRC_ID:%d, WIND:%s" % (val_id, ILSVRC_ID, WIND))

        # move val images
        output_dir = os.path.join(root, WIND)
        if os.path.isdir(output_dir):
            pass
        else:
            os.mkdir(output_dir)
        shutil.move(os.path.join(root, filename), os.path.join(output_dir, filename))

if __name__ == '__main__':
    move_valimg()

運行該腳本后,驗證集就處理成功了。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末形葬,一起剝皮案震驚了整個濱河市却汉,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌荷并,老刑警劉巖合砂,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異源织,居然都是意外死亡翩伪,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進(jìn)店門谈息,熙熙樓的掌柜王于貴愁眉苦臉地迎上來缘屹,“玉大人,你說我怎么就攤上這事侠仇∏嶙耍” “怎么了?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵逻炊,是天一觀的道長互亮。 經(jīng)常有香客問我,道長余素,這世上最難降的妖魔是什么豹休? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮桨吊,結(jié)果婚禮上威根,老公的妹妹穿的比我還像新娘。我一直安慰自己视乐,他們只是感情好洛搀,可當(dāng)我...
    茶點故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著佑淀,像睡著了一般留美。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上渣聚,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天独榴,我揣著相機(jī)與錄音,去河邊找鬼奕枝。 笑死棺榔,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的隘道。 我是一名探鬼主播症歇,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼郎笆,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了忘晤?” 一聲冷哼從身側(cè)響起宛蚓,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎设塔,沒想到半個月后凄吏,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡闰蛔,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年痕钢,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片序六。...
    茶點故事閱讀 39,785評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡任连,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出例诀,到底是詐尸還是另有隱情随抠,我是刑警寧澤,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜搁嗓,卻給世界環(huán)境...
    茶點故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望舀射。 院中可真熱鬧自赔,春花似錦、人聲如沸背犯。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽漠魏。三九已至倔矾,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間柱锹,已是汗流浹背哪自。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留禁熏,地道東北人壤巷。 一個月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像瞧毙,于是被迫代替她去往敵國和親胧华。 傳聞我的和親對象是個殘疾皇子寄症,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,713評論 2 354

推薦閱讀更多精彩內(nèi)容