拆分數(shù)據(jù)集(train和test)

簡單的從一個文件夾隨機抽取一定數(shù)量圖片到另一個文件夾竭业。

import os, random, shutil
def moveFile(fileDir):
        pathDir = os.listdir(fileDir)    #文件夾路徑下的所有圖片名以list方式存儲
        filenumber=len(pathDir)
        #picknumber=100(想取圖片數(shù)量)
        # 想以一定比率抽取圖片則為
        rate=0.2    #rate=想取圖片數(shù)量/文件夾下面所有圖片數(shù)量
        picknumber=int(filenumber*rate) #想取圖片數(shù)量(整數(shù))
        sample = random.sample(pathDir, picknumber)  #在圖片名list中隨機選取
        print (sample)
        for name in sample:
                shutil.move(fileDir+name, tarDir+name)
if __name__ == '__main__':
    fileDir = "./source-data-file/"    #源圖片文件夾路徑
    tarDir = './result-data-file/'    #移動到新的文件夾路徑
    moveFile(fileDir)

隨機讀取文件夾下面的所有文件名术徊,寫入到txt

import random
from random import shuffle
path = "C:/Users/eadhaw/Desktop/1223test/train/"
new_path = "C:/Users/eadhaw/Desktop/1223test/train.txt"
files = os.listdir(path)
shuffle(files)
#print(files)

for filename in files:
    f_path = path + filename
    print(filename[:-4])
    f = open(new_path,"a+")
    f.write(filename[:-4])     # 保存的文件名不要后面四位(.png)
    f.write("\n")
    f.close()

交叉驗證概念

百度百科:交叉驗證的基本思想是把在某種意義下將原始數(shù)據(jù)(dataset)進行分組,一部分做為訓練集(train set),另一部分做為驗證集(validation set or test set),首先用訓練集對分類器進行訓練,再利用驗證集來測試訓練得到的模型(model),以此來做為評價分類器的性能指標。

數(shù)據(jù)集定義:

訓練數(shù)據(jù)集:訓練模型母怜;
驗證數(shù)據(jù)集:驗證模型的效果失尖;如果模型的效果不好眉孩,則重新調(diào)整參數(shù)再次訓練新的模型,直到找到了一組參數(shù)技健,使得模型針對驗證數(shù)據(jù)集來說已經(jīng)達到最優(yōu)了写穴;(調(diào)整超參數(shù)使用的數(shù)據(jù)集)
測試數(shù)據(jù)集:將此數(shù)據(jù)集傳入由驗證數(shù)據(jù)集得到的最佳模型,得到模型最終的性能雌贱;(作為衡量最終模型性能的數(shù)據(jù)集)

k折交叉驗證

將原始數(shù)據(jù)集分割為訓練數(shù)據(jù)集和測試數(shù)據(jù)集啊送,再將訓練數(shù)據(jù)集分割為 k 個樣本子集偿短,依次遍歷這k個子集,每次把當前子集作為驗證集删掀,其余所有子集作為訓練集翔冀。這樣算是一次實驗,而k折交叉驗證只有實驗k次才算完成完整的一次披泪,也就是說交叉驗證實際是把實驗重復做了k次(保證k個部分的數(shù)據(jù)都分別做過驗證集)訓練出 k 個模型纤子,每一個模型都在對應的驗證數(shù)據(jù)集上求出其性能的指標,k 個模型的性能指標的平均值作為最終衡量該組參數(shù)對應的模型的性能指標款票。
一組參數(shù)訓練出 k 個模型控硼,如果最終指標不理想,重新調(diào)整參數(shù)艾少,再次得到這 k 個模型的性能指標的均值卡乾。
借鑒https://www.cnblogs.com/volcao/p/9291831.html

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市缚够,隨后出現(xiàn)的幾起案子幔妨,更是在濱河造成了極大的恐慌,老刑警劉巖谍椅,帶你破解...
    沈念sama閱讀 218,451評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件误堡,死亡現(xiàn)場離奇詭異,居然都是意外死亡雏吭,警方通過查閱死者的電腦和手機锁施,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,172評論 3 394
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來杖们,“玉大人悉抵,你說我怎么就攤上這事≌辏” “怎么了姥饰?”我有些...
    開封第一講書人閱讀 164,782評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長孝治。 經(jīng)常有香客問我媳否,道長,這世上最難降的妖魔是什么荆秦? 我笑而不...
    開封第一講書人閱讀 58,709評論 1 294
  • 正文 為了忘掉前任篱竭,我火速辦了婚禮,結果婚禮上步绸,老公的妹妹穿的比我還像新娘掺逼。我一直安慰自己,他們只是感情好瓤介,可當我...
    茶點故事閱讀 67,733評論 6 392
  • 文/花漫 我一把揭開白布吕喘。 她就那樣靜靜地躺著赘那,像睡著了一般。 火紅的嫁衣襯著肌膚如雪氯质。 梳的紋絲不亂的頭發(fā)上募舟,一...
    開封第一講書人閱讀 51,578評論 1 305
  • 那天,我揣著相機與錄音闻察,去河邊找鬼拱礁。 笑死,一個胖子當著我的面吹牛辕漂,可吹牛的內(nèi)容都是我干的呢灶。 我是一名探鬼主播,決...
    沈念sama閱讀 40,320評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼钉嘹,長吁一口氣:“原來是場噩夢啊……” “哼鸯乃!你這毒婦竟也來了?” 一聲冷哼從身側響起跋涣,我...
    開封第一講書人閱讀 39,241評論 0 276
  • 序言:老撾萬榮一對情侶失蹤缨睡,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后陈辱,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體宏蛉,經(jīng)...
    沈念sama閱讀 45,686評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,878評論 3 336
  • 正文 我和宋清朗相戀三年性置,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片揍堰。...
    茶點故事閱讀 39,992評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡鹏浅,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出屏歹,到底是詐尸還是另有隱情隐砸,我是刑警寧澤,帶...
    沈念sama閱讀 35,715評論 5 346
  • 正文 年R本政府宣布蝙眶,位于F島的核電站季希,受9級特大地震影響,放射性物質發(fā)生泄漏幽纷。R本人自食惡果不足惜式塌,卻給世界環(huán)境...
    茶點故事閱讀 41,336評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望友浸。 院中可真熱鬧峰尝,春花似錦、人聲如沸收恢。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,912評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至火窒,卻和暖如春硼补,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背熏矿。 一陣腳步聲響...
    開封第一講書人閱讀 33,040評論 1 270
  • 我被黑心中介騙來泰國打工已骇, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人曲掰。 一個月前我還...
    沈念sama閱讀 48,173評論 3 370
  • 正文 我出身青樓疾捍,卻偏偏與公主長得像,于是被迫代替她去往敵國和親栏妖。 傳聞我的和親對象是個殘疾皇子乱豆,可洞房花燭夜當晚...
    茶點故事閱讀 44,947評論 2 355