訓(xùn)練集與測試集切分

前言

為了 更好的訓(xùn)練數(shù)據(jù)并且更好測試模型,一般做機器學(xué)習之前都會進行訓(xùn)練集和測試集的切分竹祷。

train_test_split實現(xiàn)

其實我們可以先把數(shù)據(jù)的輸入X和輸出向量y進行一個水平拼接谈跛,然后隨機之后拆開,但是過程比較麻煩塑陵。在sklearn中shuffle的并不是訓(xùn)練集感憾,而是訓(xùn)練集長度大小的隨機索引

產(chǎn)生隨機索引值

shuffle_indexes=np.random.permutation(len(X)) #X為數(shù)據(jù)的輸入
shuffle_indexes

np.random.permutation( x )這個函數(shù)可以產(chǎn)生x和隨機數(shù)猿妈,并且隨機數(shù)的范圍是0~x

shuffle_indexes=np.random.permutation(3)
shuffle_indexes

array([2, 0, 1])

設(shè)置切分的比例

test_ratio=0.2
test_size=int(len(X) * test_ratio)

求出切分索引

test_indexes=shuffle_indexes[:test_size]
train_indexes=shuffle_indexes[test_size:]

獲得數(shù)據(jù)

X_train=X[train_indexes]
y_train=y[train_indexes]

X_test=X[test_indexes]
y_test=y[test_indexes]

sklearn中的劃分

有了之前的知識就能更好的理解sklearn中的切分函數(shù)的每個參數(shù)的意思吹菱。

導(dǎo)入包

from sklearn.model_selection import train_test_split

調(diào)用

X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2, 
random_state=0)

參數(shù)意義:
X,數(shù)據(jù)集的輸入
y, 數(shù)據(jù)集的輸出
test_size 默認參數(shù)彭则,這個測試集所占百分比。
radom_state 默認參數(shù)占遥,隨機數(shù)種子俯抖,一般調(diào)試的時候希望每次切分要是一樣的,就給這個種子一個固定的值就好了瓦胎。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末芬萍,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子搔啊,更是在濱河造成了極大的恐慌柬祠,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,406評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件负芋,死亡現(xiàn)場離奇詭異漫蛔,居然都是意外死亡,警方通過查閱死者的電腦和手機旧蛾,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,732評論 3 393
  • 文/潘曉璐 我一進店門莽龟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人锨天,你說我怎么就攤上這事毯盈。” “怎么了病袄?”我有些...
    開封第一講書人閱讀 163,711評論 0 353
  • 文/不壞的土叔 我叫張陵搂赋,是天一觀的道長。 經(jīng)常有香客問我益缠,道長脑奠,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,380評論 1 293
  • 正文 為了忘掉前任左刽,我火速辦了婚禮捺信,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己迄靠,他們只是感情好秒咨,可當我...
    茶點故事閱讀 67,432評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著掌挚,像睡著了一般雨席。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上吠式,一...
    開封第一講書人閱讀 51,301評論 1 301
  • 那天陡厘,我揣著相機與錄音,去河邊找鬼特占。 笑死糙置,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的是目。 我是一名探鬼主播谤饭,決...
    沈念sama閱讀 40,145評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼懊纳!你這毒婦竟也來了揉抵?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,008評論 0 276
  • 序言:老撾萬榮一對情侶失蹤嗤疯,失蹤者是張志新(化名)和其女友劉穎冤今,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體茂缚,經(jīng)...
    沈念sama閱讀 45,443評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡戏罢,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,649評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了阱佛。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片帖汞。...
    茶點故事閱讀 39,795評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖凑术,靈堂內(nèi)的尸體忽然破棺而出翩蘸,到底是詐尸還是另有隱情,我是刑警寧澤淮逊,帶...
    沈念sama閱讀 35,501評論 5 345
  • 正文 年R本政府宣布催首,位于F島的核電站,受9級特大地震影響泄鹏,放射性物質(zhì)發(fā)生泄漏郎任。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,119評論 3 328
  • 文/蒙蒙 一备籽、第九天 我趴在偏房一處隱蔽的房頂上張望舶治。 院中可真熱鬧分井,春花似錦、人聲如沸霉猛。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,731評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽惜浅。三九已至瘫辩,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間坛悉,已是汗流浹背伐厌。 一陣腳步聲響...
    開封第一講書人閱讀 32,865評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留裸影,地道東北人挣轨。 一個月前我還...
    沈念sama閱讀 47,899評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像空民,于是被迫代替她去往敵國和親刃唐。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,724評論 2 354

推薦閱讀更多精彩內(nèi)容