它存在的意義就是自動調(diào)參圆米,只要把參數(shù)輸進(jìn)去蒋畜,就能給出最優(yōu)化的結(jié)果和參數(shù)声畏。
對于和pipeline聯(lián)合使用的時候,可用
'poly__degree':[i for i in range(2, 5)]
}]
進(jìn)行管道中每個方法參數(shù)的網(wǎng)格搜索
fit_transform,fit,transform區(qū)別和作用
fit和transform沒有任何關(guān)系,僅僅是數(shù)據(jù)處理的兩個不同環(huán)節(jié)姻成,之所以出來fit_transform這個函數(shù)名插龄,僅僅是為了寫代碼方便,會高效一點(diǎn)科展。
sklearn里的封裝好的各種算法使用前都要fit均牢,fit相對于整個代碼而言,為后續(xù)API服務(wù)才睹。fit之后徘跪,然后調(diào)用各種API方法甘邀,transform只是其中一個API方法,所以當(dāng)你調(diào)用transform之外的方法垮庐,也必須要先fit松邪。
fit原義指的是安裝、使適合的意思突硝,其實(shí)有點(diǎn)train的含義,但是和train不同的是置济,它并不是一個訓(xùn)練的過程解恰,而是一個適配的過程,過程都是確定的浙于,最后得到一個可用于轉(zhuǎn)換的有價值的信息护盈。
fit(): Method calculates the parameters μ and σ and saves them as internal objects.
解釋:簡單來說,就是求得訓(xùn)練集X的均值羞酗,方差腐宋,最大值,最小值,這些訓(xùn)練集X固有的屬性檀轨。
transform(): Method using these calculated parameters apply the transformation to a particular dataset.
解釋:在fit的基礎(chǔ)上胸竞,進(jìn)行標(biāo)準(zhǔn)化,降維参萄,歸一化等操作(看具體用的是哪個工具卫枝,如PCA,StandardScaler等)讹挎。