AUC是一種衡量機(jī)器學(xué)習(xí)模型分類性能的重要且非常常用的指標(biāo),其只能用于二分類的情況.AUC的本質(zhì)含義反映的是對(duì)于任意一對(duì)正負(fù)例樣本,模型將正樣本...
涉及一些數(shù)據(jù)集中存在中文字符, 原始的matplotlib繪圖會(huì)出現(xiàn)中文亂碼的問題.試了很多辦法,最后這里找到一個(gè)可以完美解決的方案,親測(cè)有效:...
一. 為什么要參加競賽? 二. 需要哪些技能? 三. 怎么選擇比賽合適的比賽? 建議去kaggle學(xué)習(xí). 里面大牛分享的想法 , 還有開源.c...
pandas 中的merge是一種功能比較強(qiáng)大的用于兩個(gè)DataFrame或者Series進(jìn)行合并的方法. 合并時(shí)會(huì)將所有的列進(jìn)行合并,但是指定...
pandas中DataFrame結(jié)構(gòu)的索引分為行索引和列索引,因此在不同的用法下索引指代的操作也是不一樣的.這里記錄一下,后面忘記了再回來看. ...
這是實(shí)現(xiàn)將數(shù)據(jù)正態(tài)分布化,然后整體One-Hot化的代碼
OrdinalEncoder / OneHotEncoder /get_dummies 三個(gè)方法都能夠?qū)㈦x散的類別特征轉(zhuǎn)換成由數(shù)字代表的類別特征...
?這邊文章主要是記錄自己對(duì)于Ridge & Lasson & Elastic Net的理解和總結(jié).內(nèi)容較為粗淺,偏向應(yīng)用而沒有太多的數(shù)學(xué)理論.?...
在機(jī)器學(xué)習(xí)中,模型的欠擬合和過擬合是需要格外注意的問題,同時(shí)也是經(jīng)常發(fā)生的問題,其中過擬合最為常見. 欠擬合,即訓(xùn)練出的算法模型不足以表達(dá)數(shù)據(jù)間...