IP屬地:青海
XGBoost現(xiàn)在風頭正盛,把它也用在Titanic試試咯這個Kernel值得一試 最終測試結(jié)果0.886644219978,比RF好,最重要的是快啊
Kaggle上的Titanic梗夸,先跟著別人做,學(xué)習下別人的特征工程和調(diào)參。https://www.kaggle.com/startupsci/t...
這段時間在看GBDT痒筒,這篇文章寫的很好轉(zhuǎn)載過來。http://www.cnblogs.com/LeftNotEasy/archive/2011/...
自己造輪子系列今天造的是AdaBoost,基分類器用的是DS(decision stump)簿透。之所以會寫這個系列主要是我覺得一方面可以鍛煉cod...
自己造輪子是理解算法的好辦法移袍,今天寫了一個ID3的,對決策樹理解更加深刻了
特征工程里會遇到屬性非數(shù)值難以處理的情況萎战,這時就可以用One-hot Encoding了 今天學(xué)習了sklearn里面的OneHotEncode...
在Python中字符串處理函數(shù)里有三個去空格(包括'\n', '\r', '\t', ' ')的函數(shù): strip只能刪除兩側(cè)的字符 in:'*...
今天寫程序的時候發(fā)現(xiàn)兩個axis其實是有區(qū)別的咐容,程序如下 DataFrame numpy 亂了吧,原因是沒有理解axis簡單的來說就是axis=...