Kaggle-Titanic,XGBoost

XGBoost現(xiàn)在風頭正盛，把它也用在Titanic試試咯
這個Kernel值得一試

import pandas as pd
import xgboost as xgb
from sklearn.preprocessing import LabelEncoder
import numpy as np

# Load the data
train_df = pd.read_csv(r'C:\Users\oncem\Desktop\Titanic\train.csv', header=0)
test_df = pd.read_csv(r'C:\Users\oncem\Desktop\Titanic\test.csv', header=0)

# We'll impute missing values using the median for numeric columns and the most
# common value for string columns.
# This is based on some nice code by 'sveitser' at http://stackoverflow.com/a/25562948
from sklearn.base import TransformerMixin
class DataFrameImputer(TransformerMixin):
    def fit(self, X, y=None):
        self.fill = pd.Series([X[c].value_counts().index[0]
            if X[c].dtype == np.dtype('O') else X[c].median() for c in X],
            index=X.columns)
        return self
    def transform(self, X, y=None):
        return X.fillna(self.fill)

feature_columns_to_use = ['Pclass','Sex','Age','Fare','Parch']
nonnumeric_columns = ['Sex']

# Join the features from train and test together before imputing missing values,
# in case their distribution is slightly different
big_X = train_df[feature_columns_to_use].append(test_df[feature_columns_to_use])
big_X_imputed = DataFrameImputer().fit_transform(big_X)

# XGBoost doesn't (yet) handle categorical features automatically, so we need to change
# them to columns of integer values.
# See http://scikit-learn.org/stable/modules/preprocessing.html#preprocessing for more
# details and options
le = LabelEncoder()
for feature in nonnumeric_columns:
    big_X_imputed[feature] = le.fit_transform(big_X_imputed[feature])

# Prepare the inputs for the model
train_X = big_X_imputed[0:train_df.shape[0]].as_matrix()
test_X = big_X_imputed[train_df.shape[0]::].as_matrix()
train_y = train_df['Survived']

# You can experiment with many other options here, using the same .fit() and .predict()
# methods; see http://scikit-learn.org
# This example uses the current build of XGBoost, from https://github.com/dmlc/xgboost
gbm = xgb.XGBClassifier(max_depth=3, n_estimators=300, learning_rate=0.05).fit(train_X, train_y)
predictions = gbm.predict(test_X)

# Kaggle needs the submission to have a certain format;
# see https://www.kaggle.com/c/titanic-gettingStarted/download/gendermodel.csv
# for an example of what it's supposed to look like.
submission = pd.DataFrame({ 'PassengerId': test_df['PassengerId'],
                            'Survived': predictions })
submission.to_csv("submission.csv", index=False)

最終測試結果0.886644219978蔑舞，比RF好较性，最重要的是快啊

最后編輯于：2017.12.08 00:56:37

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末堵第，一起剝皮案震驚了整個濱河市矾芙，隨后出現(xiàn)的幾起案子脖岛，更是在濱河造成了極大的恐慌，老刑警劉巖颊亮，帶你破解...
沈念sama閱讀 207,248評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件柴梆，死亡現(xiàn)場離奇詭異，居然都是意外死亡终惑，警方通過查閱死者的電腦和手機绍在，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,681評論 2贊 381
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來雹有，“玉大人偿渡，你說我怎么就攤上這事“赞龋” “怎么了溜宽？”我有些...
開封第一講書人閱讀 153,443評論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長质帅。經常有香客問我适揉，道長，這世上最難降的妖魔是什么煤惩？我笑而不...
開封第一講書人閱讀 55,475評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任嫉嘀，我火速辦了婚禮，結果婚禮上魄揉，老公的妹妹穿的比我還像新娘剪侮。我一直安慰自己，他們只是感情好什猖，可當我...
茶點故事閱讀 64,458評論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布票彪。她就那樣靜靜地躺著红淡，像睡著了一般不狮。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上在旱，一...
開封第一講書人閱讀 49,185評論 1贊 284
城市分裂傳說
那天摇零，我揣著相機與錄音，去河邊找鬼桶蝎。笑死驻仅，一個胖子當著我的面吹牛，可吹牛的內容都是我干的登渣。我是一名探鬼主播噪服，決...
沈念sama閱讀 38,451評論 3贊 401
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼胜茧！你這毒婦竟也來了粘优？” 一聲冷哼從身側響起仇味，我...
開封第一講書人閱讀 37,112評論 0贊 261
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎雹顺，沒想到半個月后丹墨，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經...
沈念sama閱讀 43,609評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡嬉愧，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 36,083評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年贩挣，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片没酣。...
茶點故事閱讀 38,163評論 1贊 334
活死人
序言：一個原本活蹦亂跳的男人離奇死亡王财，死狀恐怖，靈堂內的尸體忽然破棺而出裕便，到底是詐尸還是另有隱情搪搏，我是刑警寧澤，帶...
沈念sama閱讀 33,803評論 4贊 323
?日本核電站爆炸內幕
正文年R本政府宣布闪金，位于F島的核電站疯溺，受9級特大地震影響，放射性物質發(fā)生泄漏哎垦。R本人自食惡果不足惜囱嫩，卻給世界環(huán)境...
茶點故事閱讀 39,357評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望漏设。院中可真熱鬧墨闲，春花似錦、人聲如沸郑口。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,357評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽犬性。三九已至瞻离，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間乒裆，已是汗流浹背套利。一陣腳步聲響...
開封第一講書人閱讀 31,590評論 1贊 261
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留鹤耍，地道東北人肉迫。一個月前我還...
沈念sama閱讀 45,636評論 2贊 355
代替公主和親
正文我出身青樓，卻偏偏與公主長得像稿黄，于是被迫代替她去往敵國和親喊衫。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 42,925評論 2贊 344

Kaggle-Titanic,XGBoost

推薦閱讀更多精彩內容