利用sklearn進行titanic船員獲救預(yù)測

本例使用sklearn進行kaggle案例泰坦尼克Titanic船員獲救預(yù)測

環(huán)境:python3+Anaconda(Anaconda集成了實驗用到的包)
源碼及語料:https://gitee.com/yqmyqm/Machine_learn
下面為實現(xiàn)代碼:

'''
Created on 2017年12月20日

@author: yqm
'''
import pandas

file_dir = "G:\\研究生\\實驗\\語料\\titanic_train.csv"
titanic = pandas.read_csv(file_dir)
# print(titanic.head(5))

# Age列存在缺失項畔塔,用Age的平均數(shù)填充缺失值(NaN格式)
titanic["Age"] = titanic["Age"].fillna(titanic["Age"].median())
titanic.loc[titanic["Sex"] == "male", "Sex"] = 0
titanic.loc[titanic["Sex"] == "female", "Sex"] = 1
# print(titanic["Sex"].unique())
# print(titanic["Embarked"].unique())  # unique()函數(shù)查看一共有多少重復(fù)的值 例:['S' 'C' 'Q' nan]
titanic["Embarked"] = titanic["Embarked"].fillna("S")
titanic.loc[titanic["Embarked"] == "S", "Embarked"] = 0
titanic.loc[titanic["Embarked"] == "C", "Embarked"] = 1
titanic.loc[titanic["Embarked"] == "Q", "Embarked"] = 2
# print(titanic.describe())#輸出總數(shù)作谚,均值叉讥。蛉顽。等信息

from sklearn.linear_model import LinearRegression #引入線性回歸
from sklearn.cross_validation import KFold #交叉驗證庫照宝,將測試集進行切分交叉取平均
#傳入模型的特征
predictors = ['Pclass','Sex','Age','SibSp','Parch','Fare','Embarked']
alg = LinearRegression() #實例化模型
# print(titanic.shape)
# 將m個樣本平均分成3份進行交叉驗證
# titanic.shape輸出樣本集的行和列本例輸出為(891, 12),shape[0]指第一個列的值
# 本例titanic.shape[0]為樣本的個數(shù)
# 根據(jù)參數(shù)n和n_folds將n個樣本分成n_folds份叔遂。每次驗證過程選取其中1份作為測試集同规,剩下的n_folds-1份作為訓(xùn)練集,并且做n_folds次這樣的驗證
kf = KFold(titanic.shape[0], n_folds=3, random_state=1)
# print(kf)
predictions = []
for train, test in kf:
    train_predictions = (titanic[predictors].iloc[train,:])#將predictors作為測試特征
    train_target = titanic["Survived"].iloc[train] #訓(xùn)練集標簽值
    alg.fit(train_predictions, train_target) #訓(xùn)練數(shù)據(jù)
    #用訓(xùn)練好的模型預(yù)測數(shù)據(jù)
    test_prediction = alg.predict(titanic[predictors].iloc[test,:])
#     print(test_prediction)
    predictions.append(test_prediction)
print(predictions)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末咧擂,一起剝皮案震驚了整個濱河市逞盆,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌松申,老刑警劉巖云芦,帶你破解...
    沈念sama閱讀 222,000評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件俯逾,死亡現(xiàn)場離奇詭異,居然都是意外死亡焕数,警方通過查閱死者的電腦和手機纱昧,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,745評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來堡赔,“玉大人识脆,你說我怎么就攤上這事∩埔眩” “怎么了灼捂?”我有些...
    開封第一講書人閱讀 168,561評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長换团。 經(jīng)常有香客問我悉稠,道長,這世上最難降的妖魔是什么艘包? 我笑而不...
    開封第一講書人閱讀 59,782評論 1 298
  • 正文 為了忘掉前任的猛,我火速辦了婚禮,結(jié)果婚禮上想虎,老公的妹妹穿的比我還像新娘卦尊。我一直安慰自己,他們只是感情好舌厨,可當我...
    茶點故事閱讀 68,798評論 6 397
  • 文/花漫 我一把揭開白布岂却。 她就那樣靜靜地躺著,像睡著了一般裙椭。 火紅的嫁衣襯著肌膚如雪躏哩。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,394評論 1 310
  • 那天揉燃,我揣著相機與錄音扫尺,去河邊找鬼。 笑死炊汤,一個胖子當著我的面吹牛正驻,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播婿崭,決...
    沈念sama閱讀 40,952評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼肴颊!你這毒婦竟也來了氓栈?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,852評論 0 276
  • 序言:老撾萬榮一對情侶失蹤婿着,失蹤者是張志新(化名)和其女友劉穎授瘦,沒想到半個月后醋界,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,409評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡提完,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,483評論 3 341
  • 正文 我和宋清朗相戀三年形纺,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片徒欣。...
    茶點故事閱讀 40,615評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡逐样,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出打肝,到底是詐尸還是另有隱情脂新,我是刑警寧澤,帶...
    沈念sama閱讀 36,303評論 5 350
  • 正文 年R本政府宣布粗梭,位于F島的核電站争便,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏断医。R本人自食惡果不足惜滞乙,卻給世界環(huán)境...
    茶點故事閱讀 41,979評論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望鉴嗤。 院中可真熱鬧斩启,春花似錦、人聲如沸躬窜。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,470評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽荣挨。三九已至男韧,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間默垄,已是汗流浹背此虑。 一陣腳步聲響...
    開封第一講書人閱讀 33,571評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留口锭,地道東北人朦前。 一個月前我還...
    沈念sama閱讀 49,041評論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像鹃操,于是被迫代替她去往敵國和親韭寸。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,630評論 2 359

推薦閱讀更多精彩內(nèi)容