2018-03-03

探索數(shù)據(jù)集-泰坦尼克號(hào)數(shù)據(jù)

一、讀取數(shù)據(jù)

import pandas as pd import numpy as np df = pd.read_csv('titanic-data.csv') df

#查看具體信息字段 df.info()

#數(shù)據(jù)概況 df.describe()

數(shù)據(jù)整體概況: 1.總共有189個(gè)數(shù)據(jù) 2.總的存活率是38.4%壮吩,乘客的平均年齡是30歲, 3.Age,Cabin,Embarked列存在缺失值

二结闸、提出問(wèn)題

Survived為因變量描函,Pclass、Sex精刷、Age剪决、SibSp灵汪、Parch、Fare柑潦、Cabin享言、Embarked為自變量。希望通過(guò)分析數(shù)據(jù)渗鬼,得出自變量對(duì)因變量的影響程度览露,幾個(gè)猜想:

? ? 1、性別影響生還率譬胎,女性的生還率顯著高于男性

? ? 2差牛、社會(huì)地位影響生還率命锄,社會(huì)地位高的乘客生還率顯著高于社會(huì)地位低的乘客

? ? 3、年齡影響生還率多糠,老人和孩子的生還率顯著高于中年

三累舷、數(shù)據(jù)整理階段

處理缺失值-Embarked(2個(gè)空值)

#空值定位 df.Embarked[df.Embarked.isnull()]

61 ? ? ?NaN

829? ? NaN

Name: Embarked, dtype: object

#估計(jì)Embarked的取值情況 df.groupby('Embarked').Survived.count()?

Embarked

C? ? 168

Q? ? 77

S? ? 644

Name: Survived, dtype: int64

Embarked取值只有3個(gè)值浩考,每個(gè)值對(duì)應(yīng)的人數(shù)有統(tǒng)計(jì)量夹孔,發(fā)現(xiàn)基本上大部分取值是'S',只有兩個(gè)空值析孽,可全部補(bǔ)充為's'

#眾數(shù)賦值 df["Embarked"] = df["Embarked"].fillna("S")

處理缺失值-Age(177個(gè)空值)

## 使用 RandomForestClassifier 填補(bǔ)缺失的年齡屬性 from sklearn.ensemble import RandomForestRegressor def set_missing_ages(df): age_df = df[['Age','Fare', 'Parch', 'SibSp', 'Pclass']]#把已有的數(shù)值型數(shù)據(jù)取出來(lái)丟進(jìn)Random Forest Regressor中 ? known_age = age_df[age_df.Age.notnull()].as_matrix()#乘客分成已知年齡和未知年齡兩部分 ? unknown_age = age_df[age_df.Age.isnull()].as_matrix() y = known_age[:, 0]# y即目標(biāo)年齡 X = known_age[:, 1:] # X即特征屬性值 rfr = RandomForestRegressor(random_state=0, n_estimators=2000, n_jobs=-1) rfr.fit(X, y) # fit到RandomForestRegressor之中 predictedAges = rfr.predict(unknown_age[:, 1::]) # 用得到的模型進(jìn)行未知年齡結(jié)果預(yù)測(cè) df.loc[ (df.Age.isnull()), 'Age' ] = predictedAges # 用得到的預(yù)測(cè)結(jié)果填補(bǔ)原缺失數(shù)據(jù) return df, rfr set_missing_ages(df) df

數(shù)據(jù)類型轉(zhuǎn)換-Age/Cabin/Embarked轉(zhuǎn)換成整型數(shù)據(jù)

#數(shù)據(jù)類型 df.dtypes

PassengerId int64

Survived? ? ? ? int64

Pclass? ? ? ? ? int64

Name? ? ? ? ? ? object

Sex? ? ? ? ? ? object

Age? ? ? ? ? ? float64

SibSp? ? ? ? ? ? int64

Parch? ? ? ? ? ? int64

Ticket? ? ? ? ? object

Fare? ? ? ? ? float64

Cabin? ? ? ? ? object

Embarked? ? ? ? object

dtype: object

#性別轉(zhuǎn)化為整數(shù)型 df['Sex'] = df['Sex'].map({'female':0, 'male':1}).astype(int) df['Sex'].value_counts()#計(jì)數(shù)

1 ? ?577

0? ? 314

Name: Sex, dtype: int64

男性乘客有577名搭伤,女性乘客有314名

#有船艙的賦值1,缺失值賦值0袜瞬,默認(rèn)為沒(méi)有固定船艙 df.loc[ (df.Cabin.notnull()), 'Cabin' ] = 1 df.loc[ (df.Cabin.isnull()), 'Cabin'] = 0 df['Cabin'].value_counts()#計(jì)數(shù) #登船碼頭賦值 df['Embarked'] = df['Embarked'].map({'S':0, 'C':1, 'Q':2}).astype(int) df['Embarked'].value_counts()#計(jì)數(shù)

有船艙的乘客有204人怜俐,沒(méi)有船艙的乘客有687人,從S碼頭上船的乘客有646人邓尤,從C碼頭上船的乘客有168人,從Q碼頭上船的乘客有77人拍鲤。

數(shù)據(jù)重構(gòu)-利用SibSp、Parch特征構(gòu)建兩個(gè)新特征(家庭人口總數(shù) familysize汞扎、是否單身 isalone)

df.loc[:,'SibSp']#兄妹個(gè)數(shù) df.loc[:,'Parch']#父母子女個(gè)數(shù) df['familysize'] = df.loc[:,'SibSp'] + df.loc[:,'Parch'] + 1 #增加一列column季稳,表示家庭成員個(gè)數(shù) df['isalone'] = 0 #增加一列column,表示是否是獨(dú)身,設(shè)初始值為0澈魄,代表不是獨(dú)身 df.loc[df['familysize'] == 1,'isalone'] = 1 #定位familysize是1的元素景鼠,isalone相應(yīng)元素賦值為1,代表是獨(dú)身

四痹扇、探索階段

A.單變量數(shù)據(jù)分析

1.Pclass單變量分析

#不同社會(huì)等級(jí)的乘客數(shù)量 df.groupby('Pclass')['PassengerId'].count()

Pclass

1? ? 216

2? ? 184

3? ? 491

import matplotlib.pyplot as plt import seaborn as sns df.groupby('Pclass')['PassengerId'].count().plot(kind = "pie",autopct = "%.0f%%") plt.title('Pclass VS Count') plt.show()


一等艙乘客有214位铛漓,占24%;二等艙乘客有184位鲫构,占21%浓恶;三等艙乘客有491位,占55%结笨;樣本數(shù)量都大約30问顷,具有統(tǒng)計(jì)意義。

2.Sex單變量分析 ?

df.groupby('Sex')['PassengerId'].count() #男女的乘客數(shù)量 df.groupby('Sex')['PassengerId'].count().plot(kind = "pie",autopct = "%.0f%%") plt.title('Sex VS Count') plt.show()

Sex

0? ? 314

1? ? 577


#我們也可以將乘客分為男禀梳,女杜窄,小孩,為原有數(shù)據(jù)庫(kù)新增一個(gè)字段算途,此字段因此包含兩個(gè)屬性年齡和性別 def male_famle_child(passenger):? ? age,sex = passenger if age < 16: return int(2) #小孩用2表示 else: return sex #增加字段df["Person"].value_counts() #男塞耕、女、小孩的數(shù)量 df["Person"] = df[["Age","Sex"]].apply(male_famle_child,axis=1) df["Person"].value_counts() #男嘴瓤、女扫外、小孩的數(shù)量 df.groupby('Person')['PassengerId'].count().plot(kind = "pie",autopct = "%.0f%%") plt.title('Person VS Count') plt.show()

1.0 ? ?532

0.0? ? 264

2.0? ? 95


成年男性乘客有537位莉钙,占大約60%,成年女性有271位筛谚,占大約30%磁玉,小孩有83位,占大約9%驾讲。樣本數(shù)量都大于30蚊伞,具有統(tǒng)計(jì)學(xué)意義。

3.isalone單變量分析

df.groupby('isalone')['PassengerId'].count() df.groupby('isalone')['PassengerId'].count().plot(kind = "pie",autopct = "%.0f%%") plt.title('isalone VS Count') plt.show()

單身乘客有537位吮铭,占60%时迫;有家庭乘客有354位,占40%谓晌;樣本數(shù)量都大于30掠拳,具有統(tǒng)計(jì)意義。

4.Age單變量分析

bins = [0, 12, 18, 65, 100] #將年齡劃分為4個(gè)年齡段纸肉,兒童溺欧、青少年,青中年柏肪,老人 df['Age_group'] = pd.cut(df['Age'], bins) #增加'Age_group']列 df.groupby('Age_group')['PassengerId'].count() #每個(gè)年齡段的乘客人數(shù) df.groupby('Age_group')['PassengerId'].count().plot(kind = "pie",autopct = "%.0f%%") plt.title('Age_group VS count') plt.show()

0-12歲的乘客有69位姐刁,12-18歲的乘客有70位,18-65歲的乘客有567位预吆,這三個(gè)年齡段的樣本數(shù)量都大約30龙填,具有統(tǒng)計(jì)意義;65-100歲的乘客只有8位拐叉,樣本量太小岩遗,統(tǒng)計(jì)過(guò)程中會(huì)存在很大的誤差,不具有統(tǒng)計(jì)意義凤瘦。

5.Fare單變量分析

bins = [0, 10, 50, 100, 300,520] #將票價(jià)劃分為6個(gè)價(jià)格段 df['Fare_group'] = pd.cut(df['Fare'], bins) #增加'Fare_group']列df.groupby('Fare_group') df['PassengerId'].count() df.groupby('Fare_group')['PassengerId'].count().plot(kind = "pie",autopct = "%.0f%%") plt.title('Fare_group VS count') plt.show()

票價(jià)在0-10美元的乘客有321位宿礁,票價(jià)在10-50美元的乘客有395位,票價(jià)在50-100美元的乘客有107位蔬芥,票價(jià)在100- 300美元的乘客有50位梆靖,這四個(gè)票價(jià)范圍的樣本數(shù)超過(guò)30,具有統(tǒng)計(jì)意義笔诵,票價(jià)在300-520美元的乘客有3位返吻,樣本量太小,沒(méi)有統(tǒng)計(jì)意義乎婿。

6.Cabin單變量分析

df.groupby('Cabin')['PassengerId'].count() #有無(wú)客艙的乘客的數(shù)量 df.groupby('Cabin')['PassengerId'].count().plot(kind = "pie",autopct = "%.0f%%") plt.title('Cabin VS count') plt.show()


沒(méi)有具體客艙的乘客有687位乘客测僵,有具體客艙的有204位乘客,都具有統(tǒng)計(jì)意義

7.Embarked單變量分析

df.groupby('Embarked')['PassengerId'].count()#從S,C,Q碼頭登船的乘客的數(shù)量 df.groupby('Embarked')['PassengerId'].count().plot(kind = "pie",autopct = "%.0f%%") plt.title('Embarked VS count') plt.show()

從s碼頭上船的乘客有646位,從c碼頭上船的乘客有168位捍靠,從q碼頭上船的乘客有77位沐旨,都具有統(tǒng)計(jì)意義。

B.描述性分析

1.性別是否影響生還率

x = df[['Sex', 'Survived']].groupby(['Sex']).mean() #男性女性存活率 plt.bar( [0,1], [x.loc[0,'Survived'],x.loc[1,'Survived']], 0.5, color='g', alpha=0.7 ) plt.xticks([0,1],['female','male']) plt.xlabel('Sex') plt.ylabel('survived_rate') plt.title('Sex VS Survived') plt.show()


如圖榨婆,女性的存活率更高磁携,并且高出了50%左右。

x1=df[['Person','Survived']].groupby(['Person']).mean()#男性女性存活率 plt.bar([0,1,2], [x1.loc[0,'Survived'],x1.loc[1,'Survived'],x1.loc[2,'Survived']], 0.5, color='g', alpha=0.7) plt.xticks([0,1,2],['female','male','kids']) plt.xlabel('Person') plt.ylabel('survived_rate') plt.title('Person VS Survived') plt.show()

女性和孩子的存活率高于成年男性

2.有無(wú)家庭是否影響生還率

d=df[['isalone','Survived']].groupby(['isalone']).mean()#有無(wú)家庭的乘客存活率 plt.bar([0,1],[d.loc[0,'Survived'],d.loc[1,'Survived']],0.5,color='r',alpha=0.5,) plt.xticks([0,1],['notalone','alone']) plt.xlabel('isalone') plt.ylabel('survived_rate') plt.title('isalone VS Survived') plt.show()

如圖良风,有家庭乘客的存活率更高

%pylabinline sns.factorplot("isalone",data=df,hue="Person",kind="count")#有無(wú)家庭中男女小孩的分布 plt.xlabel('isalone_Pclass') plt.ylabel('count') plt.title('isalone_Person VS count')

單身乘客中成年男性較多谊迄,成年男性的存活率低從而拉低單身乘客的存活率,可能存活率跟是否有家人沒(méi)有關(guān)系拖吼。

3.社會(huì)地位是否影響生還率

p = df[['Pclass', 'Survived']].groupby(['Pclass']).mean() #不同社會(huì)等級(jí)的乘客存活率 plt.bar( ? [0,1,2], [p.loc[1,'Survived'],p.loc[2,'Survived'],p.loc[3,'Survived']], 0.5, color='b', alpha=0.7) plt.xticks([0,1,2],[1,2,3]) plt.xlabel('Pclass') plt.ylabel('survived_rate') plt.title('Pclass VS Survived') plt.show()


sns.factorplot("Pclass",data=df,hue="Person",kind="count")#各等級(jí)中男女小孩的分布 plt.xlabel('Pclass_Person') plt.ylabel('count') plt.title('Pclass_Person VS count'

雖然等級(jí)越高存活率也越高鳞上,但3等艙乘客中成年男性占大多數(shù)这吻,所以等級(jí)高的存活率高除等級(jí)影響外吊档,也收性別影響性別的影響。

4.年齡是否影響生還率

by_age = df.groupby('Age_group')['Survived'].mean() by_age.plot(kind = "bar") plt.xlabel('Age_group') plt.ylabel('survived_rate') plt.title('Age_group VS Survived')

如圖唾糯,兒童和青少年的存活率高怠硼。

sns.factorplot("Age_group",data=df,hue="Pclass",kind="count")#各年齡段等級(jí)分布 plt.xlabel('Age_group_pclass') plt.ylabel('count') plt.title('Age_group_Pclass VS count')


青中年乘客中一等艙比例高于兒童和青少年,但青中年乘客的存活率確低于兒童和青少年移怯,說(shuō)明等級(jí)對(duì)存活率的影響沒(méi)有年齡對(duì)生存率的影響大香璃。

sns.factorplot("Age_group",data=df,hue="Sex",kind="count")#各年齡段男女分布 plt.xlabel('Age_group_sex') plt.ylabel('count') plt.title('Age_group_Sex VS count')


青中年乘客中男性比女性多超過(guò)50%,其他年齡段舟误,男女比例差不多葡秒,所以,青中年乘客的存活率比兒童和青少年的存活率低嵌溢,除了年齡的影響也可能是受性別的影響眯牧。

5.乘客票價(jià)是否影響生還率

plt.figure(figsize=(10,5)) df['Fare'].hist(bins = 70) #把票價(jià)分為70個(gè)小組 plt.xlabel('Fare') plt.ylabel('count') plt.title('Fare VS count') df.boxplot(column='Fare', by='Pclass', showfliers=False) plt.xlabel('Fare_pclass') plt.ylabel('count') plt.show()


fare_not_survived = df["Fare"][df["Survived"] == 0] fare_survived = df["Fare"][df["Survived"] == 1] avgerage_fare = pd.DataFrame([fare_not_survived.mean(), fare_survived.mean()]) std_fare = pd.DataFrame([fare_not_survived.std(), fare_survived.std()]) avgerage_fare.plot(yerr=std_fare,kind='bar',legend=False) plt.xlabel('survived_rate') plt.ylabel('Fare') plt.title('Fare VS Survived') plt.show()

可見(jiàn),票價(jià)與生還有一定相關(guān)性赖草,生還者的平均票價(jià)要比未生還的高学少。

6.有無(wú)艙位是否影響生還率

c =df[['Cabin', 'Survived']].groupby(['Cabin']).mean() plt.bar( ? [0,1], ? [c.loc[0,'Survived'],c.loc[1,'Survived']], 0.5, color='c', alpha=0.9, ) plt.xticks([0,1],['isnull','notnull']) plt.xlabel('Cabin') plt.ylabel('survived_rate') plt.title('Cabin VS Survived') plt.show()

如圖秧骑,有艙號(hào)的存活率更高版确,缺失值的乘客可能是沒(méi)有艙位

sns.factorplot("Cabin",data=df,hue="Person",kind="count")#有無(wú)船艙成年男性、女性乎折、小孩的分布 plt.xlabel('Cabin_pclass') plt.ylabel('count') plt.title('Cabin_Person VS count')

沒(méi)有船艙的乘客中男性占75%绒疗,有船艙的乘客中男性大約只占50%,而存活率無(wú)船艙的比有船艙的低37%骂澄,有無(wú)船艙的存活率差異受年齡性別影響吓蘑。

7.登船碼頭不同是否影響生還率

e=df[['Embarked', 'Survived']].groupby(['Embarked']).mean() plt.bar( [0,1,2], ? ? [e.loc[0,'Survived'],e.loc[1,'Survived'],e.loc[2,'Survived']], 0.5, color='g', alpha=0.4 ) plt.xticks([0,1,2],['S','C','Q']) plt.xlabel('Embarked') plt.ylabel('survived_rate') plt.title('Embarked VS Survived') plt.show()

如圖,從S碼頭上船的乘客存活率最低酗洒,從C碼頭上船的存活率最高

sns.factorplot("Embarked",data=df,hue="Person",kind="count")#不同碼頭上船的乘客中成年男性士修、女性枷遂、小孩的分布 plt.xlabel('Embarked_person') plt.ylabel('count') plt.title('Embarked_Person VS count')

從S碼頭上船的乘客中男性比例很高,可能影響S碼頭生存率的是性別和年齡

結(jié)論階段

1.報(bào)告中使用的數(shù)據(jù)不是全部乘客數(shù)據(jù)棋嘲,報(bào)告使用的數(shù)據(jù)有891個(gè)樣本酒唉,不是全部的乘客數(shù)據(jù)并且這891個(gè)樣本同是含有一定數(shù)量的缺失值,所以樣本可能會(huì)有偏差沸移。 樣本雖然不能夠代表整體人口痪伦,但樣本來(lái)自整體,樣本量也比較多雹锣,分析是有說(shuō)服力的网沾。

2.對(duì)數(shù)據(jù)的處理有一定的偏差和不確定性。 ①對(duì)Age數(shù)據(jù)的處理蕊爵,Age有177個(gè)缺失值辉哥,用 RandomForestClassifier填補(bǔ)缺失值,隨機(jī)填補(bǔ)的缺失值和缺失年齡乘客的真實(shí)年齡肯定存在偏差②對(duì)Cabin數(shù)據(jù)的處理攒射,Cabin有87個(gè)缺失值醋旦,我的處理方式是把Cabin分為2類數(shù)據(jù),一類是有cabin值的会放,一類是沒(méi)有cabin的饲齐,這樣分類的前提是假設(shè)cabin值缺失的乘客是沒(méi)有具體客艙的,但這個(gè)假設(shè)不是肯定成立的咧最,缺失值里也可能包含大量有具體客艙但丟失客艙信息的乘客捂人,可能會(huì)有一點(diǎn)的偏差③對(duì)Embarked數(shù)據(jù)的處理,有2個(gè)缺失值矢沿,我的處理方式是填充了眾數(shù)滥搭,但Embarked的數(shù)據(jù)極有可能跟Pclass和Fare有關(guān),因?yàn)橐话闱闆r下咨察,等級(jí)越高距離越遠(yuǎn)的票價(jià)會(huì)更貴论熙,但此列只有兩個(gè)缺失值,相對(duì)于891個(gè)樣本摄狱,不會(huì)帶入太多偏差

3.乘客是否會(huì)游泳脓诡、乘客的身體素質(zhì)也可能會(huì)影響存活率,但此數(shù)據(jù)表中沒(méi)有相關(guān)數(shù)據(jù)媒役。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末祝谚,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子酣衷,更是在濱河造成了極大的恐慌交惯,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,888評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異席爽,居然都是意外死亡意荤,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,677評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén)只锻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)玖像,“玉大人,你說(shuō)我怎么就攤上這事齐饮【枇龋” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,386評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵祖驱,是天一觀的道長(zhǎng)握恳。 經(jīng)常有香客問(wèn)我,道長(zhǎng)捺僻,這世上最難降的妖魔是什么乡洼? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,726評(píng)論 1 297
  • 正文 為了忘掉前任,我火速辦了婚禮陵像,結(jié)果婚禮上就珠,老公的妹妹穿的比我還像新娘寇壳。我一直安慰自己醒颖,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,729評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布乃摹。 她就那樣靜靜地躺著渠概,像睡著了一般锰提。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上腰耙,一...
    開(kāi)封第一講書(shū)人閱讀 52,337評(píng)論 1 310
  • 那天,我揣著相機(jī)與錄音铲球,去河邊找鬼挺庞。 笑死,一個(gè)胖子當(dāng)著我的面吹牛稼病,可吹牛的內(nèi)容都是我干的选侨。 我是一名探鬼主播,決...
    沈念sama閱讀 40,902評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼然走,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼援制!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起芍瑞,我...
    開(kāi)封第一講書(shū)人閱讀 39,807評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤晨仑,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體洪己,經(jīng)...
    沈念sama閱讀 46,349評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡妥凳,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,439評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了答捕。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片猾封。...
    茶點(diǎn)故事閱讀 40,567評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖噪珊,靈堂內(nèi)的尸體忽然破棺而出晌缘,到底是詐尸還是另有隱情,我是刑警寧澤痢站,帶...
    沈念sama閱讀 36,242評(píng)論 5 350
  • 正文 年R本政府宣布磷箕,位于F島的核電站,受9級(jí)特大地震影響阵难,放射性物質(zhì)發(fā)生泄漏岳枷。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,933評(píng)論 3 334
  • 文/蒙蒙 一呜叫、第九天 我趴在偏房一處隱蔽的房頂上張望空繁。 院中可真熱鬧,春花似錦朱庆、人聲如沸盛泡。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,420評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)傲诵。三九已至,卻和暖如春箱硕,著一層夾襖步出監(jiān)牢的瞬間拴竹,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,531評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工剧罩, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留栓拜,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,995評(píng)論 3 377
  • 正文 我出身青樓惠昔,卻偏偏與公主長(zhǎng)得像幕与,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子舰罚,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,585評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • 對(duì)kaggle不做過(guò)多介紹 都知道這是一個(gè)數(shù)據(jù)挖掘的圣地纽门,泰坦尼克號(hào)事件也不多做介紹,馬上進(jìn)入正題 ...
    披風(fēng)海膽放閱讀 1,212評(píng)論 1 4
  • Introduction This notebook describes and implements a bas...
    Brakeman閱讀 326評(píng)論 0 0
  • 一 經(jīng)典又兼具備趣味性的Kaggle案例[泰坦尼克號(hào)問(wèn)題 畫(huà)多圖 數(shù)據(jù)探索 進(jìn)行特征選擇時(shí)营罢,判斷每一個(gè)特征(連續(xù)赏陵,...
    maocy閱讀 1,033評(píng)論 0 0
  • 1饼齿、加載文件,查看:(兩個(gè)數(shù)據(jù)集蝙搔,train作為學(xué)習(xí)集進(jìn)行數(shù)據(jù)建模缕溉,通過(guò)test測(cè)試集查看建模的情況。) trai...
    12_21閱讀 1,047評(píng)論 0 0
  • 我們?cè)?jīng)都期許過(guò),未來(lái)的他一定是踏著七彩祥云來(lái)接自己的人勤晚。 想找一個(gè)我愛(ài)的并且愛(ài)我的人有多難枉层,簡(jiǎn)直大海撈針?你知道...
    芭蕉姑娘閱讀 244評(píng)論 1 1