python數(shù)據(jù)分析學(xué)習(xí)筆記（三）：文件讀取&繪圖&機(jī)器學(xué)習(xí)調(diào)包

pandas read_csv函數(shù)

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html?

%matplotlib inline的作用

%matplotlib inline是在使用jupyter notebook 或者 jupyter qtconsole的時(shí)候购公，才會(huì)經(jīng)常用到哪审。用處是當(dāng)你調(diào)用matplotlib.pyplot的繪圖函數(shù)plot()進(jìn)行繪圖的時(shí)候养篓，或者生成一個(gè)figure畫布的時(shí)候泡躯，可以直接在你的python console里面生成圖像旗们。省略plt.show()

鏈接：http://www.reibang.com/p/2dda5bb8ce7d

sklearn中, fit痛倚，fit_transform,transform的區(qū)別與聯(lián)系

https://blog.csdn.net/ljyljyok/article/details/79722089

matplotlib

matplotlib的pyplot子庫提供了和matlab類似的繪圖API咬展，方便用戶快速繪制2D圖表

一般用以下形式導(dǎo)入：import matplotlib.pyplot as plt

一般用法：

1丰刊、plt.figure(figsize=(8,4))：創(chuàng)建一個(gè)指定大小的figure隘谣，單位英寸，若不創(chuàng)建figure直接plot則會(huì)默認(rèn)創(chuàng)建figure

2啄巧、plt.plot(x,y,label="$sin(x)$",color="red",linewidth=2)：

x和y一般為numpy創(chuàng)建的數(shù)組

label : 給所繪制的曲線一個(gè)名字寻歧，此名字在圖示(legend)中顯示。只要在字符串前后添加"$"符號(hào)秩仆，matplotlib就會(huì)使用其內(nèi)嵌的latex引擎繪制的數(shù)學(xué)公式码泛。

color : 指定曲線的顏色

linewidth : 指定曲線的寬度

3、plt.xlabel("")澄耍，plt.ylabel("")：設(shè)置坐標(biāo)軸名字

4噪珊、plt.title("")：設(shè)置圖表標(biāo)題

5、plt.xlim()齐莲，plt.ylim()：設(shè)置坐標(biāo)軸范圍

6卿城、plt.legend()：顯示圖例

7、plt.show()：顯示創(chuàng)建的所有繪圖對(duì)象結(jié)果

8铅搓、plt.subplot(numRows, numCols, plotNum)：將整個(gè)繪圖區(qū)域等分為numRows行 * numCols列個(gè)子區(qū)域瑟押，當(dāng)繪圖對(duì)象中有多個(gè)軸的時(shí)候，可以通過工具欄中的Configure Subplots按鈕星掰，交互式地調(diào)節(jié)軸之間的間距和軸與邊框之間的距離多望。如果希望在程序中調(diào)節(jié)的話，可以調(diào)用subplots_adjust函數(shù)氢烘，它有l(wèi)eft, right, bottom, top, wspace, hspace等幾個(gè)關(guān)鍵字參數(shù)怀偷，這些參數(shù)的值都是0到1之間的小數(shù)，它們是以繪圖區(qū)域的寬高為1進(jìn)行正規(guī)化之后的坐標(biāo)或者長(zhǎng)度播玖。

9椎工、以上是一般的基礎(chǔ)用法，進(jìn)階用法是對(duì)Artist進(jìn)行操作，Artists分為簡(jiǎn)單類型和容器類型兩種维蒙。簡(jiǎn)單類型的Artists為標(biāo)準(zhǔn)的繪圖元件掰吕，例如Line2D、 Rectangle颅痊、 Text殖熟、AxesImage 等等。而容器類型則可以包含許多簡(jiǎn)單類型的Artists斑响，使它們組織成一個(gè)整體菱属，例如Axis、 Axes舰罚、Figure等

簡(jiǎn)單說每個(gè)獨(dú)立部分都是一個(gè)獨(dú)立的Artists纽门，通過對(duì)每個(gè)Artists的屬性進(jìn)行設(shè)置（set_*），可以得到最終理想的結(jié)果营罢，具體參考http://old.sebug.net/paper/books/scipydoc/matplotlib_intro.html

特征處理：

sklearn.preprocessing.LabelEncoder 可以把無序變量或者分類變量編碼成數(shù)字

測(cè)試集訓(xùn)練集區(qū)分 cross_validation.train_test_split

from sklearn import cross_validation,preprocessing

X= processed_df.drop(['survived'],axis=1).values

y= processed_df['survived'].values

X_train,X_test, y_train,y_test= cross_validation.train_test_split(X,y,test_size=0.2)

gbdt的sklearn調(diào)用方法

http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.GradientBoostingRegressor.html

from sklearn.ensemble import GradientBoostingClassifier

gbdt=GradientBoostingClassifier(n_estimators=50)

gbdt.fit(X_train, y_train)

gbdt.score(X_test, y_test)

features = pd.DataFrame()

features['feature'] = ['pclass', 'sex', 'age', 'sibsp', 'parch', 'fare', 'embarked']

features['importance'] = gbdt.feature_importances_

features.sort_values(by=['importance'], ascending=True, inplace=True)

features.set_index('feature', inplace=True)

features.plot(kind='barh',figsize=(10,5),fontsize=10)

最后編輯于：2018.09.10 23:15:50

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末膜毁，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子愤钾，更是在濱河造成了極大的恐慌瘟滨，老刑警劉巖，帶你破解...
沈念sama閱讀 211,123評(píng)論 6贊 490
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件能颁，死亡現(xiàn)場(chǎng)離奇詭異杂瘸，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)伙菊，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,031評(píng)論 2贊 384
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門败玉，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人镜硕，你說我怎么就攤上這事运翼。” “怎么了兴枯？”我有些...
開封第一講書人閱讀 156,723評(píng)論 0贊 345
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵血淌，是天一觀的道長(zhǎng)。經(jīng)常有香客問我财剖，道長(zhǎng)悠夯，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 56,357評(píng)論 1贊 283
?港島之戀（遺憾婚禮）
正文為了忘掉前任躺坟，我火速辦了婚禮沦补，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘咪橙。我一直安慰自己夕膀，他們只是感情好虚倒，可當(dāng)我...
茶點(diǎn)故事閱讀 65,412評(píng)論 5贊 384
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著产舞，像睡著了一般魂奥。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上庞瘸，一...
開封第一講書人閱讀 49,760評(píng)論 1贊 289
城市分裂傳說
那天捧弃，我揣著相機(jī)與錄音赠叼，去河邊找鬼擦囊。笑死，一個(gè)胖子當(dāng)著我的面吹牛嘴办，可吹牛的內(nèi)容都是我干的瞬场。我是一名探鬼主播，決...
沈念sama閱讀 38,904評(píng)論 3贊 405
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼涧郊，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼贯被！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起妆艘，我...
開封第一講書人閱讀 37,672評(píng)論 0贊 266
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤彤灶，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后批旺，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體幌陕，經(jīng)...
沈念sama閱讀 44,118評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,456評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年汽煮，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了搏熄。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 38,599評(píng)論 1贊 340
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡暇赤，死狀恐怖心例，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情鞋囊，我是刑警寧澤止后，帶...
沈念sama閱讀 34,264評(píng)論 4贊 328
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站溜腐，受9級(jí)特大地震影響坯门，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜逗扒，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,857評(píng)論 3贊 312
男人毒藥：我在死后第九天來索命
文/蒙蒙一古戴、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧矩肩，春花似錦现恼、人聲如沸肃续。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,731評(píng)論 0贊 21
一樁弒父案叉袍，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽始锚。三九已至，卻和暖如春喳逛，著一層夾襖步出監(jiān)牢的瞬間瞧捌，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,956評(píng)論 1贊 264
情欲美人皮
我被黑心中介騙來泰國打工润文，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留姐呐，地道東北人。一個(gè)月前我還...
沈念sama閱讀 46,286評(píng)論 2贊 360
代替公主和親
正文我出身青樓典蝌，卻偏偏與公主長(zhǎng)得像曙砂，于是被迫代替她去往敵國和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子骏掀，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,465評(píng)論 2贊 348