python數(shù)據(jù)分析學(xué)習(xí)筆記(三):文件讀取&繪圖&機(jī)器學(xué)習(xí)調(diào)包

pandas read_csv函數(shù)

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html?

%matplotlib inline的作用

%matplotlib inline是在使用jupyter notebook 或者 jupyter qtconsole的時(shí)候购公,才會(huì)經(jīng)常用到哪审。用處是當(dāng)你調(diào)用matplotlib.pyplot的繪圖函數(shù)plot()進(jìn)行繪圖的時(shí)候养篓,或者生成一個(gè)figure畫布的時(shí)候泡躯,可以直接在你的python console里面生成圖像旗们。省略plt.show()

鏈接:http://www.reibang.com/p/2dda5bb8ce7d

sklearn中, fit痛倚,fit_transform,transform的區(qū)別與聯(lián)系

https://blog.csdn.net/ljyljyok/article/details/79722089

matplotlib

matplotlib的pyplot子庫提供了和matlab類似的繪圖API咬展,方便用戶快速繪制2D圖表

一般用以下形式導(dǎo)入:import matplotlib.pyplot as plt

一般用法:

1丰刊、plt.figure(figsize=(8,4)):創(chuàng)建一個(gè)指定大小的figure隘谣,單位英寸,若不創(chuàng)建figure直接plot則會(huì)默認(rèn)創(chuàng)建figure

2啄巧、plt.plot(x,y,label="$sin(x)$",color="red",linewidth=2):

x和y一般為numpy創(chuàng)建的數(shù)組

label : 給所繪制的曲線一個(gè)名字寻歧,此名字在圖示(legend)中顯示。只要在字符串前后添加"$"符號(hào)秩仆,matplotlib就會(huì)使用其內(nèi)嵌的latex引擎繪制的數(shù)學(xué)公式码泛。

color : 指定曲線的顏色

linewidth : 指定曲線的寬度

3、plt.xlabel("")澄耍,plt.ylabel(""):設(shè)置坐標(biāo)軸名字

4噪珊、plt.title(""):設(shè)置圖表標(biāo)題

5、plt.xlim()齐莲,plt.ylim():設(shè)置坐標(biāo)軸范圍

6卿城、plt.legend():顯示圖例

7、plt.show():顯示創(chuàng)建的所有繪圖對(duì)象結(jié)果

8铅搓、plt.subplot(numRows, numCols, plotNum):將整個(gè)繪圖區(qū)域等分為numRows行 * numCols列個(gè)子區(qū)域瑟押,當(dāng)繪圖對(duì)象中有多個(gè)軸的時(shí)候,可以通過工具欄中的Configure Subplots按鈕星掰,交互式地調(diào)節(jié)軸之間的間距和軸與邊框之間的距離多望。如果希望在程序中調(diào)節(jié)的話,可以調(diào)用subplots_adjust函數(shù)氢烘,它有l(wèi)eft, right, bottom, top, wspace, hspace等幾個(gè)關(guān)鍵字參數(shù)怀偷,這些參數(shù)的值都是0到1之間的小數(shù),它們是以繪圖區(qū)域的寬高為1進(jìn)行正規(guī)化之后的坐標(biāo)或者長(zhǎng)度播玖。

9椎工、以上是一般的基礎(chǔ)用法,進(jìn)階用法是對(duì)Artist進(jìn)行操作,Artists分為簡(jiǎn)單類型和容器類型兩種维蒙。簡(jiǎn)單類型的Artists為標(biāo)準(zhǔn)的繪圖元件掰吕,例如Line2D、 Rectangle颅痊、 Text殖熟、AxesImage 等等。而容器類型則可以包含許多簡(jiǎn)單類型的Artists斑响,使它們組織成一個(gè)整體菱属,例如Axis、 Axes舰罚、Figure等

簡(jiǎn)單說每個(gè)獨(dú)立部分都是一個(gè)獨(dú)立的Artists纽门,通過對(duì)每個(gè)Artists的屬性進(jìn)行設(shè)置(set_*),可以得到最終理想的結(jié)果营罢,具體參考http://old.sebug.net/paper/books/scipydoc/matplotlib_intro.html

特征處理:

sklearn.preprocessing.LabelEncoder 可以把無序變量或者分類變量編碼成數(shù)字

測(cè)試集訓(xùn)練集區(qū)分 cross_validation.train_test_split

from sklearn import cross_validation,preprocessing

X= processed_df.drop(['survived'],axis=1).values

y= processed_df['survived'].values

X_train,X_test, y_train,y_test= cross_validation.train_test_split(X,y,test_size=0.2)

gbdt的sklearn調(diào)用方法

http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.GradientBoostingRegressor.html

from sklearn.ensemble import GradientBoostingClassifier

gbdt=GradientBoostingClassifier(n_estimators=50)

gbdt.fit(X_train, y_train)

gbdt.score(X_test, y_test)

features = pd.DataFrame()

features['feature'] = ['pclass', 'sex', 'age', 'sibsp', 'parch', 'fare', 'embarked']

features['importance'] = gbdt.feature_importances_

features.sort_values(by=['importance'], ascending=True, inplace=True)

features.set_index('feature', inplace=True)

features.plot(kind='barh',figsize=(10,5),fontsize=10)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末膜毁,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子愤钾,更是在濱河造成了極大的恐慌瘟滨,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,123評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件能颁,死亡現(xiàn)場(chǎng)離奇詭異杂瘸,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)伙菊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,031評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門败玉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人镜硕,你說我怎么就攤上這事运翼。” “怎么了兴枯?”我有些...
    開封第一講書人閱讀 156,723評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵血淌,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我财剖,道長(zhǎng)悠夯,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,357評(píng)論 1 283
  • 正文 為了忘掉前任躺坟,我火速辦了婚禮沦补,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘咪橙。我一直安慰自己夕膀,他們只是感情好虚倒,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,412評(píng)論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著产舞,像睡著了一般魂奥。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上庞瘸,一...
    開封第一講書人閱讀 49,760評(píng)論 1 289
  • 那天捧弃,我揣著相機(jī)與錄音赠叼,去河邊找鬼擦囊。 笑死,一個(gè)胖子當(dāng)著我的面吹牛嘴办,可吹牛的內(nèi)容都是我干的瞬场。 我是一名探鬼主播,決...
    沈念sama閱讀 38,904評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼涧郊,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼贯被!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起妆艘,我...
    開封第一講書人閱讀 37,672評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤彤灶,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后批旺,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體幌陕,經(jīng)...
    沈念sama閱讀 44,118評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,456評(píng)論 2 325
  • 正文 我和宋清朗相戀三年汽煮,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了搏熄。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,599評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡暇赤,死狀恐怖心例,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情鞋囊,我是刑警寧澤止后,帶...
    沈念sama閱讀 34,264評(píng)論 4 328
  • 正文 年R本政府宣布,位于F島的核電站溜腐,受9級(jí)特大地震影響坯门,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜逗扒,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,857評(píng)論 3 312
  • 文/蒙蒙 一古戴、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧矩肩,春花似錦现恼、人聲如沸肃续。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,731評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽始锚。三九已至,卻和暖如春喳逛,著一層夾襖步出監(jiān)牢的瞬間瞧捌,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,956評(píng)論 1 264
  • 我被黑心中介騙來泰國打工润文, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留姐呐,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,286評(píng)論 2 360
  • 正文 我出身青樓典蝌,卻偏偏與公主長(zhǎng)得像曙砂,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子骏掀,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,465評(píng)論 2 348