本文要講的是Matplotlib邑蒋,一個強大的Python可視化庫姓蜂。通過模塊,輕松實現(xiàn)曲線圖医吊、散點圖钱慢、折線圖、直方圖卿堂、柱狀圖束莫、餅圖等。
一草描、曲線圖
繪制單條曲線:
x = [1,2,3,4,5,6,7,8,9,10]
y = [10,9,8,7,6,5,4,3,2,1]
plt.plot(x,y)
注意:y,x軸的值必須為數(shù)字
繪制拋物線:
x = np.arange(-np.pi,np.pi,0.1)
y = x**2
plt.plot(x,y)
繪制正弦曲線圖:
x = np.linspace(-np.pi,np.pi,100)
y = np.sin(x)
plt.plot(x,y)
包含多個曲線的圖:
1览绿、連續(xù)調(diào)用多次plot函數(shù)
plt.plot(x,y)
plt.plot(x+2,y+2)
2、也可以在一個plot函數(shù)中傳入多對X,Y值穗慕,在一個圖中繪制多個曲線
plt.plot(x,y,x-1,y+1)
plt.subplot(row,col,loc)
將多個曲線圖繪制在一個table區(qū)域中:對象形式創(chuàng)建表圖
a=plt.subplot(row,col,loc) 創(chuàng)建曲線圖 rol col可以決定table的大小
a.plot(x,y) 繪制曲線圖屏幕快照 2018-11-07 下午5.44.30.png
網(wǎng)格線 plt.grid(XXX)
參數(shù):
axis:軸向
color:支持十六進制顏色
linestyle: -- -. :樣式
alpha:透明度
使用plt繪制:
plt.plot(x,y)
plt.grid(color='red',linestyle=':',alpha=0.5)
使用對象形式設(shè)置網(wǎng)格:
ax = plt.subplot(111)
ax.plot(x,y)
ax.grid(linestyle='--')
設(shè)置坐標軸界限
axis方法:設(shè)置x饿敲,y軸刻度值的范圍
plt.axis([xmin,xmax,ymin,ymax])
關(guān)閉坐標軸
plt.axis('off')
設(shè)置畫布比例:plt.figure(figsize=(a,b)) a:x刻度比例 b:y刻度比例 (2:1)表示x刻度顯示為y刻度顯示的2倍
plt的xlabel方法、ylabel方法逛绵、 title方法
參數(shù)介紹:
s 標簽內(nèi)容
color 標簽顏色
fontsize 字體大小
rotation 旋轉(zhuǎn)角度
對象方法set_xlabel/ylabel()
圖例
legend方法
兩種傳參方法:
1.分別在plot函數(shù)中增加label參數(shù),再調(diào)用plt.legend()方法顯示
plt.plot(x,label='AAA')
plt.legend()
2.直接在legend方法中傳入字符串列表
put.plot(x)
plt.plot(y)
plt.legend(['BBB','AAA'])
legend的參數(shù)
loc參數(shù):
loc參數(shù)用于設(shè)置圖例標簽的位置怀各,一般在legend函數(shù)內(nèi)
matplotlib已經(jīng)預(yù)定義好幾種數(shù)字表示的位置
ncol參數(shù):
ncol控制圖例中有幾列,在legend中設(shè)置ncol
圖像保存:
使用figure對象的savefig函數(shù)來保存圖片
fig = plt.figure()---必須放置在繪圖操作之前
figure.savefig的參數(shù)選項:
filename:
含有文件路徑的字符串或Python的文件型對象。圖像格式由文件擴展名推斷得出术浪,例如渠啤,.pdf推斷出PDF,.png推斷出PNG (“png”添吗、“pdf”沥曹、“svg”、“ps”碟联、“eps”……)
dpi:
圖像分辨率(每英寸點數(shù))妓美,默認為100
facecolor
打開保存圖片查看 圖像的背景色,默認為“w”(白色)
設(shè)置plot的風格和樣式:
plot語句中支持除X,Y以外的參數(shù)鲤孵,以字符串形式存在壶栋,來控制顏色、線型普监、點型等要素贵试,語法形式為:
plt.plot(X, Y, 'format', ...)
-- 顏色
參數(shù)color或c
-- 透明度
alpha參數(shù)
-- 線型
參數(shù)linestyle或ls
-- 線寬
linewidth或lw參數(shù)
-- 點型
marker 設(shè)置點形
markersize 設(shè)置點形大小
二琉兜、直方圖
plt.hist(x):
是一個特殊的柱狀圖,又叫做密度圖毙玻。
【直方圖的參數(shù)只有一個xM泱!桑滩!不像條形圖需要傳入x,y】
plt.hist()的參數(shù)
bins
直方圖的柱數(shù)梧疲,可選項,默認為10
color
指定直方圖的顏色运准』系可以是單一顏色值或顏色的序列。如果指定了多個數(shù)據(jù)集合,例如DataFrame對象胁澳,顏色序列將會設(shè)置為相同的順序该互。如果未指定,將會使用一個默認的線條顏色
orientation
通過設(shè)置orientation為horizontal創(chuàng)建水平直方圖韭畸。默認值為vertical
三宇智、條形圖
plt.bar(x,y):
plt.bar()垂直條形圖
參數(shù):第一個參數(shù)是索引。第二個參數(shù)是數(shù)據(jù)值陆盘。第三個參數(shù)是條形的寬度普筹。
條形圖有兩個參數(shù)x,y
width 縱向設(shè)置條形寬度
height 橫向設(shè)置條形高度
plt.barh()水平條形圖
四、餅圖
plt.pie(x)
餅圖也只有一個數(shù)據(jù)參數(shù)x
餅圖適合展示各部分占總體的比例隘马,條形圖適合比較各部分的大小餅圖陰影太防、分裂等屬性設(shè)置
labels參數(shù)設(shè)置每一塊的標簽;
labeldistance參數(shù)設(shè)置標簽距離圓心的距離(比例值)
autopct參數(shù)設(shè)置比例值小數(shù)保留位(%.3f%%)酸员;
pctdistance參數(shù)設(shè)置比例值文字距離圓心的距離
explode參數(shù)設(shè)置每一塊頂點距圓心的長度(比例值,列表)蜒车;
colors參數(shù)設(shè)置每一塊的顏色(列表);
shadow參數(shù)為布爾值幔嗦,設(shè)置是否繪制陰影
startangle參數(shù)設(shè)置餅圖起始角度
五酿愧、散點圖
scatter(x,y)
散點圖:因變量隨自變量而變化的大致趨勢
散點圖需要兩個參數(shù)x,y,但此時x不是表示x軸的刻度邀泉,而是每個點的橫坐標嬉挡!
plt.scatter(x,y,marker='d',c="rbgy") 設(shè)置不同的散點顏色
六、簡單了解機器學習實現(xiàn)線性回歸
- 導(dǎo)入sklearn汇恤,建立線性回歸算法模型對象
from sklearn.linear_model import LinearRegression
linear = LinearRegression()
樣本集:用于對機器學習算法模型對象進行訓練庞钢。樣本集通常為一個DataFrame。
特征數(shù)據(jù):特征數(shù)據(jù)的變化會影響目標數(shù)據(jù)的變化因谎。必須為多列基括。
目標數(shù)據(jù):結(jié)果。通常為一列财岔。 - 使用樣本數(shù)據(jù)對模型進行訓練
linear.fit(near_citys_dist.reshape(-1,1),near_citys_max_temp)
- 對模型進行精準度的評分
linear.score(near_citys_dist.reshape(-1,1),near_citys_max_temp)
- 使用模型進行預(yù)測
x = np.array([65,44,12,99]).reshape(-1,1)
linear.predict(x)
- 繪制回歸曲線
x = np.linspace(0,100,num=100)
y = linear.predict(x.reshape(-1,1))
plt.scatter(x,y)
線性回歸詳細案例和素材詳見github:
https://github.com/wangjifei121/Data_analysis_case3