1.制作IQ數(shù)據(jù)圖
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
#使用%matplotlib命令可以將matplotlib的圖表直接嵌入到Notebook之中兽叮,或者使用指定的界面庫顯示圖表究珊,它有一個參數(shù)指定matplotlib圖表的顯示方式
*#inline表示將圖表嵌入到Notebook中。
%matplotlib inline
#為了使畫出來的圖支持 retina格式
%config InlineBackend.figure_format = 'retina'
iq_data = pd.read_csv('IQscore.csv')
len(iq_data)
70
iq = iq_data['IQ']
mean = iq.mean()
mean
100.82857142857142
std = iq.std()
std
15.015905990389498
#normfun正態(tài)分布函數(shù)融欧,mu: 均值,sigma:標(biāo)準(zhǔn)差箫章,pdf:概率密度函數(shù)嗤堰,np.exp():概率密度函數(shù)公式
def normfun(x,mu, sigma):
pdf = np.exp(-((x - mu)**2) / (2* sigma**2)) / (sigma * np.sqrt(2*np.pi))
return pdf
# x的范圍為60-150浴骂,以1為單位,需x根據(jù)范圍調(diào)試
x = np.arange(60, 150,1)
# x數(shù)對應(yīng)的概率密度
y = normfun(x, mean, std)
# 參數(shù),顏色,線寬
plt.plot(x,y, color='g',linewidth = 3)
#數(shù)據(jù)梦裂,數(shù)組似枕,顏色,顏色深淺年柠,組寬凿歼,顯示頻率
plt.hist(iq, bins =7, color = 'r',alpha=0.5,rwidth= 0.9, normed=True)
plt.title('IQ distribution')
plt.xlabel('IQ score')
plt.ylabel('Probability')
plt.show()
2. 制作賽馬數(shù)據(jù)圖
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
%config InlineBackend.figure_format = 'retina'
stakes_data = pd.read_csv('stakes.csv')
len(stakes_data)
89
stakes = stakes_data['time']
mean = stakes.mean()
mean
149.22101123595513
std = stakes.std()
std
1.6278164717748154
def normfun(x,mu, sigma):
pdf = np.exp(-((x - mu)**2) / (2* sigma**2)) / (sigma * np.sqrt(2*np.pi))
return pdf
stakes.max()
153.19999999999999
stakes.min()
146.0
x = np.arange(145, 155,0.2)
y = normfun(x, mean, std)
plt.plot(x,y,'g',linewidth = 3)
plt.hist(stakes, bins = 6,color = 'b',alpha=0.5, rwidth= 0.9, normed=True)
plt.title('stakes distribution')
plt.xlabel('stakes time')
plt.ylabel('Probability')
plt.show()
結(jié)論:
1.概率密度函數(shù)是圖形中的一條線,而概率則是這條線下方一定數(shù)值內(nèi)的面積冗恨。
2.求某一個精確數(shù)值的概率為0.因?yàn)閷?yīng)的面積趨近于0
3.直方圖與正態(tài)分布圖不完全對應(yīng)答憔,只有當(dāng)n充分大,才能更接近于正態(tài)分布掀抹。
參考資料:
1.使用ipython %matplotlib inline
2.python中求分布函數(shù)相關(guān)的包
3.python 數(shù)學(xué)繪圖工具 matplotlib 的優(yōu)化配置
4.【python】matplotlib.pyplot介紹
5.正態(tài)分布