import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
%config InlineBackend.figure_format='retina'
def normfun(x,mu,sigma):
pdf=np.exp(-((x-mu)**2)/(2*sigma**2))/(sigma*np.sqrt(2*np.pi))
return pdf
iq_data=pd.read_csv('IQscore.csv')
iq=iq_data['IQ']
len(iq)
70
max(iq)
140
min(iq)
69
mean=iq.mean()
std=iq.std()
x=np.arange(60,150,1)
y=normfun(x,mean,std)
plt.plot(x,y)
plt.hist(iq,bins=10,rwidth=0.9,normed=True)
plt.title('IQ distribution')
plt.xlabel('Porbability')
plt.show()
std=iq.std()
std
15.015905990389502
mean
100.82857142857142
peng=pd.read_csv('stakes.csv')
peng.head(5)
len(peng)
89
time=peng['time']
mean=time.mean()
mean
149.22101123595507
std=time.std()
std
1.627816471774816
max=time.max()
max
153.19999999999999
min=time.min()
min
146.0
def normfun(x,mu,sigma):
pdf=np.exp(-((x-mu)**2)/(2*sigma**2))/(sigma*np.sqrt(2*np.pi))
return pdf
x=np.arange(140,160,1)#140和160是起點和終點耕蝉,根據(jù)最大更耻、最小阅畴、均值設(shè)置;
#0.3表示線的彎曲角度(步長)
y=normfun(x,mean,std)
plt.plot(x,y)
plt.hist(time,bins=10,rwidth=0.9,normed=True)#time表示數(shù)據(jù),bins表示顯示的組數(shù)
#rwidth表示每組寬度,normed表示顯示曲線
plt.title("time")
plt.xlabel("stakes")
plt.ylabel("Probability")
plt.show()
3、結(jié)果分析:
歷屆賽馬冠軍的平均時間是149.22:說明如果你成績控制在149.22的話就有一半的概率得冠軍
標(biāo)準(zhǔn)差是1.62:說明波動性較小
成績最好的是146:你合理的追求成績是146-149.22
最差的成績是153:如果你想得冠軍,成績又沒有153好梦湘,那么建議你比賽的同時買幾張彩票,至少她們的概率上來說差不多的件甥,買張彩票多個機(jī)會哈
[參考文章](http://www.reibang.com/p/cc3b5d76c587)