在余博士的教材指導(dǎo)下靴拱,終于完成了python的環(huán)境設(shè)置,非常感謝余博士竹挡。
在把代碼打進(jìn)去剖踊,直方圖出現(xiàn)的那一刻真的好興奮骂删,終于學(xué)會(huì)用python做直方圖了,用python做比excel快多了蝴乔。真的沒錯(cuò)记餐,編程是每個(gè)人該學(xué)會(huì)的技能。
言歸正轉(zhuǎn)薇正,下面是作業(yè):
- 一組人的體重
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
weight_data=pd.read_table('weight.txt')
weight_data.shape
(80, 1)
80個(gè)樣本數(shù)據(jù)片酝,一行
#求均值
weight_data['weight'].mean()
50.7
#求方差
weight_data['weight'].var()
39.27594936708859
fig=plt.figure()
x=weight_data['weight']
ax=fig.add_subplot(111)
numBins=15
ax.hist(x,numBins,color='blue',alpha=0.8,rwidth=0.9)
plt.title(u'weight')
plt.show()
Paste_Image.png
分析:
(1)樣本是80個(gè)人的體重
(2)平均體重是50.7kg
(3)這群人的體重偏離平均體重39.27kg
(4) 體重集中在45kg-50kg的人數(shù)最多
- 樣本是49年至60年每個(gè)月的乘客數(shù)量
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
passengers_data = pd.read_csv('AirPassengers.csv')
passengers_data.shape
#read_csv 從文件、URL挖腰、文件型對象中加載帶分隔符的數(shù)據(jù)雕沿。默認(rèn)分隔符為逗號
(144, 2)
144個(gè)數(shù)據(jù),2行
#求NumPassengers這列數(shù)的平均數(shù)
passengers_data['NumPassengers'].mean()
280.2986111111111
#求NumPassengers這列數(shù)的方差
passengers_data['NumPassengers'].var()
14391.917200854701
fig = plt.figure()
x = passengers_data['NumPassengers']
ax = fig.add_subplot(111)
ax.hist(x , bins = 20, color = 'blue', alpha = 0.8, rwidth = 0.9)
plt.title('passenger')
plt.show()
Paste_Image.png
分析:
(1)樣本是49年至60年這12年144個(gè)月每個(gè)月的乘客數(shù)量
(2)12年來每個(gè)月乘座飛機(jī)的平均人數(shù)是280人
(3)由于時(shí)間維度比較長猴仑,歷史背景條件不一樣审轮,所以這組數(shù)據(jù)的波 動(dòng)比較大,方差是14391
(4)每個(gè)月出行人數(shù)最多是100至200之間辽俗,500-600最少
(5)這組數(shù)據(jù)這樣做直方圖太籠統(tǒng)了疾渣,很想按年和月做直方圖,可惜現(xiàn)在還不會(huì)榆苞,等以后學(xué)了再做吧稳衬。