Python方差分析實踐


實踐數據:鏈接: https://pan.baidu.com/s/1ljLoZrT_MnAZYnpOmJt0wQ 提取碼: xw8p


#1、每個地區(qū)間的銷售量是否相同瓤逼?

#(1)提出假設

#H0:u1=u2=u3=…=un踢关,每個地區(qū)間的銷售量沒有顯著變化伞鲫。

#H1:ui(i=1,2,3,…)不完全相等,地區(qū)對銷量有顯著變化签舞。

#(2)構造檢驗的統計量

#計算各水平的均值 因素為地區(qū)秕脓,水平為4,因變量為銷售量瘪菌,根據單因素銷售量

import pandasas pd

import numpyas np

data = pd.read_excel(r"D:\Users\Downloads\銷售數據.xlsx")

print('A地區(qū)的均值:',data['A'].mean())

print('B地區(qū)的均值:',data['B'].mean())

print('C地區(qū)的均值:',data['C'].mean())

print('D地區(qū)的均值:',data['D'].mean())

sum1=data['A'].sum()+data['B'].sum()+data['C'].sum()+data['D'].sum()

ave=sum1/(4*data.shape[0])

print('總均值',ave)

#計算誤差平方和

SST=sum((data['A']-ave)*(data['A']-ave))+sum((data['B']-ave)*(data['B']-ave))+sum((data['C']-ave)*(data['C']-ave))+sum((data['D']-ave)*(data['D']-ave))

print("SST(總誤差平方和):",SST)

SSA1=11*(data['A'].mean()-ave)*(data['A'].mean()-ave)+11*(data['B'].mean()-ave)*(data['B'].mean()-ave)+11*(data['C'].mean()-ave)*(data['C'].mean()-ave)+11*(data['D'].mean()-ave)*(data['D'].mean()-ave)

print("SSA(組間(水平項)誤差平方和):",SSA1)

SSE=sum((data['A']-data['A'].mean())*(data['A']-data['A'].mean()))+sum((data['B']-data['B'].mean())*(data['B']-data['B'].mean()))+sum((data['C']-data['C'].mean())*(data['C']-data['C'].mean()))+\

sum((data['D']-data['D'].mean())*(data['D']-data['D'].mean()))

print("SSE(組內誤差項平方和):",SSE)

#均方

MSA=SSA1/(4-1)

print("MSA:",MSA)

MSE=SSE/(44-4)

print("MSE:",MSE)

F=MSA/MSE

print("F分布是:",F)

#由于查的F阿法(3,40)=3.13,由于F>Fa ,所以我們認為地區(qū)對銷售量有顯著性影響撒会,即每個地區(qū)間銷售量不同。


#2师妙、不同月份的銷售量是否相同?

import datetime

data=data[['A','B','C','D','month']].copy()

def fun_m(x):

a=datetime.datetime.strftime(x, '%Y-%m')

return a

data['month'] = data['month'].apply(lambda x:fun_m(x))

#按月份匯總統計值

data1=data.groupby(['month']).agg('sum').reset_index()

#print(data1['month'])

print('1月的均值:', (data1[data1['month']=='2019-01']['A']+data1[data1['month']=='2019-01']['B']+data1[data1['month']=='2019-01']['C']+data1[data1['month']=='2019-01']['D'])/4)

print('3月的均值:', (data1[data1['month']=='2019-03']['A']+data1[data1['month']=='2019-03']['B']+data1[data1['month']=='2019-03']['C']+data1[data1['month']=='2019-03']['D'])/4)

print('12月的均值:',(data1[data1['month']=='2019-12']['A']+data1[data1['month']=='2019-12']['B']+data1[data1['month']=='2019-12']['C']+data1[data1['month']=='2019-12']['D'])/4)

data1['ave']=[22445.5,13402.0,26101.75]

#總均值

sum1=data1['A'].sum()+data1['B'].sum()+data1['C'].sum()+data1['D'].sum()

ave=sum1/(4*data1.shape[0])

print('總均值:',ave)

# SST

SST=sum((data1['A']-ave)*(data1['A']-ave))+sum((data1['B']-ave)*(data1['B']-ave))+sum((data1['C']-ave)*(data1['C']-ave))+sum((data1['D']-ave)*(data1['D']-ave))

print("SST(:",SST)

# SSA 水平項誤差平凡和

SSA2=4*sum((data1['ave']-ave)*(data1['ave']-ave))

print("SSA:",SSA2)

# SSE? 誤差項平方和

SSE=SST-SSA2

print("SSE:",SSE)

#均方

MSA=SSA2/(4-1)

print("MSA:",MSA)

MSE=SSE/(44-4)

print("MSE:",MSE)

F=MSA/MSE

print("F分布是:",F)

#由于F>Fa ,所以我們認為不同月份對銷售量有顯著性影響屹培,即每個月銷售量不同默穴。

#3、不同時間與地區(qū)的銷售量是否相同褪秀?

#雙因素對方差分析的影響

#分為行因素 和列因素

#我將時間為行因素蓄诽,將地區(qū)為列因素。

#SSR為行因素產生的誤差平方和

#SST=SSR+SSC+SSE

# SST? 總誤差平方和

data1=data[['A','B','C','D','month']].copy()

SST=sum((data1['A']-ave)*(data1['A']-ave))+sum((data1['B']-ave)*(data1['B']-ave))+sum((data1['C']-ave)*(data1['C']-ave))+sum((data1['D']-ave)*(data1['D']-ave))

print("SST:",SST)

SSR=SSA2

print("SSR:",SSR)

SSC=SSA1

print("SSC:",SSC)

SSE=SST-SSR-SSC

print("SSE:",SSE)

MSR=SSR/2

print("MSR:",MSR)

MSC=SSC/3

print("MSC:",MSC)

MSE=SSE/(2*3)

print("MSE:",MSE)

Fr=MSR/MSE

print("Fr:",Fr)

Fc=MSC/MSE

print("Fc:",Fc)

Fr>Fa,Fc>Fa,所以不同時間與地區(qū)的銷售量不相同媒吗。

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末仑氛,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌锯岖,老刑警劉巖介袜,帶你破解...
    沈念sama閱讀 216,692評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異出吹,居然都是意外死亡遇伞,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 92,482評論 3 392
  • 文/潘曉璐 我一進店門捶牢,熙熙樓的掌柜王于貴愁眉苦臉地迎上來鸠珠,“玉大人,你說我怎么就攤上這事秋麸〗ヅ牛” “怎么了?”我有些...
    開封第一講書人閱讀 162,995評論 0 353
  • 文/不壞的土叔 我叫張陵灸蟆,是天一觀的道長驯耻。 經常有香客問我,道長次乓,這世上最難降的妖魔是什么吓歇? 我笑而不...
    開封第一講書人閱讀 58,223評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮票腰,結果婚禮上城看,老公的妹妹穿的比我還像新娘。我一直安慰自己杏慰,他們只是感情好测柠,可當我...
    茶點故事閱讀 67,245評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著缘滥,像睡著了一般轰胁。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上朝扼,一...
    開封第一講書人閱讀 51,208評論 1 299
  • 那天赃阀,我揣著相機與錄音,去河邊找鬼擎颖。 笑死榛斯,一個胖子當著我的面吹牛,可吹牛的內容都是我干的搂捧。 我是一名探鬼主播驮俗,決...
    沈念sama閱讀 40,091評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼允跑!你這毒婦竟也來了王凑?” 一聲冷哼從身側響起搪柑,我...
    開封第一講書人閱讀 38,929評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎索烹,沒想到半個月后工碾,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 45,346評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡术荤,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,570評論 2 333
  • 正文 我和宋清朗相戀三年倚喂,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片瓣戚。...
    茶點故事閱讀 39,739評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡端圈,死狀恐怖,靈堂內的尸體忽然破棺而出子库,到底是詐尸還是另有隱情舱权,我是刑警寧澤,帶...
    沈念sama閱讀 35,437評論 5 344
  • 正文 年R本政府宣布仑嗅,位于F島的核電站宴倍,受9級特大地震影響,放射性物質發(fā)生泄漏仓技。R本人自食惡果不足惜鸵贬,卻給世界環(huán)境...
    茶點故事閱讀 41,037評論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望脖捻。 院中可真熱鬧阔逼,春花似錦、人聲如沸地沮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,677評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽摩疑。三九已至危融,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間雷袋,已是汗流浹背吉殃。 一陣腳步聲響...
    開封第一講書人閱讀 32,833評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留楷怒,地道東北人寨腔。 一個月前我還...
    沈念sama閱讀 47,760評論 2 369
  • 正文 我出身青樓,卻偏偏與公主長得像率寡,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子倚搬,可洞房花燭夜當晚...
    茶點故事閱讀 44,647評論 2 354

推薦閱讀更多精彩內容

  • mean to add the formatted="false" attribute?.[ 46% 47325/...
    ProZoom閱讀 2,696評論 0 3
  • pyspark.sql模塊 模塊上下文 Spark SQL和DataFrames的重要類: pyspark.sql...
    mpro閱讀 9,451評論 0 13
  • # -*- coding: utf-8 -*- from __future__ import division f...
    小豆角lch閱讀 1,293評論 0 0
  • 在C語言中,五種基本數據類型存儲空間長度的排列順序是: A)char B)char=int<=float C)ch...
    夏天再來閱讀 3,340評論 0 2
  • 8月22日-----字符串相關 2-3 個性化消息: 將用戶的姓名存到一個變量中冶共,并向該用戶顯示一條消息。顯示的消...
    future_d180閱讀 971評論 0 1