在描述性統(tǒng)計(jì)中脸甘,一組數(shù)據(jù)的特征除了使用集中趨勢(shì)和離中趨勢(shì)來(lái)描述外,還使用其分布的形狀來(lái)分析乎串。數(shù)據(jù)分布形態(tài)的測(cè)度主要是以正態(tài)分布為標(biāo)準(zhǔn)進(jìn)行衡量损晤,正態(tài)分布在數(shù)軸上的形態(tài)如一個(gè)倒鐘形,曲線以均數(shù)為中心诫欠,左右對(duì)稱升薯,曲線兩端永遠(yuǎn)不與橫軸相交莱褒,曲線的高峰位于正中央,即均數(shù)所在的位置涎劈。
一組數(shù)據(jù)的分布形狀是通過(guò)直方圖將該數(shù)據(jù)分布在數(shù)軸上擬合出一條曲線广凸,將曲線的尖峭(qiào)程度和對(duì)稱性與正態(tài)分布曲線相比較,其測(cè)試指標(biāo)包括偏態(tài)和峰度蛛枚。
數(shù)據(jù)分布的不對(duì)稱性稱作偏態(tài)谅海。偏態(tài)是指數(shù)據(jù)分布的偏斜方向和程度。偏度蹦浦,通常分為右偏(或正偏)與左偏(或負(fù)偏)兩種扭吁。
測(cè)定偏態(tài)的指標(biāo)是偏態(tài)系數(shù)。偏態(tài)系數(shù)以平均值與中位數(shù)之差對(duì)標(biāo)準(zhǔn)差之比率來(lái)衡量偏斜的程度,用SK表示偏斜系數(shù):偏態(tài)系數(shù)小于0智末,因?yàn)槠骄鶖?shù)在眾數(shù)之左,是一種左偏的分布徒河,又稱為負(fù)偏系馆。偏態(tài)系數(shù)大于0,因?yàn)榫翟诒姅?shù)之右顽照,是一種右偏的分布由蘑,又稱為正偏。計(jì)算公式為:
偏態(tài)系數(shù)的取值為0時(shí)代兵,表示數(shù)據(jù)為完全的對(duì)稱分布尼酿;偏態(tài)系數(shù)的取值為正數(shù)時(shí),表示數(shù)據(jù)為正偏態(tài)或右偏態(tài)植影;偏態(tài)系數(shù)的取值為負(fù)數(shù)時(shí)裳擎,表示數(shù)據(jù)為負(fù)偏態(tài),或左偏態(tài)思币。
注:偏態(tài)系數(shù)的絕對(duì)數(shù)值越小鹿响,表示數(shù)據(jù)偏倚的程度越小谷饿;偏態(tài)系數(shù)的絕對(duì)數(shù)值越大惶我,表示數(shù)據(jù)偏倚的程度越大。
在實(shí)際的數(shù)據(jù)分析過(guò)程中博投,偏度和峰度的作用主要表現(xiàn)在以下兩個(gè)方面绸贡。一是將偏度和峰度結(jié)合起來(lái)檢查樣本的分布是否屬于正態(tài)分布,以便判斷總體的分布毅哗。如果樣本偏度接近于0而峰度接近于3听怕,就可以判斷總體分布是接近于正態(tài)分布的,用樣本來(lái)對(duì)總體進(jìn)行測(cè)定時(shí)就可以看成是正態(tài)分布黎做,否則就可以進(jìn)行否認(rèn)叉跛。二是利用資料之間存在的偏度關(guān)系,對(duì)算術(shù)平均數(shù)蒸殿、眾數(shù)筷厘、中位數(shù)進(jìn)行推算。一般情況下宏所,只要分布不是正態(tài)的酥艳,算術(shù)平均數(shù)。眾數(shù)爬骤、中位數(shù)之間都存在以下關(guān)系充石。
右偏時(shí):
左偏時(shí):
在偏度適度時(shí),不論右偏還是左偏霞玄,三者間的距離有近似的固定關(guān)系骤铃,即中位數(shù)與算術(shù)平均數(shù)的距離拉岁,約等于眾數(shù)與算術(shù)平均數(shù)距離的1/3《枧溃可得以下關(guān)系式: