? ?描述數(shù)據(jù)用于描述已經(jīng)發(fā)生的事情,通常從數(shù)據(jù)的頻率分布灰署、集中趨勢(shì)和離散性來描述赁濒。以下會(huì)總結(jié)相關(guān)的公式以及作用。
1.頻數(shù)分布與圖形表示
1.1頻數(shù)分布
頻數(shù)分布:把一組數(shù)據(jù)分列到互補(bǔ)包含的組里净宵,以顯示各組中觀察值的個(gè)數(shù)敲才。構(gòu)造頻數(shù)分布的步驟和方法如下:
1.2莖葉圖
莖葉圖可以解決頻數(shù)分布的弊端紧武,解決頻數(shù)分布無法知道數(shù)據(jù)的真實(shí)值、不知頻數(shù)如何分布敏储、只知道數(shù)據(jù)的大概分布范圍的問題阻星。
莖葉圖:表現(xiàn)一組數(shù)據(jù)的統(tǒng)計(jì)方法。每一個(gè)數(shù)值被分成兩部分已添,領(lǐng)頭的數(shù)字作為莖妥箕,尾隨的數(shù)字作為葉。莖沿豎直軸線排列更舞,葉沿水平軸線排列畦幢。
1.3其他圖形
·直方圖
·頻數(shù)折線圖(連接組中值與組頻交點(diǎn)的線段,比直方圖的優(yōu)勢(shì)是:可以多組頻數(shù)折現(xiàn)進(jìn)行對(duì)比)
·累積頻數(shù)分布圖
2.集中趨勢(shì)的度量
用于描述一組數(shù)據(jù)集中程度缆蝉,它通常是一個(gè)單一數(shù)值宇葱,位于所有數(shù)據(jù)的中心。常用的工具和公式如下:
3.離散性
3.1常用工具和方法
當(dāng)均值等集中趨勢(shì)度量無法描述離散大的數(shù)據(jù)時(shí)刊头,而離散程度的度量可以被用于評(píng)價(jià)兩個(gè)或多個(gè)平均數(shù)的可靠性贝搁,此時(shí)需要對(duì)數(shù)據(jù)的離散程度進(jìn)行描述,常用工具和方法如下:
3.2標(biāo)準(zhǔn)差的解釋和使用
a解釋:標(biāo)準(zhǔn)差常用來對(duì)兩組或多組觀測(cè)值比較時(shí)的一種度量尺度芽偏。標(biāo)準(zhǔn)差越小表明數(shù)據(jù)的離散程度越小雷逆,數(shù)據(jù)分布越緊密。
b切比雷夫定理
對(duì)于任意一組觀測(cè)值(樣本或總體)污尉,分布在均值加減k倍標(biāo)準(zhǔn)差范圍內(nèi)的值比例至少為1-1/k2,其中k是任意一個(gè)大于1的值膀哲。
c經(jīng)驗(yàn)法則
對(duì)于對(duì)稱的鐘形頻數(shù)分布往产,大約68%的觀察值將分布在均值加減1倍標(biāo)準(zhǔn)差之間;大約95%的觀察值將分布在均值加減2倍標(biāo)準(zhǔn)差之間某宪;幾乎全部(99.7%)的觀察值分布在均值加減3倍標(biāo)準(zhǔn)差之間仿村。
d相對(duì)離散
當(dāng)對(duì)比數(shù)據(jù)具有不同單位(如美元和礦工天數(shù));數(shù)據(jù)具有相同單位兴喂,但均值相差甚遠(yuǎn)(如高層管理人員的收入與非技術(shù)性員工的收入)蔼囊,以上兩種情況下,多使用cv變異系數(shù)衡量離散性衣迷。
CV變異系數(shù)標(biāo)準(zhǔn)差與算術(shù)均值的比率畏鼓,表示一個(gè)百分?jǐn)?shù)。值越大表示離散程度越大壶谒。
e偏度
一組數(shù)據(jù)的另一個(gè)特征就是形狀云矫,通常觀察到的形狀有4類:對(duì)稱的,正偏的(右偏)汗菜,負(fù)偏(左偏)的以及雙峰的娶耍,我們用皮爾遜偏度系數(shù)來描述偏度:
sk=0套么,分布對(duì)稱赵讯,沒有顯現(xiàn)出任何的偏斜性镊辕。sk為負(fù)為負(fù)偏,為正為正偏菌瘪。
計(jì)算機(jī)輸出的偏度系數(shù)如下:
其中右側(cè)標(biāo)準(zhǔn)化腮敌,表示標(biāo)準(zhǔn)差除以各個(gè)觀察值與均值之間的離差。公式表達(dá)的意思為每一單位標(biāo)準(zhǔn)差下的各觀察值與均值的離差大小麻车,如果這一離差是正的,該特定值大于均值(正偏)斗这;如果這一值為負(fù)动猬,則該特定值小于均值(負(fù)偏);為0表箭,該特定值等于均值(對(duì)稱)赁咙。