描述統(tǒng)計(jì)學(xué)2:數(shù)值方法
1、位置的度量
1)平均數(shù)
還有加權(quán)平均數(shù)和幾何平均數(shù)
2)中位數(shù)
出現(xiàn)異常值的情況下于游,中位數(shù)提供了比平均數(shù)更好的中心位置度量毁葱。
3)眾數(shù)
4)百分位數(shù)
L=p/100*(n+1)
5)四分位數(shù)
Q1=第一四分位數(shù)
Q2=第二四分位數(shù)(也是中位數(shù))
Q3=第三四分位數(shù)
2、變異程度的度量
1)極差
2)四分位間距IQR
四分位間距是中間50%的數(shù)據(jù)的極差
IQR=Q3-Q1
3)方差
方差依賴于每個(gè)觀測值與平均值之間的差異贰剥。
方差的單位是平方項(xiàng)倾剿。
總體方差
樣本方差
4)標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差單位度量與原始數(shù)據(jù)的單位度量相同。
5)標(biāo)準(zhǔn)差系數(shù)
標(biāo)準(zhǔn)差/平均數(shù)*100%
也稱變異系數(shù)蚌成,用于不同樣本間平均值相差較大時(shí)
6)平均絕對(duì)偏差MAE
能夠更好地反應(yīng)預(yù)測值誤差的實(shí)際情況
3前痘、相對(duì)位置的度量
1)z-分?jǐn)?shù),又稱標(biāo)準(zhǔn)化數(shù)值
幫助我們確定數(shù)值距離平均數(shù)有多遠(yuǎn)
2)切比雪夫定理
指出與平均數(shù)的距離在某個(gè)特定個(gè)數(shù)標(biāo)準(zhǔn)差之內(nèi)的數(shù)據(jù)值所占的比例
3)經(jīng)驗(yàn)法則
4担忧、分布形態(tài)
分布形態(tài)的一種重要的數(shù)值度量叫偏度
分別有正偏態(tài)分布和負(fù)偏態(tài)分布
正偏態(tài)分布芹缔,又叫右偏,偏度是正直
平均數(shù)>中位數(shù)>眾數(shù)
負(fù)偏態(tài)分布瓶盛,又叫左偏最欠,偏度是負(fù)值
平均數(shù)<中位數(shù)<眾數(shù)
5、異常值的檢測
1)標(biāo)準(zhǔn)化數(shù)值(z-分?jǐn)?shù))
根據(jù)經(jīng)驗(yàn)法則惩猫,對(duì)于鐘形分布的數(shù)據(jù)芝硬,幾乎所有數(shù)據(jù)值與平均值的距離在3個(gè)標(biāo)準(zhǔn)差之內(nèi)。
2)第一四分位數(shù)帆锋、第三四分位數(shù)和四分位數(shù)間距
下限=Q1-1.5IQR
上限=Q3+1.5IQR
6吵取、匯總統(tǒng)計(jì)量
1)五數(shù)概括法
最小值、第一四分位數(shù)(Q1)锯厢、中位數(shù)(Q2)皮官、第三四分位數(shù)(Q3)脯倒、最大值
2)箱形圖
基于五數(shù)概括法的數(shù)據(jù)圖形匯總
7、兩變量間關(guān)系的度量
1)協(xié)方差
協(xié)方差求兩變量間是否存在線性相關(guān)關(guān)系捺氢,缺點(diǎn)是受單位影響較大藻丢,因此得出的相關(guān)強(qiáng)度也不同,于是產(chǎn)生了相關(guān)系數(shù)摄乒。
樣本協(xié)方差
總體協(xié)方差
2)相關(guān)系數(shù)
相關(guān)系數(shù)等于樣本協(xié)方差除以x的標(biāo)準(zhǔn)差與y的標(biāo)準(zhǔn)差的乘積悠反。
樣本相關(guān)系數(shù)
總體相關(guān)系數(shù)
注意:相關(guān)系數(shù)提供了線性關(guān)系但不是因果關(guān)系的度量。