描述性統(tǒng)計分析是指通過圖表或數(shù)學(xué)的方法,對數(shù)據(jù)資料進行整理炕檩、分析窖剑,并對數(shù)據(jù)的分布狀態(tài)坚洽、數(shù)字特征和隨機變量之間的關(guān)系進行估計和描述的方法。描述性分析主要有三大類:
1西土、集中趨勢分析(平均數(shù)讶舰、中數(shù)、眾數(shù))
2、離中趨勢分析(全距跳昼、四分差般甲、平均差、方差庐舟、標(biāo)準(zhǔn)差)
3欣除、相關(guān)分析(研究現(xiàn)象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象進行其相關(guān)方向及相關(guān)程度的研究「相關(guān)系數(shù)=》回歸方程」)
先講第一類挪略,集中趨勢分析。
1滔岳、平均數(shù)
平均數(shù)是表示一組數(shù)據(jù)集中趨勢的量數(shù)杠娱,是指在一組數(shù)據(jù)中所有數(shù)據(jù)之和在除以這組數(shù)據(jù)的個數(shù)。它反映數(shù)據(jù)集中趨勢的一項指標(biāo)谱煤。解答平均數(shù)應(yīng)用題的關(guān)鍵在于確定“總數(shù)量”以及和總數(shù)量對應(yīng)的總份數(shù)摊求。在統(tǒng)計工作中,平均數(shù)和標(biāo)準(zhǔn)差是描述數(shù)據(jù)資料集中趨勢和離散程度的兩個最重要的測度值刘离。
平均數(shù)是統(tǒng)計中的一個重要概念室叉。小學(xué)數(shù)學(xué)里所講的平均數(shù)一般是指算術(shù)平均數(shù),也就是一組數(shù)據(jù)的和除以這組數(shù)據(jù)的個數(shù)所得的商硫惕。在統(tǒng)計中算術(shù)平均數(shù)常用于表示統(tǒng)計對象的一般水平茧痕,它是描述數(shù)據(jù)集中位置的一個統(tǒng)計量。既可以用它來反映一組數(shù)據(jù)的一般情況恼除、和平均水平踪旷,也可以用它進行不同組數(shù)據(jù)的比較,以看出組與組之間的差別豁辉。用平均數(shù)表示一組數(shù)據(jù)的情況令野,有直觀、簡明的特點徽级,所以在日常生活中經(jīng)常用到气破,如平均速度、平均身高餐抢、平均產(chǎn)量现使、平均成績等等。
(1)算術(shù)平均數(shù)
算術(shù)平均數(shù)是指在一組數(shù)據(jù)中所有數(shù)據(jù)之和再除以數(shù)據(jù)的個數(shù)弹澎。它是反映數(shù)據(jù)集中趨勢的一項指標(biāo)朴下。
把n個數(shù)的總和除以n,所得的商叫做這n個數(shù)的算術(shù)平均數(shù)苦蒿。
公式:
(2)幾何平均數(shù)
n個觀察值連乘積的n次方根就是幾何平均數(shù)殴胧。根據(jù)資料的條件不同,幾何平均數(shù)分為加權(quán)和不加權(quán)之分。
公式:
(3)加權(quán)平均數(shù)
加權(quán)平均數(shù)是不同比重數(shù)據(jù)的平均數(shù)团滥,加權(quán)平均數(shù)就是把原始數(shù)據(jù)按照合理的比例來計算竿屹,若 n個數(shù)中,x1出現(xiàn)f1次灸姊,x2出現(xiàn)f2次拱燃,…,xk出現(xiàn)fk次力惯,那么
叫做x1碗誉、x2、…父晶、xk的加權(quán)平均數(shù)哮缺。f1、f2甲喝、…尝苇、fk是x1、x2埠胖、…糠溜、xk的權(quán)。
公式:
其中
f1直撤、f2非竿、…、fk叫做權(quán)(weight)谊惭。平均數(shù)是加權(quán)平均數(shù)的一種特殊情況汽馋,即各項的權(quán)相等時,加權(quán)平均數(shù)就是算術(shù)平均數(shù)圈盔。
2豹芯、中數(shù)
中數(shù)是按順序排列在一起的一組數(shù)據(jù)中居于中間位置的數(shù),即在這組數(shù)據(jù)中驱敲,有一半的數(shù)據(jù)比它大铁蹈,有一半的數(shù)據(jù)比它小。
對一組數(shù)進行排序后众眨,正中間的一個數(shù)(數(shù)字個數(shù)為奇數(shù))握牧;或者中間兩個數(shù)的平均數(shù)(數(shù)字個數(shù)為偶數(shù))。這個數(shù)可能是數(shù)據(jù)中的某一個娩梨,也可能根本不是原有的數(shù)沿腰。中數(shù)是集中量數(shù)的一種,它能描述一組數(shù)據(jù)的典型情況狈定。中數(shù)又名中位數(shù)颂龙。
3习蓬、眾數(shù)
眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,叫眾數(shù)措嵌,有時眾數(shù)在一組數(shù)中有好幾個躲叼。用M表示。 理性理解:簡單的說企巢,就是一組數(shù)據(jù)中占比例最多的那個數(shù)枫慷。
平均數(shù)非常明顯的優(yōu)點之一是,它能夠利用所有數(shù)據(jù)的特征或听,而且比較好算。另外神帅,在數(shù)學(xué)上萌抵,平均數(shù)是使誤差平方和達(dá)到最小的統(tǒng)計量,也就是說利用平均數(shù)代表數(shù)據(jù)元镀,可以使二次損失最小绍填。因此,平均數(shù)在數(shù)學(xué)中是一個常用的統(tǒng)計量讨永。但是平均數(shù)也有不足之處遇革,正是因為它利用了所有數(shù)據(jù)的信息卿闹,平均數(shù)容易受極端數(shù)據(jù)的影響。例如萝快,在一個單位里锻霎,如果經(jīng)理和副經(jīng)理工資特別高,就會使得這個單位所有成員工資的平均水平也表現(xiàn)得很高旋恼,但事實上,除去經(jīng)理和副經(jīng)理之外冰更,剩余所有人的平均工資并不是很高昂勒。這時,中位數(shù)和眾數(shù)可能是刻畫這個單位所有人員工資平均水平更合理的統(tǒng)計量戈盈。中位數(shù)和眾數(shù)這兩個統(tǒng)計量的特點都是能夠避免極端數(shù)據(jù),但缺點是沒有完全利用數(shù)據(jù)所反映出來的信息。由于各個統(tǒng)計量有各自的特征痴荐,所以需要我們根據(jù)實際問題來選擇合適的統(tǒng)計量官册。
當(dāng)然,出現(xiàn)極端數(shù)據(jù)不一定用中位數(shù)膝宁,一般,統(tǒng)計上有一個方法合蔽,就要認(rèn)為這個數(shù)據(jù)不是來源于這個總體的,因而把這個數(shù)據(jù)去掉拴事。比如大家熟悉的跳水比賽評分圣蝎,為什么要去掉一個最高分、一個最低分呢徘公,就認(rèn)為這兩個分不是來源于這個總體,不能代表裁判的鑒賞力坦袍。于是去掉以后再求剩下數(shù)據(jù)的平均數(shù)等太。需要指出的是,我們處理的數(shù)據(jù)澈驼,大部分是對稱的數(shù)據(jù),數(shù)據(jù)符合或者近似符合正態(tài)分布挎塌。這時候内边,均值(平均數(shù))榴都、中位數(shù)和眾數(shù)是一樣的漠其。只有在數(shù)據(jù)分布偏態(tài)(不對稱)的情況下竿音,才會出現(xiàn)均值、中位數(shù)和眾數(shù)的區(qū)別春瞬。所以說套啤,如果是正態(tài)的話,用哪個統(tǒng)計量都行潜沦。如果偏態(tài)的情況特別嚴(yán)重的話,可以用中位數(shù)涝影。
除了需要刻畫平均水平的統(tǒng)計量争占,統(tǒng)計中還有刻畫數(shù)據(jù)波動情況的統(tǒng)計量。比如臂痕,平均數(shù)同樣是5,它所代表的數(shù)據(jù)可能是1、3嘿辟、5、7英古、9昙读,可能是4、4.5蛮浑、5、5.5艺沼、6蕴掏。也就是說5所代表的不同組數(shù)據(jù)的波動情況是不一樣的调鲸。怎樣刻畫數(shù)據(jù)的波動情況呢挽荡?很自然的想法就是用最大值減最小值,即求一組數(shù)據(jù)的極差定拟。數(shù)學(xué)中還有方差、標(biāo)準(zhǔn)差等許多用來刻畫數(shù)據(jù)特征的統(tǒng)計量角雷。