在研究數(shù)據(jù)整體的時(shí)候菩鲜,統(tǒng)計(jì)特征可以有效的幫助我們快速了解數(shù)據(jù)罩引。
集中量數(shù)和差異量數(shù)是描述數(shù)據(jù)的兩種概念嘹悼。
一:集中量數(shù)
描述一組數(shù)據(jù)的規(guī)律性的量數(shù)稱為集中量數(shù)嵌器。它是一組數(shù)據(jù)的一般水平的代表值肛真。
教育評(píng)價(jià)中常用的描述一組評(píng)價(jià)對(duì)象一般水平的量數(shù)有算術(shù)平均數(shù)、中位數(shù)和眾數(shù)爽航、幾何平均數(shù)等蚓让。
1.算術(shù)平均數(shù)
算術(shù)平均數(shù)是全部數(shù)據(jù)的算術(shù)平均,又稱均值讥珍,符號(hào)為M(Mean)历极。算術(shù)平均數(shù)是集中趨勢(shì)作主要的測(cè)度值,在統(tǒng)計(jì)學(xué)中具有重要地位衷佃, 是進(jìn)行統(tǒng)計(jì)分析和統(tǒng)計(jì)推斷的基礎(chǔ)趟卸。它主要適用于數(shù)值型數(shù)據(jù),但不適用品質(zhì)數(shù)據(jù)氏义。根據(jù)表現(xiàn)形式的不同锄列,算術(shù)平均數(shù)有不同的計(jì)算形式和計(jì)算公式。其中惯悠,算術(shù)平均數(shù)是加權(quán)平均數(shù)的一種特殊形式(它特殊在各項(xiàng)全相等)邻邮,在實(shí)際問題中,當(dāng)各項(xiàng)權(quán)不相等時(shí)克婶,計(jì)算平均數(shù)時(shí)就要采用加權(quán)平均數(shù)筒严,當(dāng)各項(xiàng)權(quán)相等時(shí),計(jì)算平均數(shù)就要采用算數(shù)平均數(shù)情萤。兩者不可混淆鸭蛙。
簡(jiǎn)單算術(shù)平均數(shù)
簡(jiǎn)單算術(shù)平均數(shù)主要用于未分組的原始數(shù)據(jù)。設(shè)一組數(shù)據(jù)為X1筋岛,X2娶视,...,Xn泉蝌,簡(jiǎn)單的算術(shù)平均數(shù)的計(jì)算公式為:
M=(X1+X2+...+Xn)/n
優(yōu)缺點(diǎn)
算數(shù)平均數(shù)具備了良好集中量數(shù)應(yīng)具備的一些條件:
1歇万、集中量數(shù)
2、反應(yīng)靈敏
3勋陪、確定嚴(yán)密
4贪磺、簡(jiǎn)明易解
5、計(jì)算簡(jiǎn)單
6诅愚、適合進(jìn)一步演算
7寒锚、較小受抽樣變化的影響等優(yōu)點(diǎn)。
同時(shí)也存在一定的缺點(diǎn)违孝,限制了它的使用:
1刹前、算術(shù)平均數(shù)易受極端數(shù)據(jù)的影響,這是因?yàn)槠骄鶖?shù)反應(yīng)靈敏雌桑,每個(gè)數(shù)據(jù)的或大或小的變化都會(huì)影響到最終結(jié)果喇喉。
2、若出現(xiàn)模糊不清的數(shù)據(jù)時(shí)校坑,無法計(jì)算平均數(shù)拣技。[1]
應(yīng)用原則
1、同質(zhì)性數(shù)據(jù)
2耍目、平均數(shù)與個(gè)體數(shù)值相結(jié)合考慮
3膏斤、平均數(shù)于方差、標(biāo)準(zhǔn)差相結(jié)合考慮
二.中位數(shù)
中數(shù)(Median)邪驮,又名中位數(shù)莫辨。 對(duì)一組數(shù)進(jìn)行排序后,正中間的一個(gè)數(shù)(數(shù)字個(gè)數(shù)為奇數(shù))毅访;或者中間兩個(gè)數(shù)的平均數(shù)(數(shù)字個(gè)數(shù)為偶數(shù))沮榜。
中數(shù)是按順序排列在一起的一組數(shù)據(jù)中居于中間位置的數(shù),即在這組數(shù)據(jù)中喻粹,有一半的數(shù)據(jù)比它大敞映,有一半的數(shù)據(jù)比它小。這個(gè)數(shù)可能是數(shù)據(jù)中的某一個(gè)磷斧,也可能根本不是原有的數(shù)振愿。
優(yōu)點(diǎn)
1、計(jì)算簡(jiǎn)單
2弛饭、容易理解
3冕末、不受極端值影響
缺點(diǎn)
1、反應(yīng)不夠靈敏
2侣颂、 受抽樣影響較大
3档桃、中數(shù)乘以總次數(shù)于總數(shù)不相等
4、不能進(jìn)一步代數(shù)運(yùn)算
應(yīng)用情況
1憔晒、需要快速估算集中值時(shí)
2藻肄、有極端數(shù)據(jù)時(shí)
3蔑舞、有模糊不清楚的數(shù)據(jù)時(shí)
3.眾數(shù)
眾數(shù)(Mode),一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值嘹屯,叫眾數(shù)攻询,用M表示。
計(jì)算眾數(shù)的方法
(一)州弟、根據(jù)單項(xiàng)數(shù)列求眾數(shù)钧栖,不需要任何計(jì)算,可以直接從分配數(shù)列中找出出現(xiàn)次數(shù)或頻率最大的一組標(biāo)志值婆翔,就是所求的眾數(shù)拯杠。
(二)、對(duì)組距數(shù)列求眾數(shù)啃奴。對(duì)眾數(shù)的計(jì)算有兩種公式:
1潭陪、上限公式:
2、下限公式
其中:
f表示眾數(shù)所在組次數(shù)最蕾;
f-1表示眾數(shù)所在組前一組的次數(shù)畔咧;
f+1表示眾數(shù)所在組后一組的次數(shù);
L表示眾數(shù)所在組組距的下限揖膜;
U表示眾數(shù)所在組組距的上限誓沸;
i表示組距;
優(yōu)點(diǎn)
1壹粟、簡(jiǎn)單明了
2拜隧、容易理解
缺點(diǎn)
1、不穩(wěn)定趁仙,受分組和樣本變動(dòng)影響
2洪添、反應(yīng)不靈敏
3、不能進(jìn)一步做代數(shù)運(yùn)算
應(yīng)用
1雀费、需要快速估算一組數(shù)據(jù)集中值時(shí)干奢。
2、數(shù)據(jù)不同質(zhì)時(shí)
3盏袄、兩極端有極端值時(shí)
4忿峻、快速估計(jì)分布形體時(shí)
4.幾何平均數(shù)
幾何平均數(shù)(Geometric mean),是求一組數(shù)值的平均數(shù)的方法中的一種辕羽。適用于對(duì)比率數(shù)據(jù)的平均逛尚,并主要用于計(jì)算數(shù)據(jù)平均增長(zhǎng)(變化)率。
幾何平均數(shù)(geometric mean)是指n個(gè)觀察值連乘積的n次方根刁愿。
1绰寞、簡(jiǎn)單幾何平均數(shù):
2、加權(quán)幾何平均數(shù):
應(yīng)用
1、對(duì)比率滤钱、指數(shù)等進(jìn)行平均觉壶;
2、計(jì)算平均發(fā)展速度件缸;
其中:樣本數(shù)據(jù)非負(fù)铜靶,主要用于對(duì)數(shù)正態(tài)分布。
3停团、復(fù)利下的平均年利率;
4掏熬、連續(xù)作業(yè)的車間求產(chǎn)品的平均合格率佑稠。
二 :差異量數(shù)
差異量數(shù)亦稱變異量數(shù),又稱離散趨勢(shì)量數(shù)旗芬,它是統(tǒng)計(jì)學(xué)的基本概念之一舌胶,指表示樣本數(shù)據(jù)偏離中間數(shù)值的趨勢(shì)的量數(shù),或者說它是反映樣本頻率分布離散程度的量數(shù)疮丛。差異量數(shù)大幔嫂,表示各數(shù)值分布的范圍廣且參差不齊;差異量數(shù)小誊薄,表示各數(shù)值較集中履恩、整齊,波動(dòng)的范圍幅度小呢蔫。因此切心,集中量數(shù)的代表性如何,可由差異量數(shù)得到反映片吊。差異量數(shù)愈大绽昏,則集中量數(shù)的代表性愈小俏脊;差異量數(shù)愈小全谤,則集中量數(shù)的代表性愈大。所以爷贫,考察某種分布的差異量數(shù)认然,還有助于對(duì)集中量數(shù)的理解。
常見的差異量有平均差漫萄、方差季眷、標(biāo)準(zhǔn)差、全距卷胯、四分差子刮、百分差等。
1.平均差
一組數(shù)據(jù)( 樣本)Xi,i = 1挺峡,…葵孤,N(1)的平均差公式為下圖
它是算術(shù)平均數(shù)與各數(shù)據(jù)距離的平均,有效地利用了信息橱赠,能直接很好地反映這組數(shù)據(jù)的差異程度尤仍。但由于MD(平均數(shù))用了絕對(duì)值,難以進(jìn)行代數(shù)運(yùn)算狭姨,理論分析困難宰啦,所以運(yùn)用較少。
2.方差
它是將MD中的距離改為距離的平方得到饼拍。方差可有效地利用信息赡模,且能很好地反映這組數(shù)據(jù)的差異程度。這樣改變后师抄,雖然不如平均差反映差異那么直接漓柑,但避免了絕對(duì)值,從而進(jìn)行數(shù)學(xué)處理更加方便叨吮,應(yīng)用最廣辆布。
3.標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差(Standard Deviation),在概率統(tǒng)計(jì)中最常?
4.全距
全距是用來表示統(tǒng)計(jì)資料中的變異量數(shù)(measure sofvariation)茶鉴,其最大值與最小值之間的差距锋玲;即最大值減最小值后所得之?dāng)?shù)據(jù)。其適用于等距變量涵叮、比率變量嫩絮,不適用于名義變量或次序變量。
全距也稱為極差围肥,是指總體各單位的兩個(gè)極端標(biāo)志值之差剿干,即:R=最大標(biāo)志值-最小標(biāo)志值
因此,全距(R)可反映總體標(biāo)志值的差異范圍穆刻。
5.四分差與百分差
百分差與四分差只利用了數(shù)據(jù)的部分信息置尔,不能進(jìn)行代數(shù)運(yùn)算,反應(yīng)不靈敏氢伟,但當(dāng)兩極端數(shù)據(jù)不清楚或數(shù)據(jù)信息不全時(shí)榜轿,只能用百分差與四分差。
全距朵锣、百分差與四分差都只利用了數(shù)據(jù)的部分信息谬盐,一般是在數(shù)據(jù)信息不全,平均差和方差及其改進(jìn)量不能用時(shí)選用诚些。