大凡說起數(shù)據(jù)分析叮喳,很多人就會想起平均數(shù)购啄。為什么平均數(shù)如此深入人心睁宰?它的重要性又是什么呢肪获?
從釋義上講,漢字的“平均”有按份兒均勻計算的含義柒傻。統(tǒng)計學(xué)上的平均數(shù)其實(shí)有好幾種不同的方式(大家應(yīng)該能記得什么叫“統(tǒng)計口徑”吧)孝赫,我們耳熟能詳?shù)耐ǔJ恰八阈g(shù)平均數(shù)”。舉個例子红符,如果有4個系統(tǒng)支持工程師青柄,甲乙丙丁,每個人的每天的解決問題的數(shù)量如下表预侯。
系統(tǒng)工程師 | 每天解決問題的數(shù)量 |
---|---|
甲 | 17 |
乙 | 23 |
丙 | 19 |
丁 | 27 |
表1 系統(tǒng)工程師小分隊每日解決問題的數(shù)量(分布)
根據(jù)上表致开,這個小小系統(tǒng)支持團(tuán)隊的平均每天每人的解決問題數(shù)量是:
(17+23+19+27)/(1+1+1+1)= 21.5(個)
因?yàn)槊總€工程師的表現(xiàn)不同,我們不能單純拿出某個工程師來代表這個團(tuán)隊的表現(xiàn)萎馅。于是双戳,平均數(shù)就是一個非常好的用來描述“團(tuán)隊”的指標(biāo)。如果用統(tǒng)計術(shù)語來說糜芳,甲工程師的17個問題是“個體”的特征飒货,21.5個問題則是“整體”的特征魄衅。平均數(shù)最直觀的一個作用就是來對某個數(shù)據(jù)集的“整體情況”做一個表述。
上例中塘辅,每個工程師解答的問題是同質(zhì)同權(quán)的晃虫,也就是說每個工程師在解決問題的過程中的“權(quán)重”是一樣的,并不存在甲解決的問題價值更加大一點(diǎn)扣墩。但實(shí)際情況通常會更加復(fù)雜哲银,假定問題因有難易不同,給客戶帶來的價值也不同呻惕。那么我們怎么評價這個團(tuán)隊的一般表現(xiàn)荆责?因?yàn)檫@次不同問題的價值不同,也就是說“權(quán)重”不同了蟆融。在IT的世界里草巡,按常規(guī),我們一般把問題分成4個等級型酥。為方便起見山憨,價值就是1、2弥喉、3郁竟、4。
1 | 2 | 3 | 4 | 小計 | |
---|---|---|---|---|---|
甲 | 1 | 1 | 3 | 12 | 17 |
乙 | 4 | 7 | 5 | 7 | 23 |
丙 | 11 | 0 | 0 | 8 | 19 |
丁 | 20 | 2 | 4 | 1 | 27 |
表2 系統(tǒng)工程師小分隊解決問題數(shù)量按不同價值(分布)
有了權(quán)重再來看看甲和丁的表現(xiàn):
甲:1x1+1x2+3x3+12x4 = 60
队删场:20x1+2x2+4x3+1x4 = 40
雖然棚亩,丁每天要多解10個問題,但是從價值上來說竟然還是甲要多出20分虏杰。憑直覺就能夠猜出來甲是經(jīng)驗(yàn)豐富的老工程師經(jīng)常是被要求解決一些棘手的問題讥蟆,而丁很可能是剛剛?cè)胄械男率郑饕幚硪恍┍容^簡單但多發(fā)的問題纺阔。
插播一句瘸彤。這個就是通過數(shù)字(或者更精確地說,用統(tǒng)計)來理解現(xiàn)實(shí)世界的一個例子笛钝,以后還會常常提到质况。畢竟,不解決實(shí)際問題玻靡,思想和技術(shù)就沒有什么意義了结榄。
那么,在有權(quán)重下的平均數(shù)囤捻,就是加權(quán)平均數(shù)臼朗。沿用表2,加權(quán)平均數(shù)為:
乙:4x1+7x2+5x3+7x4 = 61
丙:11x1+0x2+0x3+8x4 = 43
(60+61+43+40)/(1+1+1+1)= 51(分)
注意哦,這里單位改成了“分”依溯,因?yàn)樗阈g(shù)平均數(shù)是同質(zhì)平均老厌,只要單純計算即可瘟则,而加權(quán)平均是有權(quán)重的黎炉,有時候要通過“某種衡量”來表達(dá)“量化”。
通過這兩個平均數(shù)醋拧,可以看到同一個小分隊慷嗜,如果從不同的角度去了解情況,會得出一些完全不同的結(jié)論丹壕。單純看解決問題的算術(shù)平均數(shù)庆械,那么甲就是個典型的拖后腿的家伙了。再細(xì)致一些菌赖,了解到了不同問題的本質(zhì)不同時缭乘,甲作為有經(jīng)驗(yàn)的工程師的價值就體現(xiàn)出來了。
插播第二句×鹩茫現(xiàn)實(shí)中堕绩,理解事情本身很重要,正確的理解才能有效利用數(shù)字邑时。當(dāng)然奴紧,利用統(tǒng)計來檢驗(yàn)?zāi)承┱f法的有效性也是很有意思的話題。
平均數(shù)作為一個統(tǒng)計指標(biāo)晶丘,它更深層次的意義還體現(xiàn)在“回歸”上黍氮。這個話題有點(diǎn)復(fù)雜需要逐漸展開。
光有平均數(shù)是不是可以浅浮?當(dāng)然不行沫浆,不然大家怎么老覺得自己“被平均”了呢?下周我們來聊聊方差與標(biāo)準(zhǔn)差滚秩。