統(tǒng)計(jì)數(shù)據(jù)就是用數(shù)字表達(dá)出來的證據(jù)这溅。這樣的證據(jù)可能看起來非常動(dòng)人,因?yàn)閿?shù)字讓證據(jù)顯得非常有科學(xué)性棒仍,非常精確悲靴,似乎它就代表了“事實(shí)”。但是莫其,統(tǒng)計(jì)數(shù)據(jù)能癞尚,而且經(jīng)常會(huì),“撒謊”乱陡!它們并不必然就能證明它們想要證明的一切浇揩。
比如,這兩天前程無憂發(fā)布了2021年第一季度薪酬調(diào)研報(bào)告憨颠,報(bào)告顯示北京一季度平均工資11187元胳徽,是全國最高的,其次是上海和深圳爽彤,分別是10814元养盗、10247元。很多網(wǎng)友紛紛表示自己被平均了适篙,究竟是大家被平均了還是這就是實(shí)際情況呢往核?
我們?cè)賮砜匆幌聰?shù)據(jù),一季度平均工資11187元嚷节。
平均數(shù)是怎么計(jì)算的呢聂儒?平均數(shù)就是把所有數(shù)值相加,然后用總數(shù)除以相加的數(shù)目硫痰。這就出現(xiàn)高收入人群提升了整體的收入水平衩婚。
但是,這是不是真相呢碍论?大家的收入真有這么高嗎谅猾?這是不是與我們的統(tǒng)計(jì)方式有關(guān)?一般數(shù)學(xué)里鳍悠,有三種形式的平均數(shù)税娜,我們這只是代表了其中一種,還有兩種藏研,是中位數(shù)和眾數(shù)敬矩。
中位數(shù):將所有數(shù)值從高到低排列,然后找到位于最中間的數(shù)值蠢挡,這個(gè)中間數(shù)值就是中位數(shù)弧岳。有一半的數(shù)據(jù)比他大凳忙,有一半的數(shù)據(jù)比他小。
眾數(shù):將所有數(shù)值排列好禽炬,計(jì)算每個(gè)不同數(shù)值出現(xiàn)的次數(shù)或每個(gè)不同數(shù)值范圍出現(xiàn)的次數(shù)涧卵,出現(xiàn)頻率最高的數(shù)值就叫作眾數(shù)。
我們?cè)賮砜纯匆唤M數(shù)據(jù):
北京2020年收入的中位數(shù)是6906元腹尖,大部分城市是不超過6000元的柳恐。基本與一季度調(diào)研的平均收入要相差一倍呢热幔。
通過上面這個(gè)案例可以看到:選用不同的數(shù)據(jù)來表現(xiàn)收入乐设,差異很大。顯然绎巨,選用收入的中位數(shù)要比平均數(shù)更為接近實(shí)際情況近尚。
所以,平均數(shù)有時(shí)候不一定是靠譜的场勤。尤其學(xué)了《學(xué)會(huì)提問》后戈锻,看到平均數(shù),要運(yùn)用批判性思維却嗡,多問幾句:“是平均數(shù)舶沛、中位數(shù)還是眾數(shù),平均值的含義不同會(huì)不會(huì)產(chǎn)生什么影響窗价?”
不僅判斷一個(gè)平均值是平均數(shù)如庭、中位數(shù)還是眾數(shù)非常重要,判定最小數(shù)值和最大數(shù)值之間的差距撼港,即全距以及每個(gè)數(shù)值出現(xiàn)的頻率坪它,也就是數(shù)值分布,常常也顯得異常重要帝牡。
一般來說往毡,病人應(yīng)該考慮國內(nèi)不同的醫(yī)院對(duì)于他的疾病的存活率是不是有不同的全距和數(shù)值分布。這樣的話靶溜,他就應(yīng)該考慮選擇在那家有最樂觀的數(shù)值分布情況的醫(yī)院就診开瞭。當(dāng)我們遇到平均數(shù)的時(shí)候,記住全距和數(shù)值分布的一個(gè)總體好處罩息,就是這樣做會(huì)提醒你嗤详,大多數(shù)人或事并不完全符合確切的平均值,與平均數(shù)值差異極大的結(jié)果也在預(yù)料之中瓷炮。
此外葱色,針對(duì)上述數(shù)據(jù),我們還可以再多問問:“調(diào)研了多大規(guī)模的樣本娘香?調(diào)研了哪些人群或行業(yè)苍狰?這些人群或行業(yè)能否代表其他人或行業(yè)办龄?采取了怎樣的方式進(jìn)行調(diào)研?數(shù)據(jù)的有效性如何淋昭?”等等一些問題俐填。