統(tǒng)計數(shù)字會撒謊

一、內(nèi)在有偏的樣本

1渣窜、抽樣:只要樣本足夠大铺根,并且具有代表性,多數(shù)情況下乔宿,樣本的信息可以很好地代表總體位迂。但如果條件不滿足,抽樣的結(jié)果比一個臆想的結(jié)果好不到哪兒去——除了會形成一種十分科學(xué)精確的虛假印象以外。

2掂林、一個以抽樣為基礎(chǔ)的報告如果要有價值臣缀,就必須使用具有代表性的樣本,這種樣本排除了各種誤差泻帮。只要有產(chǎn)生誤差的可能性精置,你就有必要對結(jié)果保留一定的懷疑。

3锣杂、造成偏差的一些原因:人們不可能完全說真話脂倦;選取的樣本有偏;調(diào)查人員的組成(人們在接受調(diào)查時有迎合對方說好話的明顯傾向)元莫。

二赖阻、精心挑選的平均數(shù)

1、平均數(shù)包括:均值柒竞、中位數(shù)政供、眾數(shù)播聪。

2朽基、標準正態(tài)分布的情況下,三者是相等的离陶;若分布傾斜稼虎,則三者會有差距。

3招刨、有目的地挑選平均數(shù)霎俩,可以造成結(jié)果的不同。

三沉眶、沒有披露的數(shù)據(jù)

1打却、在大樣本的使用中,任何由于機遇產(chǎn)生的差異都是微不足道的谎倔。而小樣本的結(jié)果則會不準確(如拋硬幣)柳击。

2危虱、多大的樣本容量才是足夠的榨了,取決于抽樣時你所研究的總體万皿,其容量有多大土砂,以及變動范圍有多大贸诚。有時樣本中單位的數(shù)量看上去已經(jīng)足夠多匆光,但實際并非如此(如醫(yī)學(xué)試驗采转,因發(fā)病率很低堡纬,需要樣本容量足夠大)孽查。

3饥悴、顯著性檢驗方法:顯著性是一種反應(yīng)測驗數(shù)據(jù)以多大可能性代表實際結(jié)論,而不代表那些由于機遇產(chǎn)生的其他結(jié)論。如果某條信息提供了顯著性程度西设,你將對它有更深的了解(這就是那些沒有披露的數(shù)據(jù))起宽。通常情況下,5%的顯著水平是最低要求济榨。1%的顯著水平說明以99%的概率保證該結(jié)果是真實的坯沪。

4、另一類需要關(guān)注的“沒有披露的數(shù)據(jù)”:事物整體范圍的全距(也稱極差)和與平均數(shù)偏離水平(如不能只根據(jù)年平均氣溫選擇野營地點擒滑,應(yīng)當(dāng)注意波動范圍)腐晾。

四、毫無意義的工作

1丐一、樣本以多大的精度代表總體是可以用數(shù)據(jù)衡量的:可能誤差和標準誤差藻糖。用腳丈量100碼的距離,平均而言有3碼的誤差库车,則可能誤差是100±3巨柒,亦即3%;標準誤差中柠衍,2/3的單位將落在加洋满、減一個標準誤差的范圍內(nèi),而不是1/2的單位珍坊。

2牺勾、只有當(dāng)差別有意義時才能稱之為差別。忽略可能/標準誤差的比較并沒有意義阵漏。

五驻民、驚人的統(tǒng)計圖形

1、人們常用直線圖來表示趨勢履怯。

2回还、縱軸的刻度會影響直線的斜率。在畫圖時叹洲,若縱軸刻度截取在某一段(如18-24)柠硕,其圖形增長情況可能會遠遠超過刻度在0-24的情況,造成增長很快的假象疹味。

六仅叫、平面圖形

1、在比較兩種或以上的事物時糙捺,柱狀圖是一種描繪數(shù)量的常用的方法诫咱。

2、形象化的圖形的前身是普通的柱狀圖洪灯,如用錢袋來代表收入坎缭。當(dāng)要表達A的收入是B的兩倍時竟痰,可以畫兩個錢袋分別代表兩者的收入,前者高是后者的兩倍掏呼。但其視覺效果是具有欺騙性的坏快,因為前者的寬同樣是后者的兩倍,實際給人的印象會是四倍的差距憎夷,若考慮到三維莽鸿,則是八倍。

七拾给、相匹配的資料

1祥得、如果你想證明某事,卻發(fā)現(xiàn)沒有能力辦到蒋得,那么試著解釋其他事情并假裝它們是一回事级及。

2、不相匹配包括:兩組對象的條件不同(如用實驗的情況宣傳實際效果)额衙;兩組對象不可比(如海軍與城市居民死亡率對比饮焦,一組是青年,一組包含老幼)窍侧;相比較的對象不合適(去年飛機失事比1910年多)等县踢。

3、在描述同一個數(shù)據(jù)時疏之,可以有不同的方法殿雪。例如,你可以把相同的事情表述為:1%的銷售利潤了锋爪;15%的投資回報率;1000萬美元的利潤爸业;利潤上升40%(相比1935-1939年的平均水平)其骄;利潤相比去年下降60%。選擇一個目前最有利于你的說法扯旷。

八拯爽、相關(guān)關(guān)系與因果關(guān)系

1、謬誤:“如果B緊跟著A出現(xiàn)钧忽,那么A一定導(dǎo)致B”毯炮,更大的可能性是兩個因素并不互為因果,而同為第三個因素的產(chǎn)物耸黑。例如桃煎,學(xué)生中抽煙與低分經(jīng)常同時出現(xiàn),但不一定是抽煙導(dǎo)致的低分大刊。

2为迈、相關(guān)是通過相關(guān)系數(shù)這個精確的數(shù)據(jù)來證明兩件事物具有關(guān)聯(lián)關(guān)系,它可以有多種不同的類型。一種相關(guān)是由于機緣巧合產(chǎn)生的葫辐,由于機會的存在搜锰,你或許可以通過一組數(shù)據(jù)來證明一些根本不存在的結(jié)論,如硬幣百分百是正面朝上的耿战;聯(lián)合變動是兩者存在真實的關(guān)系蛋叼,但卻無法確定何為因、何為果剂陡,如收入與股票鸦列;還有一種相關(guān)是所有變量相互間沒有任何影響,但卻存在顯著的相關(guān)鹏倘,如抽煙與低分薯嗤。

3、需要留意超過了推斷相關(guān)關(guān)系的數(shù)據(jù)范圍而得出的結(jié)論纤泵。例如骆姐,一般雨下的越多,谷物長得越好捏题。但超過了一定的降雨量玻褪,則會轉(zhuǎn)化為負相關(guān)。

4公荧、相關(guān)顯示了一種趨勢(正相關(guān)或負相關(guān))带射,但這種趨勢通常不是理想的一對一關(guān)系。例如循狰,高個子男孩一般比矮個子男孩更重窟社,但也有例外。

5绪钥、兩個錯誤觀點:用真實的相關(guān)關(guān)系來支持一個未經(jīng)證實的因果關(guān)系灿里;一旦兩個事物共同變動,他們便存在因果關(guān)系程腹。

九匣吊、如何進行統(tǒng)計操縱

1、統(tǒng)計操縱:利用統(tǒng)計資料傳遞錯誤的信息而誤導(dǎo)他人寸潦。

2色鸳、常見的方法:利用地圖傳達與事實不符的印象(利用廣袤的偏遠地區(qū)的收入與政府支出相等來證明政府支出過多);利用小數(shù)點和百分數(shù)為不確切的事物蒙上精確的面紗(平均7.81比平均7.8顯得更有說服力)见转;偷換基數(shù)(將打五折表述為節(jié)省100%)命雀;將百分數(shù)直接相加(四項成本開支都上升5%,則總成本也是上升5%池户,并非20%)咏雌;百分比之間的比較(第一年ROI為3%凡怎,第二年為6%,既可以表述為增長了3個百分點赊抖,也可以說增長高達100%)等统倒。

3、在報紙氛雪、雜志或書籍中看到統(tǒng)計材料房匆、結(jié)論以及數(shù)據(jù)時,應(yīng)該經(jīng)過認真的思考后再接受它們报亩。

十浴鸿、對統(tǒng)計資料提出的五個問題

1、誰說的弦追?首先要尋找的是偏差岳链。出于利己的考慮,發(fā)布消息的一方可能制造偏差劲件。包括有意識的偏差和無意識的偏差掸哑。

a)有意識的偏差:錯誤的陳述或含糊不清之詞;刻意挑選適合的數(shù)據(jù)而丟棄不合適的數(shù)據(jù)零远;改動測量標準(在進行一種比較時確定了某年為基期苗分,而另一種比較時卻使用了更有利的年份);使用不正確的測量方法(簡單地使用“平均數(shù)”一詞)等牵辣。

b)無意識的偏差:權(quán)威人士是否是真的權(quán)威人士摔癣;當(dāng)某個權(quán)威人士被引用時,請弄清楚到底資料的內(nèi)容是權(quán)威的纬向,還是僅僅與權(quán)威人士沾邊(結(jié)論卻不是來自權(quán)威人士)择浊。

2、他是如何知道的罢猪?樣本是否有偏近她,是否足夠大能保證結(jié)論值得信賴?是否具有一定的顯著性膳帕?等等。

3薇缅、遺漏了什么危彩?樣本包含多少案例缺失時值得質(zhì)疑;對一個沒有經(jīng)過可信度(可能誤差泳桦、標準誤差)檢驗的相關(guān)不用太當(dāng)真汤徽;均值與中位數(shù)相差甚遠時,注意那些沒有表明類型的平均數(shù)灸撰;很多數(shù)據(jù)因為缺乏比較而變得沒有意義(在大霧的一周里有2800人死亡)谒府;僅給出百分數(shù)而缺少原始數(shù)據(jù)也能造成欺騙(1/3的女學(xué)生嫁給了大學(xué)老師拼坎,實際上只有3位女學(xué)生被錄取)完疫;有些文章遺漏了引起變化的原因(用今年4月銷售額高于去年來證明經(jīng)濟在復(fù)蘇泰鸡,然而去年復(fù)活節(jié)在3月今年則在4月)。

4壳鹤、是否有人偷換了概念盛龄?留心從搜集原始資料到形成結(jié)論的整個過程中,是否有人偷換了概念芳誓。用發(fā)病數(shù)替代更有意義的發(fā)病率余舶;被調(diào)查者不一定說了真話;將相關(guān)關(guān)系偷換成因果關(guān)系锹淌;標榜自己是某個特定領(lǐng)域的“第一”匿值;等等。

5赂摆、這個資料有意義嗎挟憔?當(dāng)所接觸的資料是建立在未經(jīng)證實的假設(shè)基礎(chǔ)上時,你可以發(fā)問库正,這個資料有意義嗎曲楚?例如用1947-1952的家庭電視機擁有數(shù)量增長速率來預(yù)測未來的擁有數(shù),是毫無意義的褥符。因為擁有數(shù)越接近飽和增長會放緩龙誊。


——著作權(quán)歸原作者所有——

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市喷楣,隨后出現(xiàn)的幾起案子趟大,更是在濱河造成了極大的恐慌,老刑警劉巖铣焊,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件逊朽,死亡現(xiàn)場離奇詭異,居然都是意外死亡曲伊,警方通過查閱死者的電腦和手機叽讳,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來坟募,“玉大人岛蚤,你說我怎么就攤上這事⌒概矗” “怎么了涤妒?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長赚哗。 經(jīng)常有香客問我她紫,道長硅堆,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任贿讹,我火速辦了婚禮渐逃,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘围详。我一直安慰自己朴乖,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布助赞。 她就那樣靜靜地躺著买羞,像睡著了一般。 火紅的嫁衣襯著肌膚如雪雹食。 梳的紋絲不亂的頭發(fā)上畜普,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天,我揣著相機與錄音群叶,去河邊找鬼吃挑。 笑死,一個胖子當(dāng)著我的面吹牛街立,可吹牛的內(nèi)容都是我干的舶衬。 我是一名探鬼主播,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼赎离,長吁一口氣:“原來是場噩夢啊……” “哼逛犹!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起梁剔,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤虽画,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后荣病,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體码撰,經(jīng)...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年个盆,在試婚紗的時候發(fā)現(xiàn)自己被綠了脖岛。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡颊亮,死狀恐怖鸡岗,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情编兄,我是刑警寧澤,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布声登,位于F島的核電站狠鸳,受9級特大地震影響揣苏,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜件舵,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一卸察、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧铅祸,春花似錦坑质、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至盟庞,卻和暖如春吃沪,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背什猖。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工票彪, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人不狮。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓降铸,卻偏偏與公主長得像,于是被迫代替她去往敵國和親摇零。 傳聞我的和親對象是個殘疾皇子推掸,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,979評論 2 355

推薦閱讀更多精彩內(nèi)容