一、內(nèi)在有偏的樣本
1渣窜、抽樣:只要樣本足夠大铺根,并且具有代表性,多數(shù)情況下乔宿,樣本的信息可以很好地代表總體位迂。但如果條件不滿足,抽樣的結(jié)果比一個臆想的結(jié)果好不到哪兒去——除了會形成一種十分科學(xué)精確的虛假印象以外。
2掂林、一個以抽樣為基礎(chǔ)的報告如果要有價值臣缀,就必須使用具有代表性的樣本,這種樣本排除了各種誤差泻帮。只要有產(chǎn)生誤差的可能性精置,你就有必要對結(jié)果保留一定的懷疑。
3锣杂、造成偏差的一些原因:人們不可能完全說真話脂倦;選取的樣本有偏;調(diào)查人員的組成(人們在接受調(diào)查時有迎合對方說好話的明顯傾向)元莫。
二赖阻、精心挑選的平均數(shù)
1、平均數(shù)包括:均值柒竞、中位數(shù)政供、眾數(shù)播聪。
2朽基、標準正態(tài)分布的情況下,三者是相等的离陶;若分布傾斜稼虎,則三者會有差距。
3招刨、有目的地挑選平均數(shù)霎俩,可以造成結(jié)果的不同。
三沉眶、沒有披露的數(shù)據(jù)
1打却、在大樣本的使用中,任何由于機遇產(chǎn)生的差異都是微不足道的谎倔。而小樣本的結(jié)果則會不準確(如拋硬幣)柳击。
2危虱、多大的樣本容量才是足夠的榨了,取決于抽樣時你所研究的總體万皿,其容量有多大土砂,以及變動范圍有多大贸诚。有時樣本中單位的數(shù)量看上去已經(jīng)足夠多匆光,但實際并非如此(如醫(yī)學(xué)試驗采转,因發(fā)病率很低堡纬,需要樣本容量足夠大)孽查。
3饥悴、顯著性檢驗方法:顯著性是一種反應(yīng)測驗數(shù)據(jù)以多大可能性代表實際結(jié)論,而不代表那些由于機遇產(chǎn)生的其他結(jié)論。如果某條信息提供了顯著性程度西设,你將對它有更深的了解(這就是那些沒有披露的數(shù)據(jù))起宽。通常情況下,5%的顯著水平是最低要求济榨。1%的顯著水平說明以99%的概率保證該結(jié)果是真實的坯沪。
4、另一類需要關(guān)注的“沒有披露的數(shù)據(jù)”:事物整體范圍的全距(也稱極差)和與平均數(shù)偏離水平(如不能只根據(jù)年平均氣溫選擇野營地點擒滑,應(yīng)當(dāng)注意波動范圍)腐晾。
四、毫無意義的工作
1丐一、樣本以多大的精度代表總體是可以用數(shù)據(jù)衡量的:可能誤差和標準誤差藻糖。用腳丈量100碼的距離,平均而言有3碼的誤差库车,則可能誤差是100±3巨柒,亦即3%;標準誤差中柠衍,2/3的單位將落在加洋满、減一個標準誤差的范圍內(nèi),而不是1/2的單位珍坊。
2牺勾、只有當(dāng)差別有意義時才能稱之為差別。忽略可能/標準誤差的比較并沒有意義阵漏。
五驻民、驚人的統(tǒng)計圖形
1、人們常用直線圖來表示趨勢履怯。
2回还、縱軸的刻度會影響直線的斜率。在畫圖時叹洲,若縱軸刻度截取在某一段(如18-24)柠硕,其圖形增長情況可能會遠遠超過刻度在0-24的情況,造成增長很快的假象疹味。
六仅叫、平面圖形
1、在比較兩種或以上的事物時糙捺,柱狀圖是一種描繪數(shù)量的常用的方法诫咱。
2、形象化的圖形的前身是普通的柱狀圖洪灯,如用錢袋來代表收入坎缭。當(dāng)要表達A的收入是B的兩倍時竟痰,可以畫兩個錢袋分別代表兩者的收入,前者高是后者的兩倍掏呼。但其視覺效果是具有欺騙性的坏快,因為前者的寬同樣是后者的兩倍,實際給人的印象會是四倍的差距憎夷,若考慮到三維莽鸿,則是八倍。
七拾给、相匹配的資料
1祥得、如果你想證明某事,卻發(fā)現(xiàn)沒有能力辦到蒋得,那么試著解釋其他事情并假裝它們是一回事级及。
2、不相匹配包括:兩組對象的條件不同(如用實驗的情況宣傳實際效果)额衙;兩組對象不可比(如海軍與城市居民死亡率對比饮焦,一組是青年,一組包含老幼)窍侧;相比較的對象不合適(去年飛機失事比1910年多)等县踢。
3、在描述同一個數(shù)據(jù)時疏之,可以有不同的方法殿雪。例如,你可以把相同的事情表述為:1%的銷售利潤了锋爪;15%的投資回報率;1000萬美元的利潤爸业;利潤上升40%(相比1935-1939年的平均水平)其骄;利潤相比去年下降60%。選擇一個目前最有利于你的說法扯旷。
八拯爽、相關(guān)關(guān)系與因果關(guān)系
1、謬誤:“如果B緊跟著A出現(xiàn)钧忽,那么A一定導(dǎo)致B”毯炮,更大的可能性是兩個因素并不互為因果,而同為第三個因素的產(chǎn)物耸黑。例如桃煎,學(xué)生中抽煙與低分經(jīng)常同時出現(xiàn),但不一定是抽煙導(dǎo)致的低分大刊。
2为迈、相關(guān)是通過相關(guān)系數(shù)這個精確的數(shù)據(jù)來證明兩件事物具有關(guān)聯(lián)關(guān)系,它可以有多種不同的類型。一種相關(guān)是由于機緣巧合產(chǎn)生的葫辐,由于機會的存在搜锰,你或許可以通過一組數(shù)據(jù)來證明一些根本不存在的結(jié)論,如硬幣百分百是正面朝上的耿战;聯(lián)合變動是兩者存在真實的關(guān)系蛋叼,但卻無法確定何為因、何為果剂陡,如收入與股票鸦列;還有一種相關(guān)是所有變量相互間沒有任何影響,但卻存在顯著的相關(guān)鹏倘,如抽煙與低分薯嗤。
3、需要留意超過了推斷相關(guān)關(guān)系的數(shù)據(jù)范圍而得出的結(jié)論纤泵。例如骆姐,一般雨下的越多,谷物長得越好捏题。但超過了一定的降雨量玻褪,則會轉(zhuǎn)化為負相關(guān)。
4公荧、相關(guān)顯示了一種趨勢(正相關(guān)或負相關(guān))带射,但這種趨勢通常不是理想的一對一關(guān)系。例如循狰,高個子男孩一般比矮個子男孩更重窟社,但也有例外。
5绪钥、兩個錯誤觀點:用真實的相關(guān)關(guān)系來支持一個未經(jīng)證實的因果關(guān)系灿里;一旦兩個事物共同變動,他們便存在因果關(guān)系程腹。
九匣吊、如何進行統(tǒng)計操縱
1、統(tǒng)計操縱:利用統(tǒng)計資料傳遞錯誤的信息而誤導(dǎo)他人寸潦。
2色鸳、常見的方法:利用地圖傳達與事實不符的印象(利用廣袤的偏遠地區(qū)的收入與政府支出相等來證明政府支出過多);利用小數(shù)點和百分數(shù)為不確切的事物蒙上精確的面紗(平均7.81比平均7.8顯得更有說服力)见转;偷換基數(shù)(將打五折表述為節(jié)省100%)命雀;將百分數(shù)直接相加(四項成本開支都上升5%,則總成本也是上升5%池户,并非20%)咏雌;百分比之間的比較(第一年ROI為3%凡怎,第二年為6%,既可以表述為增長了3個百分點赊抖,也可以說增長高達100%)等统倒。
3、在報紙氛雪、雜志或書籍中看到統(tǒng)計材料房匆、結(jié)論以及數(shù)據(jù)時,應(yīng)該經(jīng)過認真的思考后再接受它們报亩。
十浴鸿、對統(tǒng)計資料提出的五個問題
1、誰說的弦追?首先要尋找的是偏差岳链。出于利己的考慮,發(fā)布消息的一方可能制造偏差劲件。包括有意識的偏差和無意識的偏差掸哑。
a)有意識的偏差:錯誤的陳述或含糊不清之詞;刻意挑選適合的數(shù)據(jù)而丟棄不合適的數(shù)據(jù)零远;改動測量標準(在進行一種比較時確定了某年為基期苗分,而另一種比較時卻使用了更有利的年份);使用不正確的測量方法(簡單地使用“平均數(shù)”一詞)等牵辣。
b)無意識的偏差:權(quán)威人士是否是真的權(quán)威人士摔癣;當(dāng)某個權(quán)威人士被引用時,請弄清楚到底資料的內(nèi)容是權(quán)威的纬向,還是僅僅與權(quán)威人士沾邊(結(jié)論卻不是來自權(quán)威人士)择浊。
2、他是如何知道的罢猪?樣本是否有偏近她,是否足夠大能保證結(jié)論值得信賴?是否具有一定的顯著性膳帕?等等。
3薇缅、遺漏了什么危彩?樣本包含多少案例缺失時值得質(zhì)疑;對一個沒有經(jīng)過可信度(可能誤差泳桦、標準誤差)檢驗的相關(guān)不用太當(dāng)真汤徽;均值與中位數(shù)相差甚遠時,注意那些沒有表明類型的平均數(shù)灸撰;很多數(shù)據(jù)因為缺乏比較而變得沒有意義(在大霧的一周里有2800人死亡)谒府;僅給出百分數(shù)而缺少原始數(shù)據(jù)也能造成欺騙(1/3的女學(xué)生嫁給了大學(xué)老師拼坎,實際上只有3位女學(xué)生被錄取)完疫;有些文章遺漏了引起變化的原因(用今年4月銷售額高于去年來證明經(jīng)濟在復(fù)蘇泰鸡,然而去年復(fù)活節(jié)在3月今年則在4月)。
4壳鹤、是否有人偷換了概念盛龄?留心從搜集原始資料到形成結(jié)論的整個過程中,是否有人偷換了概念芳誓。用發(fā)病數(shù)替代更有意義的發(fā)病率余舶;被調(diào)查者不一定說了真話;將相關(guān)關(guān)系偷換成因果關(guān)系锹淌;標榜自己是某個特定領(lǐng)域的“第一”匿值;等等。
5赂摆、這個資料有意義嗎挟憔?當(dāng)所接觸的資料是建立在未經(jīng)證實的假設(shè)基礎(chǔ)上時,你可以發(fā)問库正,這個資料有意義嗎曲楚?例如用1947-1952的家庭電視機擁有數(shù)量增長速率來預(yù)測未來的擁有數(shù),是毫無意義的褥符。因為擁有數(shù)越接近飽和增長會放緩龙誊。
——著作權(quán)歸原作者所有——