在《對“偽心理學(xué)”說不》一書的第 10 章中,有這樣一個(gè)例子:
如果在每 1000 人中有 1 個(gè)人攜帶艾滋病的病毒(HIV)愕难,
再假設(shè)有一種檢查可以百分百地診斷出真的攜帶該病毒的人;
最后棘幸,假設(shè)這個(gè)檢查有 5% 的可能性四康,把沒有攜帶者說成是有古涧。
也就是說馍乙,這項(xiàng)檢查在沒有攜帶 HIV 的人中,也會錯(cuò)誤地檢測出有 5% 的人是攜帶病毒者炎辨。
假設(shè)我們隨便找一個(gè)人來進(jìn)行這項(xiàng)檢查岳锁,得到了呈陽性反應(yīng),亦即此人為 HIV 攜帶者蹦魔。
假定我們不知道這個(gè)人的患病史,那么他真的是 HIV 攜帶者的概率是多少呢?
如果憑直覺大概會猜答案是 95% 咳燕。
如果知道這是一道典型的條件概率題目勿决,大概會認(rèn)真對待:翻開書本,復(fù)習(xí)一下條件概率招盲,然后套公式(貝葉斯定理):
首先找準(zhǔn)事件:
設(shè) H 為攜帶 HIV 事件
設(shè) N 為沒有攜帶 HIV 事件
設(shè) + 為檢測為陽性事件然后可以得到:
P(H) = 0.1%
P(N) = 1 - P(H) = 99.9%
攜帶者接受檢測低缩,并檢測出陽性的概率:
P(+|H) = 100%
沒有攜帶者接受檢測,并檢測出陽性的概率:
P(+|N) = 5%問題是 P(H|+) 等于多少
得到:
P(H|+) = P(+,H) / P(+) = P(+|H) * P(H) / P(+)
= P(+|H) * P(H) / (P(+,H) + P(+,N))
= P(+|H) * P(H) / (P(+|H) * P(H) + P(+|N) * P(N))
= 1 * 0.1% / (1 * 0.1% + 5% * 99.9%)
≈ 0.01963
那么新的問題又來了曹货,如果沒學(xué)過(或者忘記了)條件概率咆繁,有沒有辦法得出“正確的”答案呢?
辦法還是有的顶籽,有一種很簡單的辦法玩般,能得到大致正確的答案。
關(guān)鍵思路是:把概率化作統(tǒng)計(jì)礼饱。
還記得題目問的是什么嗎坏为?一個(gè)檢測呈陽性的人真實(shí)患病的概率有多大究驴。這個(gè)問題可以略為簡化一下,看成是真實(shí)患病的人占被檢出陽性的人的比例有多大匀伏。
首先隨機(jī)找到 10,000 個(gè)人洒忧,根據(jù)條件,我們可以假設(shè)其中有 10 人患有艾滋补坏摺熙侍;
讓這 10,000 人接受檢查履磨,那么這患病的 10 人一定會被檢出陽性蛉抓;
被檢出陽性的人一共有多少呢?除去那真實(shí)患病的 10 人蹬耘,還有不患病的 9990 人芝雪,他們當(dāng)中被檢出陽性的人數(shù)是 9990 * 5% ≈ 500 (要是算是 499.5 的話,得到的答案跟前面的方法是一樣的)
那么這個(gè)比例就是: 10 / (10 + 500) ≈ 0.01961
這個(gè)簡單的方法并不總能都得到正確答案综苔,但足以用來評估大概數(shù)字惩系,做出正確決策(起碼不會猜 95% _ )。實(shí)際上這個(gè)方法得到的概率只會比正確答案要高如筛,不會低堡牡。
最后再來一個(gè)例子展示怎樣使用這個(gè)簡單的方法幫助我們做出正確判斷:
近來發(fā)生的多起恐怖活動(dòng)中,某教人士所占比例非常大杨刨,導(dǎo)致人們大都信仰某教的人抱有成見:信仰某教的人很有可能是恐怖份子晤柄。問題來了,信仰某教的人是恐怖份子的概率有多大呢妖胀?
已知的條件有:1, 假設(shè)恐怖份子都信仰某教 芥颈;2, 全球有 1/100 人口信仰某教;3, 恐怖份子人數(shù)占全球人口 1/10,000 赚抡。
按照“把概率化作統(tǒng)計(jì)”的思路:
假設(shè)全球有 100爬坑,000 人口,那么當(dāng)中的恐怖份子有 10 人涂臣,信仰某教的人數(shù)是 1,000 盾计,所以得到信仰某教的人是恐怖份子的概率只有 10 / 1,000 = 1%
考慮到信仰某教的實(shí)際人口比例比 1/100 要高,而恐怖份子則要比 1/10赁遗,000 低署辉,所以這種成見是沒有數(shù)據(jù)支持的。
重要
本文所述的簡單方法岩四,出自《x的奇幻之旅》
參考