△
傳染病預(yù)測中通常使用外推法牺六。
外推法只有一個假設(shè):假設(shè)未來是現(xiàn)在趨勢持續(xù)發(fā)展的結(jié)果。用統(tǒng)計學(xué)修正后會發(fā)現(xiàn)畏纲,外推法對指數(shù)增長的效果極差春缕。
當(dāng)預(yù)測涉及人類行為時(比如預(yù)測某種病毒善于在某一類人群中傳播),預(yù)測本身就會改變?nèi)说男袨榉绞剑ù蠹彝蝗婚g就開始注意個人衛(wèi)生了)票灰,而方式又會作用于預(yù)測(實際調(diào)查發(fā)現(xiàn)病毒在目標(biāo)人群中的傳播并不廣泛)。這類作用可以分為自我實現(xiàn)預(yù)測和自我否定預(yù)測兩類浸策。
△
芬蘭科學(xué)家漢娜 庫克將構(gòu)建統(tǒng)計或預(yù)測模型比作繪制地圖惹盼。
繪圖需要足夠多的細(xì)節(jié)才能真實地展現(xiàn)基本景觀手报,但過于復(fù)雜的模型又會將噪聲擬合進來,以至無法成功地復(fù)制內(nèi)在結(jié)構(gòu)掩蛤,使預(yù)測失敗盏档。
但過于簡單也不行。流行病學(xué)界懦窘,醫(yī)生所用的SIR模型就相當(dāng)?shù)睾唵危ㄊ加?927年)稚配。它只能對極少數(shù)病情有效。
簡單化是構(gòu)建模型應(yīng)有的追求午衰,但應(yīng)該是抓住核心本質(zhì)后的簡單化冒萄。哈佛大學(xué)的馬克 利普斯奇說:“根據(jù)3個數(shù)據(jù)點作預(yù)測是很愚蠢的尊流。”這三個點是1918崖技、1957和1968年迎献。
△
模型都會遺漏一些細(xì)節(jié),這些細(xì)節(jié)是否關(guān)系重大扒秸,取決于我們試圖解決的問題究竟是什么,還要看我們想要得到的答案有多精確宾巍。
模型也是幫助我們理解某一領(lǐng)域復(fù)雜性的工具渔伯,而不是用來取代整個領(lǐng)域的肄程。
△人與機器
在傳染病預(yù)測中,表面上還是模型的問題玄叠,但深層下依然是理論的問題拓提。不能對現(xiàn)實進行合理的簡化,不能抓住問題的重點寺惫,其實都是理論構(gòu)建不到位的緣故蹦疑。雖然是不同的領(lǐng)域,但存在的問題卻總是相似的:如果沒有在理論上做好足夠的準(zhǔn)備艇肴,貿(mào)然地認(rèn)為單憑數(shù)據(jù)就能解決問題的叁温,最后總要面對失敗的苦果膝但。
△前七章總結(jié)
表面上是“越依賴數(shù)據(jù)的領(lǐng)域,如果數(shù)據(jù)質(zhì)量越差娘侍,那么預(yù)測效果越差”泳炉。而實際原因則根源于人。出于人的動機花鹅,為了符合自己的理論氧腰,寧愿使用差的數(shù)據(jù),就會導(dǎo)致預(yù)測結(jié)果變差。
對比下前三章古拴,同樣的近似的情況下箩帚,因為克服了人的錯誤,預(yù)測效果馬上就變好了黄痪。而第四至第七章雖然是不同領(lǐng)域紧帕,講的其實是同一個問題:因為人的動機問題,最后導(dǎo)致的不但是整體預(yù)測效果的低下桅打,也阻礙了理論和技術(shù)的進步是嗜。
但正如“經(jīng)濟人”總是存在的一樣,人的動機問題也是客觀存在的挺尾。那么是否有辦法能解決這一問題,提高預(yù)測的精度呢遭铺?作者的答案是貝葉斯定理丽柿。
承認(rèn)我們天生帶有偏見,并保證說即使帶著偏見魂挂,我們依然能夠進步甫题,聽起來就很振奮人心。下一章開始锰蓬,作者會介紹如何在帶有個人偏見的前提下幔睬,通過應(yīng)用貝葉斯定理,來幫助我們克服自身的偏見芹扭,讓預(yù)測結(jié)果能更接近客觀真實麻顶。