萬萬沒想到?11月19日Day?11

科研的格調

《生活大爆炸》(The Big Bang Theory)是個很有意思的美劇,它說的是四個年輕物理學家的故事——或者說是他們的泡妞故事,如果你樂意的話。現(xiàn)在物理學家似乎正在變成令人感興趣的人群,套用劇中倫納德(Leonard)的話,簡直是“我們是新的阿爾法雄性(we are the new alpha males)”在四位男主角中盯质,最有意思的是謝爾頓·庫珀(Sheldon Cooper),我猜別人也會這么想概而。

謝爾頓非常聰明呼巷,而且他處處要告訴別人他非常聰明。物理學家聰明很正常赎瑰,但謝爾頓還非常博學甚至無所不知王悍,他號稱對世界上所有重要的事情都有可應用級別的知識(working knowledge)這種人存在嗎?《新京報》曾經(jīng)就這個問題采訪過該劇的物理負責人餐曼。答案是有些物理學家就是這么博學压储。

比如說因為夸克理論獲得諾貝爾物理獎的蓋爾曼(Murray Gell-Mann)就是這樣的人。我認為蓋爾曼是謝爾頓的原型源譬。第一集惋,蓋爾曼曾長期待在加州理工學院,只不過他的職位是教授而謝爾頓是博士后踩娘。第二刮刑,蓋爾曼非常聰明,而且處處要告訴別人他很聰明养渴。比如他喜歡用外國當?shù)氐臉藴拾l(fā)音來讀一個外國人名或地名(好吧雷绢,我承認這一點似乎更像劇中的霍華德)。這個逼著別人承認不如自己聰明的毛病使得蓋爾曼和謝爾頓一樣不受周圍人的歡迎理卑。第三翘紊,蓋爾曼非常博學。比如說傻工,所有物理學家都知道彩虹是怎么回事霞溪;很多物理學家知道是笛卡兒第一個科學地解釋了彩虹;但如果你想知道古人怎么看彩虹中捆,你得問蓋爾曼。蓋爾曼會告訴你各個古文明對彩虹的解釋坊饶。

我甚至覺得謝爾頓的長相也有點蓋爾曼的“意思”泄伪。我還真找到一張蓋爾曼年輕時的照片。


圖片發(fā)自簡書App


(左邊是蓋爾曼匿级,右邊是謝爾頓)

但本文真正要說的是蓋爾曼和謝爾頓的第四個共同點:兩人都看不上蟋滴,甚至可以說看不起染厅,理論物理之外的任何科學。

謝爾頓的姐姐有一次說津函,她很自豪謝爾頓是個“rocket scientist”肖粮。注意這里面有個典故,英文中“rocket science”(火箭科學)是個成語尔苦,指任何特別復雜的東西涩馆。比如你想說什么東西很簡單,就說這個東西不是rocket science.

但謝爾頓認為被當成“rocket scientist”是一種侮辱允坚。他說你還不如說我是金門大橋上的收費員魂那。在謝爾頓看來,理論物理學家比火箭科學家要高級得多稠项。

蓋爾曼也是這么想的涯雅。在蓋爾曼看來,純粹的理論物理展运,也就是說專門研究基本粒子相互作用活逆,超弦理論這種理論物理,是最高級的科學拗胜。因為這種科學研究的是世界的最基本定律划乖,而其他所有學科只不過是應用這些定律而已。

《費曼的彩虹》這本書生動地形容道挤土,蓋爾曼這種純理論物理學家看其他學科琴庵,就如同站在曼哈頓往西看整個美國。新澤西地區(qū)相當于其他的理論物理工作仰美,中部相當于實驗迷殿,而再往西一直到加州,則到處都是中國城之類完全沒格調的東西咖杂,相當于各種應用科學庆寺,比如說半導體之類。

物理學的格調比化學高诉字,就如同福賽爾《格調》說網(wǎng)球的格調比足球高一樣懦尝。蓋爾曼就是這種人∪榔裕《費曼的彩虹》的作者當初也在加州理工當教員陵霉,本來是想做超弦的,辦公室就在蓋爾曼隔壁伍绳。結果他后來改做量子光學踊挠,蓋爾曼立即打發(fā)他去別的樓層辦公,把辦公室騰出來給自己的研究生用冲杀。此書作者還曾經(jīng)嘗試寫劇本效床,立即被自己的研究生導師鄙視睹酌,因為他認為好萊塢都是垃圾。劇本的格調還不如小說剩檀。

我想看到這里憋沿,很多讀者要憤怒了。(免責聲名:我是做物理的沪猴,但我并不是做理論物理的辐啄,所以我也不在曼哈頓——如果這可以讓你好受一點的話。)

其實這種格調也許并不存在字币。蓋爾曼在加州理工的死對頭——費曼——就不贊成這個態(tài)度则披。費曼對所有物理領域都感興趣,他從來不認為量子光學是比量子色動力學低一等的科學洗出。

其實蓋爾曼和費曼對其他學科態(tài)度的不同士复,一個原因是他們的科學理念不同。蓋爾曼這一派的物理學家追求邏輯和數(shù)學的完美翩活,在他們眼中所有學科是以理論物理為核心的金字塔形阱洪。而費曼則有一點實用主義,他最關心的是怎么解釋自然現(xiàn)象菠镇,而不怎么追求數(shù)學上的完美冗荸。費曼說,為什么非得追求一個統(tǒng)一理論利耍?也許自然就是給四種力四個理論蚌本。我想費曼眼中的科學世界不是金字塔,而是是一個互相平等的網(wǎng)絡結構隘梨。

但費曼的確認為物理學比小說要難程癌。因為小說的想象不需要負責,而物理的想象需要一個實驗來判決轴猎。不管你多么喜歡你的理論嵌莉,跟實驗不符就是不行。

實際上捻脖,費曼鄙視很多東西锐峭。費曼極度鄙視哲學,連他的秘書都知道千萬別跟費曼談哲學可婶。費曼還一度強烈鄙視超弦(但在最后時刻還是跟蓋爾曼學了一點超弦)沿癞。另外,我們已知的還有費曼鄙視心理學扰肌,認為心理學全是扯淡抛寝。

我的問題是,既然所有學科中都有“道”曙旭,蓋爾曼的格調論和費曼的鄙視盗舰,是合理的嗎?

我認為它們是不客觀的桂躏,但是有道理的钻趋。因為一個人如果對所有東西都感興趣,他將無所適從剂习。也許要想干好一行蛮位,就必須愛這一行。而愛這一行鳞绕,就意味著“不愛”其他行失仁。所以一個科學家應該學會從心理上“鄙視”自己專業(yè)以外的其他學科。

科學本身是客觀的们何,但科學家都是主觀的萄焦。最好的科學家甚至可能是極度主觀的。有愛恨冤竹,才是真正的科學家拂封。敢說不,才是真正的科學家鹦蠕。

最后歡迎化學家們給自己找一個充分的理由來鄙視物理學冒签。

喝一口的心理學與喝一瓶的心理學

我有時候特別羨慕“實驗心理學家”和“行為經(jīng)濟學家”。他們常常能以非常直觀的邏輯钟病,在大學里找一幫學生受試者做一些特別方便的“實驗”萧恕,寫成一篇簡明易懂的論文,證明的不過是一個顯而易見的結論肠阱,然后還能經(jīng)常發(fā)表在《科學》之類的頂級刊物上票唆,并且被媒體和博客大肆報道。相比之下辖所,物理學家們就算投入幾百萬美元做實驗惰说,加上外行根本看不懂的理論推導,結論完全不顯然的情況下缘回,也未必能確保一篇PRL(物理評論快報)和15分鐘的名望吆视。

比如2007年《科學》上有一篇被報道了無數(shù)多次的論文,“Are Women Really More Talkative Than Men?(女人比男人更健談嗎)”研究的問題是人們都說女人話比男人多酥宴,多嗎啦吧?這篇文章的研究方法是在8年的時間跨度內(nèi)選取了6個大學,每個實驗進行4~10天拙寡,總共考察了男女共396名大學生授滓,讓他們只要是清醒的時候就佩戴一個錄音機記錄所說的話。這樣直接統(tǒng)計的結果是女生平均每天說16215個詞,男生每天說15669個詞般堆,相差7%在孝,因此女生似乎并不明顯比男生嘮叨。我對這個研究的評論是如果一個物理學家這樣搞科研的話早沒工作了淮摔。就算給他們八年時間私沮,他們都不知道重點考察中年以上婦女。

但是人們就是喜歡心理學和橙。本文并不是為了抒發(fā)怨念仔燕,其實我也喜歡心理學——我從來不在博客上談論自己寫的論文,卻經(jīng)常談論心理學實驗魔招。本文要說的是這些心理學實驗的一個重大弊端晰搀。

最近中文媒體上流傳非常廣泛的一個心理學實驗是德國人做的,說護身符的確能給人帶來好運办斑,因為這是一種積極的心理暗示外恕。這個研究的方法是:

在德國科學家進行的一場實驗中,數(shù)十人被叫來進行一場高爾夫比賽俄周,其中一半人被告知使用的是在多場比賽中給選手帶來好運的幸運球吁讨,而另一半人則被告知使用的只是普通球。比賽結束后峦朗,科學家發(fā)現(xiàn)使用“幸運球”的選手的擊球入洞率要比使用普通球的選手高出近40%建丧。

首先這是心理實驗庸俗化的一個典型例子,因為關于積極心理暗示效應的實驗早就汗牛充棟波势,比如在《怪誕行為學》這本書里就介紹了好幾個翎朱。其中一個說傳統(tǒng)上人們都認為亞洲學生數(shù)學好,而女生的數(shù)學不好尺铣,那么亞洲女生呢拴曲?在試驗中找一幫亞洲女生分成兩組做數(shù)學測驗。測驗前心理暗示其中一組在強調她們是亞洲人凛忿;另一組則強調她們是女生澈灼。結果果然,第一組的成績好于第二組店溢。

另一個更有意思的實驗則在考試之前向學生賣SoBe飲料(這是一種比較貴的飲料叁熔,我喝過,味道倒在其次床牧,瓶子做得挺好)荣回,只說這個飲料可能會有效果,但不一定是對腦力有好處(其實沒好處)戈咳。結果那些拒絕買和花全價買了SoBe的學生在測驗中成績相同心软,都是15道題平均答對9道壕吹,而那些被允許以一個折扣價買了這飲料喝的學生則只答對了6.5道。

據(jù)此删铃,我們是否應該佩戴護身符耳贬,應該在參加數(shù)學考試之前提醒自己是個亞洲人,并且千萬別喝減價飲料呢泳姐?很可能不是這樣的效拭。

這些實驗的弊端在于只做一次暂吉,而且還是在實驗室里胖秒。如果讓那些受試者每天都來參加這種考試,每天都是用幸運球比賽慕的,積極心理暗示還有用嗎阎肝?

提姆·哈福德(Tim Harford)在《誰賺走了你的薪水》(The Logic of Life)這本書中介紹了一個在我看來重要得多的實驗。在實驗室里肮街,受試者們分別扮演雇主和雇員风题,實驗發(fā)現(xiàn)如果雇主給雇員比標準工資高一些的工資的話,雇員也會自覺的干比標準要求多一點的活兒嫉父。實驗結論顯然是沛硅,意外的漲工資會帶來員工更努力工作的善意回報。但這一次經(jīng)濟學家并沒有滿足于此绕辖!

他們決定把實驗在生活中再做一次摇肌。他們在報紙上刊登廣告招來一批工人,然后隨機地給其中一些工人比廣告上說的更高的工資仪际。一開始似乎驗證了實驗室的結論围小,那些獲得意外高工資的人的確干的更加賣力——然而這種賣力只持續(xù)了不到半天。半天之后树碱,所有的工人都只干他們“該干”的活了肯适。

這個實驗使我想起百事可樂與可口可樂之爭。這兩種可樂的味道非常接近成榜,但如果你仔細品的話框舔,會發(fā)現(xiàn)百事可樂更甜一點,而可口可樂略帶一點酸味赎婚×跣澹可口可樂公司曾經(jīng)做過實驗顷啼,在不公布品牌的情況下把這兩種可樂倒在小杯里拆火,找一幫受試者品嘗虏冻。結果是大多數(shù)人認為百事可樂更好喝况鸣。

在實驗結果的刺激下可口可樂決定改良配方搔驼,使得味道更像百事可樂签赃,結果是慘遭失敾居咬腋!消費者抗議新配方。懷舊因素之外向瓷,一個重要原因在于在實驗室里喝一口和拿回家去喝一瓶肠套,感覺是兩碼事。如果只喝一口的話猖任,可能很多人認為汽水比茶好喝你稚。

目前大多數(shù)的心理學實驗,是“喝一口的心理學”朱躺,而不是“喝一瓶的心理學”刁赖。佩戴護身符的第一天也許會充滿正面的情緒,第二天可能就不好使了长搀,時間長了反而成為累贅宇弛,一天不戴可能還會恐慌。所謂“積極心理暗示”源请,其關鍵也許就在于讓受試者感到新鮮枪芒。

那么,如果一個人每天都能想象到一個不同的“積極心理暗示”谁尸,總能變著法地鼓勵自己舅踪,他是否會在長期尺度上比別人做得更好呢?我猜每個人都會有自己的看法良蛮,為了把這些個人看法變成無可爭議的結論抽碌,我們需要的還是,設計得非常合理的心理學實驗背镇。從這個角度說實驗心理學畢竟還真有可能是一門科學咬展。

醫(yī)學研究能當真嗎?

轉基因食品無害瞒斩。地震不可預測破婆。干旱氣候與三峽大壩無關。我們非常關心這些問題胸囱,科學家似乎明確地給出了答案祷舀,可是仍然有人無所適從。我們應該聽科學家的嗎烹笔?但科學家肯定也會經(jīng)常說錯裳扯。有時候他們說手機輻射可以導致腦癌,有時候又說這種效應根本沒有足夠的證據(jù)谤职。有時候他們說大蒜可以降低有害膽固醇饰豺,有時候又說大蒜其實不能降低有害膽固醇。在這種情況下允蜈,你應該怎么辦呢冤吨?

(a) 以最權威科學家蒿柳,比如諾貝爾獎得主或者《自然》上的論文的意見為主。

(b) 科學家中的“主流意見”(如果“主流”真的存在的話)為主漩蟆。

(c) 以最新發(fā)表的意見為主垒探。

(d) 別當真,科學新聞可以當娛樂新聞看怠李。

如果這條新聞說的是醫(yī)學研究圾叼,那么最理性的選擇是……(d),別當真捺癞。那些寫在晚報副刊上的各種所謂健康指南夷蚊,連看都別看。而那些刊登在主流媒體上翘簇,有最新的論文支持的科學新聞撬码,比如說英國某個團隊又發(fā)現(xiàn)什么東西對兒童的智力有新影響,我們大概可以看版保,但是看完就可以直接把它忘了。

更進一步夫否,如果這條新聞說的是營養(yǎng)學研究彻犁,比如吃某種維生素對身體有某種好處或壞處,那么哪怕是發(fā)表在最權威醫(yī)學期刊上的那些高引用率論文凰慈,也應該全部忽略汞幢。

說這句話的人叫埃尼迪斯(John P.A. Ioannidis),他是斯坦福大學預防醫(yī)學研究中心主任微谓。埃尼迪斯說森篷,“ignore them all(全部忽略)”.他攻擊的不僅僅是營養(yǎng)學,而是整個醫(yī)學研究豺型。2005年仲智,埃尼迪斯發(fā)表兩篇論文,證明大部分醫(yī)學研究都是錯的姻氨。這兩篇論文在醫(yī)學界被引用了好幾百次钓辆,但是沒有人說他這個看似無比偏激的結論是錯的。甚至沒人表示驚訝肴焊。所有搞醫(yī)學研究的科學家都知道這個秘密:醫(yī)學研究根本不靠譜前联。

但是這件事一直到2010年底才引起公眾的關注。首先是大西洋月刊發(fā)表充滿憤怒的長文娶眷,標題采用英國首相和馬克吐溫發(fā)明的著名句式:“謊言似嗤,該死的謊言和醫(yī)學研究”。時代周刊立即跟進届宠,并把結論進一步精簡為“90%的醫(yī)學研究都是錯的”! 《時代周刊》這篇報道說烁落,現(xiàn)在已經(jīng)有人開始真正認真地重新審視整個醫(yī)學科研壳咕,而且立即發(fā)現(xiàn)了幾個與我們此前的知識完全相反的結論,比如:

· 沒事兒自己檢查乳房顽馋,不但不會降低乳房癌的死亡率谓厘,沒準還有壞處;

· 其實科學家并沒有足夠證據(jù)說注射流感疫苗對防治流感有效寸谜。

由埃尼迪斯兩篇論文引發(fā)的這場醫(yī)學暴動仍在進行之中竟稳。2011年一月的新聞周刊報道,又有兩個醫(yī)學常識被干掉了:

· 不僅僅是大蒜熊痴,如果服藥者本人沒有心臟病史的話他爸,就連那些專門的降低膽固醇的藥,其實都沒什么作用果善;

· “補鈣要加D”純屬扯淡——我們幾乎每個人都已經(jīng)有足夠多的維生素D诊笤,根本不需要從鈣片和善純片里獲得。新的報告說巾陕,一般人可以從陽光中(白人每天日照5分鐘讨跟,有色人種15~20分鐘)獲得維生素D,而少數(shù)青春期女生和老人也許需要通過從食物中補充一點鄙煤。

所以《新聞周刊》有充分的理由把這篇報道的標題定為“為什么幾乎所有你聽說的醫(yī)學都是錯的”晾匠。

科學新聞常常教育我們要用現(xiàn)代醫(yī)學的常識去反駁民間偏方,用科學家的論文去反駁普通人的常識梯刚,再用歐美科學家的論文去反駁中國科學家的論文凉馆。然而埃尼迪斯說歐美科學家的論文其實也不可靠,錯誤率是90%亡资?民間偏方?jīng)]準還比這個好點澜共。所以以上這幾篇報道大概也有點標題黨,我們必須看看埃尼迪斯到底說了什么锥腻。

他一篇發(fā)表在PLoS Medicine上的文章說嗦董,在醫(yī)學研究中被廣泛使用的統(tǒng)計方法,其實是個非常脆弱的體系旷太。如果你的一項研究是考察某種藥物對人的健康是否有好處展懈,而你希望能證明有好處的話,你將很容易做到這一點供璧。首先存崖,現(xiàn)在大部分醫(yī)學科研研究的效應其實都是比較微弱的,因為不微弱的效應別人早就研究完了睡毒。其次来惧,什么是對健康有好處?也許一個病人的病情并沒有什么明顯好轉演顾,但因為你希望這個藥物有效供搀,你也許會完全無意識的刻意去尋找他好轉的證據(jù)隅居,你可能會把本來沒什么好轉的病人當成好轉的病人。這就是你的偏見葛虐。埃尼迪斯這篇論文其實全是數(shù)學胎源,他做了一番計算,說如果這個微弱效應有10%屿脐,而你的偏見有30%的話涕蚤,你的實驗得到正確結論的概率只有20%。

科學家是有偏見的的诵。他可能因為拿了醫(yī)藥公司的資助而希望證明一個藥物的療效万栅,他更可能為了能發(fā)表有轟動效應的論文而追求驚人的結果。鑒于10%的效應率和30%的偏見率差不多就是一般流行病學研究的水平西疤,我們大概可以說80%的流行病學研究都是錯的烦粒。根據(jù)同樣的計算,小規(guī)模隨機試驗的可信性也只有23%代赁。埃尼迪斯這篇文章就是用數(shù)學方法證明這種偏見有多可怕扰她。

光玩數(shù)學當然不行,批評現(xiàn)實得有真實證據(jù)管跺。這正是埃尼迪斯另一篇論文要完成的任務义黎,它發(fā)表在權威期刊JAMA上。沒有人能把所有醫(yī)學論文都研究一遍豁跑,所以他的做法相當具有戲劇性:他只看1990年到2003年間發(fā)表在頂級臨床醫(yī)學期刊上的頂級論文,入選標準是被引用超過1000次泻云。符合這個標準的論文一共有49篇艇拍,其中45篇聲稱發(fā)現(xiàn)了某種有效的藥物或者療法。

我們都知道科學結果必須都是可重復的宠纯,我們不知道的是有多少科學結果真的被人重復過卸夕。這45篇論文雖然都被引用了千次以上,其中只有34篇被重復檢驗過婆瓜。

而后人檢驗的結果是其中7篇的結論是錯誤的快集。比如有一篇論文說維生素E對降低男子冠心病風險有好處,有一篇論文說維生素E對降低女子冠心病風險有好處廉白,而后來的大規(guī)模隨機實驗則證明維生素E對降低冠心病風險根本沒好處个初。另有7篇論文被發(fā)現(xiàn)是夸大了有效性。也就是說34篇經(jīng)過檢驗的論文中的14篇(41%)猴蹂,被發(fā)現(xiàn)結論有問題院溺。這45篇最權威的論文中只有20篇接受了并扛過了時間的考驗。

頂級論文尚且如此磅轻,一般論文又能怎么樣呢珍逸?真有90%都不可靠嗎逐虚?我從未發(fā)現(xiàn)埃尼迪斯說過“90%的醫(yī)學研究都錯了”這句話,時代周刊的報道的確是標題黨谆膳。

埃尼迪斯說的不是90%叭爱,而是431/432。沒有人能徹查所有醫(yī)學論文漱病,所以埃尼迪斯的做法是選擇一個熱門領域买雾,徹查這個領域內(nèi)所有的論文。這個領域是研究男女患各種疾病的風險不同缨称,是不是因為基因的影響凝果。在2007年JAMA(美國醫(yī)學會雜志)的一篇論文中,埃尼迪斯與合作者找到這個領域的所有77篇論文睦尽,然后逐篇分析這些論文處理數(shù)據(jù)的方法是否足夠嚴謹器净。這些論文一共提出了432個論斷,其中只有60個論斷可以稱得上是方法嚴謹当凡。而這60個拿得出手的論斷中山害,曾經(jīng)被其他研究至少重復驗證了兩次的,只有一個沿量。

如果我們對正確科學論斷的要求是方法嚴謹浪慌,結果至少經(jīng)過兩次檢驗,那么這個領域的合格率只有1/432朴则。如果我們放寬要求权纤,只要一篇論文不被證明是錯的,就算它是好論文乌妒,那么發(fā)表在最權威期刊上的被引用次數(shù)最多的醫(yī)學論文中汹想,有7/45是壞論文。

這7篇壞論文中的兩篇說維生素E可以降低冠心病風險撤蚊,而事實上古掏,后來2000年《新英格蘭醫(yī)學雜志》上就有文章用超過9000人的嚴格隨機實驗證明維生素E根本不能降低冠心病風險,這一結論從此之后再也沒被推翻過侦啸。那么到底有多少科學家知道這件事兒呢槽唾?埃尼迪斯等人曾經(jīng)專門調查了到底有多少論文還在使用“維生素E降低冠心病風險”這個錯誤知識,結論是一直到2005年光涂,仍有50%的新發(fā)論文還在引用前面那兩篇錯誤的頂級論文庞萍,并且以為它們是對的。

如果你現(xiàn)在隨便找個中國醫(yī)生問他維生素E是否對冠心病有好處顶捷,我敢打賭他說有好處挂绰。我在谷歌搜索“維生素E冠心病”,第一頁的結果全是說有好處,它甚至已經(jīng)作為常識進入各種醫(yī)學網(wǎng)站葵蒂。

肯定有人因為看了2000年之前的新聞報道而大吃維生素E來降低冠心病風險交播。肯定有人還在吃大蒜降膽固醇践付∏厥浚肯定有人還在補鈣加D。

把學術論文的結論推廣為真實世界的真理永高,有時候是非常危險的事情隧土。因為不理解科學研究的思維方式,導致大多數(shù)人對科學有兩個重大誤解:第一命爬,認為科學研究絕對真理曹傀;第二,認為每一項科研都是在生產(chǎn)我們?nèi)粘Q策的答案饲宛。真實的科學研究其實一個充滿曲折皆愉,甚至有時候錯進錯出的過程。

更重要的是艇抠,科學的野心其實比公眾設想的小幕庐。而恰恰是因為這個原因,科學才有這么強大的力量家淤。很多論文不嚴謹异剥,甚至很多都是錯的,這并不表明科學中沒有正確答案絮重,它只是表明得到和判斷正確答案并不簡單冤寿。

科學報道都是用人類傳統(tǒng)語言寫成的,而科學研究使用的卻不是傳統(tǒng)的人類語言青伤。所謂“科學方法”疚沐,其實是另一套很不一樣的思維方式。今天醫(yī)學研究的悲催現(xiàn)狀并不見得就說明科學方法不行潮模。科學方法痴施,是一種超越了人類本能的思維方式擎厢。一個簡單的問題是我們憑什么相信“維生素E不能降低冠心病風險”這個結論就是對的?因為有些科學方法比另一些科學方法更可信辣吃《猓看新聞不如看論文,看一篇論文不如把多篇論文綜合在一起看(稱為meta-analysis)神得,而且有時候這么看還是不行±宓耄現(xiàn)代社會中的智者,應該掌握這一套思維方式哩簿。

科學是成年人玩的東西宵蕉。我認為抱著謙卑的情緒去“仰望科學”是個錯誤的態(tài)度酝静,正確的視角應該像下棋一樣,是俯視羡玛。

***

其他醫(yī)學研究者并沒有對Ioannidis揭示的現(xiàn)狀無動于衷别智。有一個成立于1993年的叫做考科藍協(xié)作(Cochrane Collaboration)的國際組織,就正在專門嚴格審視各種醫(yī)學研究稼稿,并且推出了很多報告薄榛,而且他們也采納了埃尼迪斯提出的審查方法。這個組織特別強調經(jīng)費只來自于政府让歼,大學和私人捐款敞恋,而不拿醫(yī)藥公司的錢。

真空農(nóng)場中的球形雞

美劇《生活大爆炸》曾經(jīng)講過一個好多觀眾沒聽懂的笑話谋右。說有一個農(nóng)民發(fā)現(xiàn)自己養(yǎng)的雞都不下蛋了硬猫,于是他找了一個物理學家?guī)兔ΑN锢韺W家做了一番計算之后宣布我已經(jīng)找到了一個解倚评!但是這個解只對真空農(nóng)場中的球形雞有效浦徊。這個笑話的意思是物理學家使用了一個過分簡化的模型去模擬真實世界。

更有效的模型大概需要考慮在空氣中傳播的病毒對存在空氣的農(nóng)場中的有下蛋器官的雞的影響天梧。但不管你使用什么模型盔性,你必須得使用一個模型。任何科學研究中的任何計算都是針對科學家選擇的模型呢岗,而不是針對“真實世界”本身冕香。

有時候簡化的模型已經(jīng)足夠好,比如我們要計算天體運行的軌道后豫,把任何恒星和行星都簡化為沒有體積的質點就可以了悉尾。有時候是不得不簡化。比如說如果要模擬全球氣候挫酿,大概要考慮洋流運動和南北極冰川的影響构眯,那么要不要考慮云的變化?要不要考慮太陽黑子的影響早龟?要不要考慮植物分布的影響惫霸?要不要考慮冰島火山爆發(fā)、喜馬拉雅山葱弟、貝加爾湖壹店、三峽大壩和中國春運的影響?在有限計算能力下不可能都考慮芝加。但世界的復雜性并不是我們必須使用模型的本質原因硅卢。

我們必須使用模型的本質原因是,我們對世界的觀察是主觀的〗埽霍金和蒙洛迪諾(Leonard Mlodinow)在《大設計》這本書里講了一個金魚的故事脉顿,說意大利蒙扎(Monza)市禁止在彎曲的碗狀魚缸里養(yǎng)金魚,因為從彎曲的魚缸往外看會看到一個扭曲了的現(xiàn)實抬旺,這對金魚“太殘酷了”弊予。對此霍金提出了一個莊子式的問題:我們又怎么知道我們看到的現(xiàn)實不是扭曲的?金魚仍然可以對魚缸外部的世界總結一套物理定律开财。也許因為坐標系彎曲汉柒,金魚總結的物理定律會比我們總結的要復雜一點,但簡單只是個人品位责鳍,金魚的物理學同樣正確碾褂。

從這個角度說,所有物理定律历葛,乃至所有科學理論正塌,都只不過是主觀模型。托勒密的理論說地球靜止恤溶,太陽繞著地球轉乓诽;而哥白尼的理論說太陽靜止,地球繞著太陽轉——這兩個模型其實都可以用咒程,只不過其中一個比另一個更好用一點鸠天。

物理學革命其實就是用一個模型取代另一個模型。我們可以把力解釋成一種波動的場帐姻,或者空間的彎曲稠集,或者一堆粒子的來回傳遞,或者又把各種粒子解釋成弦的震動饥瓷。當物理學家發(fā)明這些模型的時候剥纷,他們心里想的并不是“真實的力到底是什么東西呢?超弦理論符合我的世界觀嗎呢铆?”這種哲學問題晦鞋,他們想的是什么模型有效就用什么模型!

也許與模型無關的“現(xiàn)實概念”根本就不存在棺克,霍金把這個思想叫作“依賴模型的現(xiàn)實主義(model-dependent realism)”鳖宾。這聽上去有點像中國人說的“道可道非常道”,又有點像《論語》里面每次有不同的人問孔子“仁”是什么逆航,孔子都給一個“依賴提問者的仁的定義”。但實際上這里面說的是科學這門業(yè)務的工作方式渔肩,是從來不直接追求那個“最后的因俐,真正的現(xiàn)實”,而只是不停地用不同的模型去模擬現(xiàn)實。

也許有些科學家的確相信絕對真理的存在抹剩,但科學研究從來不涉及絕對真理撑帖。哲學才研究絕對真理“木欤科學研究的是“有效的真理”胡嘿,是“有限的真理”。兩個古代哲學家坐在那里談論“天道”钳踊,說來說去只能是空對空衷敌。科學方法的第一個智慧就是我不直接用心去跟“天道”對話拓瞪,我做幾個實驗缴罗,總結幾條規(guī)律,形成一個不求“天道”但求有效的“模型”祭埂。

所以當一個科學家說一個真實世界中的什么東西會發(fā)生什么情況的時候面氓,他說的實際意思是在他使用的那個模型里,這個東西對應的變量發(fā)生了什么狀況蛆橡。他說的是真空農(nóng)場中的球形雞舌界。

在所有科學模型中理論物理是最成功的,而且成功到了不可思議的地步泰演。量子電動力學并不是物理學家關于世界的最新模型呻拌,它把各種基本粒子都簡單地當作球,完全不考慮原子核內(nèi)部的相互作用粥血,沒有引力柏锄,但它卻是一個相當完美的模型。它只用非常簡單的幾個方程复亏,就能夠描寫原子核和引力之外幾乎所有現(xiàn)象趾娃,而且這個模型無比精確。費曼曾經(jīng)在一本通俗讀物里自豪地寫道缔御,量子電動力學計算的電子自旋磁矩是1.00115965246個玻爾磁子抬闷,而實驗測量的值1.00115965221,這個誤差相當于橫跨美國東西海岸耕突,計算從波士頓到帕薩迪納的距離笤成,結果只差一根頭發(fā)絲那么細。

我們可以無比準確地預言每一次日食眷茁,可以攔截導彈炕泳,甚至可以用遙控方法把探測器精確地放置在火星表面指定的地點。這些并不完美的物理模型是如此的足夠完美上祈,有些人錯誤地以為科學就應該提供精確的答案培遵。但事實是很多重要問題的模型根本做不到這一點浙芙。2008年金融危機給人的印象就是所有正規(guī)經(jīng)濟學家都沒有預見到。格林斯潘說:“我們都錯誤判斷了這個風險籽腕。所有人都沒想到——學術界嗡呼、聯(lián)儲、監(jiān)管者皇耗∧洗埃”一時之間批評經(jīng)濟學成了時尚,很多人認為經(jīng)濟學根本不能算科學郎楼。

我不知道經(jīng)濟學模型算不算科學万伤,但的確有正規(guī)經(jīng)濟學家,在不使用陰謀論的情況下箭启,預警過這場金融危機壕翩。去年,2500名經(jīng)濟學家投票選出了對這次危機的最好預測:史蒂夫·金(Steve Keen)早在1995年就搞了一套理論模型傅寡,并且從2006年開始使用這個模型每月發(fā)布預警報告放妈;魯里埃爾·魯比尼(Nouriel Roubini)在2005年就指出美國房價會在3年內(nèi)跌30%;而迪恩·貝克(Dean Baker)則從2002年開始反復說房價是個泡沫荐操。我們可以看到芜抒,這些預測是有限的,不論是金融危機的規(guī)模還是爆發(fā)時間托启,它們都遠遠談不上準確宅倒。

無論如何,嘲笑經(jīng)濟學模型是從事“硬科學”的科學家屯耸,甚至是所有學者最愛干的事情之一拐迁。看完《金融時報》上一個歷史學家嘲笑經(jīng)濟學家的文章之后疗绣,一個物理學家笑了线召。他說我看經(jīng)濟學模型還算好的,氣候模型還不如經(jīng)濟模型多矮。經(jīng)濟學家至少知道模型里面“經(jīng)濟人”是什么東西缓淹,而氣象學家根本不知道氣候模型里的云和海洋混合(ocean mixing)是怎么回事。

他說的是關于模型的重大問題:如果你根本沒搞清楚所有的原理和機制塔逃,你做的簡化距離真實世界非常遙遠讯壶,你的模型還有意義嗎?物理學家弗里曼·戴森(Freeman Dyson)認為沒意義湾盗。他說:

我沒有氣象學位伏蚊,所以我大概沒資格談論這個話題「穹啵可是我也研究過這些氣象模型丙挽,我知道它們能干什么肺孵。這些模型對大氣和海洋的流體力學方程可以解得很好,但是它們對云颜阐、塵埃、地表和森林中生化過程的描寫很差吓肋。它們根本談不上描寫我們生活的這個真實世界……這就是為什么搞氣象模型的這幫人只不過是自己相信自己的模型而已凳怨。

那么IPCC(國際氣候變化委員會)怎么評價氣象模型呢?在2007年報告的一個FAQ(常見問題解答)中是鬼,IPCC表示它對這些模型非常自信肤舞。但是在我看來,這份文字寫得有點不夠意思均蜜。IPCC說這些模型的基本原理是建立在動量能量守恒之類的基本物理定律上的李剖,而且還有大量觀測事實作為支持。它沒說的是模型的“非基本原理”囤耳,比如戴森說的那些東西篙顺,是怎么處理的,更沒說這些非基本原理能起到多大作用充择。IPCC還說這些模型能夠成功地模擬當前氣候德玫,而且還成功再現(xiàn)了過去100年的氣候變化。沒錯椎麦,但IPCC沒說的是這正是那些“大量觀測事實”支持的結果宰僧,是用這些觀測事實調參數(shù)湊答案的結果(叫做“parameterization”),這些模型在很大程度上是基于經(jīng)驗的观挎。

其實琴儿,調參數(shù)沒有什么不對。根據(jù)“依賴模型的現(xiàn)實主義”這個精神嘁捷,你怎么就能說基本物理定律不是基于經(jīng)驗的呢造成?氣象學家可能的確不怎么理解云,但難道物理學家就敢說自己真的理解電子嗎普气?所以我認為戴森的批評等于說黑貓肯定不如白貓谜疤,并不重要。重要的是氣象模型預測未來的能力怎么樣现诀。

有一個關于天氣預報的笑話是這么講的夷磕。有人打電話到電臺問你們每天預報的降雨概率到底是怎么算出來的?主持人回答說我們一共有十個預報員仔沿,每天投票預報坐桩,如果有3個人認為會下雨,我們就說降雨概率是30%封锉。IPCC預測未來的辦法跟這個有點類似绵跷。一個最常用的辦法膘螟,是把各個不同氣候模型綜合起來取平均值。比如把12個國家的17個研究組使用的24個模型取平均碾局。

下面這張圖來自IPCC網(wǎng)站的那個FAQ荆残,其用現(xiàn)有模型去模擬過去100年的溫度變化,看看是否符合觀測結果净当。圖中雜亂的線是使用14個不同氣候模型進行的58次模擬的結果内斯,而單條灰色線則是這些結果的平均值,它與實際觀測值(黑線)相當接近像啼。

我們可以仔細想想這個事情俘闯。IPCC的這個做法相當于投票選舉真理。如果我們對氣候的認識是完美的忽冻,如果科學家明確知道自己在做什么真朗,那么世界上應該只有一個氣候模型。現(xiàn)在這種讓大家都算一算然后取個平均值的做法僧诚,等于說我們不知道到底哪個是對的遮婶,其根本原因在于模型中的物理機制和參數(shù)有很多不能確定的地方。而這張圖則說明這個做法的效果還不錯振诬!


圖片發(fā)自簡書App


但既然你的模型中有很多參數(shù)都是用歷史數(shù)據(jù)擬合出來的蹭睡,這些模型能夠再現(xiàn)歷史就不奇怪,最關鍵的測試還是你能不能預測未來赶么。2007年《科學》上的一篇論文比較了IPCC在1990年對未來氣候的預測肩豁,與從1990到2006期間的實際觀測。圖中虛線是IPCC的預測辫呻,實線則是觀測值清钥。

這是一個非常有意思的結果。盡管我們一再被告知二氧化碳濃度上升主要是人為的放闺,但IPCC對二氧化碳濃度的上升卻預測得非常準確(文中解釋祟昭,這是一個巧合)。它預測得不太準確的是溫度上升怖侦,它預測得更不準確的則是海平面的上升篡悟。但最驚人的是IPCC不是高估了溫度和海平面上升,而是低估了匾寝。實際情形比IPCC警告我們的更壞搬葬。


圖片發(fā)自簡書App


這張圖至少說明在簽署京都議定書期間,IPCC的模型不是故意夸大危險來忽悠世人艳悔。此圖用的都是1990年的舊模型急凰,那么新模型們是否表現(xiàn)得更好呢?一份非正式的研究猜年,把IPCC 2007年的新報告與從2007到現(xiàn)在的實際觀測比較抡锈,則發(fā)現(xiàn)IPCC高估了溫度的上升疾忍。

所以用模型預測未來是非常困難的事情,越復雜的模型就越困難床三,而且越細致的未來就越不好預測一罩。我們看到預測海平面上升已經(jīng)比預測溫度上升困難,那么如果有人想進一步預測全球變暖帶來的惡劣氣候導致多少“氣候難民”撇簿,我們就可以想見那是不可能準確的擒抛。聯(lián)合國環(huán)境規(guī)劃署曾經(jīng)在2005年預測到2010年沿海地區(qū)將會有50萬氣候難民,結果到今年人們發(fā)現(xiàn)這些地區(qū)的人口不減反增补疑。那么聯(lián)合國網(wǎng)站怎么辦?第一歹撒,刪除原有預測(有人還是保留了一份證據(jù))莲组;第二,不解釋暖夭;第三锹杈,50萬難民的預測時間現(xiàn)在被改成2020年了。

不要特別相信那些復雜的模型能對未來做出的復雜預測迈着。問題是新聞記者總是比科學家更相信模型竭望。2011年初一份氣候預測報告說未來十年溫度將上升2.4℃并導致全球糧食短缺,科學家很快發(fā)現(xiàn)報告存在嚴重錯誤并且立即撤回了報告裕菠,可是這時候這個新聞已經(jīng)被無數(shù)媒體廣泛報道過了咬清。

2009年,英國女王伊麗莎白質問經(jīng)濟學家說你們就怎么都沒預測到這次金融危機呢奴潘?經(jīng)濟學家們回信說旧烧,經(jīng)濟學這個工作都是各自為戰(zhàn)研究具體領域內(nèi)的小問題的,我們并沒有坐在一起對世界經(jīng)濟這個整體發(fā)揮“集體想象力(collective imagination)”画髓。換句話說掘剪,他們玩的都是小模型,沒玩過這么大的奈虾。

科學家也是這樣夺谁,一般情況下不想玩大的∪馕ⅲ科學家玩模型最大的目的其實是想解決小問題匾鸥,是想通過模型來發(fā)現(xiàn)和證實一些小機制。所有玩模型的科學家都知道自己模型的局限性浪册∩ㄏ伲可是公眾和政客非逼著你預測。如果非得預測大的不可村象,最好還是用IPCC這種多個模型取平均值的辦法笆环,也叫“發(fā)揮集體想象力”攒至。

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市躁劣,隨后出現(xiàn)的幾起案子迫吐,更是在濱河造成了極大的恐慌,老刑警劉巖账忘,帶你破解...
    沈念sama閱讀 219,366評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件岂膳,死亡現(xiàn)場離奇詭異,居然都是意外死亡亏栈,警方通過查閱死者的電腦和手機芋忿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蒋荚,“玉大人戳稽,你說我怎么就攤上這事∑谏” “怎么了惊奇?”我有些...
    開封第一講書人閱讀 165,689評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長播赁。 經(jīng)常有香客問我颂郎,道長,這世上最難降的妖魔是什么容为? 我笑而不...
    開封第一講書人閱讀 58,925評論 1 295
  • 正文 為了忘掉前任乓序,我火速辦了婚禮,結果婚禮上舟奠,老公的妹妹穿的比我還像新娘竭缝。我一直安慰自己,他們只是感情好沼瘫,可當我...
    茶點故事閱讀 67,942評論 6 392
  • 文/花漫 我一把揭開白布抬纸。 她就那樣靜靜地躺著,像睡著了一般耿戚。 火紅的嫁衣襯著肌膚如雪湿故。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,727評論 1 305
  • 那天膜蛔,我揣著相機與錄音坛猪,去河邊找鬼。 笑死皂股,一個胖子當著我的面吹牛墅茉,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 40,447評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼就斤,長吁一口氣:“原來是場噩夢啊……” “哼悍募!你這毒婦竟也來了?” 一聲冷哼從身側響起洋机,我...
    開封第一講書人閱讀 39,349評論 0 276
  • 序言:老撾萬榮一對情侶失蹤坠宴,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后绷旗,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體喜鼓,經(jīng)...
    沈念sama閱讀 45,820評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,990評論 3 337
  • 正文 我和宋清朗相戀三年衔肢,在試婚紗的時候發(fā)現(xiàn)自己被綠了庄岖。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,127評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡角骤,死狀恐怖顿锰,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情启搂,我是刑警寧澤,帶...
    沈念sama閱讀 35,812評論 5 346
  • 正文 年R本政府宣布刘陶,位于F島的核電站胳赌,受9級特大地震影響,放射性物質發(fā)生泄漏匙隔。R本人自食惡果不足惜疑苫,卻給世界環(huán)境...
    茶點故事閱讀 41,471評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望纷责。 院中可真熱鬧捍掺,春花似錦、人聲如沸再膳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽喂柒。三九已至不瓶,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間灾杰,已是汗流浹背蚊丐。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留艳吠,地道東北人麦备。 一個月前我還...
    沈念sama閱讀 48,388評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親凛篙。 傳聞我的和親對象是個殘疾皇子黍匾,可洞房花燭夜當晚...
    茶點故事閱讀 45,066評論 2 355