在COVID-19(新型冠狀病毒肺炎)疫情的背景下蟀拷,人們接觸到更多的統(tǒng)計學(xué)名詞:空白對照組制市、設(shè)計雙盲隨機對照試驗、核酸檢測陽性率暖庄、提高治愈率聊替,降低病亡率等。例如鐘南山院士在介紹廣醫(yī)防疫經(jīng)驗時就提到了空白對照和雙盲隨機對照培廓。
大敵當(dāng)前惹悄,坦白說,你敢用空白對照嗎医舆?如果他發(fā)展得很重怎么辦俘侠?
在治療第一、科研第二的情況下蔬将,我們怎么能設(shè)計雙盲隨機對照爷速?不可能。
中國在抗擊新冠疫情中的謹(jǐn)慎霞怀,不僅體現(xiàn)在臨床試驗的方案設(shè)計上惫东,而且在多版《新型冠狀病毒肺炎診療方案》中對用藥的劑量都有明確的規(guī)定。現(xiàn)代藥物對人體功能的影響似乎是非常精確的毙石,一毫克或兩毫克的劑量就可以引起血壓或神經(jīng)的巨大變化廉沮。
不過,藥理學(xué)研究已經(jīng)證明徐矩,這些影響因素是用概率分布理論設(shè)計和分析的滞时,它們實際上是概率分布的參數(shù)。統(tǒng)計的基本思想在于滤灯,科學(xué)研究的真實對象是數(shù)據(jù)的概率分布坪稽。
統(tǒng)計學(xué)名詞對于我們來說或許有點陌生,但是當(dāng)人們解決問題沒有十足的把握時鳞骤,一般都會用概率進行表達窒百。當(dāng)我們運用概率的時候,一般就是人類承認(rèn)自己的無知豫尽。
概率僅僅是我們無知程度的度量篙梢。 -- 亨利·龐加萊
我們認(rèn)識的所有的「確定性」是「不確定性」,概率是對「不確定性」的測度美旧。人們花了很大的精力用于讓人們理解概率渤滞,試圖將概率的數(shù)學(xué)思想與現(xiàn)實生活聯(lián)系起來贬墩。
那么,人們真的理解概率嗎蔼水?
概率在現(xiàn)實生活中意味著什么震糖?這也是柯爾莫哥洛夫最后的問題。
01 數(shù)據(jù)
北京時間2020年4月24日凌晨趴腋,WHO(世界衛(wèi)生組織)官網(wǎng)發(fā)布了瑞德西韋治療重癥COVID-19的臨床試驗研究結(jié)果吊说。
數(shù)據(jù)顯示,這項瑞德西韋治療重癥COVID-19的臨床試驗原計劃入組453例优炬,實際入組237例颁井,其中瑞德西韋治療組158例,標(biāo)準(zhǔn)治療對照組79例蠢护,死亡率分別為13.9%和12.8%雅宾,無統(tǒng)計學(xué)差異。結(jié)果認(rèn)為葵硕,瑞德西韋治療未明顯改善COVID-19重癥患者臨床癥狀眉抬。
該研究團隊隨即在官網(wǎng)上發(fā)布聲明,表示此項試驗由于入組率過低而提前終止懈凹,其結(jié)果很難具有統(tǒng)計學(xué)意義蜀变。隨后WHO發(fā)言人稱無意間發(fā)布了研究團隊提供的初稿,在意識到失誤后隨即撤下介评。
北京時間2020年4月30日库北,王辰院士以及曹彬教授所領(lǐng)銜的科研團隊于The Lancet發(fā)表題為《Remdesivir in adults with severe COVID-19: a randomised, double-blind, placebo-controlled, multicentre trial 》的研究,評估了瑞德西韋用于出現(xiàn)較嚴(yán)重臨床癥狀的新冠肺炎確診病患的療效们陆,根據(jù)論文得出的結(jié)論寒瓦,與安慰劑組相比,通過瑞德西韋治療并不能加快 COVID-19 患者的恢復(fù)速度坪仇,也不能減少 COVID-19 患者的死亡杂腰。
02 模型
對于被WHO泄露的實驗設(shè)計中,不同的治療方法是隨機分配給患者的椅文。實驗啟動后觀察結(jié)果颈墅,假設(shè)兩種療法具有相同的效果。由于患者和療法的匹配是隨機的雾袱,因此任何其他分配方式都會得到類似的結(jié)果。
隨機的療法標(biāo)簽對結(jié)果沒有影響官还,可以在患者之間調(diào)換——前提是兩種療法具有相同的效果芹橡。因此,該試驗的事件空間就是可以實現(xiàn)的所有可能隨機分配方式的集合望伦。
瑞德西韋治療組和標(biāo)準(zhǔn)治療對照組的顯著性檢驗林说,屬于兩個樣本率差異的顯著性檢驗煎殷,根據(jù)提供的數(shù)據(jù)可以得出該假設(shè)檢驗的原假設(shè)H0和備擇假設(shè)H1:
H0:瑞德西韋治療組和標(biāo)準(zhǔn)治療對照組的死亡率無顯著性差異。
H1:瑞德西韋治療組和標(biāo)準(zhǔn)治療對照組的死亡率有顯著性差異腿箩。
根據(jù)被WHO泄露的數(shù)據(jù)構(gòu)造統(tǒng)計量并進行P值的計算,P-Value>顯著性水平(α=0.05)钧惧,接受原假設(shè)暇韧,即認(rèn)為瑞德西韋治療未明顯改善COVID-19重癥患者臨床癥狀。
假如這項臨床試驗的統(tǒng)計分析顯示浓瞪,瑞德西韋治療組和標(biāo)準(zhǔn)治療對照組的療法之間存在顯著性差異懈玻。這是否意味著醫(yī)學(xué)界可以肯定瑞德西韋療法能夠治療新的COVID-19重癥患者?這是否意味著它適用于一定比例的COVID-19重癥患者乾颁?它是否僅僅意味著瑞德西韋療法僅僅對于研究中選擇的這一部分人群更加有效涂乌?
統(tǒng)計學(xué)的顯著性檢驗只能與隨機化實驗共同使用。要想將概率應(yīng)用到現(xiàn)實生活中時英岭,必須確定計算這些概率所依據(jù)的事件空間湾盒。
在抽樣調(diào)查領(lǐng)域,概率在現(xiàn)實生活中的含義是非常明確的巴席。
當(dāng)統(tǒng)計方法被用于天文學(xué)历涝、社會學(xué)、流行病學(xué)漾唉、法律或者天氣預(yù)報等觀測性研究時荧库,這一含義就沒有那么明確了。因為不能確定所計算的概念的事件空間赵刑,就無法證明一個模型比另一個模型更加合理分衫,因此這些領(lǐng)域常常出現(xiàn)爭議。
03? 洞察
現(xiàn)實非常復(fù)雜般此,充滿了各種意外蚪战、混亂和轟動性事件。人們構(gòu)造的科學(xué)模型永遠無法完整地描述現(xiàn)實铐懊。科學(xué)革命必然經(jīng)歷一個模型更替的過程邀桑。
首先,科學(xué)家往往會提出一個現(xiàn)實模型科乎,這個模型看上去符合現(xiàn)有數(shù)據(jù)壁畸,而且完全可以用于預(yù)測試驗結(jié)果。
然后,隨著數(shù)據(jù)的積累捏萍,對模型做出修改以滿足新的發(fā)現(xiàn)太抓,于是模型越來越復(fù)雜,增加了對特殊情況的處理和看上去不成立的擴展令杈。
最終走敌,模型變得不再適合實際使用。此時逗噩,具有創(chuàng)造性的思想家會提出一個完全不同的模型掉丽,引發(fā)一場科學(xué)革命。
統(tǒng)計革命就是這種模型更替的一場連環(huán)顛覆的思想盛宴给赞。
決定論哲學(xué)掌控了19世紀(jì)早期的科學(xué)机打,人們相信一切事情的發(fā)生都是由宇宙初始條件和描述運動的數(shù)學(xué)公式?jīng)Q定的。
19世紀(jì)末期片迅,人們發(fā)現(xiàn)残邀,牛頓和拉普拉斯使用過的定律只是一種粗略的估計,科學(xué)逐漸使用一種新的模式柑蛇,即現(xiàn)實的統(tǒng)計模型芥挣。到了20世紀(jì)末,幾乎所有學(xué)科都轉(zhuǎn)移到了使用統(tǒng)計模型的陣營耻台。
大眾文化沒有跟上這種科學(xué)的腳步空免,有些模糊的概念和表述(如“相關(guān)性”、“概率”盆耽、“風(fēng)險”)成為了大眾詞匯蹋砚,大多數(shù)人也知道了一些科學(xué)領(lǐng)域上的不確定性。不過大多數(shù)人并沒有意識到哲學(xué)觀念已經(jīng)發(fā)生了深刻轉(zhuǎn)變摄杂。
科學(xué)研究的對象不是可以觀察到的事物坝咐,而是描述觀測值概率的數(shù)學(xué)分布函數(shù)。
當(dāng)我們進入21世紀(jì)析恢,統(tǒng)計思想幾乎在所有學(xué)科中完全擊敗了決定論墨坚。但是,我們可以想象的到映挂,統(tǒng)計革命最終也將走到盡頭泽篮,被另一種體系取代。
僅憑人類智慧不可能組織出一個能夠近似描述真實客觀世界的思想體系柑船。任何此種嘗試都將具有本質(zhì)上的錯誤帽撑。
到最后,這些錯誤將會變得越來越明顯鞍时,人們只能不斷修改科學(xué)模型并最終將其拋棄油狂,選擇另一個更加精妙的模型。
當(dāng)人們在現(xiàn)實生活中尋找概率的意義時,通常會去尋找柯爾莫哥洛夫抽象概率空間的實際意義专筷。
柯爾莫哥洛夫卻選擇了另一種方法,將他的概率公理以及解決數(shù)學(xué)問題的方法徹底推翻蒸苇,他認(rèn)為信息論不是概率計算的結(jié)果磷蛹,而是概率的起源……
也許有一個人,會接過柯爾莫哥洛夫留下的火把溪烤,開創(chuàng)一種以數(shù)字計算機的本質(zhì)為哲學(xué)基礎(chǔ)的分布理論味咳。
也許在某個地方,另一位?R. A. Fisher?已經(jīng)出現(xiàn)在當(dāng)今科學(xué)的前沿領(lǐng)域檬嘀,他很快就會以人們從未想過的見解和觀點槽驶,給世界帶來巨大的驚喜。