文獻(xiàn)閱讀|新冠進(jìn)化起源|Evolutionary origins of the SARS-CoV-2 sarbecovirus lineage responsible for the COVID...

文獻(xiàn):導(dǎo)致 COVID-19 的 SARS-CoV-2 sarbecovirus 譜系的進(jìn)化起源

發(fā)表時(shí)間:2020年7月

nature publication

文章整體思路

1、無(wú)斷點(diǎn)基因組區(qū)域的重組分析與鑒定

文章嘗試解釋人類冠狀病毒 SARS-CoV-2的進(jìn)化譜系欠痴,即嘗試解釋宿主物種的作用酝掩、重組的作用,進(jìn)化中與其他動(dòng)物病毒分化的時(shí)間觉既。用3SEQ方法對(duì)包含SARS-CoV和SARS-CoV-2的sarbecoviruses亞屬的68個(gè)病毒進(jìn)行斷點(diǎn)的分布和序列的推測(cè)研究贴唇,表明病毒經(jīng)歷了頻繁的重組遂鹊。頻繁的重組使推測(cè)病毒的進(jìn)化譜系十分具有挑戰(zhàn)性丽柿,于是恢准,研究者結(jié)合 3SEQ 推斷的斷點(diǎn)、GARD 推斷的斷點(diǎn)和 PI 信號(hào)這三種方法甫题,去除基因組重組區(qū)域馁筐,推測(cè) SARS-CoV-2的進(jìn)化譜系募强。結(jié)果表明荆陆, SARS-CoV-2 和 RaTG13 具有單一祖先譜系。來(lái)自浙江省的另外兩種蝙蝠病毒(CoVZXC21 和 CoVZC45)屬于該譜系秦躯,是 2005 年至 2007 年間采樣的 RaTG13/SARS-CoV-2 譜系和香港蝙蝠病毒進(jìn)化枝的重組體炎码。

圖1.由3SEQ方法確定的基因組重組斷點(diǎn)

a. 由 3SEQ 方法推斷的斷點(diǎn)盟迟,由68個(gè)病毒序列中支持該位置為斷點(diǎn)的百分比表示。如果序列是相同重組事件的后代辅肾,則斷點(diǎn)可以在序列之間共享队萤。粉紅色轮锥、綠色和橙色條顯示無(wú)斷點(diǎn)區(qū)域 (BFR) 矫钓,區(qū)域 A(nt 13,291–19,628)顯示兩個(gè)剪切后的片段,產(chǎn)生區(qū)域 A'(nt 13,291–14,932舍杜、15,405–17,162新娜、18,009–19,628)。區(qū)域 B 和 C 分別跨越 nt 3,625–9,150 和 9,261–11,795既绩。連接區(qū)域 A'BC 是 NRR1概龄。開(kāi)放閱讀框以箭頭的形式標(biāo)注在斷點(diǎn)圖上方,可變環(huán)區(qū)域顯示在 S 蛋白中饲握。
b. SARS-CoV-2 與其他序列之間的相似性圖私杜,包括 RaTG13(黑色)蚕键、SARS-CoV(粉色)和兩個(gè)穿山甲序列(橙色)。陰影區(qū)域?qū)?yīng)于 S 蛋白衰粹。
c. 基于 2007 年在肯尼亞采樣的病毒(BtKy72锣光;外類群,圖像中未顯示)構(gòu)建最大似然法系統(tǒng)發(fā)育樹(shù)铝耻。顯示了 sarbecovirus 比對(duì)的五個(gè) BFR誊爹。用于系統(tǒng)發(fā)育推斷的核苷酸位置是 147–695、962–1,686(第一棵樹(shù))瓢捉、3,625–9,150(第二棵樹(shù)频丘,也是 BFR B)、9,261–11,795(第三棵樹(shù)泡态,也是 BFR C)搂漠、12,443–19,638(第四棵樹(shù))和23,631–24,633、24,795–25,847某弦、27,702–28,843 和 29,574–30,650(第五棵樹(shù))状答。相關(guān)的 bootstrap 值顯示在分支上,灰色陰影區(qū)域顯示沿基因組表現(xiàn)出系統(tǒng)發(fā)育不一致的序列刀崖。

2惊科、S蛋白子區(qū)域的系統(tǒng)發(fā)育關(guān)系

由于 SARS-CoV-2的S 蛋白與過(guò)去的重組事件或可能的趨同進(jìn)化有關(guān),研究者專門(mén)研究了 S 蛋白的幾個(gè)子區(qū)域——S1 的 N 端結(jié)構(gòu)域亮钦、S1 的 C 端結(jié)構(gòu)域馆截、可變C-末端結(jié)構(gòu)域的環(huán)區(qū)和S2。SARS-CoV-2 中的可變環(huán)區(qū)域顯示出與 2019 年穿山甲冠狀病毒序列的相似性蜂莉,高于與 RaTG13 蝙蝠病毒的相似性蜡娶。這讓研究者猜測(cè) SARS-CoV-2 是Pangolin Guangdong 2019 和 RaTG13 祖先的重組體,通過(guò)重組和強(qiáng)純化選擇出現(xiàn) SARS-CoV-2映穗。然而窖张,仔細(xì)觀察后發(fā)現(xiàn),系統(tǒng)發(fā)育樹(shù)中的相對(duì)差異表明 SARS-CoV-2 不太可能從 Pangolin-2019 的祖先那里獲得可變環(huán)蚁滋,因?yàn)檫@兩個(gè)序列在整個(gè) S 蛋白(不包括 N 端結(jié)構(gòu)域)中大約有 10-15% 的差異宿接。RaTG13 在可變環(huán)區(qū)域中更加分散,因此可能是與未被采樣的蝙蝠中sarbecovirus的重組的產(chǎn)物辕录。這是值得注意的睦霎,因?yàn)榭勺儹h(huán)區(qū)域包含 RBD 中的六個(gè)關(guān)鍵接觸殘基,這些殘基使 SARS-CoV-2 具有 ACE2 結(jié)合特異性走诞。 這些殘基也在Pangolin Guangdong 2019序列中副女。對(duì)這些共享的 ACE2 特異性殘基的最簡(jiǎn)單的解釋是,它們存在于 SARS-CoV-2蚣旱、RaTG13 和Pangolin-2019 的共同祖先中碑幅,并通過(guò)導(dǎo)致 RaTG13 的譜系中的重組丟失戴陡。這為 SARS-CoV-2 譜系是蝙蝠直接或幾乎直接的人畜共患病跳躍的結(jié)果提供了令人信服的支持,因?yàn)殛P(guān)鍵的 ACE2 結(jié)合殘基存在于蝙蝠中傳播的病毒中沟涨。(也就是說(shuō)猜欺,ACE2 特異性殘基存在于SARS-CoV-2和RaTG13 的祖先中,并且在RaTG13 的譜系中丟失拷窜。盡管RaTG13與SARS-CoV-2基因組差異較大且不具有ACE2 特異性殘基等關(guān)鍵的基因开皿,很有可能在一些我們未檢測(cè)到的蝙蝠體內(nèi),RaTG13與其祖先進(jìn)化出來(lái)的其他譜系的病毒發(fā)生重組篮昧,慢慢進(jìn)化出SARS-CoV-2這種人畜共患病病毒赋荆。)

圖2.SARS-CoV-2 與 S 蛋白亞區(qū)密切相關(guān)序列之間的系統(tǒng)發(fā)育關(guān)系

如底部條形圖所示,除了 C 端域的 222-nt 可變環(huán)區(qū)域懊昨,SARS-CoV-2 和 RaTG13 是最密切相關(guān)的(它們最近的共同祖先節(jié)點(diǎn)用綠色圓圈表示)窄潭。在可變環(huán)區(qū)域,RaTG13 的TMRCA(time to most recent common ancestor) 與其他部分有很大差異酵颁,超出了 SARS-CoV-2 和Pangolin Guangdong 2019 祖先的差異嫉你,這表明 RaTG13 是從更分歧和未被發(fā)現(xiàn)的蝙蝠譜系中獲得的。SARS-CoV-2 和 RaTG13(底部)之間的遺傳距離表明躏惋,它們的關(guān)系在除可變環(huán)外的所有區(qū)域中都是一致的幽污。除 N 端結(jié)構(gòu)域外,SARS-CoV-2 與廣東穿山甲 2019 之間的遺傳距離在所有地區(qū)都是一致的簿姨,這意味著這兩個(gè)序列在該地區(qū)不太可能發(fā)生重組距误。 NTD,N-末端結(jié)構(gòu)域扁位;CTD准潭,C-末端結(jié)構(gòu)域。

3域仇、非重組區(qū)域的進(jìn)化

非重組基因組區(qū)域(NRR1 )的系統(tǒng)發(fā)育描述了不同區(qū)域蝙蝠 sarbecovirus 種群的明顯程度的空間結(jié)構(gòu)的遺傳多樣性刑然。Kenya/Bulgaria作為外類群,下圖中包含人暇务、蝙蝠和穿山甲中采樣的病毒泼掠。雖然穿山甲可能是蝙蝠病毒進(jìn)入人類的中間宿主——它們會(huì)患上嚴(yán)重的呼吸道疾病并且通常通過(guò)販賣(mài)與人接觸——但沒(méi)有證據(jù)表明穿山甲感染是蝙蝠病毒進(jìn)入人類的必要條件。

圖3.使用兩個(gè)最長(zhǎng) BFR 的 sarbecovirus 的最大似然樹(shù)

去除區(qū)域內(nèi)的潛在重組信號(hào)般卑,區(qū)域 A 縮短為 A' (5,017 nt)武鲁。區(qū)域 B 長(zhǎng) 5,525 nt爽雄。不同顏色表示地圖中不同省份蝠检。兩棵樹(shù)中系統(tǒng)發(fā)育位置不一致的五個(gè)序列用虛線標(biāo)識(shí)。

4挚瘟、用 SARS-CoV-2 譜系 NRR 的推算TMRCA

運(yùn)用上述的三種方法得出的NRR: NRR1 叹谁、 NRR2 以及NRA3饲梭,來(lái)推斷時(shí)間尺度上的進(jìn)化歷史。研究者試圖通過(guò)分析先后采樣的幾種冠狀病毒(包括 HCoV-OC43焰檩、MERS-CoV 和 SARS-CoV 病毒基因組)來(lái)確定合適的先驗(yàn)率分布以校準(zhǔn)時(shí)間測(cè)量樹(shù)憔涉。使用貝葉斯方法,研究者估計(jì)了快速的進(jìn)化速率: SARS 病毒1年內(nèi)的替換速率為每個(gè)位點(diǎn) yr –1 0.00169 個(gè)替換, 95% 最高后驗(yàn)密度 (HPD) 區(qū)間 (0.00131,0.00205)析苫;MERS-CoV病毒4年內(nèi)替換速率0.00078(0.00063,0.00092)兜叨;HCoV-OC43 在近 50年中的替換速率(0.00024 (0.00019,0.00029) 。這些差異體現(xiàn)了進(jìn)化速率的時(shí)間依賴性衩侥,即速率估計(jì)會(huì)隨著測(cè)量的時(shí)間尺度而有很大差異国旷,這是病毒中經(jīng)常觀察到的現(xiàn)象。在相對(duì)短的時(shí)間尺度上茫死,這種差異可以主要通過(guò)改變選擇壓力跪但,具有輕度的有害變體被通過(guò)純化選擇在更長(zhǎng)的時(shí)間尺度更強(qiáng)烈地消除說(shuō)明。與此一致峦萎,我們估計(jì)在較長(zhǎng)的進(jìn)化時(shí)間尺度內(nèi)非同義替換率比值隨之降低:分別有 SARS-CoV屡久,1.41 (1.20,1.68)、0.35 (0.30,0.41) 和 0.133 (0.129,0.136)和 HCoV-OC43爱榔。鑒于這些時(shí)間依賴的進(jìn)化速率動(dòng)態(tài)被环,較慢的速率適用于校準(zhǔn) sarbecovirus 進(jìn)化歷史。

圖4.冠狀病毒 HCoV-OC43详幽、MERS 和 SARS 的時(shí)間信號(hào)和平均進(jìn)化率估計(jì)值

a – c蛤售,Root-to-tip (RtT) divergence在不同時(shí)間尺度上展開(kāi)的三種冠狀病毒進(jìn)化歷史(HCoV-OC43 ( n ?= 37; a ) MERS ( n ?= 35; b ) 和 SARS( n ?= 69; c ))。d妒潭,針對(duì)相同的三個(gè)數(shù)據(jù)集(用與各自 RtT 散點(diǎn)圖中的數(shù)據(jù)點(diǎn)相同的顏色表示)以及使用兩個(gè)不同先驗(yàn)的可比 NRA3 的采樣時(shí)間范圍繪制的平均進(jìn)化率估計(jì)貝葉斯推理(紅點(diǎn))悴能。

5、系統(tǒng)發(fā)育分歧時(shí)間的推測(cè)

使用最保守的方法 (NRR1)雳灾,SARS-CoV-2 和 RaTG13 的分歧時(shí)間估計(jì)為 1969 年(95% HPD:1930-2000)漠酿,而 SARS-CoV 與其最密切相關(guān)的蝙蝠序列之間的分歧時(shí)間估計(jì)為 1962 年(95 % HPD:1932-1988)。使用 NRR2 和 NRA3 估計(jì)實(shí)驗(yàn)結(jié)果大體一致: SARS-CoV-2 的分歧時(shí)間分別為 1982 (1948-2009) 和 1948 (1879-1999)谎亩; SARS-CoV 與其已知的最接近的蝙蝠病毒的分歧時(shí)間分別是 1952 (1906-1989) 和 1970 年(1932-1996 年)炒嘲。
SARS-CoV 的分歧時(shí)間比先前估計(jì)的日期早,因?yàn)橄惹暗墓烙?jì)是使用人類和果子貍宿主(以及一些密切相關(guān)的蝙蝠基因組)的 SARS-CoV 基因組集合獲得的匈庭,這意味著進(jìn)化速率是主要受短期 SARS 爆發(fā)規(guī)模的影響夫凸,并且可能偏高。事實(shí)上阱持,這些研究報(bào)告的發(fā)病率與我們估計(jì)的短期 SARS 發(fā)病率一致夭拌。與 SARS-CoV-2/RaTG13 譜系最密切相關(guān)的穿山甲病毒的估計(jì)分歧時(shí)間從 1851 年(1730-1958 年)到 1877 年(1746-1986 年),表明這些穿山甲譜系是從蝙蝠病毒中獲得的這導(dǎo)致了 SARS-CoV-2。目前對(duì)穿山甲的采樣并未暗示它們是中間宿主鸽扁。

圖5. sarbecovirus 譜系時(shí)間測(cè)量的系統(tǒng)發(fā)育估計(jì)和分歧時(shí)間

以 NRR1 推斷的時(shí)間校準(zhǔn)的最大進(jìn)化枝可信度系統(tǒng)發(fā)育樹(shù)蒜绽。灰色對(duì)應(yīng)蝙蝠病毒桶现,綠色對(duì)應(yīng)穿山甲躲雅,藍(lán)色對(duì)應(yīng) SARS-CoV,紅色對(duì)應(yīng) SARS-CoV-2骡和。黑色內(nèi)部節(jié)點(diǎn)圓圈的大小與后節(jié)點(diǎn)支持成正比相赁。顯示所有內(nèi)部節(jié)點(diǎn)年齡的 95% 可信區(qū)間條。插圖代表基于 NRR1慰于、NRR2 和 NRA3 的發(fā)散時(shí)間估計(jì)噪生。箱線圖顯示了 SARS-CoV-2(紅色)和 2002-2003 年 SARS-CoV 病毒(藍(lán)色)與其最密切相關(guān)的蝙蝠病毒的分歧時(shí)間估計(jì)值(后中位數(shù))。綠色箱線圖顯示了 RaTG13/SARS-CoV-2 譜系及其最密切相關(guān)的穿山甲譜系的 TMRCA 估計(jì)值(Guangdong 2019)东囚。箱線圖顯示四分位距跺嗽,白線是中位數(shù),箱線圖顯示后驗(yàn)分布的全范圍页藻。四分位間距寬度和具有相同顏色的透明帶被疊加以突出估計(jì)之間的重疊桨嫁。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市份帐,隨后出現(xiàn)的幾起案子璃吧,更是在濱河造成了極大的恐慌,老刑警劉巖废境,帶你破解...
    沈念sama閱讀 218,682評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件畜挨,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡噩凹,警方通過(guò)查閱死者的電腦和手機(jī)巴元,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)驮宴,“玉大人逮刨,你說(shuō)我怎么就攤上這事《略螅” “怎么了修己?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,083評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)迎罗。 經(jīng)常有香客問(wèn)我睬愤,道長(zhǎng),這世上最難降的妖魔是什么纹安? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,763評(píng)論 1 295
  • 正文 為了忘掉前任尤辱,我火速辦了婚禮砂豌,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘啥刻。我一直安慰自己奸鸯,他們只是感情好咪笑,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布可帽。 她就那樣靜靜地躺著,像睡著了一般窗怒。 火紅的嫁衣襯著肌膚如雪映跟。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,624評(píng)論 1 305
  • 那天扬虚,我揣著相機(jī)與錄音努隙,去河邊找鬼。 笑死辜昵,一個(gè)胖子當(dāng)著我的面吹牛荸镊,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播堪置,決...
    沈念sama閱讀 40,358評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼躬存,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了舀锨?” 一聲冷哼從身側(cè)響起岭洲,我...
    開(kāi)封第一講書(shū)人閱讀 39,261評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎坎匿,沒(méi)想到半個(gè)月后盾剩,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,722評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡替蔬,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年告私,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片承桥。...
    茶點(diǎn)故事閱讀 40,030評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡德挣,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出快毛,到底是詐尸還是另有隱情格嗅,我是刑警寧澤,帶...
    沈念sama閱讀 35,737評(píng)論 5 346
  • 正文 年R本政府宣布唠帝,位于F島的核電站屯掖,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏襟衰。R本人自食惡果不足惜贴铜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧绍坝,春花似錦徘意、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,941評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至把介,卻和暖如春勤讽,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背拗踢。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,057評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工脚牍, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人巢墅。 一個(gè)月前我還...
    沈念sama閱讀 48,237評(píng)論 3 371
  • 正文 我出身青樓诸狭,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親君纫。 傳聞我的和親對(duì)象是個(gè)殘疾皇子驯遇,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 0 摘要 反向遺傳學(xué)被認(rèn)為是一種不可或缺的工具,它徹底改變了我們對(duì)病毒發(fā)病機(jī)制和疫苗開(kāi)發(fā)的認(rèn)識(shí)庵芭。大型的RNA病毒基...
    RealXuanyi閱讀 7,568評(píng)論 0 2
  • 表情是什么妹懒,我認(rèn)為表情就是表現(xiàn)出來(lái)的情緒。表情可以傳達(dá)很多信息双吆。高興了當(dāng)然就笑了眨唬,難過(guò)就哭了。兩者是相互影響密不可...
    Persistenc_6aea閱讀 125,083評(píng)論 2 7
  • 16宿命:用概率思維提高你的勝算 以前的我是風(fēng)險(xiǎn)厭惡者好乐,不喜歡去冒險(xiǎn)匾竿,但是人生放棄了冒險(xiǎn),也就放棄了無(wú)數(shù)的可能蔚万。 ...
    yichen大刀閱讀 6,052評(píng)論 0 4