Basic Information
- 英文標(biāo)題: COV2Var, a function annotation database of SARS-CoV-2 genetic variation
- 中文標(biāo)題:COV2Var瞬铸,一個(gè)關(guān)于SARS-CoV-2遺傳變異的功能注釋數(shù)據(jù)庫(kù)
- 發(fā)表日期:28 October 2023
- 文章類型:Na
- 所屬期刊:Nucleic Acids Research
- 文章作者:Yuzhou Feng | Xiaobo Zhou
- 文章鏈接:https://academic.oup.com/nar/article/52/D1/D701/7332073
Abstract
- 由冠狀病毒SARS-CoV-2引起的COVID-19大流行已導(dǎo)致數(shù)百萬(wàn)人喪生行剂,并造成了嚴(yán)重的全球經(jīng)濟(jì)后果丐巫。
- 每當(dāng)SARS-CoV-2復(fù)制時(shí),病毒在其基因組中獲得新的突變嫩海。
- SARS-CoV-2基因組中的突變導(dǎo)致傳染性增加、疾病后果嚴(yán)重囚痴、逃避免疫反應(yīng)叁怪、臨床表現(xiàn)變化以及降低疫苗或治療的有效性。
- 截至目前深滚,多種資源提供了檢測(cè)到的突變列表奕谭,但缺乏關(guān)鍵的功能注釋。
- 缺乏研究來(lái)探討突變與各種因素之間的關(guān)系痴荐,如疾病嚴(yán)重程度血柳、致病性、患者年齡生兆、患者性別难捌、跨物種傳播、病毒免疫逃逸皂贩、免疫反應(yīng)水平栖榨、病毒傳播能力昆汹、病毒進(jìn)化明刷、宿主適應(yīng)性、病毒蛋白結(jié)構(gòu)满粗、病毒蛋白功能辈末、病毒蛋白穩(wěn)定性及并發(fā)突變。
- 深入了解突變位點(diǎn)與這些因素之間的關(guān)系對(duì)于推進(jìn)我們對(duì)SARS-CoV-2的認(rèn)識(shí)和制定有效應(yīng)對(duì)措施至關(guān)重要映皆。
- 為了填補(bǔ)這一空白挤聘,我們構(gòu)建了COV2Var,這是一個(gè)關(guān)于SARS-CoV-2遺傳變異的功能注釋數(shù)據(jù)庫(kù)捅彻,可在http://biomedbdc.wchscu.cn/COV2Var/訪問(wèn)组去。
-
COV2Var旨在識(shí)別SARS-CoV-2變種中的常見(jiàn)突變并評(píng)估它們的影響,為SARS-CoV-2變種中常見(jiàn)突變的深入功能注釋提供了一個(gè)寶貴的資源
Introduction
Para_01
- 截至2023年7月步淹,SARS-CoV-2病毒已導(dǎo)致全球超過(guò)4億5千萬(wàn)人感染和6百萬(wàn)人死亡从隆,該病毒是COVID-19大流行的原因所在诚撵。
- 如同其他RNA病毒一樣,SARS-CoV-2具有較高的突變率键闺。
- 盡管大多數(shù)突變?cè)诠δ苌鲜侵行缘牟⑶译S機(jī)發(fā)生寿烟,但有些突變可以賦予病毒生存優(yōu)勢(shì)。
- 病毒突變可以在許多方面影響宿主與病原體之間的相互作用(例如辛燥,影響病毒傳播筛武、影響致病性、逃避自然或疫苗誘導(dǎo)的免疫挎塌、規(guī)避治療或診斷測(cè)試檢測(cè)以及改變宿主物種范圍)徘六。
- 例如,刺突蛋白中的D614G突變與提高傳播效率有關(guān)聯(lián)勃蜘。
- 病毒采取了一種生存策略硕噩,通過(guò)緩慢接受新突變的方式逐步進(jìn)化,而更傾向于結(jié)合現(xiàn)有的突變以獲得進(jìn)化優(yōu)勢(shì)缭贡。
- 這表明病毒可能已經(jīng)探索了大部分有利突變炉擅,使其繼續(xù)通過(guò)利用現(xiàn)有突變組合的方式進(jìn)行進(jìn)化。
- 因此阳惹,研究單個(gè)突變的確切影響至關(guān)重要谍失,目的是確定新突變是否具備使其更具致命性和傳染性的特征。
Para_02
- 截至目前莹汤,有關(guān)SARS-CoV-2突變標(biāo)注的資源多種多樣(例如COVID-19 CG快鱼、CovMT、CoV-GLUE纲岭、coronapp抹竹、GESS和Outbreak.info)。
- 然而止潮,這些資源僅提供了在SARS-CoV-2變異株中檢測(cè)到的突變列表窃判,并沒(méi)有進(jìn)行深入的功能注釋或提供對(duì)人類健康的新見(jiàn)解。
- 為了填補(bǔ)這一空白喇闸,我們對(duì)超過(guò)130億條SARS-CoV-2基因組序列及相關(guān)元數(shù)據(jù)進(jìn)行了全面的生物信息學(xué)分析袄琳。
- 通過(guò)這次廣泛的考察,我們確定了SARS-CoV-2基因組中共有9832種常見(jiàn)突變燃乍。
- 隨后唆樊,我們對(duì)這9832種常見(jiàn)突變背后的機(jī)能機(jī)制進(jìn)行了深入注釋。
- 例如刻蟹,我們研究了這些突變與多種因素之間的關(guān)聯(lián)逗旁,包括疾病嚴(yán)重程度、患者年齡舆瘪、患者性別片效、跨物種傳播仓洼、病毒免疫逃逸、免疫反應(yīng)水平堤舒、病毒傳播能力色建、病毒進(jìn)化、病毒蛋白結(jié)構(gòu)舌缤、病毒蛋白功能箕戳、病毒蛋白穩(wěn)定性以及并發(fā)突變。
- 由此產(chǎn)生的知識(shí)庫(kù)COV2Var可在http://biomedbdc.wchscu.cn/COV2Var/獲取国撵,為日常SARS-CoV-2相關(guān)研究提供了一個(gè)重要資源陵吸。
- COV2Var將有助于加深我們對(duì)SARS-CoV-2及其在新環(huán)境中適應(yīng)機(jī)制的理解,并促進(jìn)有效策略的開(kāi)發(fā)以對(duì)抗該病毒介牙。
Data integration and annotations
Data collection and quality control
數(shù)據(jù)收集與質(zhì)量控制
Para_03
- 2023年3月2日壮虫,我們從全球禽流感數(shù)據(jù)共享倡議(GISAID)數(shù)據(jù)庫(kù)中檢索了SARS-CoV-2序列,這些序列的采集時(shí)間跨度從2019年12月至2023年2月环础。
- 我們應(yīng)用過(guò)濾器來(lái)選擇具有完整基因組的序列囚似,排除了覆蓋率低(超過(guò)5%的未定義核苷酸‘N’)的序列,并確保每個(gè)序列都有完整的采集日期信息线得。
- 此外饶唤,我們還收集了與每個(gè)序列相關(guān)的元數(shù)據(jù)。
- 我們使用Pango命名法中的SARS-CoV-2譜系指定來(lái)對(duì)序列進(jìn)行分類(例如Alpha贯钩、Delta變種)募狂。
- 這種分類排除了被標(biāo)記為‘無(wú)’或‘未分配’的記錄。
Mutational analysis
突變分析
Para_04
- 為了分析SARS-CoV-2基因組序列的突變角雷,我們使用了微生物基因組突變追蹤器(MicroGMT)軟件祸穷,并采用SARS-CoV-2(武漢-胡-1)的默認(rèn)注釋。
- MicroGMT接收組裝后的基因組序列作為輸入勺三,并將其與參考序列進(jìn)行比較以檢測(cè)和表征插入雷滚、刪除和點(diǎn)突變。
- 用于分析的參考序列為SARS-CoV-2分離株武漢-胡-1(GenBank登錄號(hào)NC_045512.2)檩咱。
- 我們分析中的所有核苷酸位置標(biāo)簽均基于與該參考序列的比對(duì)揭措。
- 在我們的研究中胯舷,我們利用這一工具分析了大量共計(jì)13,344,494個(gè)SARS-CoV-2分離株的基因組序列刻蚯。
- 我們應(yīng)用了篩選標(biāo)準(zhǔn)來(lái)識(shí)別更為普遍且具有生物學(xué)意義的突變,這些突變可能對(duì)病毒適應(yīng)性和生存優(yōu)勢(shì)產(chǎn)生影響桑嘶。
- 篩選標(biāo)準(zhǔn)如下:(i) 突變?cè)谝粋€(gè)或多個(gè)病毒譜系(Pango譜系)中的頻率大于0.01炊汹,并且在同一特定譜系中至少出現(xiàn)兩次;(ii) 突變必須出現(xiàn)在總共2735個(gè)譜系中的兩個(gè)或更多譜系內(nèi)逃顶。
Geographical and temporal distributions analysis of mutations and frequency across lineages
突變及其頻率在不同譜系中的地理和時(shí)間分布分析
Para_05
- 每個(gè) SARS-CoV-2 基因組序列的元數(shù)據(jù)包括位置讨便、采樣時(shí)間和 Pango 分支信息充甚。
- 通過(guò)結(jié)合這些元數(shù)據(jù)和從序列中檢測(cè)到的突變,我們獲得了有關(guān)突變模式的寶貴見(jiàn)解霸褒,包括它們的地理分布伴找、時(shí)間分布以及在不同分支中的頻率。
- 利用 Python 的 pyecharts 庫(kù)废菱,我們可視化了全球范圍內(nèi)突變的分布和變化技矮。
- 通過(guò)這些努力,我們能夠揭示突變景觀殊轴,并為每個(gè)突變隨時(shí)間的變化進(jìn)行可視化追蹤衰倦。
Investigating the relationship between mutations and alternative non-human animal hosts
調(diào)查突變與非人類動(dòng)物替代宿主之間的關(guān)系
Para_06
- 每個(gè) SARS-CoV-2 基因組序列的元數(shù)據(jù)包括宿主信息。
- 我們根據(jù)序列宿主信息分析了不同非人類動(dòng)物宿主中突變的分布情況旁理,以了解跨物種傳播的情況樊零。
- 我們保留了至少出現(xiàn)在三種非人類動(dòng)物宿主序列中的突變。
Investigating the association between mutations and age, gender and patient status
調(diào)查突變與年齡孽文、性別和患者狀態(tài)之間的關(guān)聯(lián)
Para_07
- 我們采用邏輯回歸模型來(lái)研究突變與患者年齡驻襟、性別和狀況之間的關(guān)聯(lián)。
- 該邏輯回歸模型使用R中的glm函數(shù)進(jìn)行芋哭。
- 具體而言塑悼,我們將數(shù)據(jù)分為不同的年齡段(0-17歲、18-39歲楷掉、40-64歲厢蒜、65-84歲和85歲以上)、性別(女性和男性)以及患者狀況(能夠行走烹植、已故斑鸦、居家、住院草雕、輕癥和康復(fù))巷屿,這些分類依據(jù)GISAID的標(biāo)準(zhǔn)。
- 在分析突變與患者狀況之間的關(guān)聯(lián)時(shí)墩虹,模型包含了突變嘱巾、患者狀況、年齡诫钓、性別以及基因序列的來(lái)源和采集時(shí)間旬昭。
- 類似地,在分析突變與患者人口統(tǒng)計(jì)信息(年齡和性別)之間的關(guān)聯(lián)時(shí)菌湃,模型結(jié)合了突變问拘、患者年齡、性別以及基因序列的來(lái)源和采集時(shí)間。
- 突變變量的P值小于0.001表明骤坐,在突變前和突變后的序列比例方面的觀察到的差異具有統(tǒng)計(jì)學(xué)意義绪杏,這為否定零假設(shè)提供了證據(jù),即不存在差異的假設(shè)纽绍。
Analyzing the link between mutation sites and natural selection
分析突變位點(diǎn)與自然選擇之間的聯(lián)系
Para_08
- 由于正向自然選擇的主導(dǎo)作用蕾久,基因組中的適應(yīng)性突變基因不斷增多。
- 我們使用了默認(rèn)的SARS-CoV-2(武漢-胡-1)蛋白質(zhì)注釋的RASCL管道來(lái)研究每個(gè)譜系序列中的SARS-CoV-2基因所受到的自然選擇壓力拌夏。
- 具體來(lái)說(shuō)腔彰,我們利用HyPhy中的高級(jí)分子進(jìn)化模型進(jìn)行了分析,包括固定效應(yīng)似然法(FEL)辖佣、混合效應(yīng)進(jìn)化模型(MEME)和快速無(wú)偏貝葉斯近似法(FUBAR)霹抛,以檢測(cè)經(jīng)歷正向選擇或負(fù)向選擇的位點(diǎn)。
- 對(duì)于FEL和MEME而言卷谈,P值小于0.05的位點(diǎn)被認(rèn)為顯著正向選擇杯拐;而在FUBAR中,則是后驗(yàn)概率大于0.95的位點(diǎn)被視為顯著正向選擇世蔗。
Analyzing the impact of the mutations on protein physicochemical properties
分析突變對(duì)蛋白質(zhì)物理化學(xué)性質(zhì)的影響
Para_09
- 參考蛋白序列從 GenBank (登錄號(hào) NC_045512.2) 獲取端逼。
- 通過(guò)替換特定位置上的相應(yīng)氨基酸來(lái)生成點(diǎn)突變蛋白序列。
- 隨后污淋,使用 Expasy ProtParam 服務(wù)器 (https://web.expasy.org/protparam/) 分析了蛋白序列的理化性質(zhì)顶滩。
- 考察了多種理化性質(zhì),包括氨基酸數(shù)目寸爆、分子量礁鲁、理論等電點(diǎn) (pI)、消光系數(shù)赁豆、疏水指數(shù)和平均疏水性 (GRAVY)仅醇。
- 我們比較了突變前后理化性質(zhì)的變化,并將超過(guò) 10% 的變化視為顯著改變魔种。
Analyzing the impacts of mutations on protein stability and function
分析突變對(duì)蛋白質(zhì)穩(wěn)定性及功能的影響
Para_10
- 使用I-Mutant 2.0網(wǎng)絡(luò)服務(wù)器(https://folding.biofold.org/i-mutant/i-mutant2.0.html)來(lái)預(yù)測(cè)突變蛋白序列穩(wěn)定性變化析二。
- 體外環(huán)境模擬采用pH值為7和溫度為25°C,而體內(nèi)環(huán)境模擬則采用pH值為7.4和溫度為37°C节预。
- 得出的ΔDDG值代表預(yù)測(cè)的能量變化叶摄。
- 根據(jù)這一預(yù)測(cè),I-Mutant判斷特定突變是否會(huì)增加(ΔDDG > 0)或降低(ΔDDG < 0)蛋白質(zhì)的穩(wěn)定性安拟。
- 使用MutPred2并采用默認(rèn)參數(shù)來(lái)提供氨基酸替換致病性的概率見(jiàn)解蛤吓。
- 得分大于0.5表明致病性的可能性增加。
Analysis of intrinsically disordered regions (IDRs)
內(nèi)在無(wú)序區(qū)域(IDRs)的分析
Para_11
- SARS-CoV-2的參考蛋白序列從GenBank獲得(GenBank登錄號(hào)NC_045512.2)去扣。
- 使用IUPred3的長(zhǎng)無(wú)序預(yù)測(cè)模式和默認(rèn)(中等平滑)參數(shù)計(jì)算了無(wú)序殘基的比例柱衔。
- 預(yù)測(cè)得分大于0.5的殘基被認(rèn)為是無(wú)序的。
Alterations in enzyme cleavage sites induced by mutations
由突變引起的酶切位點(diǎn)的變化
Para_12
- 參考蛋白質(zhì)序列從GenBank獲扔淅狻(GenBank登錄號(hào)NC_045512.2)唆铐。
- 通過(guò)替換特定位置對(duì)應(yīng)的氨基酸來(lái)生成點(diǎn)突變蛋白質(zhì)序列。
- 隨后奔滑,利用ExPASy服務(wù)器上的PeptideCutter工具分析蛋白質(zhì)序列的潛在切割位點(diǎn)艾岂,考慮所有可用的酶和化學(xué)物質(zhì)。
- 我們比較了突變前后酶切割位點(diǎn)的變化朋其,并保留了發(fā)生改變的位點(diǎn)王浴。
Prediction of antigenicity and immunogenicity of spike protein mutations
預(yù)測(cè)刺突蛋白突變的抗原性和免疫原性
Para_13
- 刺突蛋白序列從GenBank獲得(GenBank登錄號(hào)NC_045512.2)。
- 定點(diǎn)突變蛋白序列是通過(guò)在特定位置替換相應(yīng)氨基酸產(chǎn)生的梅猿。
- 使用VaxiJen 2.0服務(wù)器預(yù)測(cè)刺突蛋白的抗原性(選擇的目標(biāo)生物體為"病毒")氓辣。
- 預(yù)測(cè)得分超過(guò)0.5的抗原被認(rèn)為是候選抗原。
- 通過(guò)IEDB I類免疫原性工具檢查刺突蛋白突變的MHC-I免疫原性(采用默認(rèn)參數(shù)袱蚓,即N端钞啸、C端和第二個(gè)氨基酸)。
- MHC I免疫原性得分大于0表明更有可能刺激免疫反應(yīng)喇潘。
- 對(duì)于顯著影響抗原性或免疫原性的突變体斩,我們認(rèn)為抗原性或免疫原性得分絕對(duì)變化超過(guò)所有位點(diǎn)中位絕對(duì)變化三倍以上的突變?yōu)橹匾蛔儭?/li>
Analyzing the impacts of mutations on viral transmissibility by altering the affinity between receptor binding domain (RBD) and ACE2 receptor
通過(guò)改變受體結(jié)合域(RBD)與ACE2受體之間的親和力來(lái)分析突變對(duì)病毒傳播性的影響
Para_14
- 我們利用深度突變掃描(DMS)方法的結(jié)果來(lái)實(shí)驗(yàn)測(cè)量所有可能的SARS-CoV-2受體結(jié)合域(RBD)氨基酸突變?nèi)绾斡绊慉CE2結(jié)合親和力。
- 一個(gè)正的結(jié)合親和力變化值(Δlog10(KD, app) > 0)表明由于突變導(dǎo)致RBD與ACE2受體之間的親和力增加颖低。
- 相反絮吵,一個(gè)負(fù)值(Δlog10(KD, app) < 0)表示由于突變導(dǎo)致RBD與ACE2受體之間的親和力降低。
- 我們使用了t檢驗(yàn)來(lái)確定這種變化的顯著性忱屑,其中P值<0.05表示突變后RBD與ACE2之間的親和力發(fā)生了顯著變化
Analyzing the impacts of mutations on immune escape by altering the affinity between RBD and antibody/serum
通過(guò)改變RBD與抗體/血清之間的親和力來(lái)分析突變對(duì)免疫逃逸影響
Para_15
- 深度突變掃描可以系統(tǒng)地測(cè)量所有可能的氨基酸突變?cè)诖掏坏鞍钻P(guān)鍵區(qū)域?qū)慰寺】贵w或血清抗原性影響蹬敲。
- 我們利用深度突變掃描實(shí)驗(yàn)的結(jié)果前瞻性地測(cè)量病毒突變?nèi)绾斡绊懣贵w結(jié)合或中和。
- 我們收集的數(shù)據(jù)包括RBD抗體1至4類(第1類——阻斷ACE2且僅與開(kāi)放構(gòu)象RBD結(jié)合莺戒,第2類——阻斷ACE2且與開(kāi)放及閉合構(gòu)象RBD結(jié)合粱栖,第3類——不阻斷ACE2且與開(kāi)放及閉合構(gòu)象RBD結(jié)合,第4類——不阻斷ACE2且僅與開(kāi)放構(gòu)象RBD結(jié)合)脏毯,康復(fù)者血漿以及接種疫苗后血清闹究,以考察突變位點(diǎn)對(duì)免疫逃逸的影響。
- 數(shù)值0表示變異體始終與抗體結(jié)合食店,而數(shù)值1意味著變異體始終逃避抗體結(jié)合渣淤。
- 逃逸分?jǐn)?shù)大于0.1(最大分值1的10%)的突變被歸類為逃逸突變。
Analyzing the co-mutation patterns of SARS-CoV-2
分析SARS-CoV-2的共突變模式
Para_16
- 我們?cè)?735個(gè)病毒譜系類別中計(jì)算了兩個(gè)突變位點(diǎn)之間的相關(guān)性吉嫩,旨在探究它們的相關(guān)程度价认。
- 每個(gè)序列包含不同的突變位點(diǎn)信息。
- 首先自娩,我們處理了序列并構(gòu)建了一個(gè)透視表用踩。
- 在透視表中渠退,每一行代表一個(gè)樣本,每一列代表一個(gè)突變位點(diǎn)脐彩。
- 表格中的值為0或1碎乃,表示每個(gè)樣本是否具有相應(yīng)的突變。
- 最后惠奸,我們計(jì)算了不同突變位點(diǎn)之間的斯皮爾曼相關(guān)系數(shù)梅誓。
- 我們使用了霍爾姆-邦費(fèi)羅尼方法進(jìn)行多重檢驗(yàn)校正。
- 我們保留了相關(guān)系數(shù)大于0.6或小于-0.6的突變對(duì)佛南,以及經(jīng)過(guò)霍爾姆-邦費(fèi)羅尼校正后的P值小于0.05的突變對(duì)
Manual curation of mutation-related literature from PubMed
從PubMed手動(dòng)整理與突變相關(guān)的文獻(xiàn)
Para_17
- 2023年7月29日梗掰,我們?cè)赑ubMed上進(jìn)行了搜索,以檢索與突變相關(guān)的文獻(xiàn)嗅回。
- 以D614G(S)為例及穗,使用了以下查詢:('COVID-19'[標(biāo)題/摘要] 或 'SARS-CoV-2'[標(biāo)題/摘要]) 并且 ('1841A > G'[標(biāo)題/摘要] 或 'Asp614Gly'[標(biāo)題/摘要] 或 'D614G'[標(biāo)題/摘要])。
- 搜索結(jié)果手動(dòng)篩選以確保相關(guān)性绵载。
Web interface and analysis results
Database overview
數(shù)據(jù)庫(kù)概覽
Para_18
- 在這項(xiàng)研究中拥坛,我們從GISAID匯編了一個(gè)包含超過(guò)130億條SARS-CoV-2基因組序列的巨大數(shù)據(jù)集,同時(shí)還包括每條序列的相關(guān)元數(shù)據(jù)尘分。
- 這個(gè)龐大的基因組集合跨越了從2019年12月到2023年2月的時(shí)間范圍猜惋。
- 這些基因組序列代表了來(lái)自35種不同宿主物種、218個(gè)獨(dú)特地理區(qū)域的2735種病毒譜系的豐富多樣性培愁,如圖1A和B所示著摔。
-
元數(shù)據(jù)文件包含了關(guān)鍵信息,包括來(lái)源地區(qū)定续、采集日期谍咆、提交日期和譜系,以及宿主的狀態(tài)私股、年齡和性別摹察。
- 圖 1. 數(shù)據(jù)分布概覽。(A) 序列在全球 218 個(gè)地區(qū)的分布情況倡鲸。(B) 所有基因組序列的來(lái)源供嚎。(C) SARS-CoV-2 基因組中的 9832 個(gè)突變的分布∏妥矗縱軸代表不同突變的數(shù)量克滴。(D) 在 9832 個(gè)突變中,通過(guò) FEL优床、MEME 和 FUBAR 方法檢測(cè)到的正向選擇突變劝赔。(E) 非人類動(dòng)物宿主中的突變?cè)谡麄€(gè) SARS-CoV-2 基因組中的分布〉ǔǎ縱軸代表攜帶每個(gè)突變的序列數(shù)量着帽。
Para_19
- 我們分析了每一種SARS-CoV-2基因組中的突變杂伟,并在過(guò)濾后確定了9832種常見(jiàn)突變。
- 與其他突變相比仍翰,這些突變顯示出顯著的適應(yīng)性和傳播性赫粥,表明它們?cè)谶M(jìn)化和生物學(xué)意義上具有優(yōu)勢(shì)。
- 這些突變?cè)赟ARS-CoV-2基因組中的分布如圖1C所示歉备,詳細(xì)的突變列表可在補(bǔ)充表S2中找到傅是。
- 隨后匪燕,我們通過(guò)整合序列信息和元數(shù)據(jù)對(duì)這9832種常見(jiàn)突變進(jìn)行了廣泛的功能注釋蕾羊。
Para_20
- COV2Var的整體架構(gòu)如圖2所示。
- 對(duì)于9832個(gè)個(gè)體SARS-CoV-2突變帽驯,我們研究了它們?cè)?18個(gè)地理區(qū)域中的分布龟再、時(shí)間變化以及在2735個(gè)譜系中的頻率模式,以了解它們對(duì)進(jìn)化動(dòng)態(tài)的影響尼变。
- 我們還研究了突變與不同年齡利凑、性別和狀態(tài)患者的關(guān)聯(lián)。
- 在分析的9832個(gè)突變中嫌术,429個(gè)與患者性別相關(guān)哀澈,1593個(gè)與患者狀態(tài)相關(guān),2762個(gè)與患者年齡相關(guān)度气。
- 通過(guò)分析突變與35種不同的非人類動(dòng)物宿主之間的關(guān)系割按,我們揭示了突變對(duì)病毒適應(yīng)性和跨物種傳播的影響。
- 在非人類動(dòng)物宿主中共檢測(cè)到1658個(gè)突變磷籍。
- 研究突變對(duì)蛋白質(zhì)穩(wěn)定性适荣、功能機(jī)制、酶切位點(diǎn)和理化性質(zhì)的影響為我們提供了有關(guān)它們結(jié)構(gòu)和功能含義的寶貴見(jiàn)解院领。
- 探索棘突蛋白突變對(duì)抗原性和免疫原性的影響有助于了解免疫反應(yīng)弛矛。
- 利用DMS實(shí)驗(yàn)數(shù)據(jù)揭示RBD與ACE2受體之間相互作用的影響,有助于理解這些影響對(duì)病毒傳播性的作用比然。
- 其中已確定44個(gè)突變?cè)鰪?qiáng)了RBD與ACE2受體之間的結(jié)合親和力丈氓。
- 利用DMS實(shí)驗(yàn)數(shù)據(jù)研究RBD與抗體/血清之間的相互作用,以了解逃避宿主免疫反應(yīng)的情況强法。
- 為此分析共收集了1504條抗體/血清數(shù)據(jù)扒寄。
- 我們研究了SARS-CoV-2在2735個(gè)病毒譜系中的共突變模式,以揭示不同突變對(duì)遺傳變異和疾病表型的協(xié)同效應(yīng)拟烫。
- 我們通過(guò)PubMed搜索整理了9832個(gè)常見(jiàn)突變该编。
-
其中,615個(gè)突變?cè)?587篇論文中被報(bào)道過(guò)硕淑,與COVID-19進(jìn)展中的關(guān)鍵作用相關(guān)聯(lián)课竣。
- 圖 2. COV2Var 流程概覽嘉赎。(A) 導(dǎo)致 9832 種常見(jiàn)突變的突變分析工作流程。(B) 9832 個(gè)體中常見(jiàn)突變的主要類別于樟。(C) COV2Var 網(wǎng)站的界面和架構(gòu)公条。
Association of mutations with age, gender and patient status
突變與年齡、性別和患者狀態(tài)之間的關(guān)聯(lián)
Para_21
- 先前的研究已報(bào)告了特定突變與患者年齡迂曲、性別分布及患者狀態(tài)變化之間的關(guān)聯(lián)靶橱。
- 在本研究中,我們將突變和患者信息(包括年齡路捧、性別和患者狀態(tài))進(jìn)行了整合关霸,以更好地理解這些潛在的相關(guān)性。
- 在分析的9832個(gè)突變中杰扫,我們發(fā)現(xiàn)了429個(gè)與患者性別相關(guān)的突變队寇,1593個(gè)與患者狀態(tài)相關(guān)的突變,以及2762個(gè)與患者年齡相關(guān)的突變章姓。
- 例如佳遣,P4715L(ORF1ab)和D614G(S)等突變已被證明與較高的死亡率相關(guān)聯(lián)。
- 相反地凡伊,P13L(N)零渐、Y789Y(S)、L37F(ORF10)和L6420L(ORF1ab)等突變被推測(cè)與較低的死亡率相關(guān)聯(lián)系忙。
- 此外诵盼,S24L(ORF8)突變似乎在女性中更為常見(jiàn)。
- D614G(S)突變被發(fā)現(xiàn)與男性性別及較高年齡有關(guān)笨觅。
- 這些觀察到的趨勢(shì)與我們的研究結(jié)果一致拦耐。
Natural selection sites
自然選擇位點(diǎn)
Para_22
- 檢測(cè)和量化進(jìn)化壓力揭示了大多數(shù)SARS-CoV-2密碼子處于強(qiáng)烈的正向或負(fù)向選擇之下。
- 正向選擇可以逐漸增加病毒群體中的特定突變见剩,因?yàn)檫@些突變可能會(huì)增強(qiáng)病毒的適應(yīng)性杀糯、傳播能力和抗藥性。
- 在這里苍苞,我們對(duì)2735個(gè)譜系分別進(jìn)行了選擇壓力分析固翰,并確定了共有4372個(gè)位點(diǎn)受到正向選擇壓力。
- 其中羹呵,MEME識(shí)別出3368個(gè)位點(diǎn)骂际,F(xiàn)EL識(shí)別出1778個(gè)位點(diǎn),F(xiàn)UBAR識(shí)別出3624個(gè)位點(diǎn)冈欢,而FEL歉铝、MEME和FUBAR的組合識(shí)別出1650個(gè)位點(diǎn)(圖1D)。
- 處于正向選擇下的突變有利于病毒的生存凑耻。
- 例如太示,位置L18(S)柠贤、L382(ORF1ab)、K417(S)类缤、N501(S)臼勉、H655(S)和P681(S)之前已被報(bào)道處于正向選擇之下,可能具有潛在的重要適應(yīng)性影響餐弱。
- 這些適應(yīng)性突變通常是潛在的藥物靶點(diǎn)宴霸。
Distribution in non-human animal hosts
在非人類動(dòng)物宿主中的分布
Para_23
- 當(dāng)前的研究表明,SARS-CoV-2 可以進(jìn)行跨物種傳播膏蚓。
- 已經(jīng)報(bào)告了幾起不同人類變種的 SARS-CoV-2 感染動(dòng)物的案例瓢谢,影響了包括寵物、家畜和野生動(dòng)物在內(nèi)的廣泛物種降允。
- 據(jù)報(bào)道恩闻,倉(cāng)鼠被感染后又將病毒傳回給人類艺糜,可能引發(fā)通過(guò)人際傳播蔓延的疫情剧董。
- 在本研究中,我們調(diào)查了非人類宿主中的突變分布情況破停,以深入了解跨物種傳播事件的可能性翅楼。
- 在非人類宿主中共鑒定出 1658 個(gè)突變位點(diǎn),涵蓋 29 種不同的物種真慢。
- 這些 1658 個(gè)突變的基因組分布如圖 1E 所示毅臊。
- 其中,一些突變黑界,例如 Y453F(S)管嬉、F486L(S)和 N501T(S),據(jù)報(bào)道有助于 SARS-CoV-2 適應(yīng)感染鼬科動(dòng)物朗鸠。
- 跨物種病毒傳播在病毒變異的進(jìn)化和出現(xiàn)中起著關(guān)鍵作用蚯撩。
- 分析非人類動(dòng)物中的突變提供了對(duì)潛在跨物種傳播可能性的認(rèn)識(shí),并增強(qiáng)了早期預(yù)警能力
Distribution of mutation on IDRs
IDRs上的突變分布
Para_24
- 固有無(wú)序區(qū)域是指沒(méi)有獨(dú)特三維結(jié)構(gòu)的蛋白質(zhì)區(qū)域烛占。這些蛋白質(zhì)的高度動(dòng)態(tài)無(wú)序區(qū)域與重要的現(xiàn)象有關(guān)胎挎,包括酶催化和別構(gòu)調(diào)控,以及諸如細(xì)胞信號(hào)傳導(dǎo)和轉(zhuǎn)錄等關(guān)鍵生理功能忆家。
- 在病毒蛋白中犹菇,無(wú)序區(qū)域中的突變對(duì)于免疫逃避和抗體逃逸至關(guān)重要,這暗示了對(duì)疫苗和單克隆治療策略可能存在的額外影響芽卿。
- 總共發(fā)現(xiàn)了9533個(gè)突變位點(diǎn)位于蛋白質(zhì)編碼區(qū)域內(nèi)(跨越12個(gè)GenBank蛋白質(zhì)序列)揭芍。
- 其中,735個(gè)位點(diǎn)位于固有無(wú)序區(qū)域內(nèi)卸例,分布在五個(gè)蛋白中:ORF1a(15.8%)称杨、ORF1ab(0.8%)流酬、S(10.6%)、ORF3a(4.1%)和N(68.7%)列另。
- 這與SARS-CoV-2核蛋白中IDRs的豐富性一致芽腾。
- IDRs在增加結(jié)合親和力和增強(qiáng)別構(gòu)結(jié)合方面發(fā)揮特殊作用,使N蛋白能夠高度協(xié)同地結(jié)合RNA页衙。
- Azad的研究表明摊滔,在N蛋白的IDRs中有大量突變,并且多個(gè)突變導(dǎo)致該蛋白功能發(fā)生顯著變化店乐。
- 深入了解固有無(wú)序區(qū)域的結(jié)構(gòu)將為高通量篩選提供寶貴的知識(shí)艰躺,以便識(shí)別與生物過(guò)程和功能相關(guān)的重大突變位點(diǎn)。
Associations of mutations with protein stability and function
突變與蛋白質(zhì)穩(wěn)定性及功能的相關(guān)性
Para_25
- 共有5348個(gè)錯(cuò)義突變接受了蛋白質(zhì)穩(wěn)定性和功能分析眨八。
- 使用I-Mutant預(yù)測(cè)突變對(duì)蛋白質(zhì)穩(wěn)定性的影響腺兴。
- 蛋白質(zhì)穩(wěn)定性分析表明,在體外和體內(nèi)環(huán)境中廉侧,1029個(gè)突變?cè)鰪?qiáng)了蛋白質(zhì)的穩(wěn)定性页响。
- 相反,在體外和體內(nèi)環(huán)境中段誊,4175個(gè)突變降低了蛋白質(zhì)的穩(wěn)定性闰蚕。
- 例如,像L452R和N501Y這樣的突變有助于提高S蛋白的穩(wěn)定性连舍。
- 我們的結(jié)果與這些研究一致没陡。
- 使用MutPred對(duì)所有點(diǎn)突變進(jìn)行了功能分析。
- 總共發(fā)現(xiàn)254個(gè)突變影響了蛋白質(zhì)的功能性索赏。
Associations of mutations with antigenicity and immunogenicity
突變與抗原性和免疫原性的關(guān)聯(lián)
Para_26
- 除了刺突蛋白在病毒進(jìn)入細(xì)胞過(guò)程中發(fā)揮的關(guān)鍵作用外盼玄,它還可以在病毒感染期間刺激免疫反應(yīng)。
- 研究揭示了刺突糖蛋白作為抗原區(qū)域的潛力潜腻。
- 在671種S蛋白突變中埃儿,99種表現(xiàn)出顯著改變的抗原性,27種顯示出顯著變化的免疫原性砾赔。
- 具體來(lái)說(shuō)蝌箍,共有99種突變導(dǎo)致抗原性得分變化超過(guò)0.0102(是各位置中位數(shù)的3倍)。
- 27種突變導(dǎo)致免疫原性得分變化超過(guò)0.2754(是各位置中位數(shù)的3倍)
Impact of mutations on the affinity between RBD and ACE2 receptor
突變對(duì)RBD與ACE2受體之間親和力的影響
Para_27
- 刺突蛋白通過(guò)受體結(jié)合域(RBD)與ACE2結(jié)合暴心,介導(dǎo)病毒進(jìn)入宿主細(xì)胞妓盲。
- 共鑒定出39個(gè)突變位點(diǎn)表現(xiàn)出RBD與ACE2之間結(jié)合親和力的變化。
- 發(fā)現(xiàn)RBD氨基酸K417专普、E484悯衬、L452、F486、Y489筋粗、Q493策橘、N501和Y505位點(diǎn)的突變?cè)鰪?qiáng)了該蛋白與ACE2受體的親和力。
- 我們的結(jié)果與這些研究一致娜亿。
- 深度突變掃描對(duì)于評(píng)估突變引起的ACE2結(jié)合變化具有預(yù)測(cè)價(jià)值丽已,有助于更好地理解病毒的傳播能力。
Impact of mutations on the affinity between receptor-binding domain of the spike protein and antibody/serum
突變對(duì)刺突蛋白的受體結(jié)合域與抗體/血清之間親和力的影響
Para_28
- 據(jù)報(bào)道买决,大約90%的血漿或血清中和抗體活性針對(duì)的是刺突受體結(jié)合域(RBD)沛婴。
- 不幸的是,刺突蛋白的快速進(jìn)化導(dǎo)致了血清中和效力的下降督赤,并促進(jìn)了對(duì)大多數(shù)單克隆抗體的逃避嘁灯。
- 深度突變掃描系統(tǒng)地評(píng)估了RBD關(guān)鍵區(qū)域內(nèi)氨基酸突變對(duì)單克隆抗體或血清的影響。
- 為此分析收集了總共1504項(xiàng)抗體/血清數(shù)據(jù)躲舌,并鑒定了114種突變丑婿。
- 其中,64個(gè)突變位點(diǎn)顯示出強(qiáng)大的免疫逃逸潛力没卸,至少在10種不同的抗體或血清中觀察到了免疫逃避羹奉。
- 例如,E484K(S)办悟、A475V(S)尘奏、L452R(S)滩褥、V483A(S)和F490L(S)已被鑒定為一種逃避突變病蛉,在暴露于單克隆抗體或康復(fù)者血漿時(shí)出現(xiàn)。
- 了解這些免疫逃逸突變對(duì)于評(píng)估對(duì)抗病毒的治療方法和疫苗的有效性至關(guān)重要
Co-mutation patterns
共變異模式
Para_29
- 相關(guān)系數(shù)可以衡量?jī)蓚€(gè)突變位點(diǎn)在樣本中的變異趨勢(shì)相似性哀托,從而表明它們是否共存或共同消失残黑。
- 突變位點(diǎn)的相關(guān)性分析有助于我們理解某些突變之間是否存在緊密的關(guān)系或相互作用撇吞。
- 在本研究中,我們計(jì)算了2735個(gè)譜系中每個(gè)譜系的9832個(gè)突變位點(diǎn)之間的相關(guān)性魄健。
- 根據(jù)相關(guān)性分析,9832個(gè)突變與至少一個(gè)其他突變存在相關(guān)性插勤。
- 總共沽瘦,我們確定了1,193,386對(duì)正相關(guān)和37,068對(duì)負(fù)相關(guān)。
- 其中农尖,許多相關(guān)性以前已有報(bào)道析恋。
- 例如,R203K (N) 和 G204R (N) 突變經(jīng)常組合出現(xiàn)盛卡,導(dǎo)致N蛋白的整體結(jié)構(gòu)穩(wěn)定性和靈活性降低助隧。
- D614G (S) 和 P4715 (ORF1ab) 展現(xiàn)出共存現(xiàn)象,顯示兩種不同蛋白質(zhì)間的突變具有高相關(guān)性滑沧。
- 同義突變 F924F (ORF1a) 被觀察到與其他突變共存并村,包括241C > T (-25C > T in ORF1a)巍实,P4715L (ORF1ab) 和 D614G (S)。
- 分析共突變模式有助于理解突變之間的相互依賴和排斥關(guān)系
Exploring the differences of S protein N501Y and N501T mutations using COV2Var
使用COV2Var探索S蛋白N501Y和N501T突變的差異
Para_30
- 截至目前哩牍,世界衛(wèi)生組織已指定了五種值得關(guān)注的變異株:Alpha(B.1.1.7)棚潦、Beta(B.1.351)、Gamma(P.1)膝昆、Delta(B.1.617.2)和Omicron(B.1.1.529)瓦盛。
- 位于S蛋白受體結(jié)合域的N501Y突變?cè)谶@五種變異株中普遍存在。
- 在我們的研究中外潜,我們?cè)贜501位點(diǎn)發(fā)現(xiàn)了兩種常見(jiàn)的突變:N501Y和N501T原环。
- 大約45.7%的SARS-CoV-2變異株攜帶N501Y突變,而N501T突變僅在約0.00043%的變異株中被發(fā)現(xiàn)处窥。
- 這表明N501Y突變相對(duì)普遍且分布廣泛嘱吗。
-
我們進(jìn)行了深入的研究來(lái)分析導(dǎo)致N501Y和N501T不同發(fā)生率的因素。
- 圖3. 對(duì)SARS-CoV-2刺突蛋白中N501Y和N501T突變的比較分析滔驾。(A) 含N501Y突變序列的時(shí)間動(dòng)態(tài)谒麦。(B) 含N501T突變序列的時(shí)間動(dòng)態(tài)。(C) 在B.1.6亞系中攜帶N501Y或N501T突變的序列計(jì)數(shù)哆致。(D) N501Y和N501T突變對(duì)ACE2結(jié)合親和力的比較绕德。(E) N501Y和N501T突變免疫逃逸能力的比較。
Para_31
- 值得注意的是摊阀,在B.1.604譜系內(nèi)耻蛇,我們觀察到了N501T和N501Y突變的同時(shí)存在,這兩種突變之間表現(xiàn)出強(qiáng)烈的負(fù)相關(guān)關(guān)系(相關(guān)系數(shù):-0.63胞此,Holm-Bonferroni校正P值<0.05)臣咖。
- N501Y占B.1.604譜系群體的87%,而N501T占比為5.56%(圖3C)漱牵。
- 為了探索競(jìng)爭(zhēng)關(guān)系夺蛇,我們研究了圍繞B.1.604譜系的B.1.6亞譜系。
- B.1.6內(nèi)的亞譜系具有不同的突變酣胀,其中一些只攜帶N501Y(例如B.1.621.1刁赦、B.1.605和B.1.621),其他的要么只攜帶N501T(B.1.609和B.1.626)闻镶,要么兩者都有(B.1.604)(圖3C)甚脉。
- B.1.6亞譜系中N501Y和N501T突變的這種多樣化分布是顯而易見(jiàn)的。
- B.1.621譜系顯示出N501Y的最高流行率儒溉。
- 它的頻率比其他攜帶N501Y或N501T突變的亞譜系高出6.16到2212.83倍宦焦。
- 在B.1.621分支中,只有一個(gè)突變E484K與N501Y呈現(xiàn)出強(qiáng)烈的正相關(guān)關(guān)系(相關(guān)系數(shù):0.81,Holm-Bonferroni校正P值<0.05)波闹,但與N501T沒(méi)有關(guān)聯(lián)酝豪。
- E484K被認(rèn)為是暴露于單克隆抗體(mAbs)、mAbs組合及康復(fù)者血漿時(shí)出現(xiàn)的一種逃逸突變精堕。
- 此外孵淘,N501Y和E484K的共存經(jīng)常出現(xiàn)在關(guān)注變異株(VOCs)中。
- 這表明E484K的存在增強(qiáng)了N501Y相對(duì)于N501T的競(jìng)爭(zhēng)優(yōu)勢(shì)歹篓。
Para_32
- 我們還探討了其他可能促成N501Y和N501T突變之間差異的因素瘫证。
- 使用DMS實(shí)驗(yàn)數(shù)據(jù),N501Y突變顯示出對(duì)ACE2受體增強(qiáng)的RBD親和力(圖3D)庄撮,這有助于提高N501Y的傳播性背捌。
- 與參考序列相比,N501Y保持不變的抗原性和免疫原性洞斯,而N501T顯示增強(qiáng)的抗原性而不影響免疫原性毡庆。
- 根據(jù)Fisher檢驗(yàn)P值大于0.05的結(jié)果,N501Y和N501T之間在抗體逃逸能力上沒(méi)有差異(圖3E)烙如。
- 我們進(jìn)一步整合了序列元數(shù)據(jù)進(jìn)行綜合分析么抗。
- 攜帶N501Y突變的患者表現(xiàn)出顯著的恢復(fù)改善,從26.56%提高到32.88%亚铁。
- 相反蝇刀,攜帶N501T突變的患者經(jīng)歷了更差的結(jié)果,死亡率從7.14%上升到23.08%徘溢。
- N501Y在年輕人中更為普遍吞琐,這與先前研究提出的在年輕群體中發(fā)生率更高的觀點(diǎn)一致。
- 值得注意的是甸昏,N501Y和N501T之間存在顯著的ΔDDG差異顽分,N501Y在體內(nèi)和體外都更加穩(wěn)定。
- N501Y和N501T都在不同的非人類宿主中被識(shí)別出來(lái)施蜜,這與文獻(xiàn)相符,并暗示了對(duì)病毒適應(yīng)性和跨物種傳播的潛在影響雌隅。
- 在非人類宿主中翻默,攜帶N501Y突變的序列占13.3%,而帶有N501T突變的序列占8.4%恰起。
- 這表明N501T對(duì)非人類宿主更為有利修械。
- 據(jù)報(bào)道,N501T突變促進(jìn)了SARS-CoV-2感染非人類宿主的適應(yīng)性检盼。
- 通過(guò)利用COV2Var肯污,我們進(jìn)行了N501Y和N501T突變之間的比較分析,揭示了這兩個(gè)突變?cè)谌祟愔型蛔冾l率顯著差異的潛在原因
Exploring the latest XBB.1.16* variants with COV2Var
利用COV2Var探索最新的XBB.1.16*變異株
Para_33
- 目前,SARS-CoV-2 奧密克戎 XBB 變異株的一些譜系及其后代譜系(例如 XBB.1.5蹦渣、XBB.1.9 和 XBB.1.16*)已成為全球主要流行株哄芜。星號(hào)符號(hào)代表子譜系。例如柬唯,XBB.1.5 指的是 XBB.1.5 本身及其相關(guān)的子譜系认臊。
- 世界衛(wèi)生組織(WHO)已將 XBB.1.5、XBB.1.9 和 XBB.1.16* 列為監(jiān)測(cè)中的變異株(https://www.who.int/en/activities/tracking-SARS-CoV-2-variants)锄奢。
- 根據(jù)美國(guó)疾控中心(CDC)最新數(shù)據(jù)(https://covid.cdc.gov/covid-data-tracker/#variant-proportions)失晴,截至 2023 年 7 月底,XBB.1.16 已成為美國(guó)的主要毒株拘央,迅速達(dá)到 32.9% 的流行率(圖 4A)涂屁。
- 這超過(guò)了 XBB.1.5(17.2%)和 XBB.1.9(17.6%)的比例,表明 XBB.1.16 變異株相比另外兩個(gè)變異株具有更高的潛在傳播率灰伟。
- 重要的是胯陋,根據(jù)全球共享流感數(shù)據(jù)倡議組織(GISAID)的突變位點(diǎn)數(shù)據(jù)(https://gisaid.org/lineage-comparison/),XBB.1.16* 變異株展現(xiàn)出顯著的特征性突變袱箱,包括 L3829F(ORF1a)遏乔、G18703T(ORF1b 中的 D1746Y 或 ORF1ab 中的 D6147Y)、E180V(S)和 T478R(S)(圖 4B)发笔,這些突變使其區(qū)別于 XBB.1.5* 和 XBB.1.9* 變異株盟萨。
- 圖4. 使用COV2Var探索最新變種XBB.1.16。(A) XBB.1.5了讨、XBB.1.16和XBB.1.19變種的序列計(jì)數(shù)隨時(shí)間的變化動(dòng)態(tài)捻激。(B) XBB.1.5、XBB.1.16和XBB.1.19*變種之間的突變差異前计。(C) SARS-CoV-2刺突蛋白中的T478位點(diǎn)胞谭。SARS-CoV-2受體結(jié)合域顯示為黃色,ACE2顯示為綠色男杈。品紅色區(qū)域代表ACE2結(jié)合界面丈屹,而青色區(qū)域表示受體結(jié)合域結(jié)合界面。(D) XBB.1譜系中攜帶D1746Y突變的序列頻率隨時(shí)間的變化伶棒。
Para_34
- L3829F突變位于病毒的ORF1a基因中旺垒。多項(xiàng)研究已經(jīng)報(bào)告了這一突變,主要只是列出了L3829F突變肤无,而沒(méi)有提供其影響的充分細(xì)節(jié)先蒋。
- 有一項(xiàng)研究指出L3829F處于正向選擇之下,這對(duì)病毒的生存有利宛渐。
- 我們的結(jié)果也支持這一點(diǎn)竞漾,表明L3829位點(diǎn)處于正向選擇之下眯搭。
- 此外,我們發(fā)現(xiàn)攜帶L3829F突變的變異株與感染后更高的住院率相關(guān)(P值小于0.001)业岁。
- 這與對(duì)XBB.1.16*的觀察一致鳞仙,該變異株的住院率顯著高于其他奧密克戎變異株。
- L3829F突變?cè)鰪?qiáng)了ORF1a蛋白的穩(wěn)定性和體內(nèi)外的穩(wěn)定性(ΔDDG大于0)叨襟。
- SARS-CoV-2中的ORF1a基因編碼病毒復(fù)制復(fù)合體繁扎,這對(duì)于病毒復(fù)制和轉(zhuǎn)錄至關(guān)重要。
- 此外糊闽,在非人類宿主如Felis catus梳玫、Mesocricetus auratus、Mus musculus右犹、Neovison vison和Odocoileus virginianus中也發(fā)現(xiàn)了L3829F突變提澎。
Para_35
- 與XBB.1.5和XBB.1.9相比,XBB.1.16*變異株在其刺突蛋白中擁有E180V和T478R突變念链。
- XBB.1.5和XBB.1.9帶有T478K突變盼忌,而XBB.1.16*則具有T478R突變。
- 值得注意的是掂墓,第478位位于刺突蛋白與ACE2受體結(jié)合位點(diǎn)內(nèi)(圖4C)谦纱。
- 然而,T478R和T478K突變之間ACE2結(jié)合親和力沒(méi)有顯著差異(P值 > 0.05)君编,這與文獻(xiàn)一致跨嘉,表明XBB.1.16和XBB.1.5的刺突蛋白在傳染性方面具有相似特性。
- T478R和T478K突變?cè)诳乖院兔庖咴苑矫鏇](méi)有區(qū)別吃嘿。
- E180V與參照物相比祠乃,在抗原性和免疫原性方面也沒(méi)有差異。
- XBB.1.16和XBB.1.5在逃避體液免疫的能力上表現(xiàn)出相似特征兑燥。
- 值得注意的是亮瓷,在比較T478R和T478K突變時(shí),T478R(ΔDDG > 0)增強(qiáng)了S蛋白的穩(wěn)定性降瞳,而T478K(ΔDDG < 0)降低了其穩(wěn)定性嘱支。
- E180V(ΔDDG > 0)也增強(qiáng)了S蛋白的穩(wěn)定性。
Para_36
- D1746Y突變位于ORF1b基因中力崇,該基因編碼依賴RNA的RNA聚合酶(RdRp)斗塘,這是病毒復(fù)制的關(guān)鍵成分。
- 盡管目前尚不清楚這種突變?nèi)绾斡绊懖《镜闹虏⌒粤裂ィ腥颂岢鯠1746Y突變可以增加蛋白質(zhì)的穩(wěn)定性(ΔDDG > 0),從而提高其復(fù)制速率于置。
- 我們的結(jié)果顯示D1746Y突變正經(jīng)歷正向選擇茧吊,這對(duì)病毒的生存有利贞岭。
- XBB.1.16是XBB.1的一個(gè)亞分支。
- 攜帶D1746Y突變的序列占XBB.1譜系所有XBB.1序列的0.12%搓侄。
- 在XBB.1中瞄桨,攜帶D1746Y突變的序列頻率顯著增加。
- 這表明D1746Y突變?cè)赬BB.1譜系中的適應(yīng)性讶踪。
- 在XBB.1內(nèi)芯侥,D1746Y突變與另外兩個(gè)突變E180V和D371D之間表現(xiàn)出強(qiáng)烈的正相關(guān)關(guān)系(相關(guān)系數(shù) > 0.6,Holm-Bonferroni校正P值 < 0.05)乳讥。
- E180V突變也是XBB.1.16的一個(gè)特征柱查。
- 由于XBB.1.16和XBB.1.5的刺突蛋白在感染性和逃避體液免疫的能力方面表現(xiàn)出相似的特點(diǎn),XBB.1.16適應(yīng)性的增強(qiáng)可能歸因于非刺突蛋白中的突變云石。
- D1746Y突變可能在XBB.1.16適應(yīng)性增強(qiáng)中發(fā)揮重要作用
Para_37
- XBB.1.16是一種新識(shí)別的變異體唉工,在我們的數(shù)據(jù)收集完成后出現(xiàn)。與XBB.1.5和XBB.1.9不同汹忠,XBB.1.16變異體中所有獨(dú)特的突變都被包含在這9832種常見(jiàn)突變之中淋硝。
- SARS-COV2采取了一種生存策略,通過(guò)緩慢接受新的突變宽菜,并依賴于組合突變來(lái)維持谣膳。
- 通過(guò)利用COV2Var,我們可以評(píng)估新出現(xiàn)變異體中突變的功能影響铅乡,有助于描述這些新型變異體的特點(diǎn)继谚。
Discussion
Para_38
- COV2Var是首個(gè)且獨(dú)一無(wú)二的數(shù)據(jù)庫(kù),系統(tǒng)地分析了超過(guò)130億條SARS-CoV-2基因組序列及其元數(shù)據(jù)隆判。
- 我們確定了9832種具有競(jìng)爭(zhēng)優(yōu)勢(shì)的常見(jiàn)突變犬庇。
- 這些突變比其他突變表現(xiàn)出更高的適應(yīng)性和傳播能力,突顯了它們?cè)谶M(jìn)化中的優(yōu)勢(shì)作用及生物學(xué)意義侨嘀。
- 隨后臭挽,我們通過(guò)整合序列和元數(shù)據(jù)信息,對(duì)總共9832個(gè)常發(fā)突變位點(diǎn)進(jìn)行了全面的功能注釋咬腕。
- 利用COV2Var欢峰,我們可以揭示N501Y與N501T突變?cè)谌祟愔酗@著不同的突變頻率的潛在原因。
- 例如涨共,E484K突變有助于增強(qiáng)N501Y的競(jìng)爭(zhēng)優(yōu)勢(shì)纽帖。
- N501Y突變?cè)鰪?qiáng)了受體結(jié)合域(RBD)對(duì)ACE2受體的親和力,從而增加了N501Y的傳播性举反。
- 而N501T突變則顯示出了對(duì)非人類動(dòng)物宿主更大的適應(yīng)性懊直。
- 此外,我們還使用COV2Var研究了新出現(xiàn)的變異株XBB.1.16*火鼻。
- 相較于XBB.1.5室囊,XBB.1.16*顯示出四種獨(dú)特的突變雕崩。
- D1746Y突變可能在提高XBB.1.16的適應(yīng)性方面發(fā)揮著關(guān)鍵作用。
- L3829F突變與更高的住院率相關(guān)聯(lián)融撞。
- 此外盼铁,T478R和E180V突變有助于刺突蛋白的穩(wěn)定性增強(qiáng)。
- 我們的數(shù)據(jù)庫(kù)將成為評(píng)估SARS-CoV-2突變影響以及深入了解變異株特性的獨(dú)特而全面資源尝偎。
- 為了保持COV2Var作為COVID-19突變注釋數(shù)據(jù)庫(kù)的領(lǐng)先地位饶火,我們將持續(xù)獲取并整合新的數(shù)據(jù)更新到我們的數(shù)據(jù)庫(kù)中。
Data availability
Para_39
- 我們從GISAID(https://gisaid.org/)檢索了基因組序列和元數(shù)據(jù)致扯。
- 關(guān)于所使用GISAID數(shù)據(jù)的詳細(xì)信息可以在https://doi.org/10.55876/gis8.230705yx找到肤寝。
Supplementary data
Para_40
- 補(bǔ)充數(shù)據(jù)可在 NAR 在線獲取。
本文由mdnice多平臺(tái)發(fā)布