Basic Information
- 英文標(biāo)題: gcPathogen: a comprehensive genomic resource of human pathogens for public health
- 中文標(biāo)題:gcPathogen:一個(gè)全面的基因組資源庫(kù)蹦漠,涵蓋了對(duì)人體健康構(gòu)成威脅的各種病原體
- 發(fā)表日期:18 October 2023
- 文章類型:Na
- 所屬期刊:Nucleic Acids Research
- 文章作者:Chongye Guo | Linhuan Wu
- 文章鏈接:https://academic.oup.com/nar/article/52/D1/D714/7321059
Abstract
- 這里,我們介紹了人工整理的全球病原體目錄(gcPathogen)津辩,這是一個(gè)廣泛而全面的基因組資源喘沿,旨在促進(jìn)病原體分析、流行病學(xué)探索以及對(duì)抗生素耐藥性和毒力因子監(jiān)測(cè)的速度和準(zhǔn)確性竭贩。
- 該目錄無縫整合并分析了從感染患者蚜印、動(dòng)物宿主、食物和環(huán)境中分離出的人類病原體的基因組數(shù)據(jù)及相關(guān)元數(shù)據(jù)窄赋。
- 病原體列表得到了來自醫(yī)學(xué)或政府病原體清單及出版物證據(jù)的支持哟冬。
- 目前版本的gcPathogen擁有令人印象深刻的1,164,974個(gè)組裝體,其中包括來自497種細(xì)菌分類單元的986,044株菌株忆绰,涵蓋265種真菌分類單元的4,794個(gè)組裝體浩峡,包含4,319株菌株,還有來自222種病毒分類單元的89,965個(gè)組裝體错敢,包含13,687株病毒株翰灾,以及來自159種寄生蟲分類單元的646個(gè)組裝體,包括387株寄生蟲株稚茅。
- 通過這個(gè)數(shù)據(jù)庫(kù)纸淮,研究人員能夠獲得一個(gè)全面的‘一站式服務(wù)’平臺(tái),這有助于全球長(zhǎng)期的公共衛(wèi)生監(jiān)控亚享,并且能夠深入分析不同國(guó)家、疾病和宿主中的基因組侈沪、序列類型、抗生素耐藥性基因峭竣、毒力因子和可移動(dòng)遺傳元件哲银。
- 為了訪問和探索數(shù)據(jù)與統(tǒng)計(jì)信息做院,已開發(fā)了一個(gè)交互式的網(wǎng)絡(luò)界面屈雄,可以通過https://nmdc.cn/gcpathogen/進(jìn)行訪問。
-
這個(gè)用戶友好的平臺(tái)允許順暢地查詢和探索gcPathogen數(shù)據(jù)庫(kù)中豐富的信息鼻百。
Introduction
Para_01
- 傳染病是全球公共衛(wèi)生面臨的重大威脅之一臼朗。
- 基因組序列數(shù)據(jù)的快速積累對(duì)于支持傳染病監(jiān)測(cè)和流行病學(xué)調(diào)查變得越來越重要蒜撮。
- 基于全基因組測(cè)序(WGS)數(shù)據(jù)的分型方法,如核心基因多位點(diǎn)序列分型(cgMLST)和全基因組多位點(diǎn)序列分型(wgMLST),因其在速度、成本效益和高分辨率方面的優(yōu)勢(shì)而被廣泛采用黍氮,為監(jiān)控淮捆、疫情調(diào)查痹愚、來源追溯和進(jìn)化研究提供了大量信息
Para_02
- 病原體對(duì)抗生素產(chǎn)生耐藥性的挑戰(zhàn)對(duì)人類健康具有深遠(yuǎn)的影響。
- 識(shí)別抗生素抗性基因(ARGs)并追蹤它們?cè)诓煌≡w或同一病原體的不同亞型間的傳播可以為藥物開發(fā)弦蹂、疾病預(yù)防和治療提供寶貴的見解髓抑。
- 同時(shí),毒力因子(VF)使病原體能夠感染宿主并導(dǎo)致疾病。
- 識(shí)別和分析這些因子有助于確定大規(guī)模疾病爆發(fā)的發(fā)生。
- 抗生素抗性基因和毒力因子通常通過與可移動(dòng)遺傳元件(MGEs)的水平轉(zhuǎn)移獲得。
Para_03
- 盡管WGS數(shù)據(jù)的可用性支持了病原體的精確鑒定和對(duì)毒力因子奈搜、抗性基因及移動(dòng)遺傳元件多樣性的深入理解,但當(dāng)前的基因組資源并未覆蓋所有已知的人類病原體崇堰,這限制了研究?jī)H能針對(duì)一部分物種。
- 為了克服這一局限,一個(gè)全面的基因組資源庫(kù)嵌牺,涵蓋所有已知的人類病原體他嚷,并輔以精心整理的元數(shù)據(jù),將極大地促進(jìn)跨越長(zhǎng)時(shí)間尺度的全球研究唱捣,并顯著提高傳染病的控制和治療水平烦感。
- 此外燕耿,基因組數(shù)據(jù)分析和決策制定很大程度上依賴于數(shù)據(jù)可視化亚再。
- 然而伪朽,現(xiàn)有的平臺(tái)往往缺乏基因組和流行病學(xué)數(shù)據(jù)的整合讶舰,無法創(chuàng)建交互式的可視化工具跳昼。
Para_04
- 為了彌補(bǔ)這些空白般甲,我們開發(fā)了gcPathogen(全球病原體目錄),這是一個(gè)全面的基因組資源庫(kù),它匯集堪伍、整合并分析來自全球感染患者锚烦、動(dòng)物宿主和環(huán)境樣本中的人類病原體的數(shù)據(jù)。
- 該數(shù)據(jù)庫(kù)依賴于人工精心整理的高質(zhì)量數(shù)據(jù)杠娱,支持基因組分析挽牢、MLST、cgMLST以及ARGs摊求、VFs和MGEs的分析禽拔,并且所有這些都可以通過交互界面完成。
- 這一強(qiáng)大的工具使經(jīng)驗(yàn)豐富的研究人員能夠進(jìn)行更廣泛深入的病原體研究室叉,同時(shí)也讓復(fù)雜的分析民主化睹栖,使得公共衛(wèi)生專家、臨床醫(yī)生以及其他基因組學(xué)或生物信息學(xué)領(lǐng)域的非專家也能進(jìn)行這些分析茧痕。
Database interface and features
Webpage of the pathogens
病原體的網(wǎng)頁(yè)
Para_05
- 在gcPathogen中野来,我們已經(jīng)按分類單元組織了細(xì)菌、真菌踪旷、病毒和寄生蟲的DNA序列組裝曼氛,以及相應(yīng)的人工策劃的元數(shù)據(jù)和分析結(jié)果(8),涵蓋了屬令野、種舀患、亞種或血清型(圖1A)。
-
病原微生物的基因組DNA序列數(shù)據(jù)是從公共數(shù)據(jù)庫(kù)和出版物中收集的气破。
- 圖 1. gcPathogen 網(wǎng)站的特點(diǎn)聊浅。 (A) gcPathogen 的主頁(yè)。 (B) 病原體種類概覽现使。 (C) 全球病原體低匙、抗生素耐藥基因和毒力因子的分布圖。 (D) 病原體及其整理的元數(shù)據(jù)的知識(shí)圖譜示意圖碳锈。
Para_06
- 每個(gè)病原體的網(wǎng)頁(yè)被劃分為幾個(gè)主要部分顽冶,包括概述、序列類型(STs 和 cgMLST)售碳、抗生素抗性基因渗稍、毒力因子佩迟、可移動(dòng)遺傳元件和知識(shí)圖譜(圖 1B)。
- 概述部分展示了序列組裝及其相關(guān)元數(shù)據(jù)的基本信息竿屹,如測(cè)序方法报强、提交者、基因組大小和參考基因組拱燃。
- 它還提供了一個(gè)全球分布地圖秉溉、宿主類別、關(guān)聯(lián)疾病碗誉、分離來源以及從同行評(píng)審出版物中手工整理的文字描述召嘶,這些文字描述涉及爆發(fā)或感染案例。
Para_07
- 對(duì)于每種病原體哮缺,STs部分提供了物種內(nèi)所有STs的概覽信息弄跌,包括相關(guān)基因組的數(shù)量、菌株尝苇、ARGs铛只、VFs以及與ARGs和VFs相關(guān)的MGEs。
- 可以按年份或國(guó)家顯示主要STs的信息糠溜,同時(shí)還提供代表性STs的相關(guān)性圖譜淳玩。
- 此外,用戶可以選擇序列組裝非竿,并在線進(jìn)行cgMLST分析蜕着,前提是能夠訪問相應(yīng)的種子文件
Para_08
- ARGs、VFs 和 MGEs 部分為每種物種提供了所有注釋的抗性基因红柱、毒力因子和移動(dòng)遺傳元件的綜合信息承匣。
- 可以直觀地繪制出對(duì)不同類型抗生素的耐藥性,以及按國(guó)家锤悄、疾病韧骗、宿主和分離來源分布的耐藥性、毒力和移動(dòng)遺傳元件的情況铁蹈。
Feature resources
特征資源
Para_09
- 特征資源涵蓋四個(gè)部分:高致病性病毒宽闲、注釋的ARGs列表众眨、VF和MGEs握牧。
- 高致病性病毒旨在為評(píng)估疫情爆發(fā)風(fēng)險(xiǎn)、跨物種病毒傳播及全球擴(kuò)散提供數(shù)據(jù)支持娩梨。
- 這一部分包含了被分類為生物安全等級(jí)III和IV級(jí)的病毒沿腰。
- 提供了關(guān)于傳播途徑、宿主狈定、分離來源及國(guó)家的統(tǒng)計(jì)分析颂龙。
- 同時(shí)习蓬,還展示了一個(gè)知識(shí)圖譜,該圖譜從出版物中提取出作者與機(jī)構(gòu)之間的合作網(wǎng)絡(luò)措嵌。
Para_10
- 在抗生素抗性基因部分躲叼,全面概述了病原體ARGs的概況,包括所有從病原菌注釋的ARGs企巢、每種物種中的高頻ARGs以及世界衛(wèi)生組織全球優(yōu)先列表中的抗生素耐藥細(xì)菌的主要ARGs枫慷。
- 使用表格和圖表分析這些ARGs,涉及它們所在的國(guó)家浪规、物種或听、棲息地及相關(guān)的MGEs。
- 同樣地笋婿,整合并分析了VFs及其流行病學(xué)數(shù)據(jù)誉裆,采用交互式可視化。
- MGE列表部分涵蓋了五類MGEs缸濒,包括插入序列(IS)足丢、整合共軛元件(ICE)、整合子(IN)绍填、質(zhì)粒和轉(zhuǎn)座子霎桅。
- 根據(jù)這些MGEs的分類分布、攜帶的ARGs和VFs以及分離的棲息地來分析它們讨永,旨在了解由MGEs介導(dǎo)的病原體獲得性抗性和毒力的發(fā)生和傳播滔驶。
Statistic summary and database search
統(tǒng)計(jì)總結(jié)與數(shù)據(jù)庫(kù)查詢
Para_11
- "病原體和基因組特征"頁(yè)面提供了細(xì)菌、真菌卿闹、病毒和寄生蟲的數(shù)量統(tǒng)計(jì)概要揭糕,以及它們的物種分布、數(shù)據(jù)量和每種病原體類型的最大數(shù)據(jù)提交者锻霎。
- 所有病原體著角、抗性基因、毒力因子和移動(dòng)遺傳元件的全球分布可以根據(jù)年份和國(guó)家進(jìn)行展示(圖 1C)旋恼。
Para_12
- ‘高級(jí)搜索’功能使用戶能夠根據(jù)手動(dòng)整理的元數(shù)據(jù)進(jìn)行一項(xiàng)或多項(xiàng)目的搜索吏口,這些元數(shù)據(jù)涉及:(i) 病原體信息,包括物種名稱冰更、采樣日期产徊、國(guó)家、分離來源蜀细、宿主舟铜、疾病和生物安全等級(jí);(ii) 序列組裝信息奠衔,包括測(cè)序平臺(tái)谆刨、序列類型塘娶、組裝級(jí)別和序列片段的數(shù)量。
Para_13
- gcPathogen 有效地利用語義網(wǎng)絡(luò)技術(shù)痊夭,根據(jù)整理后的元數(shù)據(jù)展示病原體刁岸、分離源、疾病和宿主之間的聯(lián)系(圖 1D)她我。
- 這一"知識(shí)圖譜"有助于用戶整合不同類型的信息难捌,從而獲得全面的視角并識(shí)別出各種聯(lián)系。
- 此外鸦难,gcPathogen 提供了一個(gè)搜索界面根吁,用于探索所選病原體之間的聯(lián)系。
Online data analysis pipelines
在線數(shù)據(jù)分析管道
Para_14
- gcPathogen 無縫集成多種在線工具合蔽,用于實(shí)現(xiàn)基因組的快速分析击敌。
- ‘病原體鑒定’工具結(jié)合了 16S rRNA 基因序列和基因組平均核苷酸同一性(ANI),以給出物種鑒定結(jié)果拴事。
- ‘基因組注釋流程’在 gcType (10) 中高效注釋細(xì)菌基因組沃斤。
- ‘MLST’流程使用 MLST 2.22.1 根據(jù)用戶提交的基因組組裝確定序列類型(ST),參照 PubMLST 分型方案刃宵。
- ‘cgMLST’流程利用 chewBBACA 2.0.9 (12) 將查詢組裝與預(yù)先計(jì)算的分型方案進(jìn)行比較衡瓶,生成包含相關(guān)元數(shù)據(jù)的系統(tǒng)發(fā)育樹。
- 這些集成的流程依托高質(zhì)量的參考數(shù)據(jù)集牲证,使用戶能夠?qū)⒆约旱幕蚪M數(shù)據(jù)與全球數(shù)據(jù)庫(kù)進(jìn)行比較哮针,有效地檢測(cè)疫情爆發(fā)并追溯其來源。
Database construction and analytical methods
Pathogen inventory and data sources
病原體清單及數(shù)據(jù)來源
Para_15
- 我們根據(jù)可靠來源的指導(dǎo)編制了一份人類病原體的詳盡清單坦袍,這些來源包括世界衛(wèi)生組織(http://ghdx.healthdata.org/gbd-2016)十厢、美國(guó)國(guó)家過敏和傳染病研究所的新興傳染病及病原體列表(https://www.niaid.nih.gov/research/emerging-infectious-diseases-pathogens)、中華人民共和國(guó)國(guó)家衛(wèi)生健康委員會(huì)捂齐、美國(guó)疾病控制中心(https://search.cdc.gov/search/index.html?all=pathogen=1#results)蛮放、美國(guó)傳染病學(xué)會(huì)和美國(guó)微生物學(xué)會(huì)。
- 這份清單還補(bǔ)充了疫情爆發(fā)報(bào)告和相關(guān)研究文章奠宜。
- 此外包颁,世界衛(wèi)生組織(WHO)發(fā)布的全球抗生素耐藥細(xì)菌優(yōu)先清單指導(dǎo)了我們針對(duì)新抗生素的研究、發(fā)現(xiàn)和發(fā)展工作压真。
Para_16
- 為了構(gòu)建我們的數(shù)據(jù)庫(kù)娩嚼,我們從國(guó)家生物技術(shù)信息中心(NCBI)的基因組數(shù)據(jù)庫(kù)中檢索了清單中所有病原體的序列組裝。
- 從BioSamples提取并整合了相關(guān)的元數(shù)據(jù)榴都。
-
此外待锈,這些數(shù)據(jù)還參照了PubMed中索引的同行評(píng)審出版物漠其。(圖2)
- 圖 2. 在 gcPathogen 中使用的數(shù)據(jù)處理流程嘴高。
Para_17
- 該數(shù)據(jù)庫(kù)當(dāng)前版本包含了一個(gè)令人印象深刻的集合竿音,共有1164974個(gè)組裝體,涵蓋了來自497種細(xì)菌分類群的986044個(gè)菌株(8)拴驮,其中包含497種細(xì)菌分類群的4794個(gè)組裝體春瞬,涉及265種真菌分類群的4319個(gè)菌株(8),89965個(gè)組裝體涵蓋了來自222種病毒分類群的13687個(gè)菌株(8)套啤,以及646個(gè)組裝體宽气,包括來自159種寄生蟲分類群的387個(gè)菌株(8)。
- 這個(gè)龐大的數(shù)據(jù)集覆蓋了全球198個(gè)國(guó)家和地區(qū)潜沦,提供了全球病原體的全面流行病學(xué)概覽萄涯。
Data quality control
數(shù)據(jù)質(zhì)量控制
Para_18
- 為了確保數(shù)據(jù)完整性,所有上傳到gcPathogen的信息都經(jīng)過了嚴(yán)格的質(zhì)量控制檢查唆鸡,包括一致性涝影、完整性和污染情況。
- 隨后争占,對(duì)基因燃逻、MLST、cgMLST臂痕、ARGs伯襟、VFs和MGEs進(jìn)行了數(shù)據(jù)分析。
- 只有通過checkM 1.1.3驗(yàn)證顯示超過95%的完整性和低于5%的污染率的序列組裝被保留下來握童。
- 此外姆怪,根據(jù)NCBI分類學(xué),將序列組裝分配給相應(yīng)的屬和種澡绩。
- 對(duì)于物種確定片效,如果組裝的ANI在FastANI 1.3中與來自NCBI的RefSeq的參考序列相比超過95%,則認(rèn)為它們屬于同一物種英古。
- 此外淀衣,還手動(dòng)對(duì)這些組裝的宿主、分離來源和疾病相關(guān)的元數(shù)據(jù)進(jìn)行了分類召调。
Sequence-based pathogen typing
基于序列的病原體分型
Para_19
- gcPathogen 對(duì)病原細(xì)菌進(jìn)行了多態(tài)性序列分型(MLST)和核心基因組多態(tài)性序列分型(cgMLST)分析膨桥。
- 經(jīng)過質(zhì)量控制后,組裝的數(shù)據(jù)被用于 MLST 分析唠叛,以確定它們的序列類型(ST)只嚣。
- 根據(jù)國(guó)家、分離來源艺沼、宿主和采集日期生成了基于 ST 的分布特征的圖形展示册舞。
- 此外,我們還研究了耐藥基因(ARGs)/毒力因子(VFs)與每種物種的 ST 之間的關(guān)聯(lián)障般,以識(shí)別特定 ST 的 ARGs/VFs 及其相應(yīng)的 P 值调鲸。
Para_20
- 為了提高病原體來源的判別和監(jiān)控能力盛杰,我們采用了基于全基因組測(cè)序(WGS)的核基因多位點(diǎn)序列分型(cgMLST)。
- 然而藐石,由于某些物種公開可用的cgMLST方案有限即供,我們通過在gcPathogen中提供預(yù)計(jì)算的cgMLST方案來應(yīng)對(duì)這一挑戰(zhàn)。
- 我們使用基于BLAST得分比的等位基因調(diào)用算法(chewBBACA 2.0.9)對(duì)質(zhì)量控制后超過200個(gè)組裝的所有細(xì)菌種類進(jìn)行了cgMLST分析于微。
- 在當(dāng)前版本中逗嫡,我們包含了針對(duì)9個(gè)屬和95個(gè)種(總計(jì)112個(gè)種)的cgMLST方案文件。
- 這些方案包括來自Enterobase的6個(gè)株依,來自PubMLST的9個(gè)以及來自PathogenWatch的9個(gè)(cgMLST方案列于補(bǔ)充表S1中)驱证。
- 此外,除了在線分析工具外恋腕,還提供了可下載的cgMLST方案文件雷滚,并隨著更多組裝的出現(xiàn)定期更新。
Annotation of antibiotic resistance genes, virulence factors and mobile genetic elements
抗生素抗性基因吗坚、毒力因子和可移動(dòng)遺傳元件的注釋
Para_21
- 使用原核生物動(dòng)態(tài)規(guī)劃基因?qū)ふ宜惴?.6.3在質(zhì)量控制的序列組裝中預(yù)測(cè)基因祈远。
- 隨后,根據(jù)全面抗生素抗性數(shù)據(jù)庫(kù)使用Diamond 0.9.22.123對(duì)抵抗基因進(jìn)行注釋商源,覆蓋度超過80%车份。
- 此外,我們利用Resfams數(shù)據(jù)庫(kù)和HMMER 3.1有效地識(shí)別已知ARGs的甚至遠(yuǎn)親同源物(覆蓋度大于80%)牡彻。
- 為了注釋毒力因子扫沼,我們使用毒力因子數(shù)據(jù)庫(kù)和Diamond,查詢和主題覆蓋度為80%庄吼。
- 移動(dòng)遺傳元件(MGEs)是基于原始參考文獻(xiàn)中描述的方法進(jìn)行注釋的(補(bǔ)充表S2)缎除。
- 此外,根據(jù)Partridge等人研究原則確定了與MGE相關(guān)的ARGs和VFs总寻。
Data content and case studies
Taxonomy and spatial distribution of pathogens
病原體的分類學(xué)與空間分布
Para_22
- 在gcPathogen中器罐,細(xì)菌涵蓋了13個(gè)門(圖3A):變形菌門(51個(gè)屬),厚壁菌門(23個(gè)屬)渐行,放線菌門(18個(gè)屬)轰坊,擬桿菌門(6個(gè)屬),螺旋體門(4個(gè)屬)祟印,芽孢桿菌門(3個(gè)屬)肴沫,柔膜菌門(2個(gè)屬)以及其他六個(gè)門各有一個(gè)屬,包括放線菌門蕴忆、擬桿菌門颤芬、衣原體門、假單胞菌門、螺旋體門和柔壁菌門站蝠。
- 同時(shí)汰具,真菌包含五個(gè)門(圖3B):子囊菌門(61個(gè)屬),接合菌門(11個(gè)屬)沉衣,擔(dān)子菌門(9個(gè)屬),綠藻門(1個(gè)屬)和動(dòng)物寄生菌門(1個(gè)屬)减牺。
- 自2008年以來玉控,病原體序列組裝的出版數(shù)量急劇增加民镜,這主要是由于測(cè)序技術(shù)在病原體檢測(cè)中的應(yīng)用日益廣泛。
- 值得注意的是,鼠傷寒沙門氏菌止状、大腸埃希氏菌和金黃色葡萄球菌從多個(gè)國(guó)家提交的序列數(shù)量最多,表明它們分布廣泛(圖3C)丽柿。
- 相反飞袋,霍亂弧菌、副溶血性弧菌和嗜肺軍團(tuán)菌與局部爆發(fā)相關(guān)句各。
- 此外吸占,鼠傷寒沙門氏菌、大腸埃希氏菌和肺炎克雷伯菌的基因組數(shù)據(jù)中注釋的ARGs和MGEs數(shù)量最高凿宾。
- 觀察到MGEs(包括插入序列矾屯、ICE、整合子初厚、轉(zhuǎn)座子和質(zhì)粒)促進(jìn)了病原菌對(duì)外源性AMR基因的攝取件蚕,特別是在肺炎克雷伯菌中。
- 另一方面产禾,銅綠假單胞菌和鮑曼不動(dòng)桿菌具有大量的ARGs排作,但相對(duì)較少的MGEs。
-
鮑曼不動(dòng)桿菌的主要耐藥機(jī)制是通過含有不同基因內(nèi)容的多個(gè)耐藥島亚情,但它們與MGEs的關(guān)聯(lián)尚未得到報(bào)告妄痪。
- 圖 3. gcPathogen 中細(xì)菌種類的分布。最豐富的屬是 (A) 細(xì)菌中的沙門氏菌和 (B) 真菌中的釀酒酵母楞件。 (C) 在數(shù)據(jù)量最高的前 20 種細(xì)菌病原體中拌夏,序列類型(STs)、宿主履因、抗生素抗性基因(ARGs)和可移動(dòng)遺傳元件(MGEs)的數(shù)量障簿。還包括它們?cè)谇?20 個(gè)國(guó)家中的分布情況。
Para_23
- 最豐富的病原體在發(fā)達(dá)國(guó)家和發(fā)展中國(guó)家的流行情況顯示出顯著差異栅迄,這可能歸因于不同的環(huán)境和抗生素使用的差異站故。
- 例如,嗜肺軍團(tuán)菌、空腸彎曲菌和結(jié)腸彎曲菌在發(fā)達(dá)國(guó)家的流行率遠(yuǎn)高于發(fā)展中國(guó)家(圖 4)西篓。
- 這種差異可能與發(fā)達(dá)國(guó)家中用于工業(yè)和生活的城市溫水系統(tǒng)的發(fā)達(dá)有關(guān)愈腾,為嗜肺軍團(tuán)菌提供了更加適宜的生存環(huán)境。
- 此外岂津,嗜肺軍團(tuán)菌可以污染醫(yī)院的供水系統(tǒng)虱黄,在發(fā)達(dá)國(guó)家暴發(fā)軍團(tuán)病構(gòu)成重大挑戰(zhàn)。
- 相比之下吮成,它在發(fā)展中國(guó)家的流行率相對(duì)較低橱乱。
- 結(jié)核分枝桿菌在發(fā)展中國(guó)家更為普遍,主要是因?yàn)樗鼘?duì)大量營(yíng)養(yǎng)不良和免疫功能低下的人群粱甫,如艾滋病患者造成了影響泳叠。
-
在缺乏新型抗結(jié)核藥物的情況下,估計(jì)結(jié)核分枝桿菌在發(fā)展中國(guó)家感染了 40-80% 的免疫功能低下個(gè)體茶宵。
- 圖 4. 發(fā)達(dá)國(guó)家和發(fā)展中國(guó)家最常見的 20 種細(xì)菌病原體的分布危纫。
Case study: vibrio parahaemolyticus typing and antibiotic resistance
案例研究:副溶血性弧菌分型與抗生素耐藥性
Para_24
- 快速和高分辨率的分型可以在很大程度上幫助流行病學(xué)調(diào)查以及暴發(fā)源頭的識(shí)別。
- 在gcPathogen中乌庶,我們已經(jīng)鑒定了1038種副溶血弧菌的序列類型(ST)种蝶。
- 其中,ST3和ST36最為普遍(圖5A)瞒大,它們的出現(xiàn)可以追溯到2000年以前蛤吓,早于排名前20位中的其他ST。
- ST3幾乎在所有國(guó)家都有發(fā)現(xiàn)糠赦,因此被歸類為一種大流行克隆会傲。
- 值得注意的是,美國(guó)拙泽、加拿大和秘魯?shù)姆植紙D譜相似淌山,但與中國(guó)和泰國(guó)的有所不同。
- 圖5B顯示這些ST包含22種抗性基因(ARG)顾瞻,對(duì)九類藥物具有抗性泼疑,其中包括9種多藥抗性ARG和13種單一藥物抗性ARG。
-
特別地荷荤,MarR退渗、AcrB和SoxB這三個(gè)基因使細(xì)菌對(duì)七種類型的藥物產(chǎn)生抗性,并且在這些ST中的發(fā)生頻率為100%蕴纳。
- 圖5. 基于gcPathogen數(shù)據(jù)分析的副溶血性弧菌案例研究会油。(A)來自前20位序列型的基因組數(shù)據(jù),包括它們的序列型古毛、時(shí)間翻翩、宿主都许、疾病和國(guó)家信息。繪制并展示了系統(tǒng)發(fā)育樹嫂冻。(B)這些序列型對(duì)抗生素耐藥基因頻率的統(tǒng)計(jì)以及單藥和多藥耐藥特征胶征。
Antibiotic resistance of pathogenic bacteria
病原細(xì)菌的抗生素耐藥性
Para_25
- 抗生素抗性基因可以通過轉(zhuǎn)化從環(huán)境中轉(zhuǎn)移到人類病原體,導(dǎo)致微生物生態(tài)系統(tǒng)中的抗性傳播桨仿、不同病原體種群間的傳播睛低,甚至是跨物種傳播。
- 特定抗生素抗性基因時(shí)空傳播的追蹤可以促進(jìn)早期檢測(cè)和病原體控制服傍。
Para_26
- 如圖6所示钱雷,大多數(shù)藥物類別的抗生素耐藥性頻率正在增加,表明存在嚴(yán)重的抗生素耐藥性問題伴嗡。
- 與其它藥物相比急波,鏈霉菌素和磺胺類抗生素的耐藥性仍然較低从铲。
- 鏈霉菌素主要用于治療結(jié)核病瘪校,但結(jié)核分枝桿菌中的突變基因gidB可將耐藥性降低近50%,這可能是鏈霉菌素類抗生素耐藥性頻率較低的潛在原因名段。
-
此外阱扬,磺胺類抗生素在獸醫(yī)實(shí)踐中比在人類醫(yī)學(xué)中使用更為頻繁,磺胺類耐藥性的迅速發(fā)展導(dǎo)致后來被青霉素取代伸辟,從而減少了其使用量麻惶。
- 圖 6. 從 2000 年至 2021 年,在擁有最大病原體樣本量的 20 個(gè)國(guó)家中對(duì)不同藥物類別的抗性情況信夫。還展示了不同年份窃蹋、國(guó)家和宿主中的病原體移動(dòng)遺傳元件頻率及相關(guān)的抗生素抗性基因數(shù)量。
Para_27
- 此外静稻,抗生素耐藥基因在美國(guó)和英國(guó)的普遍程度顯著較高警没,而南非和秘魯?shù)臄?shù)據(jù)則顯示這類基因的普遍程度最低。
- 不同國(guó)家之間多樣的醫(yī)療標(biāo)準(zhǔn)和用藥實(shí)踐促成了這些差異振湾。
- 例如杀迹,自1978年起氨基糖苷類抗生素阿普拉米星已在英國(guó)使用,導(dǎo)致高度耐藥性押搪,特別是在大腸桿菌中
Mobile genetic elements of pathogenic bacteria
致病細(xì)菌的移動(dòng)遺傳元件
Para_28
- MGEs在細(xì)菌的水平轉(zhuǎn)移中發(fā)揮著至關(guān)重要的作用树酪,使細(xì)菌能夠獲得抗生素抗性和毒力特性,并促進(jìn)適應(yīng)性進(jìn)化大州。
- 在從基因組數(shù)據(jù)中標(biāo)注的攜帶ARGs的MGEs中续语,質(zhì)粒最為普遍,而攜帶ARGs的整合性共軛元件(ICE)則較為罕見厦画。
Para_29
- 從2000年到2022年绵载,病原菌中MGE的發(fā)生頻率沒有顯著變化,但與之相關(guān)的ARG數(shù)量增加了(圖6)。
- 這一發(fā)現(xiàn)結(jié)合ARG年度頻率的變化娃豹,突顯了MGE在ARG水平轉(zhuǎn)移中的重要作用焚虱。
- 值得注意的是,在排名前20位的國(guó)家中懂版,質(zhì)粒鹃栽、插入序列和轉(zhuǎn)座子的MGE頻率高于其他類型,美國(guó)躯畴、英國(guó)和中國(guó)與這些MGE相關(guān)的ARG數(shù)量較多民鼓。
- 質(zhì)粒介導(dǎo)的ARG水平轉(zhuǎn)移被認(rèn)為是人類、動(dòng)物和環(huán)境中ARG傳播最重要的途徑蓬抄。
- 此外丰嘉,不同宿主類別中MGE頻率分布和相關(guān)ARG數(shù)量存在顯著差異。
- 與人類相關(guān)的細(xì)菌與MGE相關(guān)的ARG數(shù)量明顯多于其他宿主類別嚷缭,表明與人類相關(guān)的分離株經(jīng)歷的水平基因轉(zhuǎn)移大約是非人類分離株的25倍饮亏。
Conclusion and future perspective
Para_30
- gcPathogen 利用病原體基因組測(cè)序、序列類型阅爽、流行病學(xué)路幸、抗生素耐藥性、毒力因子和可移動(dòng)遺傳元件的大數(shù)據(jù)付翁,支持科學(xué)研究和公共衛(wèi)生監(jiān)測(cè)简肴。
- 該數(shù)據(jù)庫(kù)將定期更新,納入來自不同來源的新興致病微生物的數(shù)據(jù)百侧。
- 從多種宿主和地理位置獲得的病原體基因組數(shù)據(jù)量不斷增長(zhǎng)砰识,使 gcPathogen 成為高質(zhì)量的參考數(shù)據(jù)集,作為泛基因組和特征基因分析的寶貴數(shù)據(jù)源佣渴,有助于設(shè)計(jì)新的基因分型標(biāo)記辫狼,實(shí)現(xiàn)快速準(zhǔn)確的目標(biāo)檢測(cè)。
Para_31
- 目前观话,在連接病原學(xué)數(shù)據(jù)與傳統(tǒng)傳染病監(jiān)測(cè)系統(tǒng)之間存在差距予借。
- 將病原體的豐富表型和基因信息與來自臨床或疾病控制監(jiān)測(cè)系統(tǒng)的各種感染病例相結(jié)合,將有助于探究病原體的整體特征频蛔、耐藥基因的轉(zhuǎn)移以及‘超級(jí)耐藥’細(xì)菌的傳播灵迫。
- 因此,這種結(jié)合將加強(qiáng)監(jiān)測(cè)措施和預(yù)防活動(dòng)晦溪。
- 為此瀑粥,我們計(jì)劃開發(fā)一個(gè)用戶友好的應(yīng)用程序編程接口(API),以便輕松地與內(nèi)部和公共傳染病監(jiān)測(cè)系統(tǒng)進(jìn)行數(shù)據(jù)連接三圆。
- 這種整合將使數(shù)據(jù)轉(zhuǎn)化為實(shí)時(shí)報(bào)告狞换,供公共衛(wèi)生專業(yè)人員決策使用避咆,并根據(jù)綜合數(shù)據(jù)提供準(zhǔn)確的早期檢測(cè)和預(yù)警。
Data availability
Para_32
- 該數(shù)據(jù)可從平臺(tái)免費(fèi)訪問和下載修噪,鏈接為 https://nmdc.cn/gcpathogen/download
Supplementary data
Para_33
- 補(bǔ)充數(shù)據(jù)可在 NAR 在線獲取查库。
本文由mdnice多平臺(tái)發(fā)布