ARGs_OAP_v2.0(步驟1):https://github.com/biofuture/Ublastx_stageone
ARGs-OAP在線分析網(wǎng)站(步驟2): http://smile.hku.hk/SARGs
無(wú)處不在的抗性基因
環(huán)境中抗生素抗性基因(ARGs)的來(lái)源:
隨機(jī)突變或表達(dá)潛在抗性基因等方式使細(xì)菌體內(nèi)基因組上存在的抗性基因原型提佣、準(zhǔn)抗性基因或潛在抗性基因被表達(dá)出來(lái)叉趣,從而使細(xì)菌獲得的抗生素抗性。
抗生素在人和動(dòng)物腸道內(nèi)誘導(dǎo)產(chǎn)生耐藥菌社裆,這些編碼ARGs的耐藥菌經(jīng)由糞便排出并進(jìn)入環(huán)境中,是環(huán)境中ARGs的重要來(lái)源点寥。
抗性基因的水平轉(zhuǎn)移是抗性基因在環(huán)境中傳播的的主要機(jī)制崭倘,通過(guò)將包含抗性基因的質(zhì)粒、轉(zhuǎn)座子悦析、整合子作為載體寿桨,通過(guò)細(xì)菌之間細(xì)胞與細(xì)胞的接觸,將抗性基因從載體細(xì)胞轉(zhuǎn)移到受體細(xì)胞。
如何檢測(cè)環(huán)境中抗生素抗性基因(ARGs):
- PCR技術(shù)---定性亭螟。
- qPCR技術(shù)---定量挡鞍。
- 宏基因組測(cè)序:以環(huán)境樣品中的整個(gè)微生物群體基因組為研究對(duì)象,檢測(cè)環(huán)境樣本微生物中的物種組成预烙、豐度墨微,基因預(yù)測(cè)、基因豐度扁掸,利用數(shù)據(jù)庫(kù)進(jìn)行注釋翘县,得到樣本中ARGs的種類和豐度與樣本的相關(guān)性。
- ARDB數(shù)據(jù)庫(kù):主要包含細(xì)菌病原菌的多種抗性基因數(shù)據(jù)谴分,不能為環(huán)境樣本宏基因組數(shù)據(jù)提供詳細(xì)的ARG概況(即對(duì)每個(gè)檢測(cè)到的ARG提供type/subtype的ARG分類信息和豐度信息)锈麸。
- CARD數(shù)據(jù)庫(kù):以Antibiotic Resistance Ontology(ARO)為分類單位的形式所構(gòu)建,ARO用于關(guān)聯(lián)抗生素模塊及其目標(biāo)牺蹄、抗性機(jī)制忘伞、基因變異等信息。
ResFinder:需要較長(zhǎng)的查詢r(jià)eads沙兰。對(duì)于在ResFinder中被檢測(cè)為ARG的序列氓奈,其必須至少覆蓋數(shù)據(jù)庫(kù)中匹配ARG長(zhǎng)度的五分之二,具有不小于50%的相似性鼎天。 - ARGO:側(cè)重于萬(wàn)古霉素和β-內(nèi)酰胺抗性基因舀奶。
ARG-ANNOT:設(shè)計(jì)用于檢測(cè)細(xì)菌基因組中的ARG而不是環(huán)境樣品。
構(gòu)建ARG綜合數(shù)據(jù)庫(kù)SARG v1.0
- 整合CARD和ARDB數(shù)據(jù)庫(kù)
CARD數(shù)據(jù)庫(kù)2,513條序列斋射;
ARDB數(shù)據(jù)庫(kù)7,828條序列育勺;
去除586條共享序列;
SARG包含4246條ARGs參考序列绩鸣。 - 去除非ARG序列
- 去除冗余序列(完整蛋白質(zhì)序列具有100%同一性)
- 去除與SNP相關(guān)的ARG序列
- 去除描述為“假定蛋白質(zhì)”或“未命名蛋白質(zhì)”的序列
- 構(gòu)建結(jié)構(gòu)化ARG數(shù)據(jù)庫(kù)SARG
構(gòu)建ARG綜合數(shù)據(jù)庫(kù)SARG v2.0
- 使用SARG v1.0作為從NCBI-NR獲取潛在ARG序列的種子怀大。
- NCBI-NR序列BLASTP比對(duì)SARG v1.0數(shù)據(jù)庫(kù)(e-value:1e-7, identity: 90%、80%呀闻、70%)化借; levels: Accurate, Moderate and Loose 。
- 基于序列相似度或關(guān)鍵字匹配將ARG序列分配給不同的Subtype捡多。
- 合并時(shí)蓖康,刪除有多個(gè)分類結(jié)果的序列,只保留具有匹配分類(type和subtype)的序列垒手。
Number of ARGs reference genes in core SARG database (column ‘core SARG’) and updated SARG database using different cut off of identity (90%, 80% and 70%) for retrieving. A is the profile before using parallel classification to seat each sequence into hierarchical structure. B is the results of sequences amount after being classified into specific ARGs types and subtypes.
ARGs-OAP概述
ARGs-OAP是一個(gè)抗生素抗性基因分析平臺(tái)蒜焊、在線分析工具。
ARGs-OAP可以從宏基因組數(shù)據(jù)集中快速鑒定并定量分析抗生素抗性基因科贬。
ARGs-OAP中包含一個(gè)結(jié)構(gòu)化ARG數(shù)據(jù)庫(kù)SARG(type--subtype--reference sequence)泳梆。
ARGs-OAP 1.0版包括CARD及ARDB數(shù)據(jù)庫(kù)的序列鳖悠, 2.0版新納入了NCBI-NR數(shù)據(jù)庫(kù)中的ARG序列。
使用ARGs-OAP 進(jìn)行注釋后优妙,對(duì)獲得的ARGs:可以通過(guò)總reads數(shù)乘综、16S rRNA基因拷貝數(shù)和細(xì)胞數(shù)量進(jìn)行ARGs豐度標(biāo)準(zhǔn)化;2.0版優(yōu)化了細(xì)胞數(shù)量定量分析過(guò)程套硼。
ARGs-OAP在線工具使用步驟
1.本地計(jì)算機(jī)預(yù)先篩選潛在的ARG序列卡辰,以減少上傳序列文件的大小邪意;
2.使用在線平臺(tái)注釋/分類ARG序列九妈。
對(duì)于宏基因組數(shù)據(jù),快速預(yù)篩選可去除總序??列> 99.3%的不相關(guān)序列雾鬼,顯著減少上傳文件的大小并加速在線BLASTX分析萌朱。
步驟2:上傳預(yù)篩選后的ARG序列數(shù)據(jù)至online pipeline。
ARGs_OAP_v2.0(步驟1):https://github.com/biofuture/Ublastx_stageone
ARGs-OAP在線分析網(wǎng)站(步驟2): http://smile.hku.hk/SARGs
The output files can be downloaded as tables listing the abundances of ARGs types/subtypes in different units:
“ppm” (number of ARGs sequences in one million sequences) ;
“copies of ARG per copy of 16S rRNA” ;
“copies of ARG per prokaryote’s cell” .
當(dāng)數(shù)據(jù)集包含新ARG時(shí)(即數(shù)據(jù)集2):identity cutoff 設(shè)置為高于60%呆贿,則MCC值顯著下降(圖4a和4b)嚷兔,此水平下靈敏度也顯著降低(圖3d和4e),數(shù)據(jù)庫(kù)的不完整性對(duì)注釋精度影響不大(圖4g和4h)做入。
E-value 對(duì)這三個(gè)評(píng)估指標(biāo)的影響:MCC值和精度隨著E-value的減小而增加,但靈敏度沒(méi)有太大變化同衣。
評(píng)估序列長(zhǎng)度的影響:較長(zhǎng)的讀長(zhǎng)導(dǎo)致較高的MCC和靈敏度(圖3b和3c )竟块。
最佳E-value 和 identity cutoff 值:與E值相比, identity值顯示出更大的影響耐齐。藍(lán)色箭頭表示在以前ARGs注釋( E-value為1e-5浪秘, identity為90%)中對(duì)短讀數(shù)宏基因組數(shù)據(jù)進(jìn)行分析時(shí),MCC值和靈敏度較低假陰性率很高埠况,并且錯(cuò)過(guò)了許多ARG樣序列耸携。為了揭示更全面的ARG概況,基于使用模擬數(shù)據(jù)集2所示的MCC結(jié)果辕翰,如紅色箭頭所示夺衍,建議的最佳identity cutoff 為60%,E-value為1e-7喜命。
序列覆蓋度小于85%時(shí)沟沙,靈敏度和MCC值幾乎沒(méi)有影響。
序列覆蓋度從85%增加到100%時(shí)壁榕,靈敏度和MCC值急劇下降矛紫。
更嚴(yán)格的序列覆蓋度會(huì)錯(cuò)過(guò)更多類似ARG的序列。
參考文獻(xiàn):
Yang Y, Jiang X, Chai B, et al. ARGs-OAP: online analysis pipeline for antibiotic resistance genes detection from metagenomic data using an integrated structured ARG-database[J]. Bioinformatics, 2016, 32(15):2346.
Yin X, Jiang X T, Chai B, et al. ARGs-OAP v2.0 with an Expanded SARG Database and Hidden Markov Models for Enhancement Characterization and Quantification of Antibiotic Resistance Genes in Environmental Metagenomes[J]. Bioinformatics, 2018.