一、AAI
氨基酸一致性amino acid identity(AAI)是獲得屬或更高分類群分類結構的一種客觀方法。常用工具:
- CompareM:github說明
安裝使用參考利用ANI AAI比較細菌基因組
作者已經不再維護箱蟆,并推薦了AAI calculator和 EzAAI tool
- AAI calculator:在線工具,以蛋白質序列作為輸入文件
- EzAAI tool:從基因組組裝到最終樹狀圖的快速而準確的管道
Kim, D., Park, S. & Chun, J. Introducing EzAAI: a pipeline for high throughput calculations of prokaryotic average amino acid identity. J. Microbiol 59, 476-480 (2021). (https://doi.org/10.1007/s12275-021-1154-0)
二证鸥、軟件使用
2.1 軟件安裝
- EzAAI v1.0
- Java RE 8+ :java8參考ubuntu配置jre8
- Prodigal : 用conda安裝失息,conda install -c bioconda prodigal
- MMSeqs2: 用conda安裝骏庸, conda install -c bioconda mmseqs2
2.2 軟件使用
EzAAI extract 從基因組序列中提取profile數(shù)據(jù)庫
$ java -jar EzAAI_latest.jar extract -i fasta/Cn.fasta -o db/Cn.db -l "Clavibacter nebraskensis"
$ java -jar EzAAI_latest.jar extract -i fasta/Ci.fasta -o db/Ci.db -l "Clavibacter insidiosus"
$ java -jar EzAAI_latest.jar extract -i fasta/Mh.fasta -o db/Mh.db -l "Microbacterium hominis"
$ java -jar EzAAI_latest.jar extract -i fasta/Ma.fasta -o db/Ma.db -l "Microbacterium aurum"
$ java -jar EzAAI_latest.jar extract -i fasta/Lc.fasta -o db/Lc.db -l "Leucobacter chironomi"
$ java -jar EzAAI_latest.jar extract -i fasta/Lm.fasta -o db/Lm.db -l "Leucobacter muris"
EzAAI calculate 從profile數(shù)據(jù)庫計算AAI值
EzAAI將自動檢測目錄中的.db文件戚啥,并使用MMSeqs2計算每株菌與其他菌之間的AAI值杂数。
$ java -jar EzAAI_latest.jar calculate -i db/ -j db/ -o out/aai.tsv
EzAAI cluster - 通過AAI值做層次聚類
$ java -jar EzAAI_latest.jar cluster -i out/aai.tsv -o out/sample.nwk
生成的nwk文件用MEGA做可視化
完成!