安裝軟件
創(chuàng)建環(huán)境
conda create -n Pan_Genome
conda activate Pan_Genome
conda install mamba
mamba install roary
運行
NCBI下載{genome}.gbff格式的測試數(shù)據(jù)
wget https://ftp.ncbi.nlm.nih.gov/genomes/genbank/plant/Glycine_max/latest_assembly_versions/GCA_014282035.1_WHFS_GmWF7_1.0/GCA_014282035.1_WHFS_GmWF7_1.0_genomic.gbff.gz
wget https://ftp.ncbi.nlm.nih.gov/genomes/genbank/plant/Glycine_max/latest_assembly_versions/GCA_002905335.2_glyma.Lee.gnm1/GCA_002905335.2_glyma.Lee.gnm1_genomic.gbff.gz
wget https://ftp.ncbi.nlm.nih.gov/genomes/genbank/plant/Glycine_max/latest_assembly_versions/GCA_000004515.5_Glycine_max_v4.0/GCA_000004515.5_Glycine_max_v4.0_genomic.gbff.gz
wget https://ftp.ncbi.nlm.nih.gov/genomes/genbank/plant/Glycine_max/latest_assembly_versions/GCA_015227745.1_Tianlong1/GCA_015227745.1_Tianlong1_genomic.gbff.gz
ls *.gbff.gz | while read LINE;do gunzip ${LINE};done #解壓縮
gbff轉(zhuǎn)gff格式
perl ~/anaconda3/envs/Pan_Genome/bin/bp_genbank2gff3.pl *.gbff #-o ./outdir
生成泛基因組
roary -e --mafft -p 16 *.gff
DeBUG
!!!運行中如果有關(guān)于Perl腳本的報錯开镣,例如:
Can't locate File/Find/Rule.pm in @INC (you may need to install the File::Find::Rule module)
Debug如下:
進(jìn)入這個網(wǎng)頁:https://metacpan.org/pod
搜索 File::Find::Rule -> Download
tar -zxvf File-Find-Rule-0.34.gz.tar
cd File-Find-Rule-0.34/
perl Makefile.PL
make
make install
輸出文件介紹:
(1)summary_statistics.txt 包含了不同存在類型的gene個數(shù)及gene總數(shù)顶瞳。
如果core genes數(shù)或者total genes數(shù)特別高猎荠,那么要小心你的輸入文件是否混入了其他種的基因組,或者你的樣品是否存在污染。
(2)gene_presence_absence.csv
該文件記錄了每個輸入樣本中某個基因存在或缺失的信息派撕,可以用Excel等軟件打開,其中還包括基因名名稱睬魂、功能注釋终吼、存在該cluster的樣本的數(shù)量等等。
(3)gene_presence_absence.Rtab
該文件第一行為每個輸入樣本的名稱氯哮,第一列為每個基因名稱际跪。文件是由0/1構(gòu)成的矩陣,0代表缺失喉钢,1代表存在姆打。可以用R的read.table載入肠虽,進(jìn)行后續(xù)的分析幔戏。
(4)pan_genome_reference.fa
FASTA格式包含每個cluster的一個代表序列,組成pan-genome
(5)core_gene_alignment.aln
core genes多重比對的輸出結(jié)果税课,可以作為構(gòu)建系統(tǒng)發(fā)生樹的輸入文件
Ref
羅里:泛基因組管道 (sanger-pathogens.github.io)
GitHub - sanger-pathogens/Roary: Rapid large-scale prokaryote pan genome analysis
泛基因組分析軟件Roary的使用 - 知乎 (zhihu.com)