導(dǎo)讀
本文將介紹三種使用VCF
文件皂贩,構(gòu)建系統(tǒng)發(fā)育樹的方法罐寨,包括程序的安裝域滥,使用纵柿,已及系統(tǒng)發(fā)育樹的可視化與美化蜈抓。
1. VCF2Dis
VCF2Dis是一種新的簡(jiǎn)單高效的軟件,用于計(jì)算基于VCF
格式的距離矩陣
1.1. 安裝
# 下載
wget -c https://github.com/hewm2008/VCF2Dis/archive/v1.47.tar.gz
# 解壓
tar -zxvf v1.47.tar.gz
# 進(jìn)入程序目錄
cd VCF2Dis
# 編譯
make ; make clean
# 測(cè)試運(yùn)行
./bin/VCF2Dis
1.2. 距離矩陣
- 利用
VCF2Dis
生成距離矩陣
VCF2Dis -i test.vcf -o test.mat
1.3. mat2nwk
- 文件轉(zhuǎn)換
FastMe2.0
上傳距離矩陣到在線網(wǎng)站, FastMe2.0昂儒。上傳以后沟使,選擇Data type
為Distance matrix
。 然后根據(jù)自己的需要進(jìn)行配置渊跋,最后填入任務(wù)名稱和Email
來(lái)獲取結(jié)果通知腊嗡。
- 結(jié)果下載
點(diǎn)擊下載結(jié)果
結(jié)果下載
結(jié)果文件是一個(gè)壓縮文件,里面包含:
- 一個(gè)
.nwk
文件用于進(jìn)化樹可視化
結(jié)果文件
-
stats.txt
記錄了文件轉(zhuǎn)換過(guò)程中拾酝,選擇的參數(shù)
-
stdout.txt
轉(zhuǎn)換過(guò)程中的日志文件燕少,記錄了程序的運(yùn)行過(guò)程
1.4. iTOL美化
十分推薦利用
iTOL
對(duì)進(jìn)化樹進(jìn)行美化,該程序是網(wǎng)頁(yè)版蒿囤,配置簡(jiǎn)單客们,結(jié)果十分漂亮。
- 導(dǎo)入iTOL美化
iTOL
2. Phylip
PHYLIP是用于推斷系統(tǒng)發(fā)育的免費(fèi)程序包材诽。
2.1. 安裝
- 源碼編譯安裝
# 下載PHYLIP
wget -c http://evolution.gs.washington.edu/phylip/download/phylip-3.697.tar.gz
# 解包
tar zxf phylip-3.697.tar.gz
# 進(jìn)入程序文件夾
cd phylip-3.695/src/
# 復(fù)制文件
cp Makefile.unx Makefile
# 編譯
make install # 可能需要sudo 權(quán)限
-
conda
安裝
# 新建phylip環(huán)境底挫,并安裝phylip
conda create -n phylip -c bioconda phylip -y
2.2. 格式轉(zhuǎn)換
- 轉(zhuǎn)換腳本下載
# 下載
wget -c https://github.com/edgardomortiz/vcf2phylip/archive/refs/tags/v2.8.zip
# 解壓
unzip v2.8.zip
- 轉(zhuǎn)換為
PHYLIP matrix
python vcf2phylip.py -i test.vcf
# PHYLIP matrix是默認(rèn)格式,不同輸出格式脸侥,見(jiàn)下參數(shù)
# -f FASTA matrix
# -n NEXUS matrix
# -b binary NEXUS matrix
注意:test.vcf中的樣本名一定要少于10個(gè)字符凄敢,否則會(huì)報(bào)錯(cuò)
2.3. 建樹
- 構(gòu)建配置文件
- seqboot.par
test.phy # 本程序的輸入文件
R # 選擇bootstrap
100 # 設(shè)置bootstrap的值,即重復(fù)的replicate的數(shù)目湿痢,通常使用1000或者100涝缝,注意此處設(shè)定好后,后續(xù)兩步的M值也為1000或者100
Y # yes確認(rèn)以上設(shè)定的參數(shù)
9 # 設(shè)定隨機(jī)參數(shù)譬重,輸入奇數(shù)值拒逮。
- dnadist.par
seqboot.out # 本程序的輸入文件
T # 選擇設(shè)定Transition/transversion的比值
2.3628 # 比值大小
M #修改M值
D # 修改M值
100 # 設(shè)定M值大小
2 # 將軟件運(yùn)行情況顯示出來(lái)
Y # 確認(rèn)以上設(shè)定的參數(shù)
- neighbor.par
dnadist.out # 本程序的輸入文件
M
100 # 設(shè)定M值大小
9 # 設(shè)定隨機(jī)數(shù),輸入奇數(shù)值
Y # 確認(rèn)以上設(shè)定的參數(shù)
- consense.par
nei.tree #本程序的輸入文件
Y #確認(rèn)以上設(shè)定的參數(shù)
-
phylip
建樹
# 在 phylip 文件夾下臀规,依次運(yùn)行下面的命令
# seqboot
./exe/seqboot < ./seqboot.par && mv ./outfile ./seqboot.out
# dnadist
./exe/dnadist < ./dnadist.par && mv ./outfile ./dnadist.out
# neighbor
./exe/neighbor < ./neighbor.par && mv ./outfile ./nei.out && mv ./outtree ./nei.tree
# consense
./exe/consense < ./consense.par && mv ./outfile ./cons.out && mv ./outtree ./constree
3. IQ-tree
IQ-tree的建樹方法與phylip
類似滩援,只是最后一步不一樣,同樣需要先轉(zhuǎn)換文件格式為:phy
(格式轉(zhuǎn)換見(jiàn)2.2)塔嬉。
3.1. 安裝
- 利用
conda
安裝
# 新建iq-tree環(huán)境 并 安裝iqtree
conda create -n iqtree -c bioconda iqtree -y
3.2. 建樹
-
IQ-tree
建樹(簡(jiǎn)單)
iqtree -s test.phy
替代模型選擇與詳細(xì)的分支評(píng)估玩徊,見(jiàn)http://www.iqtree.org/中說(shuō)明
上面三種示例程序運(yùn)行過(guò)程中使用的參數(shù),需要根據(jù)自身數(shù)據(jù)進(jìn)行調(diào)整谨究。
本文由mdnice多平臺(tái)發(fā)布