利用VCF文件構(gòu)建系統(tǒng)發(fā)育樹

導(dǎo)讀

本文將介紹三種使用VCF文件皂贩,構(gòu)建系統(tǒng)發(fā)育樹的方法罐寨,包括程序的安裝域滥,使用纵柿,已及系統(tǒng)發(fā)育樹的可視化與美化蜈抓。

1. VCF2Dis

VCF2Dis是一種新的簡(jiǎn)單高效的軟件,用于計(jì)算基于VCF格式的距離矩陣

1.1. 安裝

# 下載
wget -c https://github.com/hewm2008/VCF2Dis/archive/v1.47.tar.gz

# 解壓
tar -zxvf v1.47.tar.gz

# 進(jìn)入程序目錄
cd VCF2Dis  

# 編譯
make ; make clean   

# 測(cè)試運(yùn)行
./bin/VCF2Dis

1.2. 距離矩陣

  • 利用VCF2Dis生成距離矩陣
VCF2Dis -i test.vcf -o test.mat

1.3. mat2nwk

  • 文件轉(zhuǎn)換
FastMe2.0

上傳距離矩陣到在線網(wǎng)站, FastMe2.0昂儒。上傳以后沟使,選擇Data typeDistance matrix。 然后根據(jù)自己的需要進(jìn)行配置渊跋,最后填入任務(wù)名稱和Email來(lái)獲取結(jié)果通知腊嗡。

  • 結(jié)果下載

點(diǎn)擊下載結(jié)果

結(jié)果下載

結(jié)果文件是一個(gè)壓縮文件,里面包含:

  1. 一個(gè).nwk文件用于進(jìn)化樹可視化
結(jié)果文件
  1. stats.txt

     記錄了文件轉(zhuǎn)換過(guò)程中拾酝,選擇的參數(shù)
    
  2. stdout.txt

     轉(zhuǎn)換過(guò)程中的日志文件燕少,記錄了程序的運(yùn)行過(guò)程
    

1.4. iTOL美化

十分推薦利用iTOL對(duì)進(jìn)化樹進(jìn)行美化,該程序是網(wǎng)頁(yè)版蒿囤,配置簡(jiǎn)單客们,結(jié)果十分漂亮。

  • 導(dǎo)入iTOL美化
iTOL

2. Phylip

PHYLIP是用于推斷系統(tǒng)發(fā)育的免費(fèi)程序包材诽。

2.1. 安裝

  • 源碼編譯安裝
# 下載PHYLIP 
wget -c http://evolution.gs.washington.edu/phylip/download/phylip-3.697.tar.gz

# 解包
tar zxf phylip-3.697.tar.gz 

# 進(jìn)入程序文件夾
cd phylip-3.695/src/

# 復(fù)制文件
cp Makefile.unx Makefile

# 編譯
make install  # 可能需要sudo 權(quán)限
  • conda安裝
# 新建phylip環(huán)境底挫,并安裝phylip
conda create -n phylip -c bioconda phylip -y

2.2. 格式轉(zhuǎn)換

  • 轉(zhuǎn)換腳本下載
# 下載
wget -c https://github.com/edgardomortiz/vcf2phylip/archive/refs/tags/v2.8.zip

# 解壓
unzip v2.8.zip
  • 轉(zhuǎn)換為PHYLIP matrix
python vcf2phylip.py -i test.vcf

# PHYLIP matrix是默認(rèn)格式,不同輸出格式脸侥,見(jiàn)下參數(shù)
# -f FASTA matrix
# -n NEXUS matrix
# -b binary NEXUS matrix

注意:test.vcf中的樣本名一定要少于10個(gè)字符凄敢,否則會(huì)報(bào)錯(cuò)

2.3. 建樹

  • 構(gòu)建配置文件
  1. seqboot.par
test.phy  # 本程序的輸入文件
R # 選擇bootstrap
100 # 設(shè)置bootstrap的值,即重復(fù)的replicate的數(shù)目湿痢,通常使用1000或者100涝缝,注意此處設(shè)定好后,后續(xù)兩步的M值也為1000或者100
Y # yes確認(rèn)以上設(shè)定的參數(shù)
9 # 設(shè)定隨機(jī)參數(shù)譬重,輸入奇數(shù)值拒逮。
  1. dnadist.par
seqboot.out # 本程序的輸入文件
T  # 選擇設(shè)定Transition/transversion的比值
2.3628  # 比值大小
M   #修改M值
D  # 修改M值
100  # 設(shè)定M值大小
2  # 將軟件運(yùn)行情況顯示出來(lái)
Y  # 確認(rèn)以上設(shè)定的參數(shù)
  1. neighbor.par
dnadist.out  # 本程序的輸入文件
M
100   # 設(shè)定M值大小
9  # 設(shè)定隨機(jī)數(shù),輸入奇數(shù)值
Y  # 確認(rèn)以上設(shè)定的參數(shù)
  1. consense.par
nei.tree  #本程序的輸入文件
Y #確認(rèn)以上設(shè)定的參數(shù)
  • phylip建樹
# 在 phylip 文件夾下臀规,依次運(yùn)行下面的命令

# seqboot
./exe/seqboot < ./seqboot.par && mv ./outfile ./seqboot.out

# dnadist
./exe/dnadist < ./dnadist.par &&  mv ./outfile ./dnadist.out

# neighbor
./exe/neighbor < ./neighbor.par && mv  ./outfile ./nei.out && mv ./outtree ./nei.tree 

# consense
./exe/consense < ./consense.par && mv ./outfile ./cons.out && mv ./outtree ./constree 

3. IQ-tree

IQ-tree的建樹方法與phylip類似滩援,只是最后一步不一樣,同樣需要先轉(zhuǎn)換文件格式為:phy(格式轉(zhuǎn)換見(jiàn)2.2)塔嬉。

3.1. 安裝

  • 利用conda安裝
# 新建iq-tree環(huán)境 并 安裝iqtree
conda create -n iqtree -c bioconda iqtree -y

3.2. 建樹

  • IQ-tree 建樹(簡(jiǎn)單)
iqtree -s test.phy

替代模型選擇與詳細(xì)的分支評(píng)估玩徊,見(jiàn)http://www.iqtree.org/中說(shuō)明

上面三種示例程序運(yùn)行過(guò)程中使用的參數(shù),需要根據(jù)自身數(shù)據(jù)進(jìn)行調(diào)整谨究。

本文由mdnice多平臺(tái)發(fā)布

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末恩袱,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子胶哲,更是在濱河造成了極大的恐慌畔塔,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,682評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異澈吨,居然都是意外死亡把敢,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門谅辣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)修赞,“玉大人,你說(shuō)我怎么就攤上這事桑阶±谱椋” “怎么了?”我有些...
    開封第一講書人閱讀 165,083評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵联逻,是天一觀的道長(zhǎng)搓扯。 經(jīng)常有香客問(wèn)我,道長(zhǎng)包归,這世上最難降的妖魔是什么锨推? 我笑而不...
    開封第一講書人閱讀 58,763評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮公壤,結(jié)果婚禮上换可,老公的妹妹穿的比我還像新娘。我一直安慰自己厦幅,他們只是感情好沾鳄,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著确憨,像睡著了一般译荞。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上休弃,一...
    開封第一講書人閱讀 51,624評(píng)論 1 305
  • 那天吞歼,我揣著相機(jī)與錄音,去河邊找鬼塔猾。 笑死篙骡,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的丈甸。 我是一名探鬼主播糯俗,決...
    沈念sama閱讀 40,358評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼睦擂!你這毒婦竟也來(lái)了得湘?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,261評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤祈匙,失蹤者是張志新(化名)和其女友劉穎忽刽,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體夺欲,經(jīng)...
    沈念sama閱讀 45,722評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡跪帝,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了些阅。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片伞剑。...
    茶點(diǎn)故事閱讀 40,030評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖市埋,靈堂內(nèi)的尸體忽然破棺而出黎泣,到底是詐尸還是另有隱情,我是刑警寧澤缤谎,帶...
    沈念sama閱讀 35,737評(píng)論 5 346
  • 正文 年R本政府宣布抒倚,位于F島的核電站,受9級(jí)特大地震影響坷澡,放射性物質(zhì)發(fā)生泄漏托呕。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評(píng)論 3 330
  • 文/蒙蒙 一频敛、第九天 我趴在偏房一處隱蔽的房頂上張望项郊。 院中可真熱鬧,春花似錦斟赚、人聲如沸着降。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)任洞。三九已至,卻和暖如春发侵,著一層夾襖步出監(jiān)牢的瞬間侈咕,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工器紧, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留耀销,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,237評(píng)論 3 371
  • 正文 我出身青樓铲汪,卻偏偏與公主長(zhǎng)得像熊尉,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子掌腰,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容