構(gòu)建系統(tǒng)發(fā)育樹主要有四種方法:ML、NJ、MP和BI哲银。
與ML和NJ相比,BI的方法效率更高呻惕,已有的研究結(jié)果顯示,對于同一組數(shù)據(jù)的分析,?貝葉斯方法分析結(jié)果中的節(jié)點支持率高于其它算法中的相應(yīng)結(jié)果荆责。最大似然法(ML)被選擇時候后最多,但是計算比較慢亚脆,如果序列屬于遠緣做院,選ML比較好;相比較而言NJ計算過程比較快。
一般系統(tǒng)發(fā)育分析都需要做兩個及其以上的方法計算山憨。這里簡單記錄一下 如何用BI構(gòu)建系統(tǒng)發(fā)育樹。
1. 多序列比對(我一般選擇MEGA-clustw)
2. 保守區(qū)檢測(Gblock 0.91b_)
http://molevol.cmima.csic.es/castresana/Gblocks_server.html? ?( 如果用的時候總是導(dǎo)不進去弥喉,可以直接以Fasta格式粘貼進去郁竟。這個運行時間有點久,不知道是不是電腦的原因)
3. 飽和度檢測(DAMBE)如果序列飽和就不能建樹由境,如果不飽和符合建樹條件棚亩。
運行完結(jié)果后檢查ISS<ISS.C,且p<0.05 說明不飽和可以建樹虏杰。
DAMBE的使用方法:http://blog.sciencenet.cn/blog-508298-716082.html??可以完全按照這個來讥蟆,導(dǎo)入文件的時候最好選擇FASTA格式的文件。
4. 核苷酸替代模型的選擇 【這一步很重要纺阔,再這個上面我花費了不少的時間瘸彤。】
這里我用是 MrMTgui 。需要加載的其他插件還有PAUP笛钝、Modeltest(48種)和MrModeltest (24種)质况。PAUP 文件格式是NEX,可以用mega導(dǎo)出這種格式的文件玻靡。
打開?MrMTgui軟件后结榄,再下方path的位置選擇各個插件的位置。比如PAUP 的console.exe文件囤捻,其他的插件也是這樣臼朗。
如果全都設(shè)置好以后,選擇 RUA-PAUP, 選怎nex格式文件(有時候找不到文件蝎土,別忘了把文件類型改為ALL*)
會出現(xiàn)以下界面视哑,這是在計算score文件,不要著急誊涯。計算完成后會提示是否運行下一步黎炉,選擇否,點擊Save Scores醋拧。文件名保存為 mrmodel.scores 文件【scores文件即可】慷嗜。
點擊select files ,選擇剛剛保存的.score 文件丹壕。點擊MrModeltest 就開始運行了庆械。結(jié)果有兩部分文件hLRTs和AIC,下滑到AIC部分,然后 找到貝葉斯部分菌赖,這個時候就已經(jīng)得到了最好的模型缭乘。將從begin到end這部分程序,復(fù)制保存琉用。
到這里做完了前期所有的工作堕绩,開始了真正的進行BI分析策幼。MrBays 準備好,這是不需要安裝的軟件奴紧,直接打開其.exe文件特姐,可以直接使用。將已原來已經(jīng)復(fù)制的幾行執(zhí)行程序粘貼到你的序列文件種黍氮,http://www.360doc.com/content/17/1002/18/45962007_691819677.shtml 【連接包括參數(shù)的各種意義唐含。】
BEGIN mrbayes;
lset nst=6 rates=propinv Code=Metmt(如果程序是線粒體);
Prset statefreqpr=dirichlet(1,1,1,1);
? ? ? ? ? ? ? ? mcmc ngen=300000(代) printfreq=1000 samplefreq=100;
sump;
sumt;
END;
設(shè)置好各項參數(shù)之后沫浆,就可以打開軟件捷枯,輸入exe? ?文件名.nex 運行了。
最后可以用figtree打開?文件名.nex.con.tre 文件专执,編輯樹淮捆。
ps:貝葉斯的nex和paup要求的有點不一樣可以用,ALTER?http://www.sing-group.org/ALTER/?轉(zhuǎn)換格式
相關(guān)參考資料:
馮思玲. 系統(tǒng)發(fā)育樹構(gòu)建方法研究[J]. 信息技術(shù), 2009(06):45-47+51.
https://www.docin.com/p-945498009-f2.html? (高芳鑾老師寫的十分詳細)
Ending~