最經(jīng)典和廣為熟知的多序列比對軟件是 clustalw 即供。 但是現(xiàn)有的多序列比對軟件較多,有文獻報道:比對速度(Muscle>MAFFT>ClustalW>T-Coffee)霜第,比對準確性(MAFFT>Muscle>T-Coffee>ClustalW)矿咕。因此名挥,推薦使用 MAFFT 軟件進行多序列比對∠睾茫【來自陳連福博客】
MAFFT
一围橡、安裝
wget https://mafft.cbrc.jp/alignment/software/mafft-7.453-with-extensions-src.tgz
tar zxvf mafft-7.453-with-extensions-src.tgz
vi修改extensions和core文件夾中MakeFile文件的第一行prefix路徑到個人文件夾
cd mafft-7.453-with-extensions/extensions
make clean
make
make install
cd ../core
make clean
make
make install
#mafft程序在scripts里
二、運行
1. 精確比對
最準確的方法缕贡。適合于 <200 條序列翁授,且序列長度 <~2000 aa/nt 的比對
mafft --maxiterate 1000 --localpair input.fa > output.fa 或者 linsi input.fa > output.fa
適合于序列長度相似的多序列比對拣播。序列條數(shù) <200, 序列長度 <~2000 aa/nt
mafft --maxiterate 1000 --genafpair input.fa > output.fa 或者 einsi input.fa > output.fa
適合序列中包含較大的非匹配區(qū)域。序列條數(shù) <200, 序列長度 <~2000 aa/nt
mafft --maxiterate 1000 --globalpair input.fa > output.fa 或者 ginsi input.fa > output.fa
2. 節(jié)約時間
減少迭代次數(shù)收擦,最大迭代次數(shù)減為 2
mafft --retree 2 --maxiterate 2 input.fa > output.fa 或者 fftnsi input.fa > output.fa
最大迭代次數(shù)減為 0
mafft --retree 2 --maxiterate 0 input.fa > output.fa 或者 fftns input.fa > output.fa
此方法非持洌快速,適合 >2000 條序列的多序列比對
mafft --retree 1 --maxiterate 0 input.fa > output.fa
迭代過程中不進行 FFT aproximation
mafft --retree 2 --maxiterate 2 --nofft input.fa > output.fa 或者 nwnsi input.fa > output.fa
mafft --retree 2 --maxiterate 0 --nofft input.fa > output.fa 或者 nwns input.fa > output.fa
3 個參數(shù)都設(shè)置為最不消耗時間的類型塞赂,適合于 ~10,000 到 ~50,000 條序列的比對
mafft --retree 1 --maxiterate 0 --nofft --parttree input.fa > output.fa