tassel需要Java環(huán)境
downloads tassel_5
cd
wget -c https://bitbucket.org/tasseladmin/tassel-5-standalone/get/5f8d2852556a.zip
zip 5f8d2852556a.zip
mv tasseladmin-tassel-5-standalone-5f8d2852556a/ tassel/
- 添加到環(huán)境變量中
echo export "PATH=/tassel/tassel:$PATH" >>.bashrc
- 命令行的tassel有很多的plugin,可以使用下面的命令查看包含了那些plugin
run_pipeline.pl -ListPlugins
- 而如果想要查看plugin的信息天梧,可以使用下面的命令
run_pipeline.pl -<plugin_name>
- 比如查看listplugin的幫助信息
run_pipeline.pl -ListPlugins
- 命令行的tassel可以使用pipeline同時來運行多條命令盔性,但是需要注意的是,每調(diào)用一次plugin呢岗,在加完參數(shù)后都需要在加上 -endPlugin
run_pipeline.pl -importGuess maize.hmp.txt -KinshipPlugin -method Centered_IBS -endPlugin -ExportPlugin -saveAs maize_kinship.txt -format SqrMatrix
- 多個管道可以交叉進(jìn)行
管道可以由多個管道組成
要正確使用-fork 和-combine(-fork<id> 指明了需要執(zhí)行的命令以及順序 )
-combine只有在合并多個plugins輸出的文件時才使用冕香,作為接下來的plugin的出入
每一個fork都有一個id
Output from a Sub-Pipeline can be used as Input to a another Sub-Pipeline by referencing with the flag -input. (i.e. -input1)
Each Sub-Pipeline (i.e. -fork) runs in it’s own CPU Process (i.e. Thread)
- 上述的舉例
run_pipeline.pl -fork1 <plugin> <plugin> -endPlugin -fork2 <plugin> <plugin> -endPlugin -fork3 <plugin> <plugin> <plugin>
run_pipeline.pl -fork1 <plugin> <plugin> -endPlugin -fork2 <plugin> -input1 <plugin> -endPlugin -fork3 <plugin> -input1 <plugin> <plugin>
run_pipeline.pl -fork1 <plugin> <plugin> -endPlugin -fork2 <plugin> <plugin> -endPlugin -combine3 -input1 -input2 <plugin> <plugin> <plugin>
run_pipeline.pl -fork1 <plugin> <plugin> -fork2 <pluginA> <pluginB> -input1
run_pipeline.pl -fork1 -importGuess mdp_genotype.hmp.txt -FilterSiteBuilderPlugin -siteMinAlleleFreq 0.01 -endPlugin -fork2 -importGuess mdp_phenotype.txt -excludeLastTrait -combine3 -input1 -input2 -intersect -FixedEffectLMPlugin -endPlugin -export glm_output
- 改變內(nèi)存大小
run_pipeline.pl -Xms512m -Xmx10g ...
我自己分析使用正常的代碼
- 將vcf文件轉(zhuǎn)換為phy文件,一遍可以構(gòu)建進(jìn)化樹后豫,然后使用PhyML 構(gòu)建進(jìn)化樹悉尾,但是需要注意的是,這個vcf文件應(yīng)該只包含SNP信息挫酿,不能有indel信息构眯,因為INDEL位點在轉(zhuǎn)換為phy文件時,會變成-或者0早龟,這個0在phylip軟件運行時識別不了會報錯惫霸,也可以把0轉(zhuǎn)換為-。因為這個使用的是全基因組的變異信息葱弟,所以INDEL位點實際上影響不是太大壹店,但為了結(jié)果的準(zhǔn)確性,最好還是使用SNP信息
run_pipeline.pl -Xmx6G -importGuess zheng58_group_genotypegvcf_noother.vcf -ExportPlugin -saveAs zheng58_group.phy -format Phylip_Inter
#第一次在運行這個命令是報錯了芝加,然后我將B73_V4_ctg硅卢、Pt和Mt這些開頭的都去掉就沒問題了
PhyML-3.1_linux64 -i zheng58_group.phy -d generic -b 1000 -m HKY85 -f m -v e -a e -o tlr
參考
Tassel 5.0 Pipeline (Command Line Interface)
Tassel 5 Pipeline Tutorial