RepeatModeler已更新毡琉,擁有了一些新的功能,可以識(shí)別LTR的結(jié)構(gòu)
在基因組注釋中第一步就是重復(fù)序列的屏蔽舍杜,目前常用的從頭注釋pipeline就是RepeatModeler + RepeatMasker新娜。
RepeatModeler的依賴工具可以conda安裝或者手動(dòng)安裝,推薦conda
1既绩、RepeatMasker概龄、TRF、RMblast
在正式安裝RepeatModeler主程序之前饲握,需要提前配置好其依賴的工具私杜。
見前文(RepeatMasker的安裝與使用)(http://www.reibang.com/p/ffdbedae80fa)。
2互拾、RECON(從頭預(yù)測(cè)功能實(shí)現(xiàn)的核心組件)
conda install RECON #自動(dòng)配置在conda環(huán)境中
3、RepeatScout(從頭預(yù)測(cè)功能實(shí)現(xiàn)的核心組件)
conda install RepeatScout
4嚎幸、可選軟件颜矿,運(yùn)行LTR結(jié)構(gòu)搜索必須軟件,也可以不安裝
LtrHarvest(是GenomeTools套件的一部分嫉晶,安裝genometools即可骑疆。)
MAFFT
conda install genometools-genometools
conda install -c bioconda mafft
Ltr_retriever,解壓即可使用
https://github.com/oushujun/LTR_retriever/archive/master.zip
unzip LTR_retriever-master
CD-HIT和Ninja替废,解壓后編譯一下就好了
wget https://github.com/weizhongli/cdhit/archive/master.zip
unzip cdhit-master.zip && cd cdhit-master/
sudo make
wget https://github.com/TravisWheelerLab/NINJA/archive/master.zip
unzip master.zip && cd NINJA/
sudo make
5箍铭、RepeatModeler
前面的工具配置好后,源碼編譯RepeatModeler椎镣,和RepeatMasker安裝過程很像诈火,需要一步步指定所依賴的環(huán)境。
#RepeatModeler
wget http://www.repeatmasker.org/RepeatModeler/RepeatModeler-2.0.1.tar.gz
tar xzvf RepeatModeler-2.0.1.tar.gz
cd RepeatModeler-2.0.1.tar.gz
chmod -R 755 *
perl ./configure
“./configure”執(zhí)行后状答,根據(jù)提示信息一步步來冷守。
首先是perl環(huán)境,推薦使用/usr/bin環(huán)境下的perl惊科,即系統(tǒng)perl拍摇,使用conda中的perl后面總出問題」萁兀回車?yán)^續(xù)充活。
RepeatModeler安裝路徑蜂莉,默認(rèn)自動(dòng)指定安裝路徑,回車?yán)^續(xù)混卵。
指定RepeatMasker的安裝路徑映穗,回車?yán)^續(xù)。
指定RECON的安裝路徑淮菠,回車?yán)^續(xù)男公。
指定RepeatScout的安裝路徑,回車?yán)^續(xù)合陵。
指定NSEG的安裝路徑枢赔,回車?yán)^續(xù)。
指定TRF的安裝路徑(這個(gè)同時(shí)也是RepeatMasker安裝必需的)拥知,回車?yán)^續(xù)踏拜。
最后是序列搜索引擎(這個(gè)同時(shí)也是RepeatMasker安裝必需的),例如我們這里選擇2低剔,指定RMBlast主程序所在路徑速梗,回車返回主界面后,再選擇3襟齿,就完成了姻锁。
你也可以指定多種序列搜索引擎后,再選擇3猜欺,不過實(shí)際運(yùn)行時(shí)位隶,一次只能選擇一種序列比對(duì)方式。
這時(shí)會(huì)有提示:
這個(gè)版本的RepeatModeler可以檢測(cè)LTR的結(jié)構(gòu)开皿,是否配置涧黄,可以根據(jù)需要自行選擇。若需要就按y赋荆,然后根據(jù)提示選擇路徑完成配置笋妥。
這就完成RepeatModeler的安裝。
終于把一些列的環(huán)境添加完了窄潭,最后配置環(huán)境變量春宣。
#例如,我的RepeatModeler安裝路徑是在“/home/my/software/RepeatModeler-open-1.0.11”
export PATH=/home/my/software/RepeatModeler-2.0.1:$PATH
#這時(shí)候沒啥問題的話應(yīng)該可以看到幫助界面了
RepeatModeler -h
使用示例:
BuildDatabase -name human human_genomic.fa
RepeatModeler -pa 4 -database human -LTRStruct
RepeatMasker -e rmblast -lib human-families.fa -pa 4 human_genomic.fa
后續(xù)結(jié)果跟RepeatModeler1.0的結(jié)果差不多
祝大家科研順利<的恪P湃稀!