http://www.reibang.com/p/bccdc3c68ace
RepeatModeler已更新烟馅,擁有了一些新的功能尾抑,可以識(shí)別LTR的結(jié)構(gòu)
在基因組注釋中第一步就是重復(fù)序列的屏蔽均函,目前常用的從頭注釋pipeline就是RepeatModeler + RepeatMasker。
RepeatModeler的依賴工具可以conda安裝或者手動(dòng)安裝我磁,推薦conda
安裝需要的環(huán)境
perl和Text::Soundex模塊-- V5.8.8及以上版本
Python 3 和 h5py 模塊 -- RepeatMasker軟件需要
RECON -- De Novo Repeat Finder
RepeatScout -- De Novo Repeat Finder
TRF-- Tandem Repeat Finder
RepeatMasker & Libraries
RMBlast NCBI Blast的修改版本,可與RepeatMasker和RepeatModeler一起使用,可選
ABBlast 比NCBI Blast更快趴泌,靈敏度更高的搜索引擎敞葛,可選
Text::Soundex和h5py 模塊
cpan install Text::Soundex #perl模塊安裝
pip3 install numpy scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple #h5py必須先裝此模塊誉察,-i表示清華鏡像
pip3 install h5py -i https://pypi.tuna.tsinghua.edu.cn/simple
1、RepeatMasker惹谐、TRF持偏、RMblast
在正式安裝RepeatModeler主程序之前,需要提前配置好其依賴的工具氨肌。
見(jiàn)前文(RepeatMasker的安裝與使用)(http://www.reibang.com/p/ffdbedae80fa)鸿秆。
2、RECON(從頭預(yù)測(cè)功能實(shí)現(xiàn)的核心組件)
conda install RECON #自動(dòng)配置在conda環(huán)境中
wget http://www.repeatmasker.org/RepeatModeler/RECON-1.08.tar.gz
tar -zxvf RECON-1.08.tar.gz
cd RECON-1.08/src
make ; make install #已經(jīng)將使用軟件安裝在 RECON-1.08/bin下
3怎囚、RepeatScout(從頭預(yù)測(cè)功能實(shí)現(xiàn)的核心組件)
conda install RepeatScout
wget http://www.repeatmasker.org/RepeatScout-1.0.6.tar.gz
tar -xzvf RepeatScout-1.0.6.tar.gz
cd RepeatScout-1.0.6
make # 會(huì)生產(chǎn)build_lmer_table和RepeatScout兩個(gè)程序
4卿叽、可選軟件,運(yùn)行LTR結(jié)構(gòu)搜索必須軟件恳守,也可以不安裝
LtrHarvest(是GenomeTools套件的一部分考婴,安裝genometools即可。)
MAFFT
conda install genometools-genometools
conda install -c bioconda mafft
wget http://genometools.org/pub/genometools-1.6.2.tar.gz
tar -pzxvf genometools-1.6.2.tar.gz
cd genometools-1.6.2
make threads=yes #設(shè)置多線程模式
make prefix=/software/annotation/genometools/1.6.2 install
Ltr_retriever催烘,解壓即可使用
https://github.com/oushujun/LTR_retriever/archive/master.zip
unzip LTR_retriever-master
CD-HIT和Ninja沥阱,解壓后編譯一下就好了
wget https://github.com/weizhongli/cdhit/archive/master.zip
unzip cdhit-master.zip && cd cdhit-master/
sudo make
wget https://github.com/TravisWheelerLab/NINJA/archive/master.zip
unzip master.zip && cd NINJA/
sudo make
5、RepeatModeler
前面的工具配置好后伊群,源碼編譯RepeatModeler考杉,和RepeatMasker安裝過(guò)程很像,需要一步步指定所依賴的環(huán)境舰始。
#RepeatModeler
wget http://www.repeatmasker.org/RepeatModeler/RepeatModeler-2.0.1.tar.gz
tar xzvf RepeatModeler-2.0.1.tar.gz
cd RepeatModeler-2.0.1.tar.gz
chmod -R 755 *
perl ./configure
“./configure”執(zhí)行后崇棠,根據(jù)提示信息一步步來(lái)。
首先是perl環(huán)境丸卷,推薦使用/usr/bin環(huán)境下的perl枕稀,即系統(tǒng)perl,使用conda中的perl后面總出問(wèn)題∥溃回車?yán)^續(xù)范抓。
RepeatModeler安裝路徑,默認(rèn)自動(dòng)指定安裝路徑食铐,回車?yán)^續(xù)匕垫。
指定RepeatMasker的安裝路徑,回車?yán)^續(xù)虐呻。
指定RECON的安裝路徑象泵,回車?yán)^續(xù)。
指定RepeatScout的安裝路徑斟叼,回車?yán)^續(xù)偶惠。
指定NSEG的安裝路徑,回車?yán)^續(xù)朗涩。
指定TRF的安裝路徑(這個(gè)同時(shí)也是RepeatMasker安裝必需的)猪落,回車?yán)^續(xù)实撒。
最后是序列搜索引擎(這個(gè)同時(shí)也是RepeatMasker安裝必需的)蛙吏,例如我們這里選擇2洲赵,指定RMBlast主程序所在路徑,回車返回主界面后识腿,再選擇3出革,就完成了。
你也可以指定多種序列搜索引擎后渡讼,再選擇3骂束,不過(guò)實(shí)際運(yùn)行時(shí),一次只能選擇一種序列比對(duì)方式成箫。
這時(shí)會(huì)有提示:
這個(gè)版本的RepeatModeler可以檢測(cè)LTR的結(jié)構(gòu)展箱,是否配置,可以根據(jù)需要自行選擇蹬昌。若需要就按y混驰,然后根據(jù)提示選擇路徑完成配置。
這就完成RepeatModeler的安裝凳厢。
終于把一些列的環(huán)境添加完了账胧,最后配置環(huán)境變量竞慢。
#例如先紫,我的RepeatModeler安裝路徑是在“/home/my/software/RepeatModeler-open-1.0.11”
export PATH=/home/my/software/RepeatModeler-2.0.1:$PATH
#這時(shí)候沒(méi)啥問(wèn)題的話應(yīng)該可以看到幫助界面了
RepeatModeler -h
使用示例:
BuildDatabase -name human human_genomic.fa
RepeatModeler -pa 4 -database human -LTRStruct
RepeatMasker -e rmblast -lib human-families.fa -pa 4 human_genomic.fa
后續(xù)結(jié)果跟RepeatModeler1.0的結(jié)果差不多
祝大家科研順利!3镏蟆遮精!