軟件安裝
軟件地址在http://www.compgen.uni-muenster.de/tools/teclass/index.hbi?, 由于TEclass這個軟件已經許久沒有更新了,因此還要講解下安裝步驟春塌。
wget http://www.compgen.uni-muenster.de/tools/teclass/download/TEclass-2.1.3.tar.gz
tar xf TEclass-2.1.3.tar.gz
cd TEclass-2.1.3
下載依賴的軟件
sh Download_dependencies.sh
由于代碼老舊啥么,部分內容無法自動下載儒溉,需要手動下載, 例如librf, blast. 最終要保證文件夾下有如下文件
- libsvm.tar.gz: http://www.csie.ntu.edu.tw/~cjlin/libsvm/
- glimmer.tar.gz: http://ccb.jhu.edu/software/glimmer/
- librf.tar.gz: http://mtv.ece.ucsb.edu/benlee/librf.html
- lvq_pak.tar: http://www.cis.hut.fi/research/som-research/nnrc-programs.shtml
- blast.tar.gz: ftp://ftp.ncbi.nlm.nih.gov/blast/executables/legacy.NOTSUPPORTED
例如blast
curl -o 'blast.tar.gz' ftp://ftp.ncbi.nlm.nih.gov/blast/executables/legacy.NOTSUPPORTED/2.2.26/blast-2.2.26-x64-linux.tar.gz
編譯依賴的軟件
sh Compile_dependencies.sh
安裝TEclass, 這一步可以跳過 RepBase的配置凯正。
perl Configure.pl
``
安裝預編譯的分類器
```bash
wget http://www.compgen.uni-muenster.de/tools/teclass/download/classifiers.tar.gz
mv classifiers.tar.gz classifiers
tar xf classifiers.tar.gz
測試運行
./TEclassTest.pl ./testfile.fa
軟件使用
構建分類器
如果你想使用最新的RepBase,那么就需要自己從RepBase下載數(shù)據(jù)進行構建。
如果是單核處理器感帅,可能要花費數(shù)周的時間,所以建議用上你的所有線程地淀。
/TEclassBuild.pl -x 0 -o new_classifiers -p 99
重復序列分類
在RepeatModeler建模后失球,提取Unknown序列使用TEclassTest
進行歸類,假如輸入文件命名為Modelerunknown.lib
TEclassTest Modelerunknown.lib
結果在Modelerunknown.lib_xxxx
, xxxx
是你運行日期帮毁。
Modelerunknown.lib # 輸入文件
Modelerunknown.lib.html
Modelerunknown.lib.lib # 輸出結果
Modelerunknown.lib.stat #結果統(tǒng)計
Modelerunknown.lib.lib
中的fasta會有分類信息实苞,如
>rnd-1_family-12#Unknown ( RepeatScout Family Size = 705, Final Multiple Alignment Size = 88, Localized to 114 out of 117 contigs )|TEclass result: LTR|forward|ORFs: 583..2355:+1
其他參數(shù):
-
-c
: 訓練的分類器所在路徑, 默認是TEclass-2.1classifiers
-
-o
: 輸出結果路徑豺撑,默認在當前文件下新建 -
-r
: 預測輸入序列的反向互補序列
參考文獻: TEclass: a tool for automated classification of unknown eukaryotic transposable elements