一鼎天、 安裝
- 使用conda安裝Pfam_scan
$ conda create -n pfam_scan ##可新建一個環(huán)境,用于安裝pfam-scan
$ source activate pfam_scan
$ conda install pfam_scan
pfam_scan依賴bioperl瘾杭,因此祟身,通過conda安裝簡單快捷.
- 安裝hmmer3 , 使用以下命令安裝:
$ wget http://eddylab.org/software/hmmer/hmmer-3.2.tar.gz
$ tar -xzvf hmmer-3.2.1.tar.gz
$ cd hmmer-3.2
$ ./configure
$ make
$ make check
$ make install
# 添加至環(huán)境變量
vim ~/.bashrc
export PATH=/usr/local/bin:$PATH
# 環(huán)境變量立即生效
source ~/.bashrc
- 數(shù)據(jù)庫下載:ftp://ftp.ebi.ac.uk/pub/databases/Pfam/current_release/
下載三個文件:
Pfam-A.hmm.dat.gz
Pfam-A.hmm.gz
active_site.dat.gz
最新版的Pfam數(shù)據(jù)庫不再有Pfam-B了司澎。
wget ftp://ftp.ebi.ac.uk:21/pub/databases/Pfam/current_release/Pfam-A.hmm.gz
wget ftp://ftp.ebi.ac.uk:21/pub/databases/Pfam/current_release/Pfam-A.hmm.dat.gz
wget ftp://ftp.ebi.ac.uk:21/pub/databases/Pfam/current_release/active_site.dat.gz
gunzip *.gz
- 通過hmmerspress來把下載的數(shù)據(jù)建庫:
$ hmmpress Pfam-A.hmm
二、軟件使用
參數(shù)說明:
-dir : Pfam_data_file_dir 包含Pfam數(shù)據(jù)文件的目錄[必須]
-fasta : fasta_file 包含序列的輸入文件名 [必須]
-e_seq 序列E-value閾值 [不指定則使用默認(rèn)閾值]
-e_dom 結(jié)構(gòu)域E-value閾值 [不指定則使用默認(rèn)閾值]
-b_seq 序列bit score閾值 [不指定則使用默認(rèn)閾值]
-b_dom 結(jié)構(gòu)域bit score閾值[不指定則使用默認(rèn)閾值]
-align 在結(jié)果中顯示比對片段 [默認(rèn)關(guān)閉]
-as 預(yù)測Pfam-A數(shù)據(jù)庫匹配的active sites[默認(rèn)關(guān)閉]
-json [pretty] 輸出結(jié)果使用JSON格式重荠。例如指定值為[pretty]箭阶,則輸出結(jié)果會使用"pretty" JSON格式輸出 [默認(rèn)關(guān)閉]
-cpu 并行工作的CPU數(shù)目 [默認(rèn)全部]
-translate [mode] 將輸入序列視為DNA,并在搜索前使用6框翻譯的方法進(jìn)行轉(zhuǎn)換戈鲁。如果翻譯模式[mode]被指定仇参,則必須為"all"或者"orf"。"all"表示完整翻譯婆殿,包括終止子并且不產(chǎn)生單獨(dú)的ORFs诈乒;"orf"表示只翻譯和報(bào)告長度大于20的ORFs。
如果使用了翻譯參數(shù)而沒有指定翻譯模式婆芦,則默認(rèn)使用"orf"模式怕磨。[默認(rèn)關(guān)閉]
- 例子
$ pfam_scan.pl -fasta ~/protein1.fa -dir ~/bio_softs/Pfam-A.hmm/ -outfile results_3.fa -as
<meta charset="utf-8">
三、結(jié)果格式
pfamscan蛋白結(jié)構(gòu)域部分分析結(jié)果說明如下:
(1) seq_id:轉(zhuǎn)錄本ID+[0,1,2]寞缝,不存在于列表中的轉(zhuǎn)錄本為noncoding
(2) hmm start:比對到結(jié)構(gòu)域的起始位置
(3) hmm end:比對到結(jié)構(gòu)域的終止位置
(4) hmm acc:比對到pfam結(jié)構(gòu)域的ID
(5) hmm name:pfam結(jié)構(gòu)域名稱
(6) hmm length:pfam結(jié)構(gòu)域的長度
(7) bit score:比對打分分值
(8) E-value:比對的E值癌压,pfam結(jié)構(gòu)域篩選的條件是: Evalue < 0.001