基因家族流程:基因家族分析(一)
基因家族流程:基因家族分析(二)
====================================================================================================================================
蛋白性質(zhì)和序列分析(都是在線網(wǎng)站分析)
1 蛋白性質(zhì)(protein properties)
1)氨基酸數(shù)量茬底、等電點(diǎn)和相對(duì)分子質(zhì)量預(yù)測:
http://web.expasy.org/compute_pi/
將所有的蛋白序列整理成以下形式急迂,批量計(jì)算垄潮。
ps:CDS長度批量計(jì)算可以利用序列比對(duì)工具姚炕。
蛋白序列.png
批量操作.png
其他網(wǎng)站:
https://web.expasy.org/protparam/
https://web.expasy.org/protscale/
2 亞細(xì)胞定位預(yù)測(Subcellular localization):
· 文件準(zhǔn)備:蛋白序列,上傳即可竹习。
在線工具:
· CELLO:http://cello.life.nctu.edu.tw/
· WoLF PSORT: https://wolfpsort.hgc.jp/
· Cell-PLoc 2.0 :http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/
· TargetP:http://www.cbs.dtu.dk/services/TargetP/
2 基因結(jié)構(gòu)分析(gene structure analysis)
1)在線網(wǎng)站GSDS2.0(Gene Structure Display Server 2.0):http://gsds.cbi.pku.edu.cn/
2)數(shù)據(jù)準(zhǔn)備:gene&CDS序列或者gff3或者bed格式伴箩;可調(diào)整輸出的順序(outorder)孵班,修改label為Exon赠潦,可添加結(jié)構(gòu)域存在區(qū)段叫胖。參看。
3)基因結(jié)構(gòu)常見統(tǒng)計(jì)信息:自己excel或?qū)懗绦蚪y(tǒng)計(jì)
· The number of intron and exon.
· The splicing intron pattern inculding 0,1,2 phase.
· The marked region. For example kinase domain.
· sequence length.
· UTR
3 保守結(jié)構(gòu)域和模體分析(conserved motif and motif annotate)
1 )保守domain:上傳蛋白序列即可
phmmer search | HMMER:上傳序列她奥,確定domain(鏈接到Pfam)
Pfam search:google瀏覽器可以使用瓮增,有的瀏覽器打不開
SMART
NCBI Batch CD- search.:上傳序列(包含多個(gè)數(shù)據(jù)庫,結(jié)果可能不一樣)
2) motif分析:上傳蛋白序列即可哩俭,可調(diào)整模體數(shù)量
MEME suite:http://meme-suite.org/tools/meme
注意:蛋白序列文件要求輸出順序時(shí)绷跑,輸入文件中順序要調(diào)整好
3)Motif注釋(不同網(wǎng)站結(jié)果有點(diǎn)不一致,大致參考)
ScanProsite: (https://prosite.expasy.org/scanprosite/)
BoxShade Server:https://embnet.vital-it.ch/software/BOX_form.html
注意:
基因結(jié)構(gòu)凡资,保守模體和保守結(jié)構(gòu)域都可以用TBtools繪制你踩。
再一次感謝CJ~