PTM/Processing 提供蛋白質(zhì)翻譯后修飾或翻譯后加工的相關(guān)信息滨嘱。
expression 提供了基因在mrna? 水平上的表達(dá)信息楚昭,或者在細(xì)胞中蛋白質(zhì)水平上的表達(dá)信息如庭,或者在不同器官組織中的表達(dá)信息碰煌。
interaction 提供了蛋白質(zhì)之間相互作用的信息舒岸。
structure 提供蛋白質(zhì)二級(jí)和三級(jí)結(jié)構(gòu)信息。
family domains 提供蛋白質(zhì)及結(jié)構(gòu)域信息芦圾。
sequence 序列信息蛾派,,个少,異構(gòu)體洪乍,可下載
PDB文件,文本文件夜焦,3D結(jié)構(gòu)
Pfam 數(shù)據(jù)庫(kù)是一個(gè)蛋白質(zhì)結(jié)構(gòu)域家族的集合壳澳。識(shí)別出蛋白質(zhì)中的結(jié)構(gòu)域?qū)τ诹私獾鞍踪|(zhì)的功能有重要意義。search來(lái)匹配結(jié)構(gòu)域茫经。
CATH重要的蛋白質(zhì)結(jié)構(gòu)分類(lèi)數(shù)據(jù)庫(kù)巷波。蛋白質(zhì)被分為四種,C A T B 卸伞。
SCOP也是蛋白質(zhì)結(jié)構(gòu)分類(lèi)數(shù)據(jù)庫(kù)抹镊,但SCOP注重蛋白質(zhì)進(jìn)化方面的分類(lèi)。(搜索PDB結(jié)構(gòu))
專(zhuān)用數(shù)據(jù)庫(kù)荤傲,KEGG 簡(jiǎn)稱(chēng)京都基因組百科全書(shū)垮耳。代謝通路。每個(gè)點(diǎn)代表一個(gè)化合物遂黍,連線代表反應(yīng)终佛。
序列比對(duì),妓湘,查蓉,替換記分矩陣(Substitution Matrix): 反應(yīng)殘基之間相互替換率的矩陣,它描述了殘基兩兩相似的量化關(guān)系榜贴。分為DNA替換記分矩陣和蛋白質(zhì)替換記分矩陣豌研。
比較序列相似度:打點(diǎn)法:對(duì)角線及對(duì)角線的平行線都是相似序列。唬党。鹃共。在線打點(diǎn)器可能需要安裝java
序列比對(duì)法:Needleman-Wunsch算法。
在線雙序列比對(duì)驶拱,? EMBL-EBI?
輸入fast格式文件霜浴。gap open(gap開(kāi)頭)? gap extend(gap 延長(zhǎng))一般設(shè)置開(kāi)頭分高,延長(zhǎng)分低蓝纲。這種設(shè)置的緣由是在連續(xù)的序列里阴孟,打開(kāi)一個(gè)口子的代價(jià)大晌纫。
如果有不同的預(yù)期,如下兩種情況:
1永丝,要比對(duì)的序列相似锹漱,期中一條結(jié)構(gòu)已知,比對(duì)慕嚷,
2哥牍,絕大部分相似,但期中一個(gè)的功能區(qū)序列缺失了喝检。
全局比對(duì)中比對(duì)不好的在局部比對(duì)中被省略嗅辣。(有時(shí),序列并不同源挠说,只是有相似的功能區(qū),這時(shí)最好用局部序列比對(duì)。)
BLAST(Basic Local Alignment Search Tool):快速在數(shù)據(jù)庫(kù)中尋找相似序列。用一條序列拧咳,與數(shù)據(jù)庫(kù)中所有的序列一一進(jìn)行雙序列比對(duì),尋找相似序列阅签。
BLAST 原理是找片段對(duì)。
Blastx 將核酸序列按6條鏈翻譯成蛋白質(zhì)序列后搜索蛋白質(zhì)序列數(shù)據(jù)庫(kù)(因?yàn)椴⒉恢獜哪莻€(gè)堿基開(kāi)始翻譯养交,索性把三種情況都試一遍碎连,因?yàn)楹怂阈蛄杏锌赡苁腔パa(bǔ)鏈廉嚼,所以有6種前鹅,而不是3種)。這樣做的原因是核酸序列庫(kù)和蛋白質(zhì)序列庫(kù)并不全面捂寿,或者有時(shí)需要的本來(lái)就是蛋白質(zhì)序列。
blast雖然速度快驳概,但犧牲了精確度,不會(huì)落下高度相似的序列稚照,但相似度低的會(huì)被落下。這時(shí)可以選擇PSI BLAST(標(biāo)黃的搜索是新搜到的序列弱恒,下一輪搜索會(huì)作為比對(duì)序列來(lái)搜索。)
PHI-BLAST 用正則表達(dá)式來(lái)搜索琉苇。
smartblast 精確抡诞,懶人專(zhuān)用,直接輸入序列。
多序列比對(duì):找功能區(qū)源哩,見(jiàn)電腦儲(chǔ)存圖片
多序列比對(duì)結(jié)果,一列全部相同底下一個(gè)*,若大致相似屉栓,有相似的,親疏水性,大小相似則:? 有不想似的則.? 若完全不同則無(wú)。
在EMBL-EBI 的Clustal Omega 里比對(duì)完后,點(diǎn)Result Summary 選擇Percent identity Matrix 可以查看各個(gè)序列間的相似度。
TCOFFEE? 多序列比對(duì)。
jalview? 比對(duì)結(jié)果修飾(重點(diǎn))http:/www.jalview.org
多序列比對(duì),尋找重要位點(diǎn)镶摘,保守區(qū)域碌冶。
序列標(biāo)識(shí)圖
MEME 幫助我們尋找序列中的特定片段,也可以對(duì)找到的特定片段搜索數(shù)據(jù)庫(kù)罐氨。
PRINTS 蛋白質(zhì)指紋圖譜數(shù)據(jù)庫(kù)约啊。(蛋白質(zhì)重要基序佣赖,可以查看3維結(jié)構(gòu)恰矩。)重點(diǎn)≡鞲颍可以搜索相似蛋白外傅。
研究進(jìn)化,最確鑿的證據(jù)俩檬,生物化石萎胰,解剖
分子進(jìn)化。
系統(tǒng)發(fā)生樹(shù)棚辽,有根技竟,無(wú)根
構(gòu)建系統(tǒng)發(fā)生樹(shù)需要兩個(gè)軟件對(duì)比。
MEGA? 要構(gòu)建更好的系統(tǒng)發(fā)生樹(shù)屈藐,必須學(xué)會(huì)至少3個(gè)參數(shù)的設(shè)置:test of phylogeny :
No. of bootstrap Replication(步長(zhǎng)檢驗(yàn)):(檢驗(yàn)次數(shù))? 在每個(gè)節(jié)點(diǎn)出都會(huì)有一個(gè)百分?jǐn)?shù)榔组,指定次數(shù)次計(jì)算所得出的系統(tǒng)發(fā)生樹(shù)中,有百分之多少棵樹(shù)中有這一節(jié)點(diǎn)联逻。一般絕大多數(shù)節(jié)點(diǎn)上的數(shù)值大于百分之70的樹(shù)才可信搓扯。
Substitution Model(計(jì)算遺傳距離時(shí)使用的計(jì)算模型)?
Gaps/Missing Date Treatment (刪除多序列比對(duì)中含有空位的鏈)
Original Tree 是原始檢驗(yàn)中其中的一棵樹(shù)(樹(shù)枝長(zhǎng)度可以精確代表遺傳距離。)包归, Bootstrap consensus tree 是合并后的結(jié)果锨推。
蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)與分析。
一級(jí)結(jié)構(gòu),氨基酸序列
二級(jí)結(jié)構(gòu)爱态,周期性的結(jié)構(gòu)構(gòu)象:DSSP文件
PDB網(wǎng)站獲取蛋白質(zhì)二級(jí)結(jié)構(gòu)谭贪,輸入PDB ID
預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)網(wǎng)站:PSIPRED
三級(jí)結(jié)構(gòu),整條多肽鏈的三維空間結(jié)構(gòu)
四級(jí)結(jié)構(gòu)锦担,多個(gè)亞基形成的復(fù)合體結(jié)構(gòu)
今天用licorice whole genome關(guān)鍵詞搜索NCBI數(shù)據(jù)庫(kù)俭识,搜到了abrus precatorius,貌似是什么相思豆洞渔,土甘草套媚,不管了,搜不到甘草的全基因組磁椒。用關(guān)鍵詞? ? ? ? ? ? ? ? ? ? ? ? ? self-incompatibility搜了自交不親和基因堤瘤。