蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)抱虐,只要有目的基因的氨基酸序列就可以做昌阿,不限物種,沒有太多要求恳邀,可為文章增色懦冰。
windows版本的VMD軟件可在公眾號(hào)生信星球回復(fù)“VMD”獲得,且附帶軟件中文教程谣沸。
一刷钢、示例序列
以這段序列為例:
AAGGAATTGACAGAAGAGCAGAGAACACAGCTTTTTGAAGATCTAAAACAGTGTAAAAATTCGACAGATCTTTCCGACGATGAGTTTGAAACGATCATTGCTAAGAAGGAGCTCCCTACTTCGGAAGCAGGCAAATGCTTCACGAAATGCTTGATGGAGAAATTGGATATAATTGAGGATGCTGAAGGAGGGAAGAAGAAAATCAGTGTGATCACGATGCAAGCCTCGCTGGAGGAGAATATGGAAAAGGAAGATGATATTGCTAAAGGGAAGGATATCATCCAGAAATGTGGAGATACAGTGGAGCCCGAAGACAGTTGCGCATATGCATATAATATCTCTAAATGCATTTACGATAGAATGAAGGAGGCAGGCATTTCTCAATAA
如果你有核苷酸序列而沒有氨基酸序列,可用NovoPro在線工具轉(zhuǎn)換:
http://www.novopro.cn/tools/translate.html
得到的氨基酸序列為:
KELTEEQRTQLFEDLKQCKNSTDLSDDEFETIIAKKELPTSEAGKCFTKCLMEKLDIIEDAEGGKKKISVITMQASLEENMEKEDDIAKGKDIIQKCGDTVEPEDSCAYAYNISKCIYDRMKEAGISQ
二乳附、三維結(jié)構(gòu)預(yù)測(cè)的方法
主要介紹同源建模與穿線法内地。
1.同源建模
網(wǎng)站:swiss-model
原理:相似的氨基酸序列對(duì)應(yīng)著相似的蛋白質(zhì)結(jié)構(gòu)
要求:找到與目標(biāo)序列一致度≥30%已知結(jié)構(gòu)作為模板
結(jié)果頁面解讀:
(1)首先看搜到的模板與你的序列一致度是否>30%伴澄,如果不大于,要發(fā)英文文章此結(jié)果就應(yīng)放棄阱缓,用iTASSER重新預(yù)測(cè)非凌。如果只是看看,發(fā)中文或放進(jìn)畢業(yè)論文荆针,20%以上也可繼續(xù)做敞嗡。
(2)如果可用,再看swissmodel自帶的評(píng)分高低航背。
GMQE :可信度范圍為 0-1喉悴,值越大表明質(zhì)量越好
QMEAN4:區(qū)間-4-0,越接近0玖媚,評(píng)估待測(cè)蛋白與模板蛋白的匹配度越好箕肃。
如果swissmodel預(yù)測(cè)結(jié)果不可用或評(píng)分不好,用iTASSER重新預(yù)測(cè)今魔。
2.折疊識(shí)別(穿線法)
網(wǎng)站:iTASSER
原理:不相似的氨基酸序列也可以對(duì)應(yīng)著相似的蛋白質(zhì)結(jié)構(gòu)勺像。
補(bǔ)充說明:已知的蛋白質(zhì)結(jié)構(gòu)有十幾萬個(gè),但其所具有的不同的結(jié)構(gòu)拓?fù)?/strong>只有1393個(gè)涡贱,也就是說咏删,所有結(jié)構(gòu)都落在這1393個(gè)拓?fù)鋬?nèi)!因此问词,選擇匹配能量最低的拓?fù)洹?br>
要求:沒要求督函,比較任性。一般是不能同源建模(一致度<30%)的蛋白選用這個(gè)方法激挪。
注意:必須用學(xué)術(shù)郵箱注冊(cè)辰狡。
結(jié)果頁面解讀:
https://zhanglab.ccmb.med.umich.edu/I-TASSER/example/
(1)預(yù)測(cè)的二級(jí)結(jié)構(gòu)
(2)預(yù)測(cè)的殘基可溶性(高度暴露的表面殘基:9,深埋的內(nèi)部殘基0)
(3)建模使用的模版及多序列比對(duì)垄分。不是序列相似性比對(duì)宛篇,而是用穿線法穿出來。
(4)預(yù)測(cè)蛋白質(zhì)功能薄湿,以及有可能與之結(jié)合的配體和該配體的結(jié)合位點(diǎn)
評(píng)估:模型質(zhì)量評(píng)估模型質(zhì)量評(píng)估系數(shù)C-score:[-5,2]叫倍,分值越高,可信度越高豺瘤。
TM-score:兩兩結(jié)構(gòu)相似度系數(shù)吆倦,>0.5說明模型具有正確的結(jié)構(gòu)拓?fù)洌尚牛?lt;0.17說明模型屬于隨即模型坐求,不可信蚕泽。
RMSD:兩兩結(jié)構(gòu)間的距離偏差。
3.從頭計(jì)算法
網(wǎng)站:quark
原理:1973年《science》Anfinsen:蛋白質(zhì)的三維結(jié)構(gòu)決定于自身的氨基酸序列桥嗤,并且處于最低自由能狀態(tài)须妻。模擬肽段在三維空間中所有可能的姿態(tài)仔蝌,并計(jì)算出自由能最低的一個(gè)。
計(jì)算量極大荒吏,不常用敛惊。
預(yù)測(cè)完成后下載對(duì)應(yīng)的pdb格式文件,用免費(fèi)軟件VMD可讀取司倚,就是你預(yù)測(cè)的三維結(jié)構(gòu)豆混,VMD打開默認(rèn)就是這么丑的篓像,之后再說如何調(diào)整顯示动知。
二.第三方軟件對(duì)模型評(píng)分
模型預(yù)測(cè)出來后需要有3個(gè)評(píng)估軟件認(rèn)為合格才能用,下載PDB文件员辩,提交到測(cè)評(píng)軟件盒粮。
saves(一次性提供6個(gè)軟件評(píng)估結(jié)果)http://servicesn.mbi.ucla.edu/SAVES/,其中有三個(gè)顯示通過即表示模型可用奠滑。
1.verify 3D
超過80%的殘基擁有大于0.2的3D/1D值丹皱,則模型質(zhì)量合格,低于0.2的部分需要進(jìn)一步修正宋税。
2.procheck
拉氏圖檢查Cα的兩面角是否合理摊崭,合格的模型超過90%的殘基都應(yīng)該落在紅色(允許區(qū)域)和正黃色(額外允許區(qū)域)落到其他區(qū)域的殘基應(yīng)當(dāng)被查看并修正。
以PDB中高分辨率的晶體結(jié)構(gòu)參數(shù)為參考杰赛,給出提交模型的一系列立體化學(xué)參數(shù)(主鏈)呢簸。其輸出結(jié)果包括:拉氏圖,主鏈的鍵長(zhǎng)與鍵角乏屯,二級(jí)結(jié)構(gòu)圖根时,平面?zhèn)孺溑c水平面之間的背離程度等。
3.whatcheck
提交的蛋白結(jié)構(gòu)與正常結(jié)構(gòu)之間的差異辰晕,指標(biāo)賊多蛤迎,綠色多就當(dāng)通過了。
4.errat
計(jì)算0.35nm范圍之內(nèi)含友,不同的原子類型對(duì)之間形成的非鍵相互作用的數(shù)目(側(cè)鏈)替裆。得分>85較好,晶體可達(dá)到95窘问,一般來說結(jié)果在91以內(nèi)庞呕。
5.prove
與預(yù)先計(jì)算好的一系列標(biāo)準(zhǔn)體積的差別,用z-score來表示冰蘑,顯示模版蛋白質(zhì)與待測(cè)蛋白之間的匹配程度厌秒,越高越好。
以剛才的同源建模文件為例:
微信公眾號(hào)生信星球同步更新我的文章汉形,歡迎大家掃碼關(guān)注纸镊!
我們有為生信初學(xué)者準(zhǔn)備的學(xué)習(xí)小組,點(diǎn)擊查看??
想要參加我的線上線下課程倍阐,也可加好友咨詢??
如果需要提問,請(qǐng)先看生信星球答疑公告