引起相變的無序結(jié)構(gòu)域(IDRs)怎么預(yù)測(cè)?跟蹤熱點(diǎn)钩骇,提升文章檔次比藻!

蛋白研究過程中,一般認(rèn)為氨基酸的序列決定了蛋白的結(jié)構(gòu)倘屹,結(jié)構(gòu)決定功能(一般指蛋白的三維結(jié)構(gòu))银亲。然而,近50年的研究中纽匙,有一種沒有特定三維結(jié)構(gòu)的蛋白不斷被研究人員發(fā)現(xiàn)群凶,由于這類蛋白無法折疊成穩(wěn)定的三維結(jié)構(gòu)而稱為固有無序蛋白(intrinsically disordered regions,IDRs)哄辣。這類蛋白雖然缺乏穩(wěn)定結(jié)構(gòu)且高度可變请梢,但是研究卻發(fā)現(xiàn)他們?cè)谏矬w內(nèi)行駛著重要的生物學(xué)功能。

尤其是最近相變頻繁登上CNS主刊力穗,越來越多認(rèn)識(shí)到IDRs在相變中的重要作用毅弧。2018 Cell系列相變最強(qiáng)綜述,未來已來当窗,你在哪够坐?

  1. 相位分離在多種細(xì)胞過程中起作用,包括形成經(jīng)典的無膜細(xì)胞器崖面、信號(hào)復(fù)合物元咙、細(xì)胞骨架和許多其他超分子組裝。

  2. 相位分離的概念為理解序列簡(jiǎn)并(低復(fù)雜性)和蛋白質(zhì)無序區(qū)域的功能提供了新的研究方向巫员。

  3. 越來越多的證據(jù)表明庶香,相變和無膜細(xì)胞器的失調(diào)在蛋白聚集相關(guān)的人類疾病中發(fā)揮關(guān)鍵作用。

  4. 理解蛋白質(zhì)相位分離背后的物理原理和分子互作機(jī)制可促進(jìn)新型生物材料的研發(fā)简识。

IDRs的存在赶掖,使得蛋白更容易形成液滴狀,誘發(fā)相變生成和調(diào)控的發(fā)生七扰。還在做經(jīng)典生物調(diào)控的你奢赂,如果能關(guān)聯(lián)下相變,可能既能更好的解釋細(xì)胞中的調(diào)控作用(畢竟細(xì)胞不是我們平常見到的溶液颈走,其極度粘稠的特性誘發(fā)不同的調(diào)控規(guī)則)膳灶,又可以跟蹤熱點(diǎn),提升下文章檔次立由。

相變IDRs預(yù)測(cè)

我們推薦一款工具轧钓,MetaDisorderhttp://iimcb.genesilico.pl/metadisorder/)司致,一個(gè)整合了多種meta-method方法的蛋白無序預(yù)測(cè)平臺(tái),操作簡(jiǎn)單聋迎,只需2步脂矫,就可以預(yù)測(cè)研究的目標(biāo)蛋白是否有可能參與相變,再?zèng)Q定是否進(jìn)行后期的驗(yàn)證霉晕。

其使用方式如下圖:

image

按照格式要求輸入氨基酸序列后庭再,點(diǎn)擊submit,跳轉(zhuǎn)結(jié)果頁面牺堰,點(diǎn)擊Graphicial format查看圖形可視化的結(jié)果拄轻,點(diǎn)擊Simple text format 查看文本化的結(jié)果。

image

可視化結(jié)果僅展示了4種MetaDisorder相關(guān)的結(jié)果伟葫,關(guān)于其它多種預(yù)測(cè)算法的結(jié)果點(diǎn)擊右側(cè)灰色圖例顯示恨搓。

image

MetaDisorder由于用到的方法多,運(yùn)行會(huì)比較慢筏养。如果特別著急斧抱,也可以使用下面的在線分析工具DISOPREDhttp://bioinf.cs.ucl.ac.uk/psipred/?disopred=1),這是綜合評(píng)估單款最優(yōu)的預(yù)測(cè)工具渐溶。

用戶可以在線提交蛋白質(zhì)序列辉浦,執(zhí)行特定的預(yù)測(cè),并可通過郵件接收預(yù)測(cè)結(jié)果茎辐。這樣可以很方便地得到一個(gè)蛋白質(zhì)序列的非結(jié)構(gòu)區(qū)域信息宪郊,能夠?yàn)榈鞍踪|(zhì)特征分析提供更多的信息。工具的使用方法在Help & Tutorials頁面有詳細(xì)的圖文介紹拖陆。

image

除了在線分析平臺(tái)弛槐,DISOPRED也有軟件版,供大批量蛋白結(jié)構(gòu)的預(yù)測(cè)(軟件下載地址:http://bioinfadmin.cs.ucl.ac.uk/downloads/DISOPRED/)依啰。一般下載使用最新版DISOPRED3.16.tar.gz乎串。

image

如果你的目標(biāo)蛋白正好有這么一段IDRs,可以試試檢測(cè)是否有相變的存在孔飒。如果對(duì)相變不熟灌闺,還是先建議閱讀 2018 Cell系列相變最強(qiáng)綜述艰争,未來已來坏瞄,你在哪?甩卓。

關(guān)于IDRs鸠匀,如果還想了解更多,請(qǐng)繼續(xù)閱讀逾柿。

IDRs的研究歷史

隨著IDRs不斷被發(fā)現(xiàn)缀棍,人們對(duì)其功能有了深入了解宅此。IDRs在調(diào)節(jié)轉(zhuǎn)錄、翻譯爬范、細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)父腕、蛋白質(zhì)磷酸化、小分子存儲(chǔ)青瀑,以及對(duì)大的多蛋白復(fù)合體(如細(xì)菌鞭毛及核糖體)自組裝的調(diào)控等各方面都發(fā)揮著重要作用璧亮。

如我們熟知的DNA結(jié)合轉(zhuǎn)錄因子(TF),其激活結(jié)構(gòu)域(activation domain, AD)中便包含了固有無序化的低復(fù)雜序列結(jié)構(gòu)域斥难,在真核生物基因轉(zhuǎn)錄階段起著至關(guān)重要的作用枝嘶。在真核生物中,大約有三分之一的蛋白已被鑒定包括長度超過30個(gè)殘基的無序區(qū)域哑诊,且有75%的哺乳動(dòng)物信號(hào)蛋白存在無序區(qū)域群扶。

同時(shí)IDRs也是許多疾病相關(guān)的位點(diǎn),由于在編碼無序區(qū)發(fā)生的染色體異位依然能保證折疊結(jié)構(gòu)域的完整性镀裤,從而會(huì)產(chǎn)生功能異常的融合蛋白竞阐,引發(fā)疾病。

可見IDRs是真核生物蛋白質(zhì)組中的重要組成部分暑劝,并在生命體的生長發(fā)育各個(gè)階段起到重要的調(diào)控作用馁菜。對(duì)這類蛋白質(zhì)的結(jié)構(gòu)、功能铃岔、進(jìn)化特征的認(rèn)識(shí)和蛋白無序區(qū)域的預(yù)測(cè)汪疮,有助于我們更深層次地理解無序蛋白質(zhì)的功能及其參與重要生理病理過程的分子機(jī)制。

如果預(yù)測(cè)到這些IDRs的存在毁习,那么就可以對(duì)感興趣的突變和相互作用進(jìn)行建模智嚷,以了解它們?nèi)绾斡绊懙鞍踪|(zhì)結(jié)構(gòu)和相變發(fā)生,并確定哪些結(jié)構(gòu)域可能適合于進(jìn)一步實(shí)驗(yàn)調(diào)查纺且。

image

<center>1990-2014年盏道,PubMed中關(guān)于固有無序/非折疊蛋白報(bào)道的數(shù)量</center>
<center>(在PubMed中可通過輸入intrinsically disordered, intrinsically unstructured, natively unfolded, intrinsically unfolded and intrinsically flexible等進(jìn)行搜索)</center>

IDRs預(yù)測(cè)方法

由于固有無序蛋白結(jié)構(gòu)的不穩(wěn)定性,很難通過實(shí)驗(yàn)手段使他們純化結(jié)晶以得到可靠的實(shí)驗(yàn)數(shù)據(jù)载碌,尤其是大規(guī)模地進(jìn)行無序蛋白質(zhì)結(jié)構(gòu)測(cè)定更是十分困難猜嘱。因此,各種IDRs預(yù)測(cè)軟件快速發(fā)展起來嫁艇,并通過每兩年舉辦一次的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)比賽(critical assessment of structure prediction朗伶,CASP)來評(píng)估各種預(yù)測(cè)軟件的準(zhǔn)確率。從CASP5開始加入了對(duì)無序蛋白質(zhì)的預(yù)測(cè)步咪,目前已經(jīng)舉行到CASP12(2016年)论皆,CASP13(2018年)比賽正在進(jìn)行中(有興趣的小伙伴可查看官網(wǎng)了解比賽:http://predictioncenter.org/casp13/index.cgi

<center>表1 部分固有無序蛋白預(yù)測(cè)工具展示</center>

image
image

這些預(yù)測(cè)方法可分為四大類:

1. Sequence based

依賴人工神經(jīng)網(wǎng)絡(luò) (artificial neural networks,ANNs)、支持向量機(jī)(support vector machines点晴,SVMs)等機(jī)器學(xué)習(xí)方法開發(fā)的算法感凤。

例如1997年Romero等開發(fā)的第一個(gè)無序區(qū)域預(yù)測(cè)的工具PONDR VL-XT,它是基于PDB數(shù)據(jù)庫中67個(gè)無序區(qū)域 (1340個(gè)殘基)和一些有序區(qū)域(16 543個(gè)殘基)建立的一種“雙層前饋式神經(jīng)網(wǎng)絡(luò)”粒督,首次表明單純從氨基酸序列可以預(yù)測(cè)無序區(qū)域陪竿。

之后利用計(jì)算技術(shù)開發(fā)了一系列的算法,如PONDR VL3屠橄、DISOPRED2萨惑、POODLE-L等。

第一類算法的缺點(diǎn)是不能很好地揭示潛在的序列性質(zhì)仇矾。

2. clustering

該方法通過使用蛋白一級(jí)序列生成三級(jí)結(jié)構(gòu)模型庸蔼,并將模型彼此疊加以鑒別蛋白高度可變區(qū)域。這個(gè)方法建立在理論上贮匕,認(rèn)為序列的位置在多個(gè)模型中應(yīng)該是保持一定的秩序規(guī)則姐仅,然而變化的殘基可能是無序的。intFOLDDISOclust便是基于此方法的預(yù)測(cè)工具刻盐。

由于聚類方法不依賴于訓(xùn)練數(shù)據(jù)集掏膏,因此這種方法可能不太能顯示關(guān)于無序區(qū)域長度的偏差。

3. template based

與聚類方法類似敦锌,基于蛋白的一級(jí)序列與已知的同源物做比對(duì)馒疹。如PrDOS就是基于此方法的預(yù)測(cè)工具,同時(shí)也可以基于氨基酸序列做預(yù)測(cè)乙墙。這個(gè)方法認(rèn)為颖变,蛋白內(nèi)在無序區(qū)域在蛋蛋白家族中應(yīng)該是保守的,通過結(jié)合氨基酸序列的預(yù)測(cè)和同源比對(duì)的方法听想,ProDOS也可劃分到第四種預(yù)測(cè)方式meta-predictor中腥刹。

4. meta-predictor approaches

基于參考多個(gè)無序預(yù)測(cè)工具的結(jié)果對(duì)蛋白做進(jìn)一步預(yù)測(cè)。使用該方法的一個(gè)例子是metaPRDOS汉买,該工具整合了八種不同單獨(dú)預(yù)測(cè)方法的結(jié)果衔峰。meta-predictor可以提高預(yù)測(cè)的準(zhǔn)確性,因其預(yù)測(cè)結(jié)果比較可靠而常將結(jié)果作為數(shù)據(jù)庫填充的來源蛙粘。如MobiDB數(shù)據(jù)庫垫卤,利用多種無序預(yù)測(cè)手段的結(jié)果,整合了來自PDBDisProt的無序蛋白質(zhì)出牧。MobiDB數(shù)據(jù)庫中的每種蛋白穴肘,是基于10種無序預(yù)測(cè)方法的結(jié)果和NMR / X射線數(shù)據(jù)來挑選的。

預(yù)測(cè)工具性能評(píng)估

為了測(cè)試各工具之間的效果差異崔列,Jennifer D. Atkins 等人用已知結(jié)構(gòu)的心肌肌肉LIM蛋白(MLP)進(jìn)行檢驗(yàn)梢褐。已知MLP的中心區(qū)域含長的無序區(qū)域旺遮,且N-末端和C-末端都含有一定程度的無序區(qū)域赵讯。

image

PDB條目2o10(殘基7-66)和2o13(殘基119-176)僅解析了具有部分接頭序列的LIM結(jié)構(gòu)域盈咳。2o10中殘基1-6、72-83和2o13中的殘基179-187也可能是接頭序列边翼,而殘基109-112,136,137,143,156,163和183-184在2o13內(nèi)未被發(fā)現(xiàn)鱼响。這表明這七個(gè)殘基加上位于66位之后的殘基可能是無序區(qū)域而沒有被解析到。此外组底,66和119之間以及176-194之間的區(qū)域可能包含無序區(qū)域丈积。基于此已知條件债鸡,將MLP提交給各預(yù)測(cè)工具江滨,下表便是各個(gè)預(yù)測(cè)工具的預(yù)測(cè)結(jié)果。

<center>表2 利用不同預(yù)測(cè)軟件心肌肌肉LIM蛋白(MLP)無序區(qū)預(yù)測(cè)結(jié)果的比較</center>

image

從上表中其實(shí)很難確定到底哪個(gè)工具預(yù)測(cè)最準(zhǔn)確厌均,因?yàn)樗械念A(yù)測(cè)結(jié)果都不一樣唬滑,甚至有些軟件的預(yù)測(cè)結(jié)果與其他結(jié)果相差甚遠(yuǎn)。這體現(xiàn)了獨(dú)個(gè)工具分析的局限性棺弊,也說明我們需要同時(shí)使用多個(gè)工具來盡可能清楚地解析給定序列中無序區(qū)域存在的可能性晶密。

有研究者用其他已知結(jié)構(gòu)的蛋白質(zhì)做過類似的比較,得到了相似的效果模她,即不同的預(yù)測(cè)工具間結(jié)果存在不同程度的差異稻艰。基于前人的研究經(jīng)驗(yàn)得出侈净,DISOPRED似乎是比較可靠的預(yù)測(cè)方法尊勿,其預(yù)測(cè)最接近已知的無序區(qū)域

我們不應(yīng)單獨(dú)使用某個(gè)預(yù)測(cè)軟件畜侦,每個(gè)工具都有缺點(diǎn)和優(yōu)點(diǎn)运怖。盡管我們不能保證預(yù)測(cè)軟件能100%地為我們提供正確的結(jié)果,但這些結(jié)果確實(shí)為我們提供了IDRs的較精準(zhǔn)估計(jì)夏伊,從而使我們了解到一些無法通過實(shí)驗(yàn)得到的IDRs結(jié)構(gòu)摇展。

由上可知目前對(duì)IDRs的研究還存在諸多難題,由于結(jié)構(gòu)不穩(wěn)定而無法通過實(shí)驗(yàn)手段進(jìn)行可靠的研究溺忧,就算有了眾多的預(yù)測(cè)軟件咏连,但是也存在一定的局限性。機(jī)遇與挑戰(zhàn)并存是生物研究中的常態(tài)鲁森,希望終有一天科學(xué)家們會(huì)揭開生物體內(nèi)這些不同尋常的蛋白域的功能祟滴。如果有精力,開發(fā)這么一款軟件和數(shù)據(jù)庫也會(huì)對(duì)大家很有幫助歌溉。

參考文獻(xiàn)

[1] 馬沖, 楊冬, 姜穎等. 無序蛋白質(zhì)的判定及其結(jié)構(gòu)垄懂、功能和進(jìn)化特征[J]. 生物化學(xué)與生物物理進(jìn)展, 2015, 42(1): 16-24.
[2] Jennifer D. Atkins. Disorder Prediction Methods, Their Applicability to Different Protein Targets and Their Usefulness for Guiding Experimental Studies [J]. Int. J. Mol. Sci. 2015, 16, 19040-19054.

文獻(xiàn)精讀

更多閱讀

畫圖三字經(jīng) 生信視頻 生信系列教程

心得體會(huì) 癌癥數(shù)據(jù)庫 Linux Python

高通量分析 在線畫圖 測(cè)序歷史 超級(jí)增強(qiáng)子

培訓(xùn)視頻 PPT EXCEL 文章寫作 ggplot2

海哥組學(xué) 可視化套路 基因組瀏覽器

色彩搭配 圖形排版 互作網(wǎng)絡(luò)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末指么,一起剝皮案震驚了整個(gè)濱河市酝惧,隨后出現(xiàn)的幾起案子榴鼎,更是在濱河造成了極大的恐慌,老刑警劉巖晚唇,帶你破解...
    沈念sama閱讀 219,490評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件巫财,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡缺亮,警方通過查閱死者的電腦和手機(jī)翁涤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門桥言,熙熙樓的掌柜王于貴愁眉苦臉地迎上來萌踱,“玉大人,你說我怎么就攤上這事号阿〔⑼遥” “怎么了?”我有些...
    開封第一講書人閱讀 165,830評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵扔涧,是天一觀的道長园担。 經(jīng)常有香客問我,道長枯夜,這世上最難降的妖魔是什么弯汰? 我笑而不...
    開封第一講書人閱讀 58,957評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮湖雹,結(jié)果婚禮上咏闪,老公的妹妹穿的比我還像新娘。我一直安慰自己摔吏,他們只是感情好鸽嫂,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,974評(píng)論 6 393
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著征讲,像睡著了一般据某。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上诗箍,一...
    開封第一講書人閱讀 51,754評(píng)論 1 307
  • 那天癣籽,我揣著相機(jī)與錄音,去河邊找鬼滤祖。 笑死筷狼,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的氨距。 我是一名探鬼主播桑逝,決...
    沈念sama閱讀 40,464評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼俏让!你這毒婦竟也來了楞遏?” 一聲冷哼從身側(cè)響起茬暇,我...
    開封第一講書人閱讀 39,357評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎寡喝,沒想到半個(gè)月后糙俗,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,847評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡预鬓,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,995評(píng)論 3 338
  • 正文 我和宋清朗相戀三年巧骚,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片格二。...
    茶點(diǎn)故事閱讀 40,137評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡劈彪,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出顶猜,到底是詐尸還是另有隱情沧奴,我是刑警寧澤,帶...
    沈念sama閱讀 35,819評(píng)論 5 346
  • 正文 年R本政府宣布长窄,位于F島的核電站滔吠,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏挠日。R本人自食惡果不足惜疮绷,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,482評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望嚣潜。 院中可真熱鬧冬骚,春花似錦、人聲如沸郑原。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽犯犁。三九已至属愤,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間酸役,已是汗流浹背住诸。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評(píng)論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留涣澡,地道東北人贱呐。 一個(gè)月前我還...
    沈念sama閱讀 48,409評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像入桂,于是被迫代替她去往敵國和親奄薇。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,086評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容