Science | AI精準預測RNA結構
原創(chuàng)?圖靈基因?圖靈基因?今天
收錄于話題#前沿生物大數據分析
有時冈爹,幾條細微的線索就足以使一幅完整倾鲫、可靠的畫面得以呈現崖堤。唉毅糟,這樣的時刻是如此罕見,事實上弛饭,如果一個福爾摩斯出現并成功地表演了幾次冕末,他們就會贏得無休止的喝彩。但是侣颂,如果這個把戲可以定期上演呢档桃?如果這個技巧不局限于孤立的、狹隘的“案例”憔晒,而是適用于范圍廣泛的案例呢藻肄?這些問題正受到結構生物學家們的關注,當他們試圖猜測蛋白質和RNA分子是如何折疊成三維(3D)結構時拒担,他們通常只能靠很少的數據來解決嘹屯。
一年前,斯坦福大學的結構生物學家們發(fā)表了一篇可以稱為“蛋白質結構案例”的文章(這篇文章的標題是“Hierarchical, rotation-equivariant neural networks to select structural models of protein complexes”从撼,發(fā)表在《Proteins》雜志上)州弟。最近,他們發(fā)表了一篇文章低零,可以稱之為RNA結構案例(這篇題為“Geometric deep learning of RNA structure”的文章發(fā)表在《Science》雜志上)婆翔。
第一項研究由計算機科學副教授Ron O. Dror博士領導,第二項研究由Dror和生物化學副教授Rhiju Das博士共同領導掏婶。斯坦福大學博士生Stephan Eismann和Raphael Townshend在這兩項研究中都提供了幫助啃奴,并且可能做得遠遠超過Watson水平。這兩項研究都表明气堕,終極神探——人工智能(AI)可以預測3D結構纺腊。
最值得注意的是,?“蛋白質是執(zhí)行各種功能的分子機器茎芭∫灸ぃ”研究人員說,“為了執(zhí)行它們的功能梅桩,蛋白質通常會與其他蛋白質結合壹粟。如果你知道一對蛋白質與一種疾病有關,并且你知道它們在3D中是如何相互作用的宿百,那么你可以嘗試用藥物非常特異地靶向這種相互作用趁仙。”
研究人員沒有具體說明是什么使結構預測更準確或更不準確垦页,而是讓算法自己發(fā)現這些分子特征雀费。他們這樣做是因為他們發(fā)現提供這些知識的傳統技術可以使算法偏向于某些特征,從而阻止它找到其他信息特征痊焊。
“算法中這些手工制作的特征的問題在于盏袄,算法會變得偏向于選擇這些特征的人認為重要的東西”∩叮”研究人員指出辕羽,“你可能會錯過一些需要改進的信息÷⒕澹”
“該網絡學會了找到對分子結構形成至關重要的基本概念刁愿,但沒有被明確告知〉窖罚”研究人員補充道铣口,“令人興奮的是,該算法清晰地恢復了我們知道的重要內容蕾管,但也恢復了我們以前不知道的特征枷踏。”
在蛋白質方面取得成功后掰曾,研究人員將注意力轉向了RNA分子旭蠕。研究人員在他們所在領域長期競爭的一系列“RNA拼圖”中測試了他們的算法,在每一種情況下旷坦,該工具的表現都優(yōu)于所有其他拼圖參與者掏熬,并且沒有專門為RNA結構設計。
“我們引入了一種機器學習方法秒梅,盡管只接受了18種已知RNA結構的訓練旗芬,但它能夠在不假設其定義特征的情況下識別準確的結構模型±κ瘢”這篇Science文章的作者寫道疮丛,“由此產生的評分函數幔嫂,即原子旋轉等變評分器(ARES),大大優(yōu)于以前的方法誊薄,并在社區(qū)范圍的盲RNA結構預測挑戰(zhàn)中始終如一地產生最佳結果履恩。”
研究人員聲稱呢蔫,他們的方法克服了標準深度神經網絡的一個主要限制切心,因為它甚至可以從少量數據中有效地學習∑酰“(我們的方法)只使用原子坐標作為輸入绽昏,不包含RNA特異性信息∏渭梗”研究人員解釋道全谤,“(它)適用于結構生物學、化學爷贫、材料科學等領域的各種問題啼县。”
研究人員指出:“機器學習最近取得的大多數戲劇性進展都需要大量數據進行訓練沸久。這種方法在訓練數據很少的情況下取得成功季眷,這一事實表明,相關方法可以解決許多數據稀缺領域中尚未解決的問題卷胯∽庸危”
“盡管只使用了少量結構進行訓練,但ARES的表現仍優(yōu)于先前的技術水平窑睁,這表明類似的神經網絡可能會在涉及3D分子結構的其他領域取得重大進展挺峡,因為這些領域的數據往往有限且收集成本高昂〉Eィ”這篇Science文章的作者得出結論橱赠,“除結構預測外,示例可能包括分子設計(蛋白質或核酸等大分子和小分子藥物的設計)箫津、納米粒子半導體電磁性能的估計狭姨,以及合金和其他材料機械性能的預測∷找#”
北卡羅來納大學教堂山分校的化學教授Kevin Weeks博士對ARES進行了評估饼拍。Weeks在《Science》雜志上發(fā)表的一篇前瞻性文章(“Piercing the fog of the RNA structure-ome”)中寫道,“ARES還沒有達到與原子分辨率一致的水平田炭,或者還不足以指導關鍵功能位點的鑒定或藥物發(fā)現工作师抄,但Townshend等人在一個被證明難以實現變革性進步的領域取得了顯著的進展〗塘颍”