Reinvent4榴蓮?fù)岛喗?/h1>

2024-03-28

導(dǎo)讀

  • REINVENT通過強(qiáng)化學(xué)習(xí)解決了逆向設(shè)計(jì)問題癞谒,使用rnn和transformer作為深度學(xué)習(xí)架構(gòu)憔披,基于SMILES字符串作為分子表示挠说。

  • 包括結(jié)合增強(qiáng)學(xué)習(xí)和課程學(xué)習(xí)(RL/CL)的分階段學(xué)習(xí)方法琅束、用于分子優(yōu)化的新變換器模型诈嘿、在所有算法框架內(nèi)完全集成所有生成器(包括遷移學(xué)習(xí)TL、RL糠雨、CL):

  1. 課程學(xué)習(xí):從簡單到復(fù)雜才睹,從少到多

  2. 支持全新設(shè)計(jì)、R-基團(tuán)替換甘邀、庫設(shè)計(jì)琅攘、Linker (連接子)設(shè)計(jì)、骨架躍遷以及分子優(yōu)化等多種應(yīng)用場景

  3. 該軟件以命令行工具的形式發(fā)布松邪,支持 TOML 或 JSON 格式的用戶配置坞琴。REINVENT 4 可以從以下網(wǎng)址免費(fèi)下載:https://github.com/MolecularAI/REINVENT4,并在Apache 2.0 許可下提供

方法:

一逗抑、基于序列的神經(jīng)網(wǎng)絡(luò)模型置济,稱為「代理」,擅長生成表示為 SMILES 字符串的分子 // 無條件代理專注于在沒有外部輸入的情況下生成序列锋八,而有條件代理則由輸入序列影響其生成序列:

  • 基于token生成
  • 負(fù)對數(shù)似然優(yōu)化

兩種解碼策略:

  • 多項(xiàng)式采樣
  • 波束搜索

Mol2Mol 作為有條件的先驗(yàn)代理浙于,代表了分子生成的另一次飛躍,該代理接受大量數(shù)據(jù)集的訓(xùn)練挟纱,系統(tǒng)地探索化學(xué)空間
【Mol2Mol】是一種用于化學(xué)分子設(shè)計(jì)的工具羞酗,它的目標(biāo)是幫助科學(xué)家和研究人員創(chuàng)建新的化學(xué)分子。
簡而言之紊服,它的作用是:給定一個已知的化學(xué)分子檀轨,Mol2Mol能夠生成與這個分子相似的新分子。這對于藥物研發(fā)特別有用欺嗤,因?yàn)樗梢詭椭芯咳藛T發(fā)現(xiàn)具有類似特性但可能效果更好或副作用更小的新藥物分子参萄。

二、遷移學(xué)習(xí)和強(qiáng)化學(xué)習(xí)

遷移學(xué)習(xí)通常用于用少量數(shù)據(jù)重新訓(xùn)練一個大型模型煎饼,以高效地獲得一個新的改進(jìn)模型讹挎,尤其適用于新任務(wù)可用數(shù)據(jù)較少的情況。因此吆玖,遷移學(xué)習(xí)可以被視為對現(xiàn)有模型的微調(diào)

遷移學(xué)習(xí):

  • 重訓(xùn)練先前模型
  • 專注于任務(wù)的數(shù)據(jù)集使用

強(qiáng)化學(xué)習(xí)的創(chuàng)新:

  • 增強(qiáng)似然概率: 將獎勵信號與序列的可能性結(jié)合起來筒溃,保持期望屬性和合理分子生成之間的平衡
  • DAP 策略: 采用一種損失函數(shù),指導(dǎo)代理生成高評分的分子沾乘,展現(xiàn)了系統(tǒng)在動態(tài)場景中的適應(yīng)性

// reinvent4提供了各種分子生成器和強(qiáng)大的評分子系統(tǒng)怜奖。該軟件使用 Python 3 開發(fā),利用 Pytorch 進(jìn)行機(jī)器學(xué)習(xí)翅阵,以及 RDKit 進(jìn)行化學(xué)信息處理歪玲。

  • 多樣化分子生成器: 促進(jìn)不同策略迁央,如從頭設(shè)計(jì)、R-基團(tuán)替換和分子優(yōu)化滥崩。
  • 全面的評分子系統(tǒng): 使用廣泛的評分功能岖圈,提供在評估分子屬性時的靈活性

案例及圖標(biāo)顯示:

展示reinvent4顯現(xiàn)出來的創(chuàng)新部分:

  • REINVENT 4 的新版本不僅延續(xù)了之前版本的特點(diǎn),還在功能上進(jìn)行了重大更新夭委。它引入了分階段學(xué)習(xí)、Transform 模型和一致的優(yōu)化算法框架募强,以及重新設(shè)計(jì)的評分子系統(tǒng)株灸,為應(yīng)對未來挑戰(zhàn)做好準(zhǔn)備。這些增強(qiáng)功能顯著提高了化合物發(fā)現(xiàn)的成功率和多樣性擎值。例如慌烧,在經(jīng)過 10 個周期的遷移學(xué)習(xí)后,新代理的生產(chǎn)率幾乎是基線強(qiáng)化學(xué)習(xí)代理的兩倍

// 一個 TOML 或 JSON 格式的輸入配置文件控制軟件的所有方面鸠儿。配置文件可能包含 Lib/Linkinvent 和 Mol2Mol 生成器的「種子」SMILES 字符串屹蚊。對于分階段學(xué)習(xí)、遷移學(xué)習(xí)(TL)和評分进每,需要輸入 SMILES 字符串汹粤。NLL 為負(fù)對數(shù)似然

信息流程圖

// Reinvent 從頭開始 創(chuàng)造新分子,Libinvent 修飾一個骨架田晚,Linkinvent 識別兩個片段之間的連接器嘱兼,而 Mol2Mol 則在用戶定義的相似度范圍內(nèi)優(yōu)化分子

REINVENT 4 中的四種分子生成器及其工作原理

// 使用reinvent4 進(jìn)行基于結(jié)構(gòu)的藥物設(shè)計(jì)

命中定義:

  • 命中被定義為那些對接分?jǐn)?shù)小于或等于-8千卡/摩爾且定量評估藥效(QED)值大于或等于0.7的分子。對接分?jǐn)?shù)是一個量化分子與蛋白質(zhì)結(jié)合親和力的指標(biāo)贤徒,分?jǐn)?shù)越低表示結(jié)合越緊密芹壕;QED是一個評估分子藥物樣性(drug-likeness)的量化指標(biāo),值越高表示分子越有可能是有效的藥物

// REINVENT 4 的 Mol2Mol 模塊設(shè)計(jì)了六種不同的先驗(yàn)接奈,這些先驗(yàn)基于各類相似度進(jìn)行了訓(xùn)練

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

  • 序言:七十年代末踢涌,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子序宦,更是在濱河造成了極大的恐慌睁壁,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,000評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件互捌,死亡現(xiàn)場離奇詭異堡僻,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)疫剃,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,745評論 3 399
  • 文/潘曉璐 我一進(jìn)店門钉疫,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人巢价,你說我怎么就攤上這事牲阁」谈螅” “怎么了?”我有些...
    開封第一講書人閱讀 168,561評論 0 360
  • 文/不壞的土叔 我叫張陵城菊,是天一觀的道長备燃。 經(jīng)常有香客問我,道長凌唬,這世上最難降的妖魔是什么并齐? 我笑而不...
    開封第一講書人閱讀 59,782評論 1 298
  • 正文 為了忘掉前任,我火速辦了婚禮客税,結(jié)果婚禮上况褪,老公的妹妹穿的比我還像新娘。我一直安慰自己更耻,他們只是感情好测垛,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,798評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著秧均,像睡著了一般食侮。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上目胡,一...
    開封第一講書人閱讀 52,394評論 1 310
  • 那天锯七,我揣著相機(jī)與錄音,去河邊找鬼誉己。 笑死起胰,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的巫延。 我是一名探鬼主播效五,決...
    沈念sama閱讀 40,952評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼炉峰!你這毒婦竟也來了畏妖?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,852評論 0 276
  • 序言:老撾萬榮一對情侶失蹤疼阔,失蹤者是張志新(化名)和其女友劉穎戒劫,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體婆廊,經(jīng)...
    沈念sama閱讀 46,409評論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡迅细,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,483評論 3 341
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了淘邻。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片茵典。...
    茶點(diǎn)故事閱讀 40,615評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖宾舅,靈堂內(nèi)的尸體忽然破棺而出统阿,到底是詐尸還是另有隱情彩倚,我是刑警寧澤,帶...
    沈念sama閱讀 36,303評論 5 350
  • 正文 年R本政府宣布扶平,位于F島的核電站帆离,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏结澄。R本人自食惡果不足惜哥谷,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,979評論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望麻献。 院中可真熱鬧们妥,春花似錦、人聲如沸赎瑰。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,470評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽餐曼。三九已至,卻和暖如春鲜漩,著一層夾襖步出監(jiān)牢的瞬間源譬,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,571評論 1 272
  • 我被黑心中介騙來泰國打工孕似, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留踩娘,地道東北人。 一個月前我還...
    沈念sama閱讀 49,041評論 3 377
  • 正文 我出身青樓喉祭,卻偏偏與公主長得像养渴,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子泛烙,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,630評論 2 359

推薦閱讀更多精彩內(nèi)容