RetroRules是一個(gè)代謝途徑發(fā)現(xiàn)和代謝工程的反應(yīng)規(guī)則數(shù)據(jù)庫丐吓。反應(yīng)規(guī)則是對反合成工作流程中所使用的反應(yīng)的一般描述季惩,以便枚舉連接目標(biāo)分子與前體的可能生物合成路線系吩。在合成生物學(xué)應(yīng)用于新途徑發(fā)現(xiàn)的背景下摔桦,以及在系統(tǒng)生物學(xué)中發(fā)現(xiàn)由于酶亂交而引起的地下代謝的背景下愕秫,這些規(guī)則的使用變得越來越重要液肌。
RetroRules提供了一組完整的反應(yīng)規(guī)則挟炬,這些規(guī)則是從公共數(shù)據(jù)庫中提取出來的,以社區(qū)標(biāo)準(zhǔn)的SMARTS格式表示嗦哆,并由具有不同特異性級別(反應(yīng)中心周圍的原子環(huán)境)的規(guī)則表示加以增強(qiáng)谤祖。這種反應(yīng)的多重表征通過預(yù)測混雜酶的從頭反應(yīng)擴(kuò)展了自然化學(xué)多樣性。我們的規(guī)則很容易被開源的化學(xué)信息工具(如RDKit)以及更復(fù)雜的逆轉(zhuǎn)錄代碼(如RetroPath2.0)所使用老速。
RetroRules通過搜索不同的可能查詢粥喜,如EC號、反應(yīng)ID橘券、底物結(jié)構(gòu)查詢等额湘,將反應(yīng)規(guī)則返回給用戶。請注意旁舰,當(dāng)查詢反轉(zhuǎn)規(guī)則時(shí)锋华,不太具體的反應(yīng)規(guī)則會(huì)根據(jù)最小直徑閾值被過濾掉。直徑是包含反應(yīng)中心周圍原子的球體箭窜。直徑越大毯焕,規(guī)則就越具體。
RetroRules是代謝工程反應(yīng)規(guī)則的數(shù)據(jù)庫(https://retrorules.org)磺樱。反應(yīng)規(guī)則是化學(xué)反應(yīng)的一般描述纳猫,可用于逆向合成工作流程婆咸,以列舉將目標(biāo)分子與其前體相連的所有可能的生物合成途徑。在應(yīng)用于新路徑發(fā)現(xiàn)的合成生物學(xué)背景下续担,以及在系統(tǒng)生物學(xué)中擅耽,由于酶的混雜性,這些規(guī)則的使用變得越來越重要物遇。在這里乖仇,我們首次提供了一個(gè)完整的集合,包含從公共數(shù)據(jù)庫中提取的> 400询兴,00 0個(gè)立體化學(xué)感知的反應(yīng)規(guī)則乃沙,并以社區(qū)標(biāo)準(zhǔn)的SMARTS(SMICKS)格式表示,通過在不同特異性水平(反應(yīng)中心周圍的原子環(huán)境)的規(guī)則表示進(jìn)行了擴(kuò)充诗舰。如此眾多的反應(yīng)表征通過預(yù)測混雜酶的從頭反應(yīng)擴(kuò)展了天然化學(xué)多樣性警儒。
RetroRules免費(fèi)下載是一個(gè)SQLite數(shù)據(jù)庫,其中包含15表和大約600萬條目相互關(guān)連的反應(yīng),規(guī)則,代謝物,序列,和一個(gè)規(guī)則得分基于生化多樣性(圖1)眶根。中心的模式規(guī)則表蜀铲,其中包含的信息來唯一地描述反應(yīng)規(guī)則從mono-component反應(yīng)。
2020-12-08:從上面的表設(shè)計(jì)架構(gòu)可以看出属百,這個(gè)反應(yīng)規(guī)則數(shù)據(jù)庫很復(fù)雜记劝。我們在設(shè)計(jì)負(fù)責(zé)的數(shù)據(jù)庫時(shí)候也要利用流程圖,完成對數(shù)據(jù)存儲(chǔ)的規(guī)劃和設(shè)計(jì)族扰。
從給定直徑的給定反應(yīng)中厌丑,一個(gè)規(guī)則與給定的底物唯一地聯(lián)系在一起,為了確定一個(gè)給定規(guī)則是否表示反應(yīng)的立體化學(xué)渔呵,布爾型柱是等立體的怒竿。因?yàn)榉磻?yīng)規(guī)則可以有多個(gè)產(chǎn)品,rule_products表包括所有規(guī)則的惟一標(biāo)識符(即reaction_id扩氢、substrate_id耕驰、直徑和isSetereo)結(jié)合列product_id和化學(xué)計(jì)量規(guī)則描述一種化學(xué)產(chǎn)品,該產(chǎn)品出現(xiàn)的次數(shù)的規(guī)則,分別。因此类茂,rule_products表與規(guī)則表之間包含一對多關(guān)系耍属。由于給定的SMARTS或SMILES反應(yīng)規(guī)則描述可以應(yīng)用于多種反應(yīng)、底物和直徑巩检,兩者都可以在SMARTS和SMILES表格中分別找到厚骗。其余的表包含從源數(shù)據(jù)庫提取的元信息。所有的蛋白質(zhì)序列兢哭、化學(xué)結(jié)構(gòu)和父反應(yīng)數(shù)據(jù)都可以在它們各自的公共數(shù)據(jù)庫中找到领舰。
RetroRules通過搜索不同的可能查詢,如EC號、反應(yīng)ID冲秽、底物結(jié)構(gòu)查詢等舍咖,將反應(yīng)規(guī)則返回給用戶。請注意锉桑,當(dāng)查詢反轉(zhuǎn)規(guī)則時(shí)排霉,不太具體的反應(yīng)規(guī)則會(huì)根據(jù)最小直徑閾值被過濾掉。直徑是包含反應(yīng)中心周圍原子的球體民轴。直徑越大攻柠,規(guī)則就越具體。
參考資料:
- 發(fā)表文獻(xiàn) https://academic.oup.com/nar/article/47/D1/D1229/5128930