摘要
人工智能的發(fā)展正在全面推動我們的生活
新藥研發(fā)過程中初始命中率低導致的成本升高是制藥行業(yè)亟需解決的問題
制藥行業(yè)正在嘗試與人工智能研究者合作來解決這一問題
人工智能將提高藥物開發(fā)過程的效率
介紹
人工智能(AI)是計算機對人類智能過程的模擬宜鸯。該過程包括獲取信息锯梁、制定使用信息的規(guī)則剥懒、得出近似或確定的結(jié)論以及自我校正蛤肌。盡管有許多人擔心人工智能的廣泛應用會造成大規(guī)模的失業(yè)展东,但不可否認爪膊,從創(chuàng)新的教學方面到商業(yè)和工業(yè)流程自動化,人工智能已經(jīng)被廣泛應用于各個領域耘成。在藥物開發(fā)過程中采用AI的新思想已經(jīng)從炒作變成了希望。這篇文章介紹了人工智能在藥物開發(fā)策略和過程等環(huán)節(jié)能起到的作用驹闰。
人工智能瘪菌、機器學習和深度學習
在發(fā)現(xiàn)類藥物小分子中使用AI的方法涉及化學空間的利用。通過計算枚舉可能的有機分子嘹朗,化學空間為鑒定全新的優(yōu)質(zhì)分子提供了舞臺师妙。此外,機器學習技術(shù)和預測模型軟件還有助于識別目標特異性虛擬分子屹培,以及分子與各自目標的關(guān)聯(lián)默穴,同時優(yōu)化安全性和功效屬性。
人工智能系統(tǒng)可以通過減少之后在體外或體內(nèi)系統(tǒng)中測試的合成化合物的數(shù)量來降低損耗率和研發(fā)支出褪秀。經(jīng)過驗證的AI技術(shù)可用于提高藥物開發(fā)的成功率蓄诽,而正在開發(fā)中的AI技術(shù)必須在應用于藥物開發(fā)過程之前進行驗證。藥物開發(fā)過程中最關(guān)鍵的部分是所選分子的合成溜歪。因此若专,人工智能具有很高的價值许蓖,因為它能夠根據(jù)合成的難易程度對分子進行優(yōu)先排序或開發(fā)出對最佳合成途徑有效的工具蝴猪。
AI在合成類藥物化合物中的意義
圖1簡明地顯示了AI在醫(yī)療行業(yè)中的整合。
說起人工智能輔助新藥研發(fā)膊爪,就不得不提到人工智能的子領域機器學習(ML)自阱。1959年,機器學習的先驅(qū)之一亞瑟·薩繆爾(Arthur Samuel)將機器學習用作研究領域米酬,使計算機無需進行顯式編程即可學習沛豌。
機器學習分為監(jiān)督學習、無監(jiān)督學習和強化學習赃额。監(jiān)督學習包括分類和回歸方法加派,其中基于來自輸入和輸出源的數(shù)據(jù)來開發(fā)預測模型。監(jiān)督性機器學習的輸出需要在亞組分類下進行疾病診斷跳芳;以及藥物功效和亞群回歸下的ADMET預測芍锦。無監(jiān)督學習包括通過僅基于輸入數(shù)據(jù)對數(shù)據(jù)進行分組和解釋來進行聚類和特征查找的方法。通過無監(jiān)督的機器學習飞盆,可以實現(xiàn)諸如從聚類中發(fā)現(xiàn)疾病亞型和從特征發(fā)現(xiàn)方法中發(fā)現(xiàn)疾病目標的輸出娄琉。強化學習主要由給定環(huán)境中的決策及其執(zhí)行以最大程度地發(fā)揮其性能來驅(qū)動次乓。這類ML的輸出包括決策中的從頭藥物設計和執(zhí)行中的實驗設計——兩者都可以通過建模和量子化學來實現(xiàn)。ML的另一個子領域是深度學習(DL)孽水,通過建立可以模擬人腦進行分析學習的神經(jīng)網(wǎng)絡票腰,讓它模仿人腦的機制來解釋數(shù)據(jù)。大數(shù)據(jù)及關(guān)聯(lián)數(shù)據(jù)挖掘算法方法可以為我們提供發(fā)現(xiàn)可能是新藥的新化合物女气,發(fā)現(xiàn)或重新使用單獨或組合使用時可能更有效的藥物的能力杏慰,并基于遺傳標記改善個性化藥物的領域。隨著數(shù)據(jù)量的增加和計算機性能的不斷增長主卫,DL逐漸成為AI子領域中非常重要的組成部分逃默,尤其是其展示的神經(jīng)網(wǎng)絡架構(gòu)的靈活性,例如卷積神經(jīng)網(wǎng)絡(CNN)簇搅,遞歸神經(jīng)網(wǎng)絡(RNN)和完全連接的前饋網(wǎng)絡完域。我們相信,通過與人工智能的結(jié)合瘩将,我們可以不斷提高臨床試驗的成功率吟税,以及打造更快、成本更低和更有效的藥物開發(fā)流程姿现。
藥物開發(fā)過程
反饋驅(qū)動的藥物開發(fā)過程始于從各種來源獲得的現(xiàn)有結(jié)果肠仪,例如高通量化合物和片段篩選,計算模型以及文獻中提供的信息备典。此過程在歸納和演繹之間交替進行异旧。這種歸納—演繹循環(huán)最終獲得優(yōu)化的苗頭化合物和先導化合物。在此循環(huán)中的特定部分的自動化可減少隨機性和錯誤提佣,并提高藥物開發(fā)的效率吮蛹。從頭設計方法需要有機化學知識來進行合成路線設計和虛擬篩選可以代替品藥效和毒性的生化和生物學測試。最終拌屏,主動學習算法可以鑒定對特定疾病靶標具有希望活性的新化合物潮针。
藥物開發(fā)的第一步是識別具有生物活性的新型化合物。該生物活性可以由化合物與特定酶或與整個生物體的相互作用產(chǎn)生倚喂。針對給定生物學靶標表現(xiàn)出活性的第一種化合物稱為“苗頭化合物”每篷。苗頭化合物通常來源于對化學庫的篩選、計算機模擬或?qū)χ参锒巳Γ毦驼婢忍烊划a(chǎn)物的篩選焦读。先導化合物的識別是藥物開發(fā)的第二步。先導化合物是一種化合物舱权,其有望開發(fā)為新藥來治療某種疾病矗晃。識別出的苗頭化合物用處于疾病狀態(tài)的細胞實驗進行篩選,并用疾病動物模型表征其有效性與安全性刑巧。一旦發(fā)現(xiàn)先導化合物喧兄,其化學結(jié)構(gòu)即就用作為結(jié)構(gòu)修飾的起點无畔,以發(fā)現(xiàn)具有最大治療益處和最小潛在危害為目標。
在生成先導化合物的過程中吠冤,研究者會對苗頭化合物進行系統(tǒng)修飾以提高其對特定生物靶標的活性和選擇性浑彰,同時降低毒性和副作用。源自苗頭化合物相關(guān)的化合物稱為衍生物拯辙,該過程稱為苗頭化合物擴展(Hit expansion)郭变。藥物化學家使用成熟的有機化學技術(shù)進行苗頭化合物擴展。為了提高合成通量涯保,化學家專注于特定的反應或一組反應诉濒,以將結(jié)構(gòu)單元組裝在一起以便快速制造一系列衍生物∠Υ海“砌塊”是具有反應性官能團與原子的一類化合物未荒,它能與與生物靶標活性位點相互作用。該活性位點是生物靶標中與化合物(或底物)通過相互作用力結(jié)合的特定區(qū)域及志。底物與活性位點的結(jié)合可以被可視化為“鎖和鑰底物匙”或“誘導契合”模型片排。
藥物開發(fā)中的研發(fā)效率和損耗率
雖然在藥物開發(fā)中已嚴格采用完善的類藥物性指南,但制藥公司在提高研發(fā)效率方面仍然面臨著巨大挑戰(zhàn)速侈。研發(fā)效率只是一個術(shù)語率寡,用于描述每10億美元研發(fā)支出可獲得被FDA批準的新藥數(shù)量。實際上倚搬,發(fā)現(xiàn)和開發(fā)一種藥物的費用已從2001年的8億美元增加到目前的約30億美元冶共。而如果將那些完全失敗的研發(fā)成本也計算進來,那么每一種將要實際使用的新藥的平均成本已經(jīng)高得驚人每界。我們系統(tǒng)地分析了造成這種令人擔憂的統(tǒng)計數(shù)據(jù)的主要原因捅僵,并將其縮小為影響研發(fā)效率低下的四個因素:
1、現(xiàn)有療法進行改進的門檻越來越高(?the ‘better than Beatles’ problem)
2盆犁、監(jiān)管機構(gòu)對風險承受力的逐漸降低(?the ‘cautious regulator’ problem)
3命咐、新藥研發(fā)需要的人員與資金越來越龐大(the ‘throw money at it’ tendency)
4篡九、“基礎研究-蠻力”偏見(basic-research–brute-force’ bias)
而另一種理論解釋被稱為“懸而未決的問題”(‘low-hanging fruit’)谐岁。意思是常見的、易于被發(fā)現(xiàn)的藥物已經(jīng)被發(fā)現(xiàn)榛臼,剩下的藥物靶標被發(fā)現(xiàn)的難度更大伊佃,因此研發(fā)的成本自然越來越高。
【此處與原文有刪減】
AI在新藥研發(fā)中的應用
尋找成功新藥的任務是艱巨沛善,也是藥物開發(fā)中最困難的部分航揉。這是因為已知的化合物空間過于巨大,據(jù)估計約為含有10^60個分子金刁。在新藥研發(fā)中結(jié)合人工智能已經(jīng)成為一種共識帅涂,并已經(jīng)廣泛應用于藥物開發(fā)的各個階段议薪,例如藥物靶標的識別與驗證、藥物設計媳友、老藥新用斯议、提高研發(fā)效率、生物醫(yī)學信息的匯總與分析醇锚、決策優(yōu)化以及招募患者進行臨床試驗哼御。人工智能強大的能力為抵消傳統(tǒng)藥物開發(fā)方法中出現(xiàn)的效率低下和不確定性提供了機會,同時將過程中的偏見和人為干預降至最低焊唬。
人工智能在藥物開發(fā)中的其他用途包括預測類藥分子的合成路線恋昼、藥理特性、蛋白特征以及藥效赶促、藥物組合和藥物-靶標關(guān)聯(lián)分析和老藥新用?液肌。此外,通過產(chǎn)生新的生物標記和治療靶標鸥滨、基于組學標記的個性化醫(yī)學以及發(fā)現(xiàn)藥物和疾病之間的聯(lián)系矩屁,這使得利用組學分析識別新的通路和靶標成為可能。
DL在提出有效的候選藥物并準確預測其性質(zhì)和可能的毒性風險方面顯示出了巨大的成功爵赵。在過去吝秕,沒有大數(shù)據(jù)集、沒有高通量化合物篩選等技術(shù)空幻,需要高達25億美元的研發(fā)成本與超過十年的時間才能研發(fā)一種新藥烁峭。而現(xiàn)在人工智能技術(shù)可以快而且低成本解決。隨著人工智能技術(shù)的進步秕铛,新的研究可以在協(xié)助新的藥物靶標约郁、合理藥物設計、藥物再利用方面繼續(xù)創(chuàng)新但两。
原文鏈接:https://www.sciencedirect.com/science/article/pii/S1359644618300916?via%3Dihub
下篇預告
AI在尋找分子靶標中的作用
AI在尋找“命中”與“先導”中的作用
AI在合成類藥物化合物中的意義
使用AI預測化合物的作用方式
AI在選擇人群中進行臨床試驗
藥物再利用中的AI
多元藥理學中的AI
制藥行業(yè)與AI公司之間的合作伙伴關(guān)系
結(jié)束語