[ZT] 阿斯利康Llinas等人JCIM論文:“溶解度挑戰(zhàn)”重現(xiàn)江湖

文章來源:微信公眾號 - ComputArt計(jì)算有樂趣 2019-7-27

溶解度是化合物的一種基本物理化學(xué)性質(zhì)稳捆,在藥物化學(xué)麦轰、環(huán)境化學(xué)等多種研究中有重要的參考價(jià)值。作為對實(shí)驗(yàn)測量方法的補(bǔ)充末荐,建立快捷新锈、可靠、普適的溶解度預(yù)測方法具有重要的理論意義和明確的應(yīng)用價(jià)值妹笆。自20世紀(jì)九十年代末以來拳缠,人們發(fā)展了許多種預(yù)測方法,應(yīng)用了多元線性回歸(MLR)海渊、主成分回歸(PCR)哲鸳、偏最小二乘法(PLS)徙菠、人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)芙盘、隨機(jī)森林回歸(RFR)等諸多算法儒老。這些工作在不同的體系上取得了不同程度的成功记餐,但是距離解決溶解度預(yù)測這一目標(biāo)尚很遙遠(yuǎn)。

2008年囚衔,Llinas等人公開發(fā)起了“溶解度挑戰(zhàn)”昭殉,其最終結(jié)果生動地反映了這一情況撒蟀,在領(lǐng)域中刷了流量。Llinas等人使用CheqSol方法精確測量了結(jié)構(gòu)不同芥被、具有重要生物學(xué)意義的132個(gè)分子的固有溶解度S0辽俗,以其中的100個(gè)分子作為訓(xùn)練集,32個(gè)分子作為測試集篡诽,要求參賽者根據(jù)溶解度實(shí)驗(yàn)數(shù)據(jù)公開的訓(xùn)練集構(gòu)建模型,對溶解度實(shí)驗(yàn)數(shù)據(jù)未公開的測試集進(jìn)行預(yù)測1杈女。該挑戰(zhàn)的獨(dú)特之處在于要求所有參賽者基于相同的數(shù)據(jù)源構(gòu)建模型朱浴。這一挑戰(zhàn)吸引了大量參賽者,他們使用了各種預(yù)測方法來計(jì)算达椰,然而所有的方法表現(xiàn)大致相同,并不能確定誰是贏家2砰碴□锓ぃ“溶解度挑戰(zhàn)”的結(jié)果引發(fā)了許多關(guān)于溶解度預(yù)測方法的有效性及數(shù)據(jù)質(zhì)量的討論。在“溶解度挑戰(zhàn)”開展之前呈枉,由于溶解度的精確測量比較困難,人們認(rèn)為不精準(zhǔn)的測量數(shù)據(jù)是預(yù)測結(jié)果不佳的重要原因猖辫。然而酥泞,“溶解度挑戰(zhàn)”的結(jié)果顯示也許并非如此芝囤,預(yù)測結(jié)果不佳應(yīng)當(dāng)主要?dú)w因于預(yù)測方法存在的固有缺陷辛萍。

彈指一揮間悯许,十年之后人們當(dāng)然積累了更多化合物的溶解度實(shí)驗(yàn)數(shù)據(jù)。Llinas等人重新審視十年前的“溶解度挑戰(zhàn)”先壕,基于包含不同實(shí)驗(yàn)室間可重現(xiàn)的實(shí)驗(yàn)數(shù)據(jù)組成的數(shù)據(jù)庫(6355S0)垃僚,從中挑選了兩組數(shù)據(jù)集作為新的測試集集绰,發(fā)起了新一輪“溶解度挑戰(zhàn)”3。第一組數(shù)據(jù)被小編毫無文采地翻譯為“緊密集”(tight set):由100個(gè)類藥性強(qiáng)的分子組成谆棺。每個(gè)分子的log S0數(shù)據(jù)來自于至少三個(gè)實(shí)驗(yàn)室栽燕,其標(biāo)準(zhǔn)偏差(SD)在0.11 ~ 0.22對數(shù)單位,平均為0.17對數(shù)單位包券。第二組數(shù)據(jù)被小編同樣毫無文采地翻譯為“松散集”(loose set):由32個(gè)分子組成,每個(gè)分子的log S0也來自于至少三個(gè)實(shí)驗(yàn)室炫贤,標(biāo)準(zhǔn)偏差(SD)在0.50 ~ 0.93對數(shù)單位溅固,平均為0.62對數(shù)單位。與之前的“溶解度挑戰(zhàn)”不同的是:新的“溶解度挑戰(zhàn)”不提供一個(gè)“標(biāo)準(zhǔn)”訓(xùn)練集兰珍,而是允許參賽者使用自己的log S0(25℃)實(shí)驗(yàn)數(shù)據(jù)作為訓(xùn)練集來構(gòu)建模型侍郭。對于手頭沒有足夠數(shù)據(jù)的新參與者,作者在文中提供了含有可靠溶解度數(shù)據(jù)的18篇參考文獻(xiàn)掠河。

作者強(qiáng)調(diào):新“溶解度挑戰(zhàn)”的目標(biāo)不在于找出“誰”是贏家亮元,而是希望找出“哪種”方法預(yù)測溶解度效果最好。為了鼓勵具有不同經(jīng)驗(yàn)或水平的人員參與唠摹,參賽者的身份最終不會透露爆捞。參與此次競賽的具體方法為:填寫提交表格中的所有空白字段,其中包含兩個(gè)測試集中每種化合物固有溶解度值的預(yù)測值(以摩爾對數(shù)單位表示)勾拉,并提供預(yù)測方法的簡要說明(訓(xùn)練集數(shù)據(jù)的來源煮甥、性質(zhì)以及使用的描述符類型),并將Excel文件發(fā)送給JCIM雜志主編Kenneth M. Merz教授 (eic@jcim.acs.org)藕赞,郵件主題為:Solubility Challenge成肘。提交時(shí)間不遲于2019年9月8日,參與者可單獨(dú)提交不超過三次斧蜕。此次挑戰(zhàn)將由JCIM論文的作者Llinas等人評估預(yù)測結(jié)果双霍,JCIM將邀請預(yù)測結(jié)果最佳者提交論文發(fā)表。

“溶解度挑戰(zhàn)”重現(xiàn)江湖批销,再次刺激到本領(lǐng)域的興奮點(diǎn)洒闸。新的挑戰(zhàn)基于更大規(guī)模、高質(zhì)量溶解度實(shí)驗(yàn)數(shù)據(jù)均芽,提供了標(biāo)準(zhǔn)化的測試集來橫向比較各種參賽方法顷蟀。哪種方法將在此次挑戰(zhàn)中拔得頭籌,小編拭目以待骡技。改革春風(fēng)吹滿地鸣个,中國人民真爭氣羞反。各位看官還等什么,還不趕緊參與進(jìn)來囤萤!

參考文獻(xiàn):

(1) Llinas, A.; Glen, R. C.; Goodman, J. M. Solubility challenge: Can you predict solubilities of 32 molecules using a database of 100 reliable measurements? J. Chem. Inf. Model. 2008, 48, 1289?1303.
(2) Hopfinger, A. J.; Esposito, E. X.; Llinas, A.; Glen, R. C.; Goodman, J. M. Findings of the challenge to predict aqueous solubility. J. Chem. Inf. Model. 2009, 49, 1?5.
(3) Llinas, A.昼窗;Avdeef,A. Solubility Challenge Revisited after Ten Years, with Multi-lab Shake-Flask Data, Using Tight (SD ~ 0.17 log) and Loose (SD ~ 0.62 log) Test Sets. J. Chem. Inf. Model. 2019, 59, 3036-3040.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市涛舍,隨后出現(xiàn)的幾起案子澄惊,更是在濱河造成了極大的恐慌,老刑警劉巖富雅,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件掸驱,死亡現(xiàn)場離奇詭異,居然都是意外死亡没佑,警方通過查閱死者的電腦和手機(jī)毕贼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蛤奢,“玉大人鬼癣,你說我怎么就攤上這事∑》罚” “怎么了待秃?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長痹屹。 經(jīng)常有香客問我章郁,道長,這世上最難降的妖魔是什么志衍? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任驱犹,我火速辦了婚禮,結(jié)果婚禮上足画,老公的妹妹穿的比我還像新娘雄驹。我一直安慰自己,他們只是感情好淹辞,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布医舆。 她就那樣靜靜地躺著,像睡著了一般象缀。 火紅的嫁衣襯著肌膚如雪蔬将。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天央星,我揣著相機(jī)與錄音霞怀,去河邊找鬼。 笑死莉给,一個(gè)胖子當(dāng)著我的面吹牛毙石,可吹牛的內(nèi)容都是我干的廉沮。 我是一名探鬼主播,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼徐矩,長吁一口氣:“原來是場噩夢啊……” “哼滞时!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起滤灯,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤坪稽,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后鳞骤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體窒百,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年豫尽,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了篙梢。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,688評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡拂募,死狀恐怖庭猩,靈堂內(nèi)的尸體忽然破棺而出窟她,到底是詐尸還是另有隱情陈症,我是刑警寧澤,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布震糖,位于F島的核電站录肯,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏吊说。R本人自食惡果不足惜论咏,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望颁井。 院中可真熱鬧厅贪,春花似錦、人聲如沸雅宾。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽眉抬。三九已至贯吓,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蜀变,已是汗流浹背悄谐。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留库北,地道東北人爬舰。 一個(gè)月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓们陆,卻偏偏與公主長得像,于是被迫代替她去往敵國和親洼专。 傳聞我的和親對象是個(gè)殘疾皇子棒掠,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,573評論 2 353

推薦閱讀更多精彩內(nèi)容