Nat Mac Int | 機(jī)器學(xué)習(xí)液相色譜-串聯(lián)質(zhì)譜提升小分子識別率
原創(chuàng)?圖靈基因?圖靈基因?2023-01-04 11:43?發(fā)表于江蘇
收錄于合集#前沿生物大數(shù)據(jù)分析
阿爾托大學(xué)(Aalto University)和盧森堡大學(xué)(University of Luxembourg)的研究人員報(bào)告稱,他們開發(fā)了一種新的機(jī)器學(xué)習(xí)模型稳衬,將有助于識別小分子霞捡,并將其應(yīng)用于醫(yī)學(xué)、藥物發(fā)現(xiàn)和環(huán)境化學(xué)薄疚。
他們的研究結(jié)果“Joint structural annotation of small molecules using liquid chromatography retention order and tandem mass spectrometry data”碧信,發(fā)表在《Nature Machine Intelligence》雜志上。
研究人員寫道:“盡管在過去十年中預(yù)測方法和工具取得了快速進(jìn)展街夭,但生物樣本中小分子的結(jié)構(gòu)注釋仍然是非靶向代謝組學(xué)的一個(gè)關(guān)鍵瓶頸键袱。液相色譜-串聯(lián)質(zhì)譜是最廣泛使用的分析平臺之一灸芳,可以檢測樣本中的數(shù)千個(gè)分子,其中絕大多數(shù)即使使用最好的方法也無法識別满粗。在這里谁不,我們介紹了LC-MS2Struct谈为,這是一種用于液相色譜-串聯(lián)質(zhì)譜(LC-MS2)測量產(chǎn)生的小分子數(shù)據(jù)結(jié)構(gòu)注釋的機(jī)器學(xué)習(xí)框架催蝗±笕剩”
阿爾托大學(xué)計(jì)算機(jī)科學(xué)教授Juho Rousu博士解釋道:“如果不對候選分子做一些額外的假設(shè),即使是最好的方法也不能識別樣本中超過40%的分子砚殿∽〔幔”
這種新方法可能能夠識別代謝紊亂,如糖尿病瓮具,甚至癌癥。
阿爾托大學(xué)機(jī)器學(xué)習(xí)與生物信息學(xué)博士生Eric Bach說:“我們的研究表明凡人,雖然絕對保留時(shí)間可能會有所不同名党,但不同實(shí)驗(yàn)室的測量結(jié)果表明,保留順序是穩(wěn)定的挠轴。這使我們能夠首次合并所有關(guān)于代謝物的公開數(shù)據(jù)传睹,并將其輸入到我們的機(jī)器學(xué)習(xí)模型中“痘蓿”
盧森堡大學(xué)盧森堡系統(tǒng)生物醫(yī)學(xué)中心(LCSB)副教授Emma Schymanski博士表示:“事實(shí)上欧啤,使用立體化學(xué)提高了識別性能,這對所有代謝物識別方法的開發(fā)人員來說都是一個(gè)啟示启上。這種方法也可以用來幫助識別和追蹤環(huán)境中的微污染物邢隧,或表征植物細(xì)胞中的新代謝物「栽冢”