????大家好毕荐,這次分享的是瑞士蘇黎世聯(lián)邦理工大學(xué)系統(tǒng)與免疫學(xué)實(shí)驗(yàn)室Sai?T.Reddy課題組去年發(fā)表在Nature?Biomedical?Engineering上的一篇優(yōu)化治療抗體的文章囚玫,標(biāo)題是通過(guò)深度學(xué)習(xí)從抗體序列預(yù)測(cè)抗原特異性來(lái)優(yōu)化治療抗體悯搔。
????18年文章介紹了利用cas9基于哺乳動(dòng)物進(jìn)行抗體高通量改造的方法
????這篇文章結(jié)合cas9和深度學(xué)習(xí)開(kāi)發(fā)了一種抗體藥物高通量?jī)?yōu)化篩選的流程约啊,fig1可以當(dāng)成整個(gè)文章的流程介紹栋荸。a圖是產(chǎn)生深度學(xué)習(xí)訓(xùn)練數(shù)據(jù)的過(guò)程框咙,他基于過(guò)去開(kāi)發(fā)的方法伸辟,用cas9介導(dǎo)的同源定向突變生成了點(diǎn)突變文庫(kù),經(jīng)過(guò)熒光激活細(xì)胞分選篩選文庫(kù)后進(jìn)行深度測(cè)序缤底,使用深度突變掃描(通過(guò)高通量測(cè)序最終確定突變對(duì)蛋白質(zhì)功能的影響顾患,這種技術(shù)使能一次性產(chǎn)生數(shù)以萬(wàn)計(jì)的變異體,然后使所有的變體相互競(jìng)爭(zhēng)從而確定他們的相對(duì)適應(yīng)性?xún)r(jià)值个唧,制造蛋白質(zhì)最合適江解、最活躍的細(xì)胞會(huì)更加豐富,制造不活躍版本的細(xì)胞則消失)評(píng)估突變?cè)诓煌恢蒙蠈?duì)蛋白質(zhì)功能的影響徙歼,并引導(dǎo)構(gòu)建組合突變文庫(kù)犁河,經(jīng)過(guò)表達(dá)分選后最終得到了HER2結(jié)合和非結(jié)合的突變體,深度測(cè)序后得到突變體CDRH3序列作為深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和測(cè)試的數(shù)據(jù)集魄梯,接著想通過(guò)得到的模型準(zhǔn)確預(yù)測(cè)未知抗體變體的抗原特異性(通用的桨螺?可能不是),從而產(chǎn)生數(shù)百萬(wàn)個(gè)預(yù)測(cè)結(jié)合抗體酿秸,接著對(duì)結(jié)合抗體用計(jì)算機(jī)工具預(yù)測(cè)黏度灭翔、可溶性、免疫原性等因素進(jìn)行篩選優(yōu)化辣苏,最終得到優(yōu)化的穩(wěn)定表達(dá)的單克隆抗體藥物肝箱。
????Fig2開(kāi)始是具體的過(guò)程,對(duì)突變?nèi)志坝^(guān)基于序列的分析稀蟋,抗體的CDRH3序列(可變重鏈互補(bǔ)決定區(qū))是決定其抗原特異性的關(guān)鍵因素煌张,作者利用CRISPR-Cas9介導(dǎo)的同源突變(Homology-Directed?Mutagenesis,?HDM)技術(shù),對(duì)表達(dá)曲妥珠單抗突變體(無(wú)法與HER2結(jié)合)的雜交瘤細(xì)胞(?由于靶向腫瘤細(xì)胞表面抗原HER2的曲妥珠單抗赫賽汀是科學(xué)界眾所周著且結(jié)構(gòu)已在開(kāi)發(fā)獲取數(shù)據(jù)庫(kù)中公開(kāi)退客,使用曲妥珠單抗)骏融,針對(duì)CDRH3序列設(shè)計(jì)了含有簡(jiǎn)并密碼子NNK的gRNA單突變文庫(kù)链嘀,每個(gè)模板與原突變體序列相比僅有一個(gè)密碼子不同,經(jīng)過(guò)突變档玻、熒光激活細(xì)胞分選(FACS),Ab+是抗體表達(dá)怀泊,Ag+是抗原特異性(先表達(dá)再特異性為后分類(lèi))對(duì)表達(dá)IgG的細(xì)胞進(jìn)行深度測(cè)序,b為相應(yīng)熱圖(15選10個(gè)原因窃肠?6哥不變包个,一個(gè)是結(jié)合殘基)
????在三輪富集后計(jì)算CDRH3各個(gè)位點(diǎn)氨基酸富集率刷允,并合理設(shè)計(jì)gRNA組合突變文庫(kù)冤留,通過(guò)HDM整合到曲妥珠單抗變體中,在二輪富集后熒光激活分選抗原結(jié)合非結(jié)合細(xì)胞树灶,深度測(cè)序后分別確定了11300個(gè)結(jié)合和27539個(gè)非結(jié)合纤怒。
????fig2e顯示的是結(jié)合的序列和非結(jié)合的序列在每個(gè)位置的AA使用頻率較為相似,無(wú)法通過(guò)可觀(guān)察的方式去識(shí)別結(jié)合序列天通,因?yàn)榭乖Y(jié)合是高維度泊窘,更為復(fù)雜的,所以才想到著手開(kāi)發(fā)和訓(xùn)練能夠預(yù)測(cè)抗體對(duì)靶抗原HER2特異性的基于序列的機(jī)器學(xué)習(xí)深度學(xué)習(xí)模型像寒。
fig3深度學(xué)習(xí)模型準(zhǔn)確預(yù)測(cè)抗原特異性烘豹。
????首先是b圖前半段,10個(gè)AA序列通過(guò)獨(dú)熱編碼轉(zhuǎn)換為輸入矩陣被計(jì)算機(jī)識(shí)別诺祸,矩陣每一列代表一個(gè)特定的殘基携悯,每一行對(duì)應(yīng)在序列中的位置順序,10AA即為10X19的矩陣筷笨,每行對(duì)應(yīng)殘基位置為1其他為0憔鬼,將序列這樣編碼輸入后進(jìn)行多個(gè)模型嘗試,在a圖中嘗試了多種機(jī)器學(xué)習(xí)模型胃夏,通過(guò)精確率(預(yù)測(cè)正的有多少對(duì)的)轴或、準(zhǔn)確率所有預(yù)測(cè)中預(yù)測(cè)正確的比例、召回率實(shí)際正樣本中預(yù)測(cè)為正的概率仰禀、F1分?jǐn)?shù)照雁、MCC(馬修相關(guān)系數(shù),二分類(lèi)評(píng)分)評(píng)估模型性能答恶,因?yàn)榫矸e神經(jīng)網(wǎng)絡(luò)更能適應(yīng)高維度高數(shù)據(jù)量的數(shù)據(jù)饺蚊,適合蛋白質(zhì)工程,且性能也較優(yōu)亥宿,于是專(zhuān)注進(jìn)一步優(yōu)化CNN卸勺,并用于后續(xù)篩選,b圖為最終架構(gòu)和參數(shù)
????c圖為對(duì)CNN模型的評(píng)估烫扼,這些曲線(xiàn)是在訓(xùn)練的條件下曙求,設(shè)置不同劃分閾值下CNN準(zhǔn)確分類(lèi)測(cè)試數(shù)據(jù)的評(píng)估,右邊100000隨機(jī)選擇的序列的預(yù)測(cè)概率p
????之后是對(duì)CNN模型預(yù)測(cè)的抗原特異性抗體的驗(yàn)證,作者基于計(jì)算機(jī)預(yù)測(cè)生成了7.2X10^7個(gè)可能的序列變體悟狱,用訓(xùn)練好的模型預(yù)測(cè)序列變體的結(jié)合能力静浴,將p閾值設(shè)置為0.7增加可信度,為了檢驗(yàn)?zāi)P偷念A(yù)測(cè)成功率挤渐,隨機(jī)選擇了p>0.75苹享,30個(gè)預(yù)測(cè)為抗原特異性的抗體和p<0.1的12個(gè)預(yù)測(cè)為非特異性的CDRH3序列,為了進(jìn)一步驗(yàn)證識(shí)別能力浴麻,還設(shè)置了條件得问,和原始CDRH3序列的最小LD距離必須為5,并且在兩類(lèi)抗體訓(xùn)練集中都有相似的序列软免,進(jìn)行重組表達(dá)和實(shí)驗(yàn)驗(yàn)證宫纬,圖4a為展示了30個(gè)變體,b為兩類(lèi)訓(xùn)練集中與隨機(jī)序列序列相似的最近序列膏萧,c為使用生物層干涉儀(研究生物分子相互作用)確定30個(gè)變體序列的親和力漓骚,Ka結(jié)合速率常數(shù),kb解離速率常數(shù)榛泛,親和力表現(xiàn)較好
????Fig4c是預(yù)測(cè)變體的序列空間分析蝌蹂,先對(duì)預(yù)測(cè)為結(jié)合和不結(jié)合的序列進(jìn)行了序列相似性網(wǎng)絡(luò)分析,聚類(lèi)在LD<=2時(shí)進(jìn)行曹锨,表明大部分變體沒(méi)有可識(shí)別的結(jié)合或者非結(jié)合預(yù)測(cè)簇孤个,圖示兩個(gè)密切相關(guān)的序列卻有相反的分類(lèi),e圖對(duì)密切相關(guān)的序列采取了能有效提取并可時(shí)候CNN建立的分類(lèi)模式的可視化方法艘希,可視化氨基酸的非線(xiàn)性組合
?????Fig5是對(duì)抗體的進(jìn)一步優(yōu)化硼身,通過(guò)計(jì)算抗體Fv電荷和FvCSP、CamSOl覆享、NetMHCIIpan分別預(yù)測(cè)抗體的黏度佳遂、可溶性、免疫原性信息撒顿,篩選高于曲妥珠單抗的抗體序列丑罪,又因?yàn)閷?shí)驗(yàn)驗(yàn)證的訓(xùn)練集中只有9個(gè)符合條件,就將篩過(guò)的數(shù)據(jù)選取了大于9個(gè)的凤壁。
? ? Fig6作者基于上述因素提出了可開(kāi)發(fā)性分?jǐn)?shù)吩屹,選取可開(kāi)發(fā)性分?jǐn)?shù)前一百序列構(gòu)建文庫(kù)分選鑒定后最終鑒定了55個(gè)突變體,選取親和力最高的10個(gè)突變體拧抖,檢測(cè)其可表達(dá)性煤搜,熱穩(wěn)定性以及潛在免疫原性,最終認(rèn)為1號(hào)突變體在熱穩(wěn)定性方面優(yōu)于曲妥珠單抗唧席,且免疫原性更弱擦盾。