文獻(xiàn)分享:Optimization of therapeutic antibodies by predicting antigen specificity from antibody seq...

????大家好毕荐,這次分享的是瑞士蘇黎世聯(lián)邦理工大學(xué)系統(tǒng)與免疫學(xué)實(shí)驗(yàn)室Sai?T.Reddy課題組去年發(fā)表在Nature?Biomedical?Engineering上的一篇優(yōu)化治療抗體的文章囚玫,標(biāo)題是通過(guò)深度學(xué)習(xí)從抗體序列預(yù)測(cè)抗原特異性來(lái)優(yōu)化治療抗體悯搔。

標(biāo)題及作者介紹

????18年文章介紹了利用cas9基于哺乳動(dòng)物進(jìn)行抗體高通量改造的方法

Cas9建庫(kù)方法參考18年文章

????這篇文章結(jié)合cas9和深度學(xué)習(xí)開(kāi)發(fā)了一種抗體藥物高通量?jī)?yōu)化篩選的流程约啊,fig1可以當(dāng)成整個(gè)文章的流程介紹栋荸。a圖是產(chǎn)生深度學(xué)習(xí)訓(xùn)練數(shù)據(jù)的過(guò)程框咙,他基于過(guò)去開(kāi)發(fā)的方法伸辟,用cas9介導(dǎo)的同源定向突變生成了點(diǎn)突變文庫(kù),經(jīng)過(guò)熒光激活細(xì)胞分選篩選文庫(kù)后進(jìn)行深度測(cè)序缤底,使用深度突變掃描(通過(guò)高通量測(cè)序最終確定突變對(duì)蛋白質(zhì)功能的影響顾患,這種技術(shù)使能一次性產(chǎn)生數(shù)以萬(wàn)計(jì)的變異體,然后使所有的變體相互競(jìng)爭(zhēng)從而確定他們的相對(duì)適應(yīng)性?xún)r(jià)值个唧,制造蛋白質(zhì)最合適江解、最活躍的細(xì)胞會(huì)更加豐富,制造不活躍版本的細(xì)胞則消失)評(píng)估突變?cè)诓煌恢蒙蠈?duì)蛋白質(zhì)功能的影響徙歼,并引導(dǎo)構(gòu)建組合突變文庫(kù)犁河,經(jīng)過(guò)表達(dá)分選后最終得到了HER2結(jié)合和非結(jié)合的突變體,深度測(cè)序后得到突變體CDRH3序列作為深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和測(cè)試的數(shù)據(jù)集魄梯,接著想通過(guò)得到的模型準(zhǔn)確預(yù)測(cè)未知抗體變體的抗原特異性(通用的桨螺?可能不是),從而產(chǎn)生數(shù)百萬(wàn)個(gè)預(yù)測(cè)結(jié)合抗體酿秸,接著對(duì)結(jié)合抗體用計(jì)算機(jī)工具預(yù)測(cè)黏度灭翔、可溶性、免疫原性等因素進(jìn)行篩選優(yōu)化辣苏,最終得到優(yōu)化的穩(wěn)定表達(dá)的單克隆抗體藥物肝箱。


Fig. 1 | Implementing deep learning to predict antibody target specificity

????Fig2開(kāi)始是具體的過(guò)程,對(duì)突變?nèi)志坝^(guān)基于序列的分析稀蟋,抗體的CDRH3序列(可變重鏈互補(bǔ)決定區(qū))是決定其抗原特異性的關(guān)鍵因素煌张,作者利用CRISPR-Cas9介導(dǎo)的同源突變(Homology-Directed?Mutagenesis,?HDM)技術(shù),對(duì)表達(dá)曲妥珠單抗突變體(無(wú)法與HER2結(jié)合)的雜交瘤細(xì)胞(?由于靶向腫瘤細(xì)胞表面抗原HER2的曲妥珠單抗赫賽汀是科學(xué)界眾所周著且結(jié)構(gòu)已在開(kāi)發(fā)獲取數(shù)據(jù)庫(kù)中公開(kāi)退客,使用曲妥珠單抗)骏融,針對(duì)CDRH3序列設(shè)計(jì)了含有簡(jiǎn)并密碼子NNK的gRNA單突變文庫(kù)链嘀,每個(gè)模板與原突變體序列相比僅有一個(gè)密碼子不同,經(jīng)過(guò)突變档玻、熒光激活細(xì)胞分選(FACS),Ab+是抗體表達(dá)怀泊,Ag+是抗原特異性(先表達(dá)再特異性為后分類(lèi))對(duì)表達(dá)IgG的細(xì)胞進(jìn)行深度測(cè)序,b為相應(yīng)熱圖(15選10個(gè)原因窃肠?6哥不變包个,一個(gè)是結(jié)合殘基)

????在三輪富集后計(jì)算CDRH3各個(gè)位點(diǎn)氨基酸富集率刷允,并合理設(shè)計(jì)gRNA組合突變文庫(kù)冤留,通過(guò)HDM整合到曲妥珠單抗變體中,在二輪富集后熒光激活分選抗原結(jié)合非結(jié)合細(xì)胞树灶,深度測(cè)序后分別確定了11300個(gè)結(jié)合和27539個(gè)非結(jié)合纤怒。

????fig2e顯示的是結(jié)合的序列和非結(jié)合的序列在每個(gè)位置的AA使用頻率較為相似,無(wú)法通過(guò)可觀(guān)察的方式去識(shí)別結(jié)合序列天通,因?yàn)榭乖Y(jié)合是高維度泊窘,更為復(fù)雜的,所以才想到著手開(kāi)發(fā)和訓(xùn)練能夠預(yù)測(cè)抗體對(duì)靶抗原HER2特異性的基于序列的機(jī)器學(xué)習(xí)深度學(xué)習(xí)模型像寒。


Fig. 2 | Sequence-based analysis of the mutational landscap

fig3深度學(xué)習(xí)模型準(zhǔn)確預(yù)測(cè)抗原特異性烘豹。

????首先是b圖前半段,10個(gè)AA序列通過(guò)獨(dú)熱編碼轉(zhuǎn)換為輸入矩陣被計(jì)算機(jī)識(shí)別诺祸,矩陣每一列代表一個(gè)特定的殘基携悯,每一行對(duì)應(yīng)在序列中的位置順序,10AA即為10X19的矩陣筷笨,每行對(duì)應(yīng)殘基位置為1其他為0憔鬼,將序列這樣編碼輸入后進(jìn)行多個(gè)模型嘗試,在a圖中嘗試了多種機(jī)器學(xué)習(xí)模型胃夏,通過(guò)精確率(預(yù)測(cè)正的有多少對(duì)的)轴或、準(zhǔn)確率所有預(yù)測(cè)中預(yù)測(cè)正確的比例、召回率實(shí)際正樣本中預(yù)測(cè)為正的概率仰禀、F1分?jǐn)?shù)照雁、MCC(馬修相關(guān)系數(shù),二分類(lèi)評(píng)分)評(píng)估模型性能答恶,因?yàn)榫矸e神經(jīng)網(wǎng)絡(luò)更能適應(yīng)高維度高數(shù)據(jù)量的數(shù)據(jù)饺蚊,適合蛋白質(zhì)工程,且性能也較優(yōu)亥宿,于是專(zhuān)注進(jìn)一步優(yōu)化CNN卸勺,并用于后續(xù)篩選,b圖為最終架構(gòu)和參數(shù)

????c圖為對(duì)CNN模型的評(píng)估烫扼,這些曲線(xiàn)是在訓(xùn)練的條件下曙求,設(shè)置不同劃分閾值下CNN準(zhǔn)確分類(lèi)測(cè)試數(shù)據(jù)的評(píng)估,右邊100000隨機(jī)選擇的序列的預(yù)測(cè)概率p


Fig. 3 | Deep-learning models accurately predict antigen specificity

????之后是對(duì)CNN模型預(yù)測(cè)的抗原特異性抗體的驗(yàn)證,作者基于計(jì)算機(jī)預(yù)測(cè)生成了7.2X10^7個(gè)可能的序列變體悟狱,用訓(xùn)練好的模型預(yù)測(cè)序列變體的結(jié)合能力静浴,將p閾值設(shè)置為0.7增加可信度,為了檢驗(yàn)?zāi)P偷念A(yù)測(cè)成功率挤渐,隨機(jī)選擇了p>0.75苹享,30個(gè)預(yù)測(cè)為抗原特異性的抗體和p<0.1的12個(gè)預(yù)測(cè)為非特異性的CDRH3序列,為了進(jìn)一步驗(yàn)證識(shí)別能力浴麻,還設(shè)置了條件得问,和原始CDRH3序列的最小LD距離必須為5,并且在兩類(lèi)抗體訓(xùn)練集中都有相似的序列软免,進(jìn)行重組表達(dá)和實(shí)驗(yàn)驗(yàn)證宫纬,圖4a為展示了30個(gè)變體,b為兩類(lèi)訓(xùn)練集中與隨機(jī)序列序列相似的最近序列膏萧,c為使用生物層干涉儀(研究生物分子相互作用)確定30個(gè)變體序列的親和力漓骚,Ka結(jié)合速率常數(shù),kb解離速率常數(shù)榛泛,親和力表現(xiàn)較好

????Fig4c是預(yù)測(cè)變體的序列空間分析蝌蹂,先對(duì)預(yù)測(cè)為結(jié)合和不結(jié)合的序列進(jìn)行了序列相似性網(wǎng)絡(luò)分析,聚類(lèi)在LD<=2時(shí)進(jìn)行曹锨,表明大部分變體沒(méi)有可識(shí)別的結(jié)合或者非結(jié)合預(yù)測(cè)簇孤个,圖示兩個(gè)密切相關(guān)的序列卻有相反的分類(lèi),e圖對(duì)密切相關(guān)的序列采取了能有效提取并可時(shí)候CNN建立的分類(lèi)模式的可視化方法艘希,可視化氨基酸的非線(xiàn)性組合


Fig. 4 | Neural-network-predicted sequences are experimentally validated to be antigen-specific


Fig. 4 | Neural-network-predicted sequences are experimentally validated to be antigen-specific

?????Fig5是對(duì)抗體的進(jìn)一步優(yōu)化硼身,通過(guò)計(jì)算抗體Fv電荷和FvCSP、CamSOl覆享、NetMHCIIpan分別預(yù)測(cè)抗體的黏度佳遂、可溶性、免疫原性信息撒顿,篩選高于曲妥珠單抗的抗體序列丑罪,又因?yàn)閷?shí)驗(yàn)驗(yàn)證的訓(xùn)練集中只有9個(gè)符合條件,就將篩過(guò)的數(shù)據(jù)選取了大于9個(gè)的凤壁。


Fig. 5 | In silico screening of the predicted binders identifies candidate sequences for further validation.

? ? Fig6作者基于上述因素提出了可開(kāi)發(fā)性分?jǐn)?shù)吩屹,選取可開(kāi)發(fā)性分?jǐn)?shù)前一百序列構(gòu)建文庫(kù)分選鑒定后最終鑒定了55個(gè)突變體,選取親和力最高的10個(gè)突變體拧抖,檢測(cè)其可表達(dá)性煤搜,熱穩(wěn)定性以及潛在免疫原性,最終認(rèn)為1號(hào)突變體在熱穩(wěn)定性方面優(yōu)于曲妥珠單抗唧席,且免疫原性更弱擦盾。

Fig. 6 | Experimental characterization of selected sequences reveals optimal candidates
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末嘲驾,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子迹卢,更是在濱河造成了極大的恐慌辽故,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,941評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件腐碱,死亡現(xiàn)場(chǎng)離奇詭異誊垢,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)症见,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)喂走,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人筒饰,你說(shuō)我怎么就攤上這事缴啡。” “怎么了瓷们?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,345評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀(guān)的道長(zhǎng)秒咐。 經(jīng)常有香客問(wèn)我谬晕,道長(zhǎng),這世上最難降的妖魔是什么携取? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,851評(píng)論 1 295
  • 正文 為了忘掉前任攒钳,我火速辦了婚禮,結(jié)果婚禮上雷滋,老公的妹妹穿的比我還像新娘不撑。我一直安慰自己,他們只是感情好晤斩,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布焕檬。 她就那樣靜靜地躺著,像睡著了一般澳泵。 火紅的嫁衣襯著肌膚如雪实愚。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,688評(píng)論 1 305
  • 那天兔辅,我揣著相機(jī)與錄音腊敲,去河邊找鬼。 笑死维苔,一個(gè)胖子當(dāng)著我的面吹牛碰辅,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播介时,決...
    沈念sama閱讀 40,414評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼没宾,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼忍法!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起榕吼,我...
    開(kāi)封第一講書(shū)人閱讀 39,319評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤饿序,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后羹蚣,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體原探,經(jīng)...
    沈念sama閱讀 45,775評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年顽素,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了咽弦。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,096評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡胁出,死狀恐怖型型,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情全蝶,我是刑警寧澤闹蒜,帶...
    沈念sama閱讀 35,789評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站抑淫,受9級(jí)特大地震影響绷落,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜始苇,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評(píng)論 3 331
  • 文/蒙蒙 一砌烁、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧催式,春花似錦函喉、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,993評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至喉童,卻和暖如春撇寞,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背堂氯。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,107評(píng)論 1 271
  • 我被黑心中介騙來(lái)泰國(guó)打工蔑担, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人咽白。 一個(gè)月前我還...
    沈念sama閱讀 48,308評(píng)論 3 372
  • 正文 我出身青樓啤握,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親晶框。 傳聞我的和親對(duì)象是個(gè)殘疾皇子排抬,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容