Nat Biotech| AI用單細胞數(shù)據(jù)優(yōu)化細胞分類
原創(chuàng)?蘇安?圖靈基因?2022-06-22 08:22?發(fā)表于江蘇
收錄于合集#前沿生物大數(shù)據(jù)分析
撰文:蘇安
IF:54.98
推薦度:?????
亮點:
研究團隊提出了一種計算算法SCAVENGE,它以單細胞分辨率將因果變異映射到其相關(guān)細胞環(huán)境蝙寨。這個方法不僅為單細胞分辨率下實現(xiàn)功能變異的洞察提供了一個框架钮呀,而且還帶來了新的啟發(fā)蔑鹦,即我們可以最大限度地利用單細胞基因組數(shù)據(jù)進行推斷。
通過將全基因組與單細胞基因組圖譜相結(jié)合研究,我們可以更深入地了解疾病遺傳變異的機制拳亿。近期,在Nature biotechnology雜志上發(fā)表了一篇名為“?Variant to function mapping at single-cell resolution through network propagation”的文章愿伴,本文的研究人員建立了一種計算算法肺魁,這個算法可以利用基因組數(shù)據(jù),在單細胞分辨率下將基因組之間因果關(guān)系進行呈現(xiàn)隔节,以優(yōu)化在單細胞分辨率下對特定細胞的功能和遺傳關(guān)聯(lián)的推斷鹅经,大大促進了對疾病遺傳變異的研究寂呛。
作者為我們介紹了SCAVENGE的原理,SCAVENGE是通過共定位來識別表型富集最多的細胞瘾晃,并探索細胞到細胞網(wǎng)絡(luò)的傳遞關(guān)聯(lián)贷痪,為每個細胞分配一個概率,代表細胞通過網(wǎng)絡(luò)傳播與那些表型豐富的細胞的相關(guān)性蹦误。對于給定的遺傳性狀/表型劫拢,通過整合精細映射變異的PP和scATAC-seq譜來計算每個細胞的偏倚校正富集統(tǒng)計量,排名靠前的細胞被選為種子細胞强胰。隨后構(gòu)建M-kNN圖以表示細胞?-?細胞相似性舱沧,并將種子細胞投影到該細胞間圖上,最后進一步縮放和歸一化網(wǎng)絡(luò)傳播評分偶洋,以獲得代表每個單個細胞感興趣的性狀/表型相關(guān)性的每細胞SCAVENGE TRS熟吏。圖1.SCAVENGE?方法和應(yīng)用概述。
為了評估SCAVENGE的強大功能和準確性玄窝,作者首先在模擬的scATAC-seq數(shù)據(jù)集(方法)上測試了它的性能牵寺,結(jié)果表明只有一小部分模擬細胞使用傳統(tǒng)的共定位方法呈現(xiàn)出準確的性狀相關(guān)相關(guān)性,其中這些細胞主要分布在排序的細胞組的頂部和底部哆料。SCAVENGE大大增強了性狀相關(guān)細胞的發(fā)現(xiàn)缸剪,準確性從0.72提高到0.97,特別是以前顯示中等富集的細胞的準確性提高东亦。這些實驗數(shù)據(jù)還表明杏节,SCAVENGE?對各種參數(shù)都很可靠,包括所選種子單元的數(shù)量典阵、用于圖構(gòu)建的鄰居數(shù)量奋渔、基線數(shù)據(jù)中的讀取次數(shù)以及數(shù)據(jù)噪聲水平的變化。從這些數(shù)據(jù)中我們可以得到結(jié)論壮啊,SCAVENGE是穩(wěn)健且可重復(fù)的嫉鲸,這使得在單細胞分辨率下能夠正確表征性狀相關(guān)性。圖2.使用模擬和真實數(shù)據(jù)集評估?SCAVENGE?的性能和穩(wěn)健性歹啼。
為了評估SCAVENGE是否可以準確地檢測遺傳驅(qū)動的表型相關(guān)細胞群玄渗,并通過大規(guī)模的單細胞表觀基因組數(shù)據(jù)產(chǎn)生生物學(xué)見解。作者利用來自22個高度可遺傳的血細胞性狀的GWAS數(shù)據(jù)來檢查這個單細胞數(shù)據(jù)集中的因果細胞狀態(tài)狸眼,并且在低維均勻流形近似和投影(UMAP)空間中顯示了四個代表性性狀的單個細胞的TRS藤树。作者發(fā)現(xiàn),與相關(guān)細胞譜系相關(guān)的性狀顯示出明顯的富集拓萌,闡明了這些遺傳效應(yīng)的細胞類型特異性岁钓,這些遺傳效應(yīng)被SCAVENGE很好地捕獲。對于單個性狀,細胞表現(xiàn)出最高TRS的富集細胞區(qū)室可以彼此遠離分布屡限。通過對齊先前批量注釋的造血細胞群品嚣,作者發(fā)現(xiàn)富集的細胞區(qū)室與先前對血液性狀因果細胞類型的了解高度一致。為了全面探索各種細胞環(huán)境中血液學(xué)表型的遺傳關(guān)聯(lián)钧大,作者匯總了同一注釋細胞類型內(nèi)細胞的SCAVENGE TRS翰撑。總之拓型,SCAVENGE可以概括表型相關(guān)遺傳變異和特定細胞環(huán)境之間的已知共定位额嘿,同時提供由單細胞譜實現(xiàn)的其他信息。
圖3.SCAVENGE能夠全面注釋血細胞性狀劣挫,并捕獲其因果細胞類型的遺傳基礎(chǔ)册养。
為了評估SCAVENGE是否可以在表型豐富但異質(zhì)的單細胞數(shù)據(jù)中捕獲與疾病相關(guān)的細胞狀態(tài)。作者調(diào)查了與SARS-CoV-2感染個體中嚴重COVID-19風(fēng)險增加相關(guān)的遺傳變異的富集压固。作者應(yīng)用SCAVENGE來研究這些變異的富集球拦,他們發(fā)現(xiàn)單核細胞和樹突狀細胞顯著富集,在15個不同細胞群中TRS最高帐我。這一觀察結(jié)果與最近的報道一致坎炼,即不同類型的單核細胞和樹突狀細胞與嚴重COVID-19中的炎癥表型和免疫反應(yīng)密切相關(guān)。作者觀察到COVID-19患者的細胞TRS顯著高于健康個體的細胞TRS拦键,這表明SCAVENGE可以捕獲與疾病相關(guān)的細胞狀態(tài)谣光。圖4.SCAVENGE捕獲與疾病相關(guān)的細胞狀態(tài),并剖析CD14單核細胞中與COVID-19嚴重程度相關(guān)的異質(zhì)性芬为。
作者雖然使用SCAVENGE的分析已經(jīng)闡明了識別疾病相關(guān)細胞類型和狀態(tài)的能力萄金,但他們也想評估是否可以在整個發(fā)育軌跡上實現(xiàn)疾病相關(guān)性。為此媚朦,作者建立了B細胞發(fā)育的軌跡氧敢。在B細胞發(fā)育的關(guān)鍵中間體中觀察到最強的ALL風(fēng)險變異富集,包括從前B細胞到幼稚的B細胞询张,在早期前B細胞中具有峰值?孙乖,這種狀態(tài)與這種疾病高度相關(guān),但尚未被證明是這種疾病作為起源細胞的確切基礎(chǔ)份氧。這種模式揭示了調(diào)節(jié)染色質(zhì)如何受到疾病易感遺傳變異的影響唯袄,該分析還揭示了特定富集變體的潛在機制。圖5.SCAVENGE揭示了所有風(fēng)險易感性沿B細胞發(fā)育軌跡的動態(tài)變化蜗帜。
本文向我們介紹了一種新的算法SCAVENGE越妈,這是一種使用網(wǎng)絡(luò)傳播策略在單細胞分辨率下表征特定細胞類型,狀態(tài)和軌跡中復(fù)雜疾病相關(guān)和性狀相關(guān)遺傳關(guān)聯(lián)的方法钮糖。作者通過使用模擬和真實的數(shù)據(jù)集來證明SCAVENGE是經(jīng)過良好校準和強大的。作者還提供了實例,展示了SCAVENGE如何通過將疾病相關(guān)的遺傳變異映射到適當(dāng)?shù)募毎h(huán)境來提供以前未被重視的生物學(xué)和功能見解店归。
教授介紹:
Vijay G. Sankaran
Vijay G. Sankaran博士是波士頓兒童醫(yī)院血液學(xué)/腫瘤學(xué)科的Lodish家庭主席;哈佛醫(yī)學(xué)院兒科副教授;Dana Farber/波士頓兒童癌癥和血液疾病中心的主治醫(yī)師阎抒。他擁有賓夕法尼亞大學(xué)生物化學(xué)學(xué)士和碩士學(xué)位,劍橋大學(xué)生物化學(xué)碩士學(xué)位消痛,哈佛醫(yī)學(xué)院獲得醫(yī)學(xué)博士和博士學(xué)位且叁,隨后,他在波士頓兒童醫(yī)院和波士頓醫(yī)療中心做了兒科住院醫(yī)師秩伞。Sankaran博士因其在利用人類遺傳學(xué)更好地了解血細胞生產(chǎn)過程方面的工作而獲得了許多獎項逞带,包括最近的2018年Gale和Ira Drukier兒童健康研究獎以及2019年美國臨床研究學(xué)會Seldin-Smith先鋒研究獎。
Sankaran實驗室利用人類遺傳學(xué)來完善我們對造血的理解纱新,以及這一過程在人類疾病中如何出錯展氓。他們還在開發(fā)技術(shù),以便更好地研究體內(nèi)人類造血脸爱,包括譜系追蹤和單細胞基因組學(xué)方法遇汞。
參考文獻:
Yu, F.,Cato, L.D., Weng, C. et al. Variant to function mapping at single-cell resolution through network propagation. Nat Biotechnol (2022).