Nat Med | 空間轉(zhuǎn)錄組學(xué)分析單細(xì)胞分辨率圖譜
原創(chuàng)?存在一棵樹(shù)?圖靈基因?今天
收錄于話題#前沿分子生物學(xué)技術(shù)
撰文:存在一棵樹(shù)
IF=28.547
推薦度:?????
亮點(diǎn):
開(kāi)發(fā)了SpaGCN,一種圖卷積網(wǎng)絡(luò)方法雕薪,其可通過(guò)圖卷積從相鄰點(diǎn)聚合每個(gè)點(diǎn)的基因表達(dá),從而能夠識(shí)別具有連貫表達(dá)和組織學(xué)的空間域;SpaGCN?計(jì)算速度快七扰,平臺(tái)獨(dú)立蒸痹,可成為各種空間分辨轉(zhuǎn)錄組學(xué)?(SRT)研究的理想工具憎瘸。
2021年10月28日,賓夕法尼亞大學(xué)佩雷爾曼醫(yī)學(xué)院生物統(tǒng)計(jì)學(xué)谨垃、流行病學(xué)和信息學(xué)系的李銘堯和Russell T. Shinohara教授在《Nature Medicine?》上發(fā)表了一篇名為“SpaGCN: Integrating gene expression, spatial location and histology to identify spatial domains and spatially variable genes by graph convolutional network”的文章启搂。在這里,該團(tuán)隊(duì)基于圖卷積網(wǎng)絡(luò)?(GCN)?的方法開(kāi)發(fā)了SpaGCN刘陶,從而整合基因表達(dá)胳赌、空間位置和組織學(xué)來(lái)識(shí)別空間域。
空間分辨轉(zhuǎn)錄組學(xué)?(SRT)的最新技術(shù)進(jìn)步使了解基因表達(dá)譜與組織中的空間信息成為可能匙隔,而在SRT?研究中疑苫,一個(gè)重要的步驟是確定空間域,定義為在基因表達(dá)和組織學(xué)上在空間上一致的區(qū)域纷责。盡管目前存在一些方法可以將斑點(diǎn)或細(xì)胞聚集成不同的組捍掺,但由于不同模式缺乏靈活性,因此通用性較差再膳。這里該團(tuán)隊(duì)開(kāi)發(fā)了?SpaGCN挺勿,一種基于圖卷積網(wǎng)絡(luò)?(GCN)?的方法,可將空間域和空間可變基因?(SVG)檢測(cè)聯(lián)合考慮饵史,其整合基因表達(dá)满钟、空間位置和組織學(xué),并通過(guò)圖卷積網(wǎng)絡(luò)識(shí)別空間域和空間可變基因胳喷。
如圖1所示湃番,基于原位捕獲的?SRT?數(shù)據(jù)為例解釋?SpaGCN?的工作流程。首先通過(guò)構(gòu)造一個(gè)表示數(shù)據(jù)的空間依賴性的無(wú)向加權(quán)圖來(lái)集成基因表達(dá)吭露、空間位置和組織學(xué)吠撮,從而識(shí)別空間域;隨后對(duì)于每個(gè)空間域讲竿,檢測(cè)域中富集的?SVGs泥兰;通過(guò)將搜索空間限制在空間域上,保證檢測(cè)到的?SVGs?具有空間表達(dá)模式题禀;當(dāng)單個(gè)基因不能標(biāo)記域的表達(dá)模式時(shí)鞋诗,SpaGCN會(huì)構(gòu)建一個(gè)由多個(gè)基因組合形成的元基因來(lái)表示域的表達(dá)模式。
這里迈嘹,團(tuán)隊(duì)針對(duì)SpaGCN?的空間域檢測(cè)能力及聚類分析能力削彬,與Louvain、stLearn?和BayesSpace進(jìn)行了比較秀仲。如圖3所示融痛,對(duì)于代表性組織切片151673,?SpaGCN?和BayesSpace?顯示的空間域與手動(dòng)注釋的組織層比?Louvain?更符合神僵;雖然?stLearn?使用了組織學(xué)信息雁刷,但其性能低于?SpaGCN?和?BayesSpace。隨后將?SpaGCN?的聚類結(jié)果與?Louvain保礼、stLearn?和?BayesSpace?的聚類結(jié)果進(jìn)行了比較沛励,顯示?Louvain?的聚類類似于?stLearn责语、BayesSpace?和?SpaGCN,但后三種方法檢測(cè)到的空間域在空間上更加連續(xù)侯勉,能夠解釋基因表達(dá)的空間依賴性鹦筹。SpaGCN?中實(shí)現(xiàn)的多域自適應(yīng)過(guò)濾標(biāo)準(zhǔn)使其能夠消除誤報(bào)?SVG,并確保所有檢測(cè)到的?SVG?具有清晰的空間表達(dá)模式址貌,其獨(dú)特而強(qiáng)大的?SVG?檢測(cè)程序也可確保不會(huì)遺失某類基因铐拐。
SpaGCN不僅可以分析單個(gè)組織切片,還可以聯(lián)合分析多個(gè)組織切片练对,展示了兩個(gè)使用10x Genomics?提供的小鼠大腦?Visium?數(shù)據(jù)的示例遍蟋。如圖3所示,由于這兩個(gè)組織切片來(lái)自同一區(qū)域螟凭,?SpaGCN?可推斷出兩個(gè)組織切片之間的聚類對(duì)應(yīng)關(guān)系虚青;隨后使用SpaGCN?聯(lián)合分析了兩個(gè)組織切片,分別來(lái)自小鼠后腦和前腦螺男;由于前部和后部在大腦中相鄰棒厘,該團(tuán)隊(duì)修改了后部斑點(diǎn)的坐標(biāo),以便修改后的坐標(biāo)反映兩個(gè)組織切片的空間相鄰性下隧;最后使用修改后的坐標(biāo)作為輸入奢人,獲得SpaGCN反映的前后腦共享層的聚類結(jié)果。
最后淆院,如圖4所示何乎,該團(tuán)隊(duì)分析了具有單細(xì)胞分辨率的?STARmap?數(shù)據(jù)集,顯示了SpaGCN對(duì)于空間信息的的高效利用率土辩≈Ь龋總的來(lái)說(shuō),SpaGCN?中的空間域檢測(cè)步驟是靈活的拷淘,首先各墨,SpaGCN?可以在基因表達(dá)平滑中調(diào)整組織學(xué)的權(quán)重,對(duì)于組織學(xué)中具有清晰組織結(jié)構(gòu)的數(shù)據(jù)集启涯,更高的權(quán)重導(dǎo)致癌癥與非癌癥區(qū)域的更清晰分離贬堵;其次,在?GCN擬合過(guò)程中逝嚎,圖權(quán)重被更新,這使?SpaGCN?能夠?qū)W習(xí)一種有效的方法來(lái)聚合每個(gè)基因的相鄰點(diǎn)的基因表達(dá)详恼,其對(duì)于從不同平臺(tái)生成的數(shù)據(jù)补君、點(diǎn)/細(xì)胞之間的空間依賴性隨著捕獲的組織區(qū)域的大小不同而不同,且空間依賴性建模的靈活性使?SpaGCN?可用于不同類型的?SRT?數(shù)據(jù)昧互。
綜上所述挽铁,本文建立了一種將基因表達(dá)伟桅、空間位置和組織學(xué)相結(jié)合的方法,SpaGCN叽掘,其可以對(duì)基因表達(dá)的空間依賴性進(jìn)行建模楣铁,以識(shí)別空間域和域豐富的?SVG。進(jìn)行的廣泛測(cè)試更扁,表明其可以識(shí)別具有一致基因表達(dá)和組織學(xué)的空間域盖腕,擁有更清晰的空間表達(dá)模式和生物學(xué)解釋的?SVG?和元基因,且其檢測(cè)到的?SVG?是可轉(zhuǎn)移的浓镜,可用于獨(dú)立組織切片的下游分析溃列,還擁有高效的計(jì)算速度和內(nèi)存效率。
教授介紹
李銘堯膛薛,賓夕法尼亞大學(xué)生物統(tǒng)計(jì)學(xué)和流行病學(xué)生物統(tǒng)計(jì)學(xué)教授听隐。1996年畢業(yè)于南開(kāi)大學(xué)學(xué)數(shù)學(xué)系,1999年獲得南開(kāi)大學(xué)數(shù)學(xué)系碩士學(xué)位哄啄;2002年獲得密歇根大學(xué)生物統(tǒng)計(jì)學(xué)碩士學(xué)位雅任,2005年取得密歇根大學(xué)生物統(tǒng)計(jì)學(xué)博士學(xué)位。她于2006年加入賓夕法尼亞大學(xué)生物統(tǒng)計(jì)學(xué)系咨跌,其主要研究領(lǐng)域是統(tǒng)計(jì)遺傳學(xué)沪么、生物信息學(xué)和計(jì)算生物學(xué),主要為開(kāi)發(fā)統(tǒng)計(jì)方法和計(jì)算工具虑润,以識(shí)別和描述影響復(fù)雜疾病易感性的基因變異目前的研究工作涉及分析高通量遺傳學(xué)/基因組學(xué)數(shù)據(jù)成玫。除此之外,她對(duì)混合種群的分析拳喻、RNA測(cè)序數(shù)據(jù)和基因表達(dá)的遺傳學(xué)特別感興趣哭当,同時(shí)也會(huì)與其他研究人員合作,尋求識(shí)別復(fù)雜的疾病易感基因冗澈。
參考文獻(xiàn)
1钦勘、Hu, J., Li, X., Coleman, K.et al.SpaGCN:Integrating gene expression, spatial location and histology to identify spatialdomains and spatially variable genes by graph convolutional network.NatMethods18,?1342–1351 (2021).