前言
Immugent最近讀到了一篇非常炸裂的文獻,篇名為:High dimensional co-expression networks enable discovery of transcriptomic drivers in complex biological systems,雖然目前掛在了預印刊bioRxiv平臺上歌懒,但是Immugent相信這篇文章很可能已經(jīng)在CNS級別的雜志上在審稿了轰传。
Immugent之所以這樣說暑椰,一方面是因為這項研究出自著名的Vivek Swarup團隊贡耽,另一方面它真的滿足了我們對單細胞數(shù)據(jù)進行WGCNA的所有想象。而且該團隊在2021年的時候就提出了scWGCNA的理念泉孩,相應文章發(fā)表在Nature Genetics雜志上。更重要的是這篇文章聯(lián)合生物學故事并淋,整篇文章做的相當完美了寓搬,那下面就讓我們一睹為快吧!
按照生信寶庫“送飯送到嘴里”的一貫做法县耽,本期推文主要是通過hdWGCNA包相應的文章在整體上了解它的功能框架订咸,后續(xù)會推出系列代碼實操的推文來介紹它的使用。
主要內(nèi)容
經(jīng)典的生物信息學方法酬诀,如差異基因表達分析脏嚷,對于發(fā)現(xiàn)在特定疾病或感興趣的病癥中發(fā)生改變的個體基因是有用的,但它們不能提供有關(guān)這些基因在特定途徑或調(diào)控機制中的更廣泛背景的信息瞒御。因此WGCNA(Weighted gene co-expression network analysis)的提出父叙,為我們提供了一個綜合分析各種基因和通路之間調(diào)控網(wǎng)絡的功能框架。
但是傳統(tǒng)的WGCNA分析只能在bulk數(shù)據(jù)上使用肴裙,而單細胞層面的WGCNA分析需要將其轉(zhuǎn)化成類似bulk數(shù)據(jù)的形式才能實現(xiàn)趾唱,而這個過程會丟掉很多信息。此外蜻懦,單細胞數(shù)據(jù)和bulk數(shù)據(jù)因為測序深度不同甜癞,它們之間的特征也有很多差異,因此照搬肯定是行不通的宛乃。
hdWGCNA的提出為我們解決了這個難題悠咱,而且是完全基于單細胞數(shù)據(jù)蒸辆,包含空間轉(zhuǎn)錄組數(shù)據(jù)。其流程基于給定一個基因表達數(shù)據(jù)集作為輸入析既,共表達網(wǎng)絡分析通常包括以下分析步驟:計算輸入特征的兩兩相關(guān)性躬贡,用軟實力閾值加權(quán)相關(guān)性(β),計算特征之間的拓撲重疊眼坏,并通過動態(tài)樹切算法進行無監(jiān)督聚類拂玻。
單細胞數(shù)據(jù)中固有的稀疏性和噪聲可能導致虛假的基因-基因相關(guān)性,從而使共表達網(wǎng)絡分析復雜化宰译。此外檐蚜,單細胞或空間轉(zhuǎn)錄組數(shù)據(jù)的相關(guān)結(jié)構(gòu)在不同的亞群(細胞類型、細胞狀態(tài)沿侈、解剖區(qū)域)中差異很大熬甚。scRNA-seq數(shù)據(jù)中的典型hdWGCNA工作流程通過將高度相似的細胞折疊成“metacell”來減少稀疏性,同時保留細胞異質(zhì)性肋坚,并允許模塊化設計在特定細胞群中執(zhí)行單獨的網(wǎng)絡分析乡括,從而考慮到這些因素。
緊接著第二張圖智厌,作者也決不含糊直接上王炸诲泌,展示如何用hdWGCNA來分析空間轉(zhuǎn)錄組數(shù)據(jù)。在這里铣鹏,作者利用來自10x Genomics的Visium轉(zhuǎn)錄組數(shù)據(jù)集敷扫,通過使用hdWGCNA來識別小鼠大腦中的空間共表達網(wǎng)絡模塊。
同一基因的不同轉(zhuǎn)錄本(Isoform)常常參與不同的生物過程诚卸,傳統(tǒng)的單細胞轉(zhuǎn)錄組學分析在基因水平上捕獲信息葵第,因此錯過了在同工異構(gòu)體水平上發(fā)生的許多生物多樣性和調(diào)節(jié)機制级零。新興的長讀測序方法使我們能夠在同種異構(gòu)體分辨率上分析細胞轉(zhuǎn)錄組措嵌,從而為利用共表達網(wǎng)絡分析來模擬同種異構(gòu)體之間的關(guān)系提供了新的機會。因此岳掐,作者接下來就介紹了如何使用hdWGCNA棠赛,對出生后第7天(P7)小鼠海馬放射狀膠質(zhì)譜系細胞進行了同型共表達網(wǎng)絡分析哮奇。
因為目前單細胞組學仍然價格昂貴。而目前bulk數(shù)據(jù)資源很豐富睛约。因此鼎俘,作者最后還不忘介紹如何使用hdWGCNA,將大量RNA-seq共表達模塊投射到單細胞數(shù)據(jù)集中辩涝。
文章內(nèi)容很多贸伐,Immugent只是介紹了一部分,感興趣的小伙伴可以直接看原文來補充學習剩下的部分怔揩。
展望
總的來說捉邢,hdWGCNA是一個分析單細胞轉(zhuǎn)錄組學數(shù)據(jù)(包含轉(zhuǎn)錄組和空間)中共表達網(wǎng)絡的綜合功能框架脯丝。hdWGCNA為網(wǎng)絡推理、基因模塊識別歌逢、功能基因富集分析、網(wǎng)絡再現(xiàn)性統(tǒng)計測試和數(shù)據(jù)可視化提供內(nèi)置功能翘狱。除了傳統(tǒng)的單細胞RNAseq外秘案,hdWGCNA還能夠使用長讀單細胞數(shù)據(jù)進行同型水平的網(wǎng)絡分析。
在這項研究中潦匈,作者利用來自自閉癥譜系障礙和阿爾茨海默病大腦樣本的公開單細胞數(shù)據(jù)集展示了hdWGCNA阱高,在特定細胞群體中確定了與疾病相關(guān)的共表達網(wǎng)絡模塊。hdWGCNA與Seurat直接兼容茬缩,作者通過分析包含近100萬個細胞的數(shù)據(jù)集來證明hdWGCNA的可擴展性赤惊。
好啦,本期分享到這里就結(jié)束了凰锡。下期推文開始未舟,Immugent將通過代碼實操的方式介紹如何使用hdWGCNA分析單細胞組學數(shù)據(jù)。
[參考文獻]
High dimensional co-expression networks enable discovery of transcriptomic drivers in complex biological systems Samuel Morabito, Fairlie Reese, Negin Rahimzadeh, Emily Miyoshi, Vivek Swarup bioRxiv 2022.09.22.509094; doi: https://doi.org/10.1101/2022.09.22.509094