hello耀里,大家好略板,今天給大家分享一些10X單細(xì)胞(10X空間轉(zhuǎn)錄組)做WGCNA分析時的一些東西疚膊,個人認(rèn)為很重要撑碴,不過不得不承認(rèn)的是,10X單細(xì)胞(10X空間轉(zhuǎn)錄組)做WGCNA分析發(fā)的文章很少捆愁,究其原因叉袍,還是無法真正的利用WGCNA分析內(nèi)容與10X單細(xì)胞(10X空間轉(zhuǎn)錄組)很好的結(jié)合塑煎,但是這個分析其實很重要,接下來我們就來分享10X單細(xì)胞(10X空間轉(zhuǎn)錄組)做WGCNA分析的智慧类浪。
WGCNA基本概念
加權(quán)基因共表達網(wǎng)絡(luò)分析 (WGCNA, Weighted correlation network analysis)是用來描述不同樣品之間基因關(guān)聯(lián)模式的系統(tǒng)生物學(xué)方法载城,可以用來鑒定高度協(xié)同變化的基因集, 并根據(jù)基因集的內(nèi)連性和基因集與表型之間的關(guān)聯(lián)鑒定候補生物標(biāo)記基因或治療靶點。(當(dāng)然费就,在我們這里每個barcode就會使一個“樣本”)
相比于只關(guān)注差異表達的基因诉瓦,WGCNA利用數(shù)千或近萬個變化最大的基因或全部基因的信息識別感興趣的基因集,并與表型進行顯著性關(guān)聯(lián)分析力细。一是充分利用了信息睬澡,二是把數(shù)千個基因與表型的關(guān)聯(lián)轉(zhuǎn)換為數(shù)個基因集與表型的關(guān)聯(lián),免去了多重假設(shè)檢驗校正的問題眠蚂。(表型關(guān)聯(lián)是WGCNA設(shè)計的初衷煞聪,但是到了我們這里,關(guān)聯(lián)的就是細(xì)胞類型)
理解WGCNA逝慧,需要先理解下面幾個術(shù)語和它們在WGCNA中的定義米绕。
共表達網(wǎng)絡(luò):定義為加權(quán)基因網(wǎng)絡(luò)。點代表基因馋艺,邊代表基因表達相關(guān)性。加權(quán)是指對相關(guān)性值進行冥次運算 (冥次的值也就是軟閾值 (power, pickSoftThreshold這個函數(shù)所做的就是確定合適的power))迈套。無向網(wǎng)絡(luò)的邊屬性計算方式為
abs(cor(genex, geney)) ^ power
捐祠;有向網(wǎng)絡(luò)的邊屬性計算方式為(1+cor(genex, geney)/2) ^ power
; sign hybrid的邊屬性計算方式為cor(genex, geney)^power if cor>0 else 0
。這種處理方式強化了強相關(guān)桑李,弱化了弱相關(guān)或負(fù)相關(guān)踱蛀,使得相關(guān)性數(shù)值更符合無標(biāo)度網(wǎng)絡(luò)
特征,更具有生物意義贵白。如果沒有合適的power率拒,一般是由于部分樣品與其它樣品因為某種原因差別太大導(dǎo)致的,可根據(jù)具體問題移除部分樣品或查看后面的經(jīng)驗值
禁荒。Module(模塊):高度內(nèi)連的基因集猬膨。在無向網(wǎng)絡(luò)中,模塊內(nèi)是高度相關(guān)的基因呛伴。在有向網(wǎng)絡(luò)中勃痴,模塊內(nèi)是高度正相關(guān)的基因。把基因聚類成模塊后热康,可以對每個模塊進行三個層次的分析:
1
. 功能富集分析查看其功能特征是否與研究目的相符沛申;2
. 模塊與性狀進行關(guān)聯(lián)分析,找出與關(guān)注性狀相關(guān)度最高的模塊姐军;3
. 模塊與樣本進行關(guān)聯(lián)分析铁材,找到樣品特異高表達的模塊尖淘。(這個地方是分析的核心部分)Connectivity (連接度):類似于網(wǎng)絡(luò)中 “度” (degree)的概念。每個基因的連接度是與其相連的基因的
邊屬性之和
著觉。Module eigengene E: 給定模型的第一主成分村生,代表整個模型的基因表達譜。這個是個很巧妙的梳理固惯,這個地方梆造,很好的用一個向量代替了一個矩陣,方便后期計算葬毫。
Intramodular connectivity: 給定基因與給定模型內(nèi)其他基因的關(guān)聯(lián)度镇辉,判斷基因所屬關(guān)系。
Module membership: 給定基因表達譜與給定模型的eigengene的相關(guān)性贴捡。
Hub gene: 關(guān)鍵基因 (連接度最多或連接多個模塊的基因)忽肛。
Adjacency matrix (鄰接矩陣):基因和基因之間的加權(quán)相關(guān)性值構(gòu)成的矩陣。
TOM (Topological overlap matrix):把鄰接矩陣轉(zhuǎn)換為拓?fù)渲丿B矩陣烂斋,以降低噪音和假相關(guān)屹逛,獲得的新距離矩陣,這個信息可拿來構(gòu)建網(wǎng)絡(luò)或繪制TOM圖汛骂。
基本分析流程
構(gòu)建基因共表達網(wǎng)絡(luò):使用加權(quán)的表達相關(guān)性罕模。
識別基因集:基于加權(quán)相關(guān)性,進行層級聚類分析帘瞭,并根據(jù)設(shè)定標(biāo)準(zhǔn)切分聚類結(jié)果淑掌,獲得不同的基因模塊,用聚類樹的分枝和不同顏色表示蝶念。
如果有表型信息抛腕,計算基因模塊與表型的相關(guān)性,鑒定性狀相關(guān)的模塊媒殉。
研究模型之間的關(guān)系担敌,從系統(tǒng)層面查看不同模型的互作網(wǎng)絡(luò)。
從關(guān)鍵模型中選擇感興趣的驅(qū)動基因廷蓉,或根據(jù)模型中已知基因的功能推測未知基因的功能全封。
導(dǎo)出TOM矩陣,繪制相關(guān)性圖桃犬。
上面部分的介紹大家都應(yīng)該很熟悉了售貌,關(guān)鍵在于這個方法在10X單細(xì)胞和10X空間轉(zhuǎn)錄組上是如何運用的。我們首先來看10X單細(xì)胞的部分:
前面的部分很常規(guī)疫萤,都是在計算基因表達的一個相關(guān)性和基因模塊
簡單說一下灰度模塊的基因颂跨,分析的時候我們?nèi)コ?/h4>
當(dāng)然,也可以做一下常規(guī)的下游分析
主要的內(nèi)容點在于和10X單細(xì)胞數(shù)據(jù)相關(guān)聯(lián)扯饶,當(dāng)然我們這里展示和cluster相關(guān)聯(lián)
我們這里需要注意的是恒削,整合樣本做WGCNA分析池颈,分析得到的模塊主要和細(xì)胞類型有關(guān)聯(lián),因為此時的cluster代表不同的細(xì)胞類型钓丰,此時做WGCNA感覺作用不大躯砰,因為不同的細(xì)胞類型本身就應(yīng)該有獨特的一套基因列表,那什么時候該用呢携丁?琢歇?
很簡單,當(dāng)我們在做同一細(xì)胞類型再分群的時候梦鉴,這個分析的用處就會很大李茫,因為得到的模塊與同一細(xì)胞類型不同的subcluster相關(guān)聯(lián),得到的就是一些在各個亞群高度協(xié)調(diào)的模塊基因肥橙,這個時候把得到的模塊基因全部做下游分析魄宏,意義非常大,從另外一個側(cè)面表現(xiàn)了細(xì)胞類型內(nèi)部的異質(zhì)性存筏,如果是多樣本整合的關(guān)系(比如正常和疾渤杌ァ),同一細(xì)胞類型的不同樣本關(guān)聯(lián)得到的gene模塊列表椭坚,就可以得到處理組和對照組關(guān)聯(lián)度高的模塊列表予跌,新的角度來看待疾病的發(fā)生。
但是我個人最喜歡的是第三個角度善茎,就是馬上要講的這個匕得,我們在做分析的時候,同樣是多個樣本(正常和疾病兩組)巾表,同一細(xì)胞類型,我們先做正常組(或者疾病組)的WGCNA略吨,得到的基因模塊反映到疾病組(正常組)集币,這個時候就會看出來明顯的差異,本應(yīng)該高度關(guān)聯(lián)的模塊可能就消失了翠忠,這個高度關(guān)聯(lián)的模塊的功能也隨之產(chǎn)生了變化鞠苟;還有就是同一細(xì)胞類型,兩組樣本先分別做WGCNA秽之,得到的基因模塊進行平行對比当娱,那么得到的,就是對疾病發(fā)生新的認(rèn)識考榨,很重要跨细,注意留心~~~
WGCNA與10X空間轉(zhuǎn)錄組相關(guān)聯(lián)(更加重要)
關(guān)于10X空間轉(zhuǎn)錄組分析的重要性,已經(jīng)講了很多了河质,這里不再贅述冀惭,但是10X空間轉(zhuǎn)錄組做重要的分析點WGCNA卻鮮有提及震叙,為什么呢?更多還是對深入認(rèn)識的缺乏散休,做WGCNA可以讓我們得到一下認(rèn)識:
-
1媒楼、模塊的空間分布特點,既然是10X空間轉(zhuǎn)錄組戚丸,我們當(dāng)然是和空間位置相關(guān)聯(lián)划址,一些高度關(guān)聯(lián)的模塊在空間上的分布特點是要告訴我們什么呢?限府?夺颤?
這個地方大家對比空間差異基因的分析方法,可參考文章10X空間轉(zhuǎn)錄組之基因的空間表達模式谣殊,這個地方價值極高拂共。
-
2、一樣的思路姻几,正常組的模塊的空間位置宜狐,在疾病組發(fā)生了怎么樣的變化呢?蛇捌?抚恒?
此時我們分開樣本做WGCNA,得到的模塊進行平行分析络拌,又會得到什么樣的結(jié)果呢俭驮??春贸?大家不妨自己好好想一想混萝。
總之,核心部分還是模塊在不同樣本的差異萍恕,10X空間轉(zhuǎn)錄組就是空間分布的差異逸嘀,當(dāng)然,還有很多分析的組合允粤,在這里不可能一一敘述完全崭倘,大家要根據(jù)自己的實際情況,安排方案設(shè)計类垫,完成自己的分析目的司光。
此時我們分開樣本做WGCNA,得到的模塊進行平行分析络拌,又會得到什么樣的結(jié)果呢俭驮??春贸?大家不妨自己好好想一想混萝。
生活很好,等你超越