WGCNA筆記第二彈
1.WGCNA應(yīng)用場景
不同組織樣品
時間序列樣品:生長發(fā)育,脅迫處理
單個材料:相同處理不同時間,不同處理相同時間,不同處理不同時間
兩個材料:相同處理不同時間腹泌,不同處理相同時間刽脖,不同處理不同時間
表型數(shù)據(jù):同級相關(guān)表型的數(shù)據(jù)
2.WGCNA實驗設(shè)計
1.時間序列樣品,兩個材料相同處理这吻,可以一起做WGCNA分析,也可以分別做然后比較般堆,相同材料不同處理之間也一樣
2.同一物種在孝,不同來源的轉(zhuǎn)錄組數(shù)據(jù),可以放在一起做WGCNA淮摔,也可以分開來比較
3.一般建議15個樣品以上進行WGCNA分析有生物學(xué)意義私沮,可以使5個時間點三個重復(fù)的15個樣品
4.表型數(shù)據(jù),建議收集可以統(tǒng)計量化的性狀數(shù)據(jù)和橙,可將模塊和表型數(shù)據(jù)關(guān)聯(lián)分析仔燕,有助于篩選關(guān)鍵基因模塊和基因來解釋相關(guān)表型
3.單個材料案例
Floral Transcriptomes in Woodland Strawberry Uncover Developing Receptacle and Anther Gene Networks
野草莓花器官轉(zhuǎn)錄組解析花發(fā)育中花托和花藥的基因調(diào)控網(wǎng)絡(luò)
3.1方案設(shè)計
單個材料不同組織樣品
取材野草莓花器官不同組織
從不同發(fā)育時期的花器官分離花藥、花粉魔招、心皮晰搀、花托等組織,再加上小苗葉片办斑,共17個組織外恕。每個組織兩個重復(fù),共34個樣本乡翅。
3.2 轉(zhuǎn)錄組數(shù)據(jù)整體分析
3.2 鑒定配子體孢子體相關(guān)基因
在不同發(fā)育時期花藥中共同表達的基因鑒定為雄性孢子體特異性基因
GO富集顯示鳞疲,雄性孢子基因集主要為代謝生物學(xué)過程,如小分子蠕蚜、有機酸建丧、細胞內(nèi)酮代謝等等
在花粉和小孢子特異表達的基因中共同表達的基因鑒定為配子體特異基因
3.3花發(fā)育過程轉(zhuǎn)錄組的時空表達模式分析
對所有差異表達的基因進行K-means聚類分析鑒定19個cluster,呈現(xiàn)出發(fā)育時期和組織特異性表達模式波势,如C1 C22為心皮特異性
進一步將19個cluster合并為10個supercluster,并進行功能富集分析橄维,如心皮特異性的supercluster尺铣,并進行功能富集分析。如心皮特異性的supercluster1富集的功能為DNA合成争舞。
對cluster中的161個轉(zhuǎn)錄因子進行表達量聚類分析凛忿,也呈現(xiàn)發(fā)育時期和組織特異性的表達模式。
3.4 WGCNA構(gòu)建共表達網(wǎng)絡(luò)
用差異表達基因進行WGCNA分析竞川,鑒定了23個基因模塊店溢。
用每個模塊的epigengene值與不同組織樣品進行關(guān)聯(lián)分析,鑒定組織緊密關(guān)聯(lián)的基因模塊委乌。
12個模塊與單一的組織樣品特異性高度相關(guān)床牧,如blue模塊與花粉(pollen)特異性相關(guān)。
WGCNA鑒定的組織特異性基因集合與K-means的結(jié)果相符合
WGCNA鑒定的花托特異性模塊(light yellow)和幼嫩花(stage1-4)特異性模塊(dark red)遭贸,在K-means的cluster中并沒有
3.5 組織特異性表達模塊
WGCNA鑒定的花托特異性模塊(light yellow)和幼嫩花(stage1-4)特異性模塊戈咳,在K-means的cluster中并沒有。
分析了Dark red模塊和Light yellow模塊epigengene在各樣品中的表達模式
熱圖呈現(xiàn)了Dark red模塊和Light yellow模塊中每個基因在各個樣品中的表達模式
3.6 花托特異性模塊內(nèi)部分析
關(guān)鍵基因(hub gene):模塊內(nèi)網(wǎng)絡(luò)中連接度較多的基因。
關(guān)注模塊中的轉(zhuǎn)錄因子:花托特異性模塊111個基因中有27個轉(zhuǎn)錄因子著蛙,重點分析這些轉(zhuǎn)錄因子删铃。
大部分hub gene為參與調(diào)控分生組織的轉(zhuǎn)錄因子,如WOX踏堡、GRS猎唁、NAC等。
hub gene中連接度最高的為GRS轉(zhuǎn)錄因子家族的FveLOM3顷蟆。擬南芥中三突變體lom1 lom2 lom3表現(xiàn)出分生組織異常的表型诫隅。因此FveLOM3可能是花托發(fā)育的關(guān)鍵調(diào)控因子。
此外慕的,高連接度的hub gene還包括一個B3 domain轉(zhuǎn)錄因子阎肝、一個Myb轉(zhuǎn)錄因子和WUS同源基因
3.7 花藥發(fā)育差異基因分析
stage9花藥中上調(diào)表達的1453個基因中,211個編碼FBX domain蛋白肮街。在野草莓基因組中包含820個FBX基因风题。大比例FBX上調(diào)表達說明在花藥減數(shù)分裂這個時期發(fā)生了大量的蛋白降解。
K-means的cluster富集分析中花藥-9的cluster富集的為蛋白降解嫉父。
FBX基因表達聚類熱圖分析顯示沛硅,大部分FBX只在stage9時期暫時高表達,隨后的stage10和11下調(diào)表達绕辖。
在花藥發(fā)育過程中摇肌,共296個FBX基因差異表達,其中6個亞家族占的比例較大仪际,包括FBD围小、LRR、DUF295
3.8花藥特異性模塊分析
花藥stage9特異性基因模塊為pink树碱,其中包含了37個FBX基因肯适。
通過篩選連接度較高的基因來鑒定hub gene。5個基因的度數(shù)目高于200成榜。
其中4個基因參與蛋白降解框舔,F(xiàn)-box、WD-repeat
3.8 小結(jié):WGCNA分析思路
實驗方案:單個材料赎婚,不同組織樣品刘绣,所有差異表達基因進行WGCNA分析
通過模塊Epigengene值與不同組織樣本進行關(guān)聯(lián)分析,鑒定組織特異性模塊
hub基因篩選
連接度較高的基因
重點關(guān)注轉(zhuǎn)錄因子(花托特異性模塊)
前期結(jié)果中的目標(biāo)基因(話要特異性模塊中的FBX)
4.兩個材料
4.1方案設(shè)計
4.2 兩個鷹嘴豆栽培種的種子發(fā)育表性分析
兩個鷹嘴豆栽培種Himchana1(小種子挣输,平均100粒種子重量為13.1g)和JGK3(大
種子纬凤,平均100粒種子重量為53.3g).
種子發(fā)育的7個時間段(S1-S7),分別代表了種子發(fā)育的三個階段:胚芽發(fā)育(S1-S3)、早期和中期成熟階段(籽粒灌漿歧焦,S4-S5)移斩、成熟晚期(種子干燥肚医,S6-S7)
種子的不同發(fā)育階段S1-S7依據(jù)授粉天數(shù)(Day after Pollination,DAP)劃分,5向瓷、9.12,19,25肠套、30和40 DAP分別為S1、S2猖任、S3.S4你稚、S5、S6和S7.
表型分析:種子發(fā)育不同時間點的種子重量和大小的統(tǒng)計數(shù)據(jù)比較朱躺。
4.3 兩個材料種子發(fā)育過程轉(zhuǎn)錄組的整體解析
為了分析兩個材料種子發(fā)育過程轉(zhuǎn)錄組動態(tài)變化的差異刁赖,基于16個組織樣品所有表達基因的表達量的斯皮爾曼相關(guān)系數(shù)(SCC)進行層次聚類和主成分分析(PCA)。
兩個材料中相同發(fā)育時期組織樣品表現(xiàn)出很高的相關(guān)性长搀。
兩個材料葉片聚在一起宇弛,與所有種子樣品表現(xiàn)出明顯差異。
兩個材料的S3有差異源请,JGK3-S3與S2更接近枪芒,而HC1-S3與S4更像。這說明HC1在種子發(fā)育早期比JGK3生長發(fā)育得更快谁尸。
雖然兩個材料S5也聚類在一起舅踪,但是關(guān)系并沒有其他時期的緊密,也呈現(xiàn)一定的差異良蛮。
因此抽碌,S3和S5可能是兩個材料種子大小和重量差異的關(guān)鍵發(fā)育時期
4.4 種子發(fā)育過程中差異基因表達分析
鑒定種子發(fā)育過程中每個時期特異表達的基因
各個時期特異表達的基因數(shù)目差異很大,S2最少决瞳,S5最多货徙。
兩個材料中各自時期特異表達的基因數(shù)目也有所不同,HC1在S2最少皮胡,JGK3則在S6最少破婆,但是兩者在S5都是最多的。
兩個材料中均時期特異表達的基因比例也不小胸囱,表達量層次聚類分析呈現(xiàn)出明顯的發(fā)育時期特異性。
說明每個發(fā)育階段有著自己獨立的發(fā)育程序瀑梗。
Go富集分析烹笔,主要為生殖過程、細胞壁組裝抛丽、細胞周期和細胞分裂谤职、碳代謝等,這些都是已知參與種子發(fā)育的亿鲜。
有些GOterm在兩個材料中均富集允蜈,有些只在一個材料中富集冤吨。
4.5兩個材料差異表達基因分析
定兩個材料在種子發(fā)育每個時期的顯著差異表達基因集。
HC1 VS JGK3,共有8562個基因上調(diào)表達饶套,9023個下調(diào)表達漩蟆。
差異基因數(shù)目最多的是S7,其次為S3妓蛮;最少的為S4怠李。
重點分析了TF,許多TF家族在JGK3中顯著上調(diào)或下調(diào)模式蛤克。
GO富集顯示捺癞,在JGK3中上調(diào)表達基因主要富集在一些細胞分裂相關(guān)term中,尤其在S3中构挤。
代謝通路注釋分析顯示髓介,在S3時期某些代謝通路呈現(xiàn)顯著的差異。
在JGK3中淀粉代謝和光合作用相關(guān)基因激活表達筋现,細胞周期和細胞分裂相關(guān)基因也上調(diào)表達唐础。
在S3時期JGK3中細胞壁合成和修飾的許多基因上調(diào)表達。
4.6 WGCNA鑒定共表達基因模塊
WGCNA分別鑒定了HC1的27個基因模塊和JGK3的21個基因模塊夫否。
所有模塊中都包含TF彻犁,數(shù)量從幾個到幾百個不等。
模塊和發(fā)育時期樣品關(guān)聯(lián)分析(PCC)凰慈,13個HC1模塊和6個JGK3模塊與發(fā)育時期樣品高度關(guān)聯(lián)(0.6以上)汞幢。
許多模塊不僅與一個發(fā)育時期關(guān)聯(lián),一些模塊僅與某個特定發(fā)育時期樣品關(guān)聯(lián)微谓。如JGK 3的lightyellow模塊與S4高度特異關(guān)聯(lián)(0.93).
模塊的GO富集分析結(jié)果與差異表達基因分析結(jié)果相一致森篷。如,種子發(fā)育早期相關(guān)模塊主要富集的GO term為細胞分離豺型、細胞形態(tài)仲智、細胞壁組裝、基因表達調(diào)控姻氨。
4.7 兩個材料的基因模塊保守性分析
鑒定兩個材料共表達基因模塊的保守性钓辆。
計算不同模塊中的相同基因數(shù)目,然后通過Fisher精確檢驗的P-value值評估顯著性肴焊。
兩個材料中大部分保守模塊關(guān)聯(lián)的是相似的種子發(fā)育時期樣品前联。
少部分保守模塊在不同材料中表型不同的發(fā)育時期關(guān)聯(lián)性和轉(zhuǎn)錄激活時期。
鑒定了材料特異性模塊娶眷,如HC1的3個模塊(organe-HS4等)和4個JGK3模塊(如lightgreen-JS4)似嗤。
HC1特異性模塊主要富集GO term為轉(zhuǎn)錄調(diào)控、細胞程序性死亡届宠、衰老等烁落;JGK3特異性模塊富集的為DNA復(fù)制乘粒、細胞分裂、基因表達伤塌、蛋白修飾等灯萍。
4.8 種子發(fā)育和種子大小、重量相關(guān)轉(zhuǎn)錄調(diào)控模塊分析
目的:鑒定JGK3發(fā)育S3和S5的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)寸谜。主要為TFs及其共表達的靶基因(包含TFs結(jié)合位點竟稳,motif顯著富集分析)
候選模塊:HC1和JGK3中與S3、S5時期相關(guān)的共表達基因模塊
JGK3的S3時期相關(guān)模塊brown轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò):顯著富集的DNA motifs有ATHB1熊痴、JASE1等他爸,相關(guān)的TFs有woX9、PDF2果善、RLT2等诊笤,以及靶基因相關(guān)的GO term,基因表達調(diào)控巾陕、細胞壁組裝讨跟、表達大小調(diào)控等。
比較JS3和HS3模塊轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)鄙煤,大部分組分是相同的晾匠,但是也有一些材料特異性的組分。
同樣也分析了JS5和HS5相關(guān)模塊轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)組分梯刚,包括DNA motifs凉馆、TFs,以及GO term亡资。
JS5和HS5的調(diào)控網(wǎng)絡(luò)大部分組分是相同的澜共,但是也有一些材料特異性的組分。
該分析鑒定了種子發(fā)育中的關(guān)鍵調(diào)控因子锥腻,兩個材料的調(diào)控相似但不完全一樣嗦董。
4.9 種子發(fā)育和種子大小、重量相關(guān)轉(zhuǎn)錄調(diào)控模塊分析
一些基因模塊在兩個材料的S3和S5時期表現(xiàn)出相反表達模式瘦黑。
主要有3類:HS3下調(diào)JS3上調(diào)京革,HS3上調(diào)JS3下調(diào),HS5下調(diào)JS5上調(diào)幸斥。
這些模塊可能與兩個材料種子發(fā)育不同相關(guān)存崖,進行轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)分析。
HJ3上調(diào)JS3下調(diào)轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)鑒定:motifs睡毒、TF、GOterms冗栗。
S3時期的top hub基因表達模式反應(yīng)了這不同模塊中所有基因的表達模式演顾。
這些網(wǎng)絡(luò)中的許多motifs供搀、TFs都是已知參與調(diào)控種子大小、重量的重要調(diào)控因子钠至。
4.10 小結(jié)
實驗方案:兩個材料葛虐,不同發(fā)育時期樣品,所有差異表達基因進行WGCNA分析棉钧。
兩個材料分別進行WGCNA分析鑒定各自的基因模塊屿脐。
通過模塊Epigengene值與不同發(fā)育時期樣品進行關(guān)聯(lián)分析,鑒定時期特異性模塊宪卿,并通過模塊GO功能富集來解析各發(fā)育時期的調(diào)控機制的诵。
兩個材料模塊保守性分析,鑒定保守性和特異性模塊佑钾,通過Go富集解析各自表型西疤。
模塊篩選:
依據(jù)前面研究結(jié)果S3和S5兩個材料差異最大,重點分析這兩個時期相關(guān)的基因模塊休溶。
依據(jù)表達模式篩選在兩個材料的S3和S5時期表現(xiàn)出相反表達模式的模塊代赁。
轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)關(guān)鍵基因篩選:TFs和包含顯著富集motifs的靶基因、top 20/40 hub gene兽掰。
5. 表型數(shù)據(jù)
Root Cell-Specific Regulators of Phosphate-Dependent Growth
5.1 PRCE在根部的細胞特異性表達驗證和T-DNA插入突變體篩選
構(gòu)建了12個PRCE基因的啟動子-GFP轉(zhuǎn)基因line芭碍,驗證它們是否呈現(xiàn)細胞特異性表達模式。
其中10個基因表現(xiàn)出嚴格的細胞類型特異性表達模式(皮層孽尽、中柱鞘窖壕、中柱、木質(zhì)部薄壁細胞等)泻云。
篩選鑒定了11個PRCE基因的T-DNA插入純合突變體艇拍,其中10個為功能缺失突變體,1個為功能獲得型突變體宠纯。
5.2 突變體表型分析
prce突變體在磷足夠和缺乏條件下卸夕,植物根和芽中磷的濃度變化。
prce突變體在磷足夠和缺乏條件下婆瓜,植物生長情況快集,根和芽中生物量的變化。
大部分prce突變體表現(xiàn)出明顯不同于野生型(Col-0)的特征廉白,包括所有定量的生理表型个初。
5.3 prce突變體根中相應(yīng)基因的轉(zhuǎn)錄水平變化
選取以前發(fā)表文獻中的缺磷的兩個轉(zhuǎn)錄組數(shù)據(jù)集,包含不同的基因型材料猴蹂,其中Col-0和phr1-1為對照材料院溺。
在兩個數(shù)據(jù)集中,Col-0的63%和6%的PSR基因在phr1-1中沒有變化磅轻;許多野生型PSR基因在prce突變體中呈現(xiàn)出不同的表達珍逸。
在兩個數(shù)據(jù)集中篩選了Col-0中差異表達2倍以上的831個磷響應(yīng)核心基因逐虚,進步通過層次聚類分析其在不同基因型材料中的表達模式。并依據(jù)基因表達模式分析不同基因型樣品之間的關(guān)系谆膳。
S6k2突變體表現(xiàn)出與phr1-1類似的缺磷反應(yīng)叭爱,而wdd1突變體表現(xiàn)出類似Col-0的缺磷反應(yīng)。
5.4 鑒定prce突變體相關(guān)共表達網(wǎng)絡(luò)
對32個RNA-seq數(shù)據(jù)集(磷足夠和磷缺乏)的所有表達轉(zhuǎn)錄本分別進行WGCNA分析漱病,都鑒定了18個共表達基因模塊买雾。
計算模塊的特征值(Eigengene),并通過特征值來計算模塊和生理性狀(數(shù)量性狀杨帽,如磷含量和濃度漓穿、生物量、根相對生長速率睦尽、初根根長等)的相關(guān)性器净。
重點關(guān)注與性狀顯著相關(guān)的10個模塊,以及在不同基因型中呈現(xiàn)相反表達模式的模塊当凡。
缺磷時山害,yellowf和red模塊與生物量顯著正相關(guān);磷充足時沿量,black模塊與生物量顯著負相關(guān)浪慌。
與生物量呈現(xiàn)相反關(guān)聯(lián)的還有缺磷的green模塊和磷足夠的pink模塊。
5.5 重點模塊和模塊內(nèi)hub基因分析
缺磷的yellow模塊朴则,包含684個基因权纤,與生物量、磷含量乌妒、根芽比例都顯著相關(guān)汹想。其中24%基因與之前轉(zhuǎn)錄組鑒定的PSI基因相一致。
模塊基因古掏,相對野生型,在phr1-1中下調(diào)表達侦啸,在prce突變體(cb/1槽唾、prce2等)上調(diào)表達。
篩選與該模塊的ME(kME)排在前300的基因進行富集分析光涂,顯著富集的GO term有缺磷相關(guān)庞萍、磷脂和半乳糖脂代謝等。
模塊hub gene篩選:kME大于0.9忘闻。主要為脂代謝钝计、感知磷、磷信號導(dǎo)、磷運輸?shù)认嚓P(guān)基因私恬。
Yellow模塊在cb/1中表現(xiàn)較高的ME值交播,說明鈣信號通過CBL1影響磷轉(zhuǎn)運。進一步篩選該模塊中鈣信號相關(guān)基因践付,重點關(guān)注,作為hub gene候選缺厉。
5.6 小結(jié)
實驗方案:兩種處理永高,不同基因型樣品,所有表達基因進行WGCNA分析提针。
兩種處理分別進行WGCNA分析鑒定各自的基因模塊命爬。
模塊篩選:
通過模塊Epigengene值與不同表型(數(shù)量性狀)進行關(guān)聯(lián)分析,篩選性狀相關(guān)模塊辐脖;篩選在缺磷和磷足夠條件下與表型呈現(xiàn)相反關(guān)聯(lián)的模塊饲宛。
模塊功能分析:GO功能富集分析。
模塊hub gene篩選:
與模塊的kME值大于0.9嗜价;分析模塊特征值在各基因型樣品中表達模式艇抠,篩選關(guān)聯(lián)高的突變體,重點關(guān)注突變基因及相關(guān)通路基因久锥。
轉(zhuǎn)載請注明周小釗的博客>>WGCNA學(xué)習(xí):WGCNA應(yīng)用場景與實例解讀