文獻
2019
PNAS
Comparative transcriptomics method to infer gene coexpression networks and its applications to maize and rice leaf transcriptomes
研究背景
在不同處理條件下獲得的轉錄組數(shù)據(jù)可以揭示條件特異性反應的差異表達基因。
在不同時間點獲得的轉錄組數(shù)據(jù)可以揭示某過程隨時間的動態(tài)調控鞋既。
這樣的三維數(shù)據(jù)(基因表達-處理條件-時間序列)對于研究基因調控網(wǎng)絡以及生物學過程非常有用,但是仍然沒有一種合適的方法可以處理這種三維數(shù)據(jù)半火。
本文亮點
作者提出了時間序列基因共表達網(wǎng)絡( time-ordered gene coexpression network, TO-GCN)來處理這種三維數(shù)據(jù)。
01?實驗材料和轉錄組數(shù)據(jù)處理
Fig S1a
作者利用13個在LD下的玉米轉錄組數(shù)據(jù)和12個在全暗(TD)條件下的轉錄組季俩,LD和TD共用一組T0數(shù)據(jù)(Fig S1a)钮糖。可以看到相同時間的TD和LD還是有很大差異的酌住。這樣就構建了一個包含25份數(shù)據(jù)的三維轉錄組數(shù)據(jù)集店归,三維指的是光照情況,發(fā)育時間以及不同的基因酪我。
基因的表達量作者用RPKM表征消痛,并且后續(xù)只分析至少在兩份數(shù)據(jù)中RPKM>1的基因,也就是去除了那些在這個范圍內(nèi)基本不表達的死基因都哭。剩余25489個基因用于后續(xù)分析秩伞,其中包括1718個轉錄因子。
02?構建時間序列基因共表達網(wǎng)絡
Fig 1a
分析這種不同條件下的時序數(shù)據(jù)存在一個主要的問題是不同的條件下基因表達模式會改變以應對不同的條件欺矫。比如在這篇文章中纱新,胚胎葉在TD條件下的最初發(fā)育速度明顯比LD條件下更快,也就是說TD下的基因表達譜可能與LD大體相似穆趴,但是可能表現(xiàn)出時間偏移脸爱,因此,當比較從不同條件獲取的兩組時間序列轉錄本時未妹,考慮時間偏移效應是很重要的簿废。
為了滿足這一點空入,作者給出的流程首先分別考慮每組時間序列轉錄本上的基因共表達,也就是先單獨看LD下的基因共表達情況族檬,再單獨看TD基因的共表達情況歪赢,然后比較LD和TD下的共表達模式(Fig 1a)。這樣考慮兩個條件的共表達一共有9種情況导梆,LD條件下正的共表達,TD下正共表達迂烁、負共表達或者不共表達看尼,或者LD條件下負的共表達,依此類推盟步。LD和TD下均不共表達的情況去除藏斩,后面只考慮前八種情況。然后對這八種情況分別構建基因共表達網(wǎng)絡(GCN)却盘。
Fig 1b
由于選用的是時間序列數(shù)據(jù)狰域,所以構建共表達網(wǎng)絡之后,可以根據(jù)隨時間的表達量變化得到每個階段有哪些基因或者轉錄因子在發(fā)揮作用黄橘,構建一系列的時序網(wǎng)絡 (Fig 1b)兆览。
03 利用TOGCN揭示生物學過程
Fig 2a-c
在八種網(wǎng)絡中,LD+TD+表示在LD和TD下均表現(xiàn)出正的共表達的基因塞关,均共表達說明光照和黑暗并沒有影響它們的潛在的調控關系抬探,也就說這些基因是與光照無關的。下面這個網(wǎng)絡圖就是作者給出的LD+TD+網(wǎng)絡的時間序列分布帆赢。根據(jù)表達量變化小压,一共可以分成L1-15 15個level (Fig 2a).
BC的熱圖展示了在LD和TD下每個level的基因的表達量,它們的表達量存在一個連續(xù)性的變化椰于。
Fig 2d
對每個level的基因做了功能富集怠益,發(fā)現(xiàn)L8和L9存在明顯的功能轉換 (Fig 2d)。在前八個level始終可以富集到泛素化介導的蛋白質降解功能瘾婿。與L1-L8相比蜻牢,L9-L15的基因主要與細胞增殖相關,在最后四個階段偏陪,也出現(xiàn)了與光合作用相關的功能孩饼,這可以說明即使在完全黑暗的情況下,玉米胚葉細胞也被編程為?? 能夠進行光合作用的細胞竹挡。
Fig 2e
另外镀娶,植物激素對于觸發(fā)發(fā)育的重編程是必不可少的,作者發(fā)現(xiàn)與ABA相關的基因傾向出現(xiàn)在前三個level揪罕,隨后逐漸減少梯码,這與ABA維持種子休眠直到萌發(fā)開始的功能一致(Fig 2e)宝泵。與ABA相比,赤霉素相關基因大多出現(xiàn)在L2和L3轩娶,這與赤霉素在誘導萌發(fā)過程中與ABA拮抗一致儿奶。大多數(shù)生長素和細胞分裂素相關基因分別出現(xiàn)在L9-L15和L10-L13,跟這兩種激素共同在調節(jié)細胞增殖和分化作用相關鳄抒。
Fig 3
之前的研究發(fā)現(xiàn)C4植物的花環(huán)結構無論在光下還是在暗中都能完成正常的發(fā)育闯捎,所以作者推測花環(huán)結構的形成與光照無關。文章的最后作者就是用LD+TD+這個網(wǎng)絡去找一些與花環(huán)結構形成相關的基因和轉錄因子许溅。
ZmSHR1基因已經(jīng)被證明在玉米的花環(huán)結構形成過程發(fā)揮重要作用瓤鼻,它的上游調控仍不是很清楚,ZmSHR1的表達活躍出現(xiàn)在L11贤重,它的上游調控應該出現(xiàn)在L11以及L11之前的level (Fig3)茬祷。這個轉錄因子的共表達網(wǎng)絡中有紅色黃色和藍色的圈奖地,黃色的圈代表該轉錄因子沒有已知的轉錄因子結合位點溯街,藍色的圈代表該轉錄因子存在已知的轉錄因子結合位點。紅色的圈代表這個轉錄因子的啟動子區(qū)域存在調控它的轉錄因子的結合位點统捶。提取了紅色的轉錄因子構建了這個通路用于后續(xù)驗證滚停。
但是這個關系是通過基因間的共表達來建立的沃粗,它們之間的連線只能代表兩基因有共表達關系,而不能直接說明有直接的調控键畴。所以進一步作者又根據(jù)轉錄因子結合位點來預測兩基因之間的調控關系陪每,根據(jù)轉錄因子結合位點可以推測前兩個基因存在某種調控。最后作者又根據(jù)EMSA實驗和PTA實驗證明了棕紅色箭頭指示的調控關系镰吵,與共表達的結果基本符合檩禾。
總結
時間序列轉錄組對于鑒定生物過程的調控因子非常有用。
為了分析這類數(shù)據(jù)疤祭,作者開發(fā)了一種避免兩個條件之間的時間點對齊和標準化的方法盼产。將其應用于分析在光-暗循環(huán)和完全黑暗條件下發(fā)育中的玉米葉片的時間序列轉錄組,并獲得了一個按時間順序排列的基因共表達網(wǎng)絡(TO-GCN)勺馆,該網(wǎng)絡很可能包括參與Kranz解剖結構發(fā)育的所有基因戏售,這種結構對于C4光合作用的高效率至關重要。利用這個TO-GCN草穆,作者預測并通過實驗證實了Kranz解剖結構發(fā)育的一個調控級聯(lián)灌灾。
本文使用 文章同步助手 同步