如果想做植物的轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò),我們可能會有以下問題侯嘀。
- 1:如何利用有限的葉片原生質(zhì)體材料獲得高質(zhì)量的TF ChIP-seq數(shù)據(jù)另凌?
- 2:如何生成可信的無標(biāo)度轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)圖谱轨?
- 3:整體網(wǎng)絡(luò)和局部網(wǎng)絡(luò)的關(guān)系,以及如何根據(jù)局部網(wǎng)絡(luò)模塊- 化確定潛在的調(diào)控因子功能吠谢?
- 4:TF 共結(jié)合有什么作用土童?
- 5:同系跨物種間TF調(diào)控作用存在什么樣的關(guān)系?
我們以玉米為例工坊,介紹構(gòu)建TF調(diào)控網(wǎng)絡(luò)的詳細(xì)方法献汗。
文獻(xiàn):Reconstructingthe maize leaf regulatory network using ChIP-seq data of 104 transcriptionfactors
真核細(xì)胞內(nèi)的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò),是由轉(zhuǎn)錄因子(TFs)的組合作用所決定的栅组。但是雀瓢,植物中的TF結(jié)合研究的數(shù)量太少,無法給出這個復(fù)雜網(wǎng)絡(luò)的全貌玉掸。
本研究以玉米為模型刃麸,對玉米葉片中表達(dá)的104種TF進(jìn)行ChIP-seq,重建其轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)司浪,并訓(xùn)練機(jī)器學(xué)習(xí)模型來預(yù)測TF結(jié)合和共定位泊业。
具體研究
1. 如何利用有限的****玉米葉片原生質(zhì)體****材料獲得高質(zhì)量的TF ChIP-seq數(shù)據(jù)?
作者開發(fā)了一種高效的玉米原生質(zhì)體分離和轉(zhuǎn)化系統(tǒng)(圖1a)啊易,成功對104個在玉米葉片發(fā)育切片上表達(dá)的TFs進(jìn)行了ChIP-seq實驗吁伺。然后應(yīng)用ENCODE2統(tǒng)一pipeline來處理,總共得到了217個ChIP-seq數(shù)據(jù)租谈,2,147,346個可重復(fù)的TF結(jié)合peak篮奄。
驗證發(fā)現(xiàn),TF結(jié)合形成密集的cluster并定位在開放的染色質(zhì)區(qū)域(圖1b-d)割去。使用GO-term和MAPMAN功能類別富集分析窟却,來根據(jù)靶基因?qū)ζ溥M(jìn)行分類(圖1e)。大部分的TFs被分為信號傳導(dǎo)呻逆、激素夸赫、光合作用和代謝類,這些都是葉子的核心生物功能咖城。
此外茬腿,作者觀察到盡管一半以上的TF結(jié)合位點位于基因5'的近端區(qū)域,但遠(yuǎn)側(cè)的TF結(jié)合位點(如Vgt1)也顯示出相似的染色質(zhì)特征宜雀,并可能在調(diào)節(jié)轉(zhuǎn)錄中發(fā)揮重要作用(圖2)切平。
2. 如何生成可信的無標(biāo)度轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)圖?
接下來州袒,使用ENCODE TIP概率框架構(gòu)建了一個基因調(diào)控網(wǎng)絡(luò)揭绑,使用該TIP模型,生成了一個具有272,627條邊和20,179個節(jié)點的網(wǎng)絡(luò)圖(約45%的注釋基因和約77%的葉子表達(dá)基因)(圖3a)。
3. 整體網(wǎng)絡(luò)和局部網(wǎng)絡(luò)的關(guān)系他匪,以及如何根據(jù)局部網(wǎng)絡(luò)模塊化確定潛在的調(diào)控因子功能菇存?
生物網(wǎng)絡(luò)通常表現(xiàn)出拓?fù)浜?或功能模塊化。應(yīng)用分區(qū)算法(Gephi version 0.92)來確定網(wǎng)絡(luò)元素子集之間的關(guān)系邦蜜,發(fā)現(xiàn)網(wǎng)絡(luò)可以被劃分為七個模塊(分辨率1.0)依鸥。每個模塊包含約27 - 5%的節(jié)點。這些模塊并不是孤立的悼沈,大約40%的邊緣出現(xiàn)在每個模塊內(nèi)贱迟,說明TFs可以調(diào)節(jié)自身模塊外的基因,模塊之間存在大量的信息流絮供。接下來衣吠,對每個模塊中的基因進(jìn)行GOterm和MapMan功能富集分析,發(fā)現(xiàn)它們確實針對特定功能富集壤靶。
然而缚俏,每個模塊包含數(shù)千個具有不同功能的基因,而且太大而不能作為一個整體進(jìn)行評估贮乳。假設(shè):由于該網(wǎng)絡(luò)已經(jīng)能夠在這個尺度上提供生物學(xué)功能的線索忧换,因此可以根據(jù)局部規(guī)模的連通性來確定更小通路的潛在調(diào)控因子。
驗證
首先向拆,在保守的葉綠素生物合成通路中測試了這一點亚茬。已知該通路受GLK TFs的調(diào)控,因為它們的突變會破壞光合作用基因的表達(dá)浓恳。為了推斷每個TF對給定通路的貢獻(xiàn)刹缝,用ENCODE TIP概率模型為每個TFtarget相互作用計算了對數(shù)轉(zhuǎn)換后的p值的總和(圖4a)。發(fā)現(xiàn)颈将,葉綠素生物合成通路的主要轉(zhuǎn)錄因子確實是兩個GLKs和一個未知的MYBR26赞草。盡管尚未在玉米中研究MYBR26的功能,但其擬南芥同源物參與了晝夜節(jié)律調(diào)節(jié)吆鹤,進(jìn)一步證實了假設(shè)。
接下來洲守,使用這種策略來檢查缺乏預(yù)先定義調(diào)控子的玉米C4光合作用通路疑务。結(jié)果表明,**連通性排名前5位的TFs均為constant -
like(COL)TFs**(圖5b梗醇,c)知允。之前其他植物的研究表明,COLs在花期和光周期的調(diào)節(jié)中發(fā)揮著重要作用叙谨。純合突變體具有淺綠色和幼苗致死性表型温鸽,支持作者的假設(shè),即COL TF對光合作用很重要(圖5d)。
有趣的是涤垫,對于在葉肉或束鞘細(xì)胞中特異性表達(dá)的關(guān)鍵C4光合作用基因姑尺,作者發(fā)現(xiàn),它們的基因位點與細(xì)胞特異性H3K27me3標(biāo)記相關(guān)蝠猬。這表明切蟋,它們不僅受到復(fù)雜的TF網(wǎng)絡(luò)的調(diào)控,而且在表觀基因組水平上也受到調(diào)控(圖5e)榆芦。
4. TF 共結(jié)合有什么作用柄粹?
利用來自于共定位模型的規(guī)則,在給定背景下作者對每個partner TF的相對重要性進(jìn)行了評分匆绣,以反映peak集的聯(lián)合分布(圖6 d)驻右。
為了從模型結(jié)果中獲得全局視圖,作者計算了所有focus-TF的TF的平均RI崎淳。觀察到堪夭,整個集合顯示出一個平均RI值趨于中低(即≤60RI,上下文相關(guān)性更高)的趨勢凯力,較少的TF可以預(yù)測大量的focus-TF(即> 60 RI茵瘾,高組合潛力)。例如咐鹤,在104個TFs中拗秘, LATE ELONGATED HYPOCOTYL (LHY) 在分化葉截面中表達(dá)最高。LHY編碼一個MYB TF祈惶,它是植物生物鐘中的中心振子雕旨,基于RI預(yù)測的前三位伙伴TFs是ZIM18、bHLH172和COL7(圖6e)捧请。
盡管它們的功能尚未在玉米中鑒定凡涩,但它們的擬南芥同源物分別與茉莉酸信號,鐵穩(wěn)態(tài)和開花時間調(diào)節(jié)有關(guān)疹蛉,所有這些都與晝夜節(jié)律緊密相關(guān)活箕。
作者的發(fā)現(xiàn)證實,共結(jié)合可能是解釋具有相似序列偏好的TF如何靶向不同基因并控制不同生物學(xué)功能的關(guān)鍵可款。共定位模型還揭示了TF結(jié)合位點的組合空間很大育韩,這可能有利于特定組合的出現(xiàn),從而促進(jìn)了物種形成過程中調(diào)控網(wǎng)絡(luò)的快速多樣化闺鲸。
5. 同系跨物種間TF調(diào)控作用存在什么樣的關(guān)系筋讨?
接下來,作者研究禾本科的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)是如何進(jìn)化的摸恍。作者在高粱和水稻中進(jìn)行了ATAC-seq悉罕,并獲得了其同系玉米基因的開放染色質(zhì)序列。然后,根據(jù)玉米TF的模型是否可以預(yù)測高粱和水稻中共同目標(biāo)基因的開放染色質(zhì)中的結(jié)合壁袄,來推斷網(wǎng)絡(luò)邊緣保守性(圖7a)类早。例如,作者在高粱中68%的同系開放染色質(zhì)區(qū)域中發(fā)現(xiàn)了預(yù)測的TF結(jié)合事件然想。從同系TF到同系基因的預(yù)測網(wǎng)絡(luò)邊緣來看莺奔,作者推斷玉米網(wǎng)絡(luò)中約28%的邊緣在高粱中是保守的,而約19%在水稻中是保守的(圖7b)变泄。
為了在植物中測試同源TF識別位點之間的強(qiáng)相關(guān)性令哟,作者計算了玉米,高粱和水稻的開放染色質(zhì)區(qū)域中每個TF模型的匹配數(shù)妨蛹,發(fā)現(xiàn)它們確實相關(guān)(圖7d)屏富。此外,每個玉米TF在水稻和高粱中發(fā)現(xiàn)的保守靶點數(shù)量也存在相關(guān)性(圖7e)蛙卤,表明在動植物進(jìn)化過程中存在相似的選擇壓力狠半。