Transposable elements employ distinct integrationstrategies with respect to transcriptional landscapesin eukaryotic genomes
Xinyan Zhang, Meixia Zhao, Donald R. McCarty and Damon Lisch
挺多地方機(jī)譯的艘款,懶得改小細(xì)節(jié)了
ABSTRACT
????TEs在真核生物基因組中的現(xiàn)有分布是由真核生物基因組中真正的TE整合偏好以及整合后的選擇決定的。使用植物和動物的多個 de novo 轉(zhuǎn)座子入數(shù)據(jù)集比較了TE靶位點在宿主基因組中的分布,并在全基因組轉(zhuǎn)錄的環(huán)境下進(jìn)行了比較输虱。展示了兩種不同類型的轉(zhuǎn)錄相關(guān)TE靶向策略窒舟,這表明真核TE家族之間的趨同進(jìn)化過程盈电。這兩個精確靶向元件的整合與高表達(dá)基因的RNA聚合酶II(Por II)轉(zhuǎn)錄起始特別相關(guān)沿癞,表明除了開放染色質(zhì)的被動靶向外躁绸,還存在著精確TE靶向的新機(jī)制等缀。還強(qiáng)調(diào)了兩個可以促進(jìn)TE存活和快速增殖的特征:組織特異性轉(zhuǎn)位和由于精確靶向而最小化對附近基因功能的負(fù)面影響枷莉。
INTRODUCTION
????事實上,許多基因組的整體結(jié)構(gòu)在很大程度上由TEs的數(shù)量和分布決定尺迂,而TEs的數(shù)量和分布又由整合偏好和整合后的選擇決定笤妙。
????根據(jù)TES的結(jié)構(gòu)和生化特征,TES可分為反轉(zhuǎn)錄轉(zhuǎn)座子(I類TES)和DNA轉(zhuǎn)座子(II類TES)噪裕。I類和II類TES既可以是自主的蹲盘,也可以是非自主的。反轉(zhuǎn)錄轉(zhuǎn)座子通過一種“復(fù)制-粘貼”機(jī)制進(jìn)行復(fù)制膳音,該機(jī)制將逆轉(zhuǎn)錄作為復(fù)制過程中的一個步驟辜限。DNA轉(zhuǎn)座子通過“剪切和粘貼”機(jī)制進(jìn)行轉(zhuǎn)座,在這種機(jī)制中严蓖,一個元件被物理地從一個位置切除薄嫡,然后在第二個位置重新整合。
????TEs對基因組進(jìn)化有重要影響颗胡。TE拷貝數(shù)的增加導(dǎo)致基因組大小毫深、復(fù)雜性和不穩(wěn)定性的增加。TE轉(zhuǎn)座與染色體結(jié)構(gòu)變異有關(guān)毒姨,也可以影響單個基因的表達(dá)哑蔫。TES已成為新突變的豐富來源,可供選擇操作,并對基因進(jìn)化和表型多樣化做出了貢獻(xiàn)闸迷。盡管如此嵌纲,由TEs對其宿主主要是中性或有害的,并且TEs受到宿主免疫系統(tǒng)的嚴(yán)格控制腥沽。重疊的轉(zhuǎn)錄和轉(zhuǎn)錄后沉默機(jī)制在植物和動物中已經(jīng)進(jìn)化為分層防御逮走,已經(jīng)進(jìn)化到抑制TE的表達(dá)和擴(kuò)增。雖然這個系統(tǒng)是高效的今阳,并導(dǎo)致大多數(shù)基因組中大多數(shù)TE的表觀遺傳沉默师溅,但很明顯,TEs也可以經(jīng)歷拷貝數(shù)的快速增加盾舌,并且目前或最近在各種生物體中都發(fā)現(xiàn)了活躍的TEs墓臭。
? ??TE活動的結(jié)果在很大程度上取決于TE在哪里整合。雖然真核生物基因組中的TE整合位點分布廣泛妖谴,但不同的TE采用不同的整合策略窿锉,導(dǎo)致截然不同的插入圖譜。有充分的證據(jù)表明膝舅,DNA轉(zhuǎn)座子和RNA轉(zhuǎn)座子都是非隨機(jī)插入宿主基因組的嗡载。轉(zhuǎn)座子Mu元件以重組熱點附近未連接的開放染色質(zhì)區(qū)域為靶標(biāo),這些區(qū)域往往位于基因的5'端铸史。果蠅整合中的P元素與復(fù)制起始點有關(guān)鼻疮,復(fù)制起始點也在基因的5‘端。人類基因組中L1反轉(zhuǎn)錄轉(zhuǎn)座子的整合似乎也受到DNA復(fù)制的影響琳轿,既不針對活躍的轉(zhuǎn)錄區(qū)域判沟,也不針對開放染色質(zhì)。其他一些反轉(zhuǎn)錄轉(zhuǎn)座子崭篡,如酵母中的ty1挪哄,由于轉(zhuǎn)座子和RNA聚合酶III亞基之間的物理相互作用,靶向Pol III轉(zhuǎn)錄基因上游的H2A/H2B界面附近的核小體結(jié)合的DNA琉闪。整合到相對開放的染色質(zhì)區(qū)迹炼,這可能有助于整合和隨后的TE元件的表達(dá),然而颠毙,情況并非總是如此斯入。例如,Tal1靶向著絲粒(22)蛀蜜,ty5靶向沉默的異染色質(zhì)刻两。
????作者對多個物種中的多個TE進(jìn)行了比較,使用包括自己在內(nèi)的許多群體收集的多個相對未選擇的de novo 轉(zhuǎn)座子插入數(shù)據(jù)集滴某,在全基因組轉(zhuǎn)錄背景下探究了TE分布磅摹。確定了兩種不同類型的Pol II相關(guān)TE靶向基因滋迈,以及那些獨立于Pol II轉(zhuǎn)錄的基因,為植物和動物TE家族之間的趨同進(jìn)化提供了證據(jù)户誓。研究數(shù)據(jù)能表明饼灿,TEs已經(jīng)進(jìn)化出策略來最小化它們對宿主基因表達(dá)的影響,即使這些TEs特別針對基因區(qū)域帝美。
MATERIALS AND METHODS
收集de novo 轉(zhuǎn)座子位置信息和RNA-seq數(shù)據(jù)集
????本研究中分析的TE家族均被用作有效的誘變劑碍彭,并且每個TE家族都被用于序列索引突變體庫的構(gòu)建。玉米证舟、水稻和果蠅的UniformMu硕旗、Dissolation(Ds)-GFP窗骑、Oryza sativa 17(Tos17)女责、Ds、Suppressor-mutator(Spm)创译、P抵知、picgyBac(Pb)和Minos(Mb)新插入轉(zhuǎn)座子插入已公開發(fā)表。SomaticMu elements 是通過對從高拷貝Mu活性玉米幼苗收集的葉片Mu-seq生成的软族,并且使用與用于萌發(fā)插入的UniformMu集合相同的pipeline得到TE位置信息刷喜。Tables S1–S5 提供了每個物種中所有TE插入的位置信息。Table S6提供了tRNA和rRNA基因附近插入的位置信息立砸。
????UniformMu掖疮,Ds- gfp,SomaticMu 颗祝,P浊闪,Pb,Mb螺戳,Tos17搁宾,Spm,Ds
????原始FPKM從玉米遺傳資源數(shù)據(jù)庫中檢索了玉米AGPv4基因的公開RNA測序?qū)嶒炛稻笥住J褂肦包FactoMineR對不同玉米組織的RNAseq數(shù)據(jù)集生成的FPKM值進(jìn)行主成分分析盖腿。分別從水稻表達(dá)數(shù)據(jù)庫和FlyAtlas2檢索水稻和果蠅的RNAseq數(shù)據(jù),使用此分析的所有基因的表達(dá)水平可在表S7中找到损同。
????玉米翩腐,水稻,果蠅轉(zhuǎn)錄組數(shù)據(jù)
轉(zhuǎn)座子在轉(zhuǎn)錄起始位點和轉(zhuǎn)錄終止位點附近分布的薈萃分析
? ??計算每個插入事件到轉(zhuǎn)錄起始位點和轉(zhuǎn)錄終止位點的距離膏燃∶裕基因插入沿正X軸繪制,基因間插入沿相對于TSS和TTS的負(fù)X軸繪制蹄梢,并與隨機(jī)選擇的基因組位點進(jìn)行比較疙筹。在玉米染色體上共產(chǎn)生了421 280個隨機(jī)插入富俄,其密度為每5kb一個插入,這與最大的插入數(shù)據(jù)集(SomaticMu)相當(dāng)而咆』舯龋考慮到水稻和果蠅的基因組相對較小且基因豐富,隨機(jī)插入的密度被設(shè)定為平均每400bp一個插入暴备。在一些基因豐富的區(qū)域中悠瞬,來自上下游基因的一小部分TE插入或隨機(jī)分布的位點都小于4kb,因此對其進(jìn)行了兩次計數(shù)涯捻。預(yù)計這將導(dǎo)致隨機(jī)選擇的基因座的子集的分布略有不均勻浅妆。
????分別繪制基因間和基因轉(zhuǎn)座子插入的元圖譜,使用以每個位置為中心的滑動30堿基對窗口的標(biāo)準(zhǔn)化插入數(shù)障癌。
????在每個 RNA-seq 實驗中凌外,根據(jù)基因的相對表達(dá)水平將基因分為20個bins,其中bin 1代表最低的表達(dá)水平涛浙,bin 20代表最高的表達(dá)水平康辑。為每個RNAseq數(shù)據(jù)集計算每個bin中與TSS相關(guān)的插入(TSS上游<2kb)的百分比,并沿X軸繪制所有數(shù)據(jù)集中的平均百分比轿亮。
基于測序的轉(zhuǎn)座子分析和基于測序的等位基因頻率分析
????以miseq為基礎(chǔ)的mu element分析是用F1雜交后代進(jìn)行的疮薇。B73親本攜帶突變活性,已滲入B73遺傳背景我注。Mo17缺少活躍 mu elements按咒。因此,所有的新插入都來自B73基因組但骨。從B73/Mo17雜種植株6日齡幼苗中提取基因組DNA励七。然后對Mu側(cè)翼DNA進(jìn)行擴(kuò)增富集。純化的PCR產(chǎn)物進(jìn)行MiSeq嗽冒。Wideseq reads比對到B73參考基因組呀伙,通過鑒定 Mu TSDs(Mu target site replications,TSDs)添坊,在雜交分離后代中到了一組mu插入靶向的基因剿另,且對mRNA序列中含有B73/Mo17 SNPs的基因進(jìn)行等位基因特異性表達(dá)分析。為了定量等位基因頻率贬蛙,我們從上述雜交種幼苗相同的莖組織中進(jìn)行了RT-PCR和Wideseq分析雨女。提RNA,反轉(zhuǎn)錄成cDNA阳准,對16個攜帶SNPs的基因進(jìn)行RT-PCR擴(kuò)增含有B73/Mo17 SNPs的RNA片段氛堕,Wideseq測序。還對四個單株雜種種子的胚乳進(jìn)行了RNAseq分析野蝇,Wideseq進(jìn)行Mu插入鑒定讼稚。Fold changes of gene expression caused by Mu insertions for each gene were calculated by comparing the B73 allele frequency in individuals containing Mu insertions with those without Mu insertions which were further normalized using the Mo17 allele transcript frequency in plants that lacked an insertion in either B73 or Mo17. 計算每個基因由插入引起的基因表達(dá)的倍數(shù)變化括儒。
RESULTS
新轉(zhuǎn)座子在宿主基因TSSs和TTSs附近的分布
? ??為了了解真正的轉(zhuǎn)座子目標(biāo)偏好,我們檢查了9個新插入數(shù)據(jù)集的目標(biāo)位點分布锐想。這些包括玉米的SomaticMu帮寻,UniformMu和Ds- gfp,水稻的Tos17赠摇、Ds和Spm固逗,果蠅的P-element,Pb和Mb插入集合藕帜。除Tos17是一個低拷貝數(shù)的LTR逆轉(zhuǎn)錄轉(zhuǎn)座子外烫罩,所有的TE都是DNA轉(zhuǎn)座子。UniformMu主要由 germinally transmitted 生殖發(fā)育傳遞的Mu插入組成洽故,而SomaticMu元素被推斷主要來自體細(xì)胞插入贝攒,因為相對于所檢測的家族中分離的插入,獲得的reads數(shù)量相對較低收津。
????通過對隨機(jī)選擇的位點的插入譜進(jìn)行比較分析饿这,發(fā)現(xiàn)不同物種中不同元素與TSSs或TTSs的關(guān)聯(lián)存在顯著的相似性和差異浊伙。TE插入分布與隨機(jī)選擇位點分布的差異揭示了TE插入在TSSs或TTSs附近的顯著富集撞秋。mu element (UniformMu和SomaticMu)和P element在TSSs附近大量富集(峰值移位<50 bp),但在TTSs附近大部分缺失嚣鄙,表明TSS與兩種轉(zhuǎn)座酶緊密相關(guān)(Figure1A, B, D, E, Supplementary Figure S1A, B, D, E)吻贿。在tss或tts附近沒有富集mb,spm哑子,tos17插入舅列。事實上,相對于這些位點卧蜓,tos17插入實際上在基因體中有所富集(Figure1C,F,Supplementary Figure S1C, F)帐要。
? ??為了確定Mu和P元素的靶向是否針對Pol II依賴的轉(zhuǎn)錄,或者實際上與任何RNA聚合酶相關(guān)愤炸,我們檢測了玉米和果蠅中分別是由RNA Pol I或III轉(zhuǎn)錄的 rRNA和 tRNA 基因附近的新Mu元素和P元素插入的分布期揪。為了最小化Pol II tss相關(guān)的TE富集,我們根據(jù)玉米中rRNA和tRNA與Pol II tss的距離對其進(jìn)行了篩選规个,獲得了與任何Pol II轉(zhuǎn)錄的注釋基因的TSSs距離超過5 kb的1610個基因凤薛。很少有轉(zhuǎn)座子插入到1610 rRNA和tRNA基因的基因體中姓建,沿著正x軸可以觀察到,可能是因為這些基因的長度小缤苫。在這些基因的TTSs下游和TSSs上游的區(qū)域引瀑,UniformMu和SomaticMu的分布類似于隨機(jī)選擇的基因組位點,只是UniformMu的分布曲線比SomaticMu的分布曲線更不平滑(Figure2A, B)榨馁,這可能是因為SomaticMu插入的數(shù)量是UniformMu插入的3.5倍憨栽。與Mu?element插入相似,P element插入rRNA和tRNA基因的TSSs和TTSs或其附近的頻率與隨機(jī)選擇的位點相當(dāng)(Supplementary Figure S2).
????植物有兩種植物特有的RNA聚合酶唧瘾,Pol IV和Pol V,它們是胞嘧啶甲基化在不對稱(CHH别凤,其中H是A, T或C)序列環(huán)境中所必需的饰序。大量的CHH島位于玉米的基因5'末端或者下游的3'末端。我們在CHH島中未觀察到Mu element插入的富集规哪。絕大多數(shù)的插入都在5'CHH島求豫,因為 Pol II轉(zhuǎn)錄本在TSSs轉(zhuǎn)錄。這些結(jié)果表明诉稍,Pol IV和Pol V轉(zhuǎn)錄起始或終止位點不是Mu element插入的顯著靶點(Figure2C, D)蝠嘉。
不同表達(dá)水平宿主基因附近TE靶位點的分布
? ??考慮到幾個TE家族的靶位點是與TSS或TSS相關(guān)的,我們假設(shè)一些家族的轉(zhuǎn)座酶以依賴于轉(zhuǎn)錄水平的方式被招募到TSS或TSS杯巨。為了驗證這一假設(shè)蚤告,檢測了轉(zhuǎn)座子靶向頻率與宿主基因相對表達(dá)水平之間的相關(guān)性。提取了一個位于TSS附近(<2 kb)的TSS相關(guān)TE插入集服爷,并從玉米的79個組織杜恰、果蠅的38個組織和水稻的59個組織中檢索了公開可用的RNAseq數(shù)據(jù)集。對于每個數(shù)據(jù)集层扶,在每個RNAseq實驗中箫章,根據(jù)排列的FPKM值將基因分成20個大小相同的組,其中bin 1包含表達(dá)最低的5%基因镜会,bin 20包含表達(dá)最高的5%基因檬寂。隨機(jī)選擇的基因組位點(對照數(shù)據(jù)集)均勻分布在不同水平表達(dá)的基因附近,Mu 和 P elements 優(yōu)先靶向高表達(dá)的基因戳表,如向上傾斜的曲線所示 (Figure3A, B)桶至。Pb 的靶向頻率與基因表達(dá)呈正相關(guān)昼伴,與p和mu elements的正相關(guān)程度比較,低一點 (Figure3B)镣屹。有趣的是圃郊,Ds(在玉米和水稻中)、Spm和Tos17轉(zhuǎn)座子插入均在中表達(dá)bin中過度分布(Figure3A, C)女蜈,表明在這些水平表達(dá)的基因是這些元件的首選靶基因持舆。Mb元素在TTS上表現(xiàn)出輕微的富集,而不是在TSS上伪窖,而且以低的表達(dá)量基因為首選靶基因(圖3B)逸寓。
????利用兩個可用的Mu插入數(shù)據(jù)集譬嚣,通過對來自TSSs的4225 Mu元件熱點基因(>3 UniformMu和>10 SomaticMu插入,<2 kb來自TSSs)使用agriGO進(jìn)行GO分析见妒,驗證了被精確定位TEs經(jīng)常靶向的基因與特定的生物學(xué)功能或過程相關(guān)的假設(shè)孤荣。為Mu熱點基因豐富的7個GO術(shù)語涉及廣泛的一般而不是專門化的生物過程和分子功能 (Supplementary Figure S3A)。按這7個GO項分類的基因须揣,平均而言,表達(dá)水平明顯高于總基因集(Kolmogorov-Smirnov檢驗钱豁,箱形圖旁邊顯示的Pvalues) (Supplementary Figure S3B)耻卡,這與觀察相一致,mu elements優(yōu)先靶向高表達(dá)基因牲尺。此外卵酪,在這7個基因組中,Mu 熱點基因的表達(dá)量均顯著高于非熱點基因(Kolmogorov-Smirnov檢驗)(Supplementary Fig- S3C)谤碳。這些觀察結(jié)果表明溃卡,這些GO terms富集并不是因為它們與特定的過程有關(guān),而是因為它們傾向于以高于平均水平的水平表達(dá)蜒简。
TE插入片段在分生組織和分化組織中的分布
????考慮到幾個TE家族的靶向頻率與宿主基因在一組組織中的表達(dá)水平有關(guān)粘昨,假設(shè)轉(zhuǎn)座具有組織特異性垢啼,兩者之間的相關(guān)性最強(qiáng)的組織將是轉(zhuǎn)座發(fā)生最頻繁的組織。以玉米中的Mu 和 Ds elements為例张肾,探討了TE轉(zhuǎn)座的組織特異性膊夹。
????為了探索影響玉米不同組織轉(zhuǎn)錄組差異的主要因素,首先對上述79個RNAseq數(shù)據(jù)集進(jìn)行了主成分分析(PCA)捌浩,發(fā)現(xiàn)第一主成分(17.8%的方差)很好地區(qū)分了分生組織和分化組織 (Supplementary Figure S4A)放刨。
在6個分生組織和6個分化組織中不从,mu和ds element插入在低表達(dá)至高表達(dá)bins中的分布曲線表現(xiàn)出不同的模式(Figure4A, Supplementary Figure S4B)。這兩條曲線在中等(條帶8-12犁跪,排名在35%-60%)和高表達(dá)基因(條帶16-20椿息,排名在75%-100%)上差異最大(Figure4A)。為了研究組織特異性基因在分生組織和分化組織中的表達(dá)是否與這種分布曲線的變化有關(guān)坷衍,我們鑒定了在分生組織中高水平表達(dá)忽妒,分化組織中中等表達(dá)的基因(meristematic-dominant genes)酒甸,以及在分化組織中高表達(dá)梨水,分生組織中中等表達(dá)的基因(differentiated-dominant genes)屋剑。得到了746個meristematic-dominant genes,723個differentiated-dominant genes (Supple-mentary Figure S5)。我們發(fā)現(xiàn)在分生顯性基因的TSSs附近的mu element插入(無論是UniformMu和Somat-icMu)比在分化顯性基因的TSSs附近的muelement插入富集得高得多(Figure4B)妻熊。這種富集是TSSs的夸浅,TTSs不存在,這與我們之前的觀察結(jié)果是一致的(Figure 4C)扔役。還發(fā)現(xiàn)帆喇,在分生組織中,中等表達(dá)bin8-12中的Ds 富集較高(Figure 4A)亿胸,這可能是由于Ds elements對中等表達(dá)基因的偏好坯钦。與這一觀察結(jié)果一致,我們觀察到在meristematic-dominant genes集(Figure4B, C)中侈玄,在TSS附近有較低水平的Ds 富集婉刀,在較小程度上,TTSs也有較低水平的Ds富集序仙,這表明在分生組織中中等水平表達(dá)的基因(差異顯性基因集)中突颊,Dselement的插入頻率較高。這些結(jié)果表明潘悼,Mu 和Ds element更傾向于靶向整合分生組織或快速分裂的細(xì)胞中表達(dá)的基因律秃。在Mu的例子中,這些基因在這些細(xì)胞中高水平表達(dá)治唤。在Ds的例子下棒动,基因在這些細(xì)胞中中等水平的表達(dá)。
重新評價精確靶向轉(zhuǎn)座子的誘變能力
????在基因內(nèi)部或附近區(qū)域插入TE可能會或可能不會擾亂宿主基因船惨,這取決于TE整合的位置。為了評價精確靶向轉(zhuǎn)座子的誘變能力缕陕,我們分別檢測了注釋玉米和蒼蠅基因的5'和3'近端的Mu元素和P元素的富集情況以及亞基因特征粱锐,進(jìn)行了卡方檢驗。與上面的薈萃分析一致(Figure1)榄檬,Mu elements 和P elements的插入都顯示在基因的5‘端(特別是TSS和5’UTR上游的200bp)有很強(qiáng)的富集作用(Table1)卜范。Muelement 在5'UTR 富集整合 (64.4-fold倍 for SomaticMu;90.1-fold for UniformMu) 相對于在編碼序列內(nèi)整合 (8.8-fold forSomaticMu; 7.0-fold forUniformMu) ( all Pvalues less?than 1E?5,卡方檢驗)鹿榜。與隨機(jī)機(jī)會相比,基因5'端的P element的富集比P element插入編碼序列的頻率降低了4倍锦爵。事實上舱殿,在P element 18213插入的總數(shù)中,只有729個险掀,即4%被插入到編碼序列(CDS)中沪袭。
? ??假設(shè)TE插入到基因的 5' 端比CDS插入的危害要小,進(jìn)一步研究了精確靶向TES插入對鄰近基因表達(dá)的影響程度死宣。為了做到這一點伟恶,我們計算了一系列新的Muelement插入的結(jié)果,其中大多數(shù)是進(jìn)入啟動子或5'UTRs毅该,通過實驗檢測 mu element 插入引起的基因表達(dá)水平的變化博秫。有活躍Mu轉(zhuǎn)座子的B73玉米品系與無活躍Mu轉(zhuǎn)座子的Mo17玉米品系雜交。利用Miseq-based amplicon-sequencing pipeline對后代中分離的Mu元件插入片段進(jìn)行測序(42)眶掌,并調(diào)用B73-Mo17 SNPs挡育,通過深度測序?qū)Σ迦牒臀床迦隡u元件的親本等位基因的相對轉(zhuǎn)錄水平進(jìn)行定量(Supplementary Figure S6)。
我們發(fā)現(xiàn)朴爬,四個啟動子的插入都沒有改變鄰近基因的表達(dá)即寒。四分之一的5‘非編碼區(qū)插入(20個中的5個)導(dǎo)致了knockout?敲除或強(qiáng)烈的knockdown 敲除效應(yīng),7個內(nèi)含子插入中的一個導(dǎo)致了knockout?敲除效應(yīng)(Table2)召噩∧刚裕總體而言,在總共33個插入片段中蚣常,只有11個顯著降低了基因表達(dá)市咽,只有兩個完全消除了表達(dá),所有這些插入片段都在距離基因200bp的范圍內(nèi)抵蚊。這些結(jié)果表明施绎,宿主基因TSSs附近的mu element插入通常與數(shù)量相關(guān),在許多情況下贞绳,可忽略對附近基因表達(dá)的功能后果谷醉。
????在更長的時間尺度上冈闭,凈化選擇有望清除只有微弱有害影響的插入突變俱尼。為了評估較老的Mu元素插入上的選擇壓力,我們檢測了一類被稱為pack - mule的突變體樣元素萎攒,其中許多是具有分叉末端反向重復(fù)序列(TIRs)的基因組中的古老插入遇八。在TSSs周圍,1358株pack - mule在玉米和2959株pack - mule在水稻中的分布表明耍休,在兩個物種中刃永,Pack-MULE數(shù)僅在TSSs上游達(dá)到峰值,并在TSSs上游1kb處減少到接近背景水平(Figure5A, B)羊精。這與我們在玉米上觀察到的新插入非常相似斯够。然而,Pack-MULE插入基因體的數(shù)量急劇下降(Figure5A, B),表明該地區(qū)對老基因的選擇壓力读规。在玉米基因組中的其他dna轉(zhuǎn)座子家族中抓督,包括HAT、Mariner束亏、CACTA铃在、Harbinger和Helitrons以及LTR反轉(zhuǎn)錄轉(zhuǎn)座子,都發(fā)現(xiàn)在tsss下游的基因轉(zhuǎn)座子插入的代表性較低枪汪,這與這一觀察結(jié)果一致涌穆,也與反對插入基因的選擇一致 (Figure5C-H)。相反雀久,我們發(fā)現(xiàn)野生黑腹果蠅基因組中注釋的Pelement與從頭插入的Pelement呈現(xiàn)相同的分布(Figures1B and 5I)宿稀。據(jù)推測,這是因為Pelement只存在于野生黑腹果蠅基因組中較短的一段時間赖捌,在野生種群中不太可能是固定的或純合的祝沸。
DISCUSSION
????我們對多個從頭轉(zhuǎn)座子集合的比較基因組分析揭示了兩種轉(zhuǎn)錄相關(guān)TE整合策略(A和B) (Figure6A)桑驱。A型精確定位策略被兩種最活躍的動植物轉(zhuǎn)座子Mu和P元素所采用竭恬,其特征是關(guān)聯(lián)非常緊密。TE整合與Pol II依賴的轉(zhuǎn)錄起始之間的作用熬的。這些TE在鄰近注釋的TSSs處富集痊硕,特別是在高水平表達(dá)的基因中。此外押框,在玉米中岔绸,Mu元件優(yōu)先插入到活躍分裂的細(xì)胞中高水平表達(dá)的基因中。
? ??與A型策略相比橡伞,采用B型策略的TE家族的靶位點(Ds和Pb)在中表達(dá)基因的TSSs和TTSs上都富集盒揉,而且B型TE插入靠近TSSs的富集水平低于B型(Figure6A,B)兑徘。A型和B型策略根據(jù)注釋基因附近具有代表性的TE分布曲線的單峰和雙峰形狀而命名预烙,這兩種分布曲線分別令人聯(lián)想到阿拉伯駱駝的單峰和雙峰駝的特性。鑒于我們分析的不同TE家族編碼的轉(zhuǎn)座酶在系統(tǒng)發(fā)育上是遠(yuǎn)親關(guān)系道媚,轉(zhuǎn)錄相關(guān)的A型和B型策略表明,植物和動物中不同TE家族之間存在趨同進(jìn)化過程。這是第一個在植物和動物中顯示出這種關(guān)系的比較研究最域。
????那些缺乏與POL II轉(zhuǎn)錄啟動或終止相關(guān)的TEs屬于C型組。POLⅡ非依賴性整合可以是轉(zhuǎn)錄無關(guān)的翘魄,也可以是轉(zhuǎn)錄相關(guān)的鼎天。與先前報道的睡美人轉(zhuǎn)座子類似,Tos17插入與TSSs或TTSs都沒有關(guān)聯(lián)暑竟,但富含在中等水平表達(dá)的基因的基因體中?(Figure3C, Supplementary Figure S1C and S1F)斋射。相比之下,Mb插入與TTSs表現(xiàn)出輕微的相關(guān)性但荤,而與TSSs沒有相關(guān)性 (Figure1B and E)罗岖,實際上在靶向頻率和基因表達(dá)水平之間呈現(xiàn)負(fù)相關(guān) (Figure3B)。Spm也顯示了在中到高水平表達(dá)的基因附近的靶向富集腹躁,但這種TE優(yōu)先靶向宿主基因組的基因間區(qū)域桑包。總體而言纺非,C型策略可能涉及只與宿主轉(zhuǎn)錄活動間接相關(guān)的基因組靶向機(jī)制哑了。
? ??先前的報告為一些DNA轉(zhuǎn)座子的開放染色質(zhì)靶向模型提供了證據(jù)(12,53)。研究結(jié)果挑戰(zhàn)了這個模型的普遍性铐炫,因為它沒有完全解釋a型整合策略垒手,盡管精確靶向a型te的插入位點確實在一定程度上與一組與開放染色質(zhì)相關(guān)的染色質(zhì)修飾共定位(12)。在植物和動物中倒信,大多數(shù)開放的染色質(zhì)區(qū)域僅僅位于tss的上游和tts的下游(54,55)科贬。在TSSs和TTSs處或附近也有報道稱玉米和果蠅中存在Pol II(55,57)。Mu和P元素插入的分布讓人聯(lián)想到Pol II在TSSs附近的占據(jù)鳖悠,而不是在TTSs附近榜掌,這表明典型的a型te的整合與轉(zhuǎn)錄起始密切相關(guān),而不僅僅與Pol II的占據(jù)有關(guān)乘综。此外憎账,我們還證明了a型轉(zhuǎn)位策略是針對Pol II的,而不是其他RNA聚合酶卡辰,如Pol I胞皱、Pol IIl或植物特異性Pol IV和Pol V(圖2)邪意。在TSSs附近的P整合被歸因于這些區(qū)域復(fù)制起源的富集,提示Po II轉(zhuǎn)錄起始是間接的(13)反砌。提出的模型包括通過轉(zhuǎn)座子靶向未激活的復(fù)制原點雾鬼,結(jié)合復(fù)制后切除位點的同源修復(fù)。雖然這個模型提供了一種增加元件拷貝數(shù)的機(jī)制宴树,但與復(fù)制起點的關(guān)聯(lián)并不能立即解釋觀察到的P和Mu靶向與基因表達(dá)水平的相關(guān)性(Figure3A, B)策菜。......
? ??分析強(qiáng)調(diào)了兩個可以促進(jìn)TE存活和快速增殖的特征:組織特異性轉(zhuǎn)位和由于精確靶向而最小化對附近基因功能的負(fù)面影響。P元素的組織特異性轉(zhuǎn)座是正確的酒贬,它只在種系中表達(dá)功能性轉(zhuǎn)座酶(58)又憨。在植物。分生組織-組織特異性轉(zhuǎn)位也有助于TE的快速和可遺傳的擴(kuò)增锭吨,因為積極分裂的植物細(xì)胞(特別是花組織和分生組織)比那些不分裂的更有可能傳遞給下一代蠢莺。在這方面,我們觀察到耐齐,在分生組織富集的組織中浪秘,Mu和Ds元件對目標(biāo)表達(dá)水平(Mu高表達(dá),Ds中表達(dá))的基因有明確的靶向偏好(Figure4B)埠况。鑒于本研究已經(jīng)確定的大量體細(xì)胞Mu插入顯示出與生殖發(fā)育傳遞Mu插入相似的插入偏好耸携,Mu元件可能主要避免插入主要在終端分化細(xì)胞中表達(dá)高水平的基因,而不是針對 “生殖發(fā)育” 體系辕翰。
? ??Mu和P元件采用的a型(TSS-targeting)策略使這些te具有利用自主元件轉(zhuǎn)錄的許可環(huán)境的能力夺衍。這對于TEs在富含異染色質(zhì)的基因組(如玉米基因組)中的存活尤為重要。這種策略有可能對宿主基因表達(dá)和功能造成有害影響喜命。事實上沟沙,我們發(fā)現(xiàn),與隨機(jī)插入相比壁榕,CDS區(qū)域的Mu插入更有可能是破壞性的矛紫,其頻率為7-9倍fold。盡管如此牌里,在TSSs附近的Mu插入有更高的富集(64-90倍)颊咬,并且啟動子和5' UTR中的大多數(shù)Mu插入對基因表達(dá)影響很小或沒有影響。這表明牡辽,考慮到Mu元件對靶基因區(qū)域的傾向喳篇,Mu元件的致突變性實際上比預(yù)期的要小得多,因為Mu元件插入和TSSs之間的緊密聯(lián)系使宿主適應(yīng)度的降低最小化态辛。鑒于此麸澜,而且絕大多數(shù)的基因Mu元素插入到5' UTR中。我們建議將Mu作為遺傳資源的研究人員謹(jǐn)慎對待這些插入奏黑,因為它們不太可能是 knockout 敲除炊邦。P 元素也很少插入cds编矾,可能是因為它們也精確地針對TSS。雖然P元件靶向啟動子和5' UTR的作用有待進(jìn)一步研究铣耘。類似地洽沟,盡管MITE?TE插入傾向于進(jìn)入或接近基因,但對基因表達(dá)的影響也很小蜗细,盡管這可能部分是由于其體積小(59)∨辏總的來說炉媒,這些數(shù)據(jù)表明,對于某些TE昆烁,選擇傾向于插入基因吊骤,但破壞性最小。Mu和P元素作為高效誘變劑的歷史觀點可能是由這樣一個事實形成的静尼,即許多由這些元素引起的插入突變在突變表型的篩選中被鑒定出來(60,61)白粉。更廣泛地說,在高等真核生物中鼠渺,幾乎所有已知的活性TE都是由于其誘變作用而首次被發(fā)現(xiàn)的鸭巴。很可能在自然種群中還有許多額外的活性TE尚未被識別,因為它們很少引起可見突變拦盹。
? ??我們對玉米和水稻中較老的MULE插入的分析表明鹃祖,這些元素的5' UTR插入最終會從基因組中清除,這表明靶向5' UTR的TEs在長期內(nèi)會受到凈化部分的影響普舆。有趣的是恬口,在近端啟動子MULE插入中,清除的效率似乎要低得多沼侣,在兩個物種中仍然大量存在祖能。
? ??TE家族通過采用不同的整合策略占有不同的基因組生態(tài)位。這反過來又影響了TE對宿主基因功能的影響程度蛾洛,并最終影響宿主基因組的進(jìn)化养铸。TE也被證明是非常寶貴的工具,無論是作為誘變劑還是轉(zhuǎn)化載體(62)雅潭。更深入地了解TEs如何針對基因組的特定區(qū)域進(jìn)行整合揭厚,有望使這些工具更有效和更精確。
文獻(xiàn):