2.轉(zhuǎn)座子(轉(zhuǎn)載)

轉(zhuǎn)座子

轉(zhuǎn)座子(transposable element):或稱跳躍基因沃饶,是一種可以改變其在基因組中位置的DNA序列胰锌,有時會產(chǎn)生或逆轉(zhuǎn)突變治泥,改變細(xì)胞的遺傳特性和基因組大小暂幼。

轉(zhuǎn)座子按照轉(zhuǎn)座方式的不同筏勒,可分為兩大類:I型轉(zhuǎn)座子(Class I elements),II型轉(zhuǎn)座子(Class II elements)旺嬉。

I型轉(zhuǎn)座子又叫反轉(zhuǎn)座子(retrotransposon)管行,其在轉(zhuǎn)座時,會先以DNA為模板鹰服,在RNA聚合酶II的作用下病瞳,轉(zhuǎn)錄成一段mRNA,然后再以這段mRNA為模板反轉(zhuǎn)錄成cDNA悲酷,最后在整合酶的作用下將這段cDNA整合到基因組上新的位置套菜。根據(jù)反轉(zhuǎn)座子轉(zhuǎn)座機(jī)制,人們形象地稱其為“復(fù)制-粘貼”型轉(zhuǎn)座原件设易。

II型轉(zhuǎn)座子也叫做轉(zhuǎn)座子(transposon)逗柴,在轉(zhuǎn)座酶的作用下,II型轉(zhuǎn)座子從原來的位置解離下來顿肺,再重新整合到染色體上的其他位置戏溺,原來的位置由于轉(zhuǎn)座子解離形成的斷鏈渣蜗,會在DNA修復(fù)的機(jī)制下被修復(fù)完整。故II型轉(zhuǎn)座子轉(zhuǎn)座的機(jī)制被形象地稱為“剪切-粘貼”旷祸。

根據(jù)參考文獻(xiàn)對轉(zhuǎn)座子的分類耕拷,總結(jié)如下:


圖1??轉(zhuǎn)座子主要分類

1. LTR 與重復(fù)序列、轉(zhuǎn)座子的關(guān)系LTR-RTs 是 Long terminal repeat-retrotransposons 的縮寫托享,中文名是長末端重復(fù)反轉(zhuǎn)座子骚烧。LTR-RTs 名字中既有重復(fù)、又有轉(zhuǎn)座子闰围,那么它和重復(fù)序列赃绊、轉(zhuǎn)座子是什么關(guān)系呢?


圖1??重復(fù)序列主要分類

重復(fù)序列:根據(jù)重復(fù)區(qū)域是否連續(xù)可分為串聯(lián)重復(fù)序列和散在重復(fù)序列(又名轉(zhuǎn)座子羡榴、轉(zhuǎn)座元件)兩大類碧查,前者相連,后者不相連校仑。

轉(zhuǎn)座元件(transposable elements, TEs) 又稱轉(zhuǎn)座子:指在基因組中能夠移動或復(fù)制忠售,并可以整合到基因組新位點(diǎn)的一段 DNA 序列。根據(jù)轉(zhuǎn)座過程是否形成 RNA 中間體肤视,轉(zhuǎn)座子可分為 DNA 轉(zhuǎn)座子和反轉(zhuǎn)錄轉(zhuǎn)座子档痪。反轉(zhuǎn)錄轉(zhuǎn)座子是以 RNA 為媒介涉枫,伴有反轉(zhuǎn)錄過程邢滑,以復(fù)制-粘貼的方式在基因組的新位置產(chǎn)生一個新的拷貝。DNA 轉(zhuǎn)座子的轉(zhuǎn)座機(jī)制則是剪切-粘貼的形式愿汰。

LTR-RTs :是反轉(zhuǎn)座子中的一種困后,因其兩側(cè)存在長的末端重復(fù)而得名。不含長末端重復(fù)的反轉(zhuǎn)座子統(tǒng)稱 non-LTR-RTs衬廷,主要包含短散在重復(fù)(SINE)和長散在重復(fù)(LINE)摇予。

2. LTR的分類

動植物基因組中存在大量轉(zhuǎn)座子,尤其是植物基因組中吗跋。LTR ?因其數(shù)量多且 LTR 長度巨大侧戴,在植物轉(zhuǎn)座子中具有較高的基因組含量。在玉米基因組中 LTR 占基因組含量高達(dá) 75% 跌宛,山蒼子基因組中 LTR 占比高達(dá) 47%酗宋,所以基因組 LTR 的鑒定尤為重要。反轉(zhuǎn)錄轉(zhuǎn)座子根據(jù)轉(zhuǎn)座元件結(jié)構(gòu)的完整性和轉(zhuǎn)座特點(diǎn)可分為自主元件(編碼轉(zhuǎn)座酶)和非自主元件(自身不編碼轉(zhuǎn)座酶)疆拘。非自主轉(zhuǎn)座元件需在自主元件的協(xié)助下才能發(fā)生轉(zhuǎn)座蜕猫。完整的 LTR-RTs 由兩端序列完全一致的末端重復(fù)、GAG(衣殼蛋白)和 POL 構(gòu)成哎迄,后生動物中含 ENV (包膜蛋白)回右。其中 POL 包含 AP(天冬氨酸酶)隆圆、INT(整合酶)、 RT(逆轉(zhuǎn)錄酶)和 RH(核糖核酸酶 H)翔烁,是 LTR 能否自主轉(zhuǎn)座的關(guān)鍵蛋白渺氧。LTR 分類見圖 2,在高等植物中主要主要包括 Ty1/Copia和 Ty3/Gypsy 兩個超家族蹬屹,二者差別在于 INT 的位置不同阶女。


圖2??LTR?的分類[1]? ? ? P: 植物? M: 后生動物? F :真菌? O:其他??


3. LTR的生物學(xué)意義

不少研究表明活性 LTR 插入到關(guān)鍵基因內(nèi)或周邊會導(dǎo)致性狀改變。2019 年哩治,發(fā)表在 Nature Communications 的《A high-quality apple genome assembly reveals the association of a retrotransposon and red fruit colour》文章中揭示蘋果紅皮表型形成與一個 LTR-RT 插入相關(guān)秃踩。MdMYB1 有 MdMYB11-1、MdMYB1-2 和 MdMYB1-3 三個等位基因业筏,其中 MdMYB1-1 是控制蘋果果皮花青素合成的單一顯性基因憔杨。相較于黃蘋果基因組,在紅蘋果基因組的 MdMYB1-1 基因啟動子上游有一個 LTR-RT(命名為 redTE)插入蒜胖,并經(jīng)過 PCR 驗(yàn)證是紅蘋果中存在一段特異的序列(圖 3)风题。redTE 作為一種增強(qiáng)子谷遂,增強(qiáng) MdMYB1-1 對光的敏感性,從而累計(jì)花青素,形成紅色表皮龟梦。


圖3? 蘋果紅皮 LTR-RT 插入[2]??


此外,LTR?的擴(kuò)張和收縮也影響著基因組大小菊卷,文章小葉茶文獻(xiàn)《Mol Plant 項(xiàng)目文章 | 第一個茶樹染色體級別高質(zhì)量參考基因組發(fā)布》中囱淋,揭示小葉茶基因組中 LTR 的擴(kuò)張尤其是非自主 LTR 的擴(kuò)張是小葉茶基因組龐大的主要原因。

4. LTR-RTs 的結(jié)構(gòu)特征

典型的 LTR-RTs 的結(jié)構(gòu)有 5 個特征樊拓,其模式圖見 4-1纠亚,各特征意義如下:


圖 4-1? 典型 LTR 的結(jié)構(gòu)特征[3]?


(1) TSR(TSD): 目標(biāo)重復(fù)位點(diǎn),是 4~6bp 的短的重復(fù)序列筋夏,在 5’LTR and 3’LTR 兩側(cè)蒂胞,是轉(zhuǎn)座子插入的信號。

(2) 5’LTR and 3’LTR : ?LTR 兩端序列完全一致的末端重復(fù)条篷, TG..CA box骗随,完整的 LTR 均含有此結(jié)構(gòu)。LTR 長度一般在 85~5000bp赴叹。

(3) PBS(primer binding site) 引物結(jié)合位點(diǎn): 在 5’LTR 的末端鸿染,可與一些 tRNA 3’ 末端互補(bǔ)結(jié)合的一段 18bp 左右的序列,是反轉(zhuǎn)錄的第一步稚瘾。

(4)?蛋白區(qū)域: 長度通常在 1000~15000bp牡昆。

GAG:衣殼蛋白。

POL:包含4中酶,由AP(天冬氨酸酶)丢烘、IN(INT,整合酶)柱宦、RT(逆轉(zhuǎn)錄酶)、RH(核糖核酸酶)播瞳,LTR 能否自主轉(zhuǎn)座的關(guān)鍵原因掸刊。

ENV:包膜蛋白,后生動物中存在赢乓。

(5) PPT:3’LTR 的起始位置短的富含嘌呤的序列忧侧,11~15bp。

LTR 在生物體內(nèi)歷經(jīng)成千上萬年的進(jìn)化牌芋,發(fā)展出許多存在形式(圖 4-2)蚓炬。我們通常將包含兩個相對完整的 LTRs 和已識別的 PPT 和 PBS 位點(diǎn)的元素,且兩側(cè)有 TSD 的 LTR 定義為 Intact LTR(A)躺屁。由于 LTR-RTs 兩端序列非常相似肯夏,LTR-RTs 內(nèi)可發(fā)生重組,導(dǎo)致內(nèi)部元件消失犀暑,形成 solo LTR(C)驯击,而 solo LTR 的數(shù)量表明了一個基因組中 LTR 去除的頻率和效率。此外 LTR 發(fā)生缺失耐亏、易位可形成截?cái)嗟?LTR(B)徊都。LTR 也會經(jīng)常插入到其他 LTR 內(nèi)部區(qū)域,形成嵌套 LTR(D)广辰。因存在這些突變機(jī)制暇矫,實(shí)際上完整的 LTR-RTs (A)只占基因組中所有 LTR-RT 相關(guān)序列的一小部分。


5. LTR-RTs 鑒定方法

LTR-RT 的鑒定方法基本歸于三類:從頭預(yù)測轨域、基于結(jié)構(gòu)預(yù)測袱耽、基于同源比對杀餐。LTR_STRUC[5]?是一款最早的從頭預(yù)測 LTR 的軟件干发,LTR_finder[3]?和 LTRharvest[6]?是目前為止鑒定 LTR 最敏感的程序,但假陽性依然很高史翘。RepeatMasker[7]?基于數(shù)據(jù)庫枉长,使用同源方法來預(yù)測 LTR,但不同物種 LTR 差異較大琼讽,構(gòu)建物種特有的 LTR 庫非常必要必峰。在 2017 年密歇根州立大學(xué)園藝系的 Shujun Ou 團(tuán)隊(duì)開發(fā) LTR_retriever[4]?平臺用于 LTR 的鑒定,文章發(fā)表在 Plant Physiology 上钻蹬。這是一款整合軟件吼蚁,以一個或多個 LTR 預(yù)測軟件鑒定 LTR 的結(jié)果作為輸入文件,通過不同模塊(圖 5-1)對 LTR 進(jìn)行過濾和修正來對預(yù)測軟件的預(yù)測結(jié)果進(jìn)行整合和調(diào)整,以得到非冗余精準(zhǔn)且完整的物種特異 LTR 庫肝匆,再使用 RepeatMasker[7]?進(jìn)行預(yù)測


圖 5-1??LTR_retriever 整合模塊[4]??


LTR_retriever 軟件從 sensitivity(敏感性)粒蜈、specificity(特異性)、accuracy(準(zhǔn)確性)旗国、precision(精確度)四個維度對 LTR 鑒定結(jié)果進(jìn)行評估枯怖,其具體意義見圖 5-2。以真實(shí) LTR 和非 LTR 序列作為參考庫能曾,使用軟件進(jìn)行預(yù)測度硝。對預(yù)測結(jié)果分為以下四類:

TP:真陽性,真實(shí)的 LTR寿冕,被準(zhǔn)確預(yù)測出

FN:假陰性 蕊程,真實(shí)的 LTR,未被準(zhǔn)確預(yù)測出

TN:真陰性 驼唱,非 LTR 序列未被預(yù)測當(dāng)成 LTR

FP:假陰性存捺,非 LTR 序列被當(dāng)成 LTR

從下圖公式可知敏感性代表對真正 LTR 的檢出能力,特異性代表排除非 LTR 序列的能力曙蒸,精確性代表正確檢出的能力捌治,精確度代表檢出結(jié)果的真陽性率,精確度越高則表明結(jié)果越可靠纽窟。

圖 5-2? 鑒定結(jié)果評估指標(biāo)[8]


使用 LTR_retriever 對現(xiàn)有軟件預(yù)測 LTR 結(jié)果進(jìn)行肖油,評估結(jié)果(圖 5-3)顯示 LTR_retriever 明顯優(yōu)于其他現(xiàn)有軟件,而 Shujun Ou 團(tuán)隊(duì)在 2019 發(fā)表在 Genome Biology 上的有關(guān)轉(zhuǎn)座子注釋方法中推薦 LTR 的鑒定方法是使用以 LTR_finder 和 LTRharvest 軟件鑒定結(jié)果作為 LTR_retriever 的輸入文件[8]臂港。

圖 5-3? 不同 LTR 鑒定方法比較[4]?


6. 諾禾致源為您定制專屬 LTR 分析方案

隨著三代測序技術(shù)的發(fā)展森枪,借助于超長度長序列,重復(fù)序列的組裝將會越來越精確审孽。人們對重復(fù)序列的研究會更加深入县袱,而 LTR 因其特殊的生物學(xué)意義被格外關(guān)注。LTR 的鑒定是 LTR 相關(guān)分析的基礎(chǔ)佑力,目前 LTR 分析方法尚無標(biāo)準(zhǔn)式散。表 6-1 是諾禾致源公司聯(lián)合發(fā)表的 LTR 分析相關(guān)文章列表。諾禾致源 LTR 分析流程中打颤,先使用 LTR_finder 和 LTRharvest 對 LTR 進(jìn)行鑒定暴拄,再利用 LTR_retriever 進(jìn)行整合,構(gòu)建非冗余精準(zhǔn)的物種特異 LTR 數(shù)據(jù)庫后使用同源預(yù)測方法進(jìn)行注釋编饺,再過濾掉假陽性乖篷,為您注釋出全面且精確的物種 LTR 序列,包括 intact LTR透且、solo LTR撕蔼、LTR 相關(guān)序列,非典型 LTR 等。明確 LTR 含量在基因組中的占比鲸沮,在染色體上的分布情況(圖 6-1)畅形。


圖?6-1? LTR?在染色上分布[9]

根據(jù)物種 LTR 蛋白結(jié)構(gòu)域數(shù)據(jù)庫,對 LTR-RT 進(jìn)行結(jié)構(gòu)注釋和家族鑒定诉探。LTR 分析很多日熬,可根據(jù)物種 LTR 鑒定結(jié)果、生物學(xué)意義進(jìn)行特殊分析肾胯,例如通過聚類分析竖席,確定基因組中主要的 LTR 屬于何種家族(圖 6-2);對 LTR 進(jìn)行插入時間評估分析敬肚,探索 LTR 的進(jìn)化動態(tài)(圖 6-3)毕荐;構(gòu)建特殊家族進(jìn)化樹,研究某類 LTR 的進(jìn)化等艳馒。此外憎亚,轉(zhuǎn)座子誘導(dǎo)的表觀遺傳變化經(jīng)常影響相鄰基因的差異表達(dá)并產(chǎn)生新的調(diào)控模式,例如前面所提的蘋果表皮顏色性狀文獻(xiàn)中檢測到紅蘋果 redTE 序列中有幾個區(qū)域明顯高度甲基化弄慰,這為 LTR 分析提供新的思路第美。


圖?6-2??LTR?家族鑒定[10]


圖?6-3??LTR?插入時間分析[11]??

參考文獻(xiàn):

[1] Wicker T, Sabot F, Hua-Van A, et al. A unified classification system for eukaryotic transposable elements[J]. Nature Rev. Genet., 2007, 8(12):973-982.

[2]?Liyi Zhang,Jiang Hu,Jingjing Li,et al. A high-quality apple genome assembly reveals the association of a retrotransposon and red fruit colour.[J]. Nature Communications, 2019.

[3] Zhao Xu and Hao Wang. LTR_FINDER: an efficient tool for the prediction of full-length LTR retrotransposons[J]. Nucleic Acids Research, 2007, 35: W265–W268.

[4] Ou S , Jiang N . LTR_retriever: a highly accurate and sensitive program for identification of long terminal-repeat retrotransposons[J]. Plant Physiology, 2017:pp.01310.2017.

[5] Mccarthy E M , Mcdonald J F . LTR_STRUC: a novel search and identification program for LTR retrotransposons[J]. Bioinformatics, 2003, 19(3):362-367.

[6] David Ellinghaus, Stefan Kurtz and Ute Willhoeft. LTRharvest, an efficient and flexible software for de novo detection of LTR retrotransposons[J]. BMC Bioinformatics, 2008, 9:18.

[7] A.F.A. Smit, R. Hubley& P. Green RepeatMasker at http://www.repeatmasker.org .

[8] Ou S , Jiang N . Benchmarking transposable element annotation methods for creation of a streamlined, comprehensive pipeline.[J]. Genome Biology, 2019,20:275.

[9] Zhao G , Zou C , Li K , et al. The Aegilops tauschii genome reveals multiple impacts of transposons[J]. Nature Plants, 2017.

[10] Zhang Qun-Jie,Li Wei,Li Kui et al. The Chromosome-Level Reference Genome of Tea Tree Unveils Recent Bursts of Non-autonomous LTR Retrotransposons to Drive Genome Size Evolution.[J] .Mol Plant, 2020.

[11] Ticao Zhang, et al.. Genome of Crucihimalaya himalaica, a close relative of Arabidopsis, shows ecological adaptation to high altitude.[J].PNAS, 2019.

轉(zhuǎn)載來源

鏈接:http://www.reibang.com/p/ae605d2799df

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市陆爽,隨后出現(xiàn)的幾起案子什往,更是在濱河造成了極大的恐慌,老刑警劉巖慌闭,帶你破解...
    沈念sama閱讀 221,273評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件别威,死亡現(xiàn)場離奇詭異,居然都是意外死亡驴剔,警方通過查閱死者的電腦和手機(jī)省古,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,349評論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來丧失,“玉大人豺妓,你說我怎么就攤上這事±ǎ” “怎么了科侈?”我有些...
    開封第一講書人閱讀 167,709評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長炒事。 經(jīng)常有香客問我,道長蔫慧,這世上最難降的妖魔是什么挠乳? 我笑而不...
    開封第一講書人閱讀 59,520評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上睡扬,老公的妹妹穿的比我還像新娘盟蚣。我一直安慰自己,他們只是感情好卖怜,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,515評論 6 397
  • 文/花漫 我一把揭開白布屎开。 她就那樣靜靜地躺著,像睡著了一般马靠。 火紅的嫁衣襯著肌膚如雪奄抽。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,158評論 1 308
  • 那天甩鳄,我揣著相機(jī)與錄音逞度,去河邊找鬼。 笑死妙啃,一個胖子當(dāng)著我的面吹牛档泽,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播揖赴,決...
    沈念sama閱讀 40,755評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼馆匿,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了燥滑?” 一聲冷哼從身側(cè)響起甜熔,我...
    開封第一講書人閱讀 39,660評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎突倍,沒想到半個月后腔稀,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,203評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡羽历,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,287評論 3 340
  • 正文 我和宋清朗相戀三年焊虏,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片秕磷。...
    茶點(diǎn)故事閱讀 40,427評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡诵闭,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出澎嚣,到底是詐尸還是另有隱情疏尿,我是刑警寧澤,帶...
    沈念sama閱讀 36,122評論 5 349
  • 正文 年R本政府宣布易桃,位于F島的核電站褥琐,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏晤郑。R本人自食惡果不足惜敌呈,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,801評論 3 333
  • 文/蒙蒙 一贸宏、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧磕洪,春花似錦吭练、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,272評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至谷异,卻和暖如春分尸,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背晰绎。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評論 1 272
  • 我被黑心中介騙來泰國打工寓落, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人荞下。 一個月前我還...
    沈念sama閱讀 48,808評論 3 376
  • 正文 我出身青樓伶选,卻偏偏與公主長得像,于是被迫代替她去往敵國和親尖昏。 傳聞我的和親對象是個殘疾皇子仰税,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,440評論 2 359

推薦閱讀更多精彩內(nèi)容