茶樹是山茶科山茶屬的一員是尔,栽培比較廣的主要包括兩個(gè)變種:大葉茶變種(CSA殉了;又稱阿薩姆)和小葉茶變種(CSS;又稱中國茶變種)拟枚。近年來茶學(xué)研究者經(jīng)過不懈努力基于 NGS 測序技術(shù)公布了第一個(gè)大葉茶變種(CSA-YK10)基因組和一個(gè)小葉茶變種(CSS-SCZ)基因組薪铜,但是由于 NGS 技術(shù)所產(chǎn)生短 reads 的限制,通過 SMRT 長讀長測序技術(shù)解析具有龐大基因組且含有大量的重復(fù)序列的茶樹而言顯得尤為重要恩溅。
在這里隔箍,作者首先通過 Kmer 分析在二十多個(gè)代表性的小葉茶品種中選用雜合度較低的小葉茶良種碧云 CSS-BY(基因組雜合度約為1.22%)為材料,采用單分子實(shí)時(shí)測序(SMRT)和 Hi-C 技術(shù)將組裝獲得的約 ~2.85-Gb 的基因組序列(占基因組長度的~97.88%)掛載到了15條假染色體上(圖 1)脚乡,其 Contig N50長度為625.11Kb蜒滩,Scaffold N50長度高達(dá)195.68Mb,是之前報(bào)道的小葉茶變種舒茶早 CSS-SCZ 基因組的9.32倍和140.78倍奶稠「┘瑁基于同源比對(duì)和 de novo 預(yù)測該基因組含有74.13%的重復(fù)序列,其含量明顯大于先前報(bào)道的 CSS-SCZ 基因組注釋結(jié)果窒典,此外 CSS-BY 基因組中 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子含量是 CSS-SCZ 的2.5倍蟆炊。所有這些結(jié)果表明,除了茶樹品種之間基因組大小可能發(fā)生變化外瀑志,與以前的基于 NGS 的基因組相比,高質(zhì)量 CSS-BY 基因組明顯提高了重復(fù)序列發(fā)現(xiàn)與識(shí)別的能力。
(A)15條假染色體劈猪;(B)基因密度昧甘;(C)TEs 的分布;(D)Ty3-gypsy LTR-RTs 的分布战得;(E)Ty1-copia LTR-RTs 的分布充边;(F)DNA-TEs 的分布;(G)SSRs 的密度常侦;(H)葉(YL)浇冰、嫩芽(TS)、花(FB)聋亡、果(FR)和莖(ST)的轉(zhuǎn)錄表達(dá)密度 (I)基因組共線性分析肘习;
作者又對(duì) CSS-BY 和 CSS-SCZ 基因組共線性分析發(fā)現(xiàn)僅檢測到21.80%的共線基因,兩種小葉茶基因組共線性如此之低坡倔,令人難以置信漂佩,于是作者對(duì)兩個(gè)版本的 contig 數(shù)量進(jìn)行統(tǒng)計(jì),又對(duì)同源區(qū)域進(jìn)行比對(duì)分析罪塔,發(fā)現(xiàn) CSS-BY 基因組 contig 數(shù)量少投蝉、序列長,且能準(zhǔn)確地鑒定幾乎所有的轉(zhuǎn)座子(圖2)征堪,說明 SMRT 測序和組裝生成了一個(gè)具有較高連續(xù)性組裝結(jié)果瘩缆,該版本包含準(zhǔn)確的長片段信息。
早在大葉茶變種 CSA-YK10基因組中曾報(bào)導(dǎo)茶樹基因組中重復(fù)序列含量極高(約占整個(gè)基因組的80.9%)佃蚜,其中含量最豐富的 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子占到整個(gè)基因組的67.21%咳榜。高質(zhì)量且能識(shí)別所有轉(zhuǎn)座元件的 CSS-BY 基因組為了解 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子是如何促成其大基因組的生成提供了一個(gè)良好的基因組資源。于是作者共提取13172個(gè) Ty3-gypsy 和4630個(gè) Ty1-copia 逆轉(zhuǎn)錄轉(zhuǎn)座子序列構(gòu)建系統(tǒng)發(fā)育樹(圖3)爽锥,聚類結(jié)果共產(chǎn)生11個(gè)家族涌韩,其中 Tat 和 Tekay 家族占 Ty3-gypsy 超家族的98%,其在基因組進(jìn)化過程中大規(guī)模擴(kuò)增很大程度上促成了龐大的茶樹基因組氯夷。作者又添加來自 CSA-YK10的4579個(gè) Ty3-gypsy 和1406個(gè) Ty1-copia 逆轉(zhuǎn)錄轉(zhuǎn)座子序列聯(lián)合構(gòu)建系統(tǒng)發(fā)育樹(圖4)臣樱,發(fā)現(xiàn)了類似的結(jié)果,暗示它們可能經(jīng)歷了相似的進(jìn)化歷史腮考。
作者又進(jìn)一步追蹤 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子如何影響茶樹基因組大小變異的動(dòng)態(tài)歷史踩蔚。序列插入時(shí)間估計(jì)表明在過去的大約一百萬年里棚放,Ty3-gypsy 超家族(比如 Tat 家族)在基因組里一開始快速擴(kuò)增占有明顯優(yōu)勢,后來擴(kuò)增速率迅速下降馅闽,取而代之的是 Ty3-gypsy 超家族的 Tekay 家族和非自治(non-autonomous)的 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子家族快速爆發(fā)飘蚯,進(jìn)而推動(dòng)了茶樹基因組大小的變異與進(jìn)化(圖 5A)馍迄。然后作者又使用來自5個(gè)組織的 RNA-seq 數(shù)據(jù)來驗(yàn)證這一結(jié)論,結(jié)果表明約63.59%的 reads 比對(duì)到多拷貝非自治 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子家族(例如TEL004局骤;TEL013攀圈;TEL019),與多拷貝 Ty1-copia 家族(TEL003)和 Ty3-gypsy 家族(TEL001)相比峦甩,顯示出較高的基因表達(dá)水平(圖5B)赘来。
(A)Ty1-copia(藍(lán)色)、Ty3-gypsy(綠色)和非自治(黃色)LTR逆轉(zhuǎn)錄轉(zhuǎn)座子的插入時(shí)間凯傲;(B)LTR逆轉(zhuǎn)錄轉(zhuǎn)座子家族轉(zhuǎn)錄表達(dá)水平
接下來研究者又提出一個(gè)新的疑問犬辰?非自治 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子(本身不編碼轉(zhuǎn)座所需的蛋白、依賴于其它家族編碼的蛋白完成轉(zhuǎn)座過程)是如何阻礙自主逆轉(zhuǎn)錄子擴(kuò)增進(jìn)而影響基因組大小的變異與進(jìn)化冰单。于是作者就對(duì)基因組注釋到的4000余個(gè)非自治 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子根據(jù)蛋白編碼結(jié)構(gòu)域的不同分為四組(包括 gag幌缝、pol 中的 PR、RT 和 IN 結(jié)構(gòu)域)球凰,一般自治 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子中間區(qū)域至少包含2個(gè)基因狮腿,即 gag 和 pol 基因。令人驚訝的是呕诉,約94.23%LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子相關(guān)轉(zhuǎn)錄本的表達(dá)與 gag 和 pol 基因無關(guān)缘厢,只有5.77%的逆轉(zhuǎn)錄轉(zhuǎn)座子相關(guān)轉(zhuǎn)錄本比對(duì)到至少一個(gè)上述基因。因此甩挫,該研究又發(fā)現(xiàn)了另外一個(gè)有趣的現(xiàn)象贴硫,即近期爆發(fā)的具有高表達(dá)水平非自主 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子可能通過減少逆轉(zhuǎn)錄轉(zhuǎn)座子所需酶的供應(yīng),進(jìn)而影響了茶樹基因組中 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子的轉(zhuǎn)座和擴(kuò)增(圖 6)
圖6 茶樹基因組中 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子家族中的“搭便車”的非自治轉(zhuǎn)座子的進(jìn)化動(dòng)態(tài) (A)LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子的插入時(shí)間伊者;(B)TEL001反轉(zhuǎn)錄轉(zhuǎn)座子家族的四組結(jié)構(gòu)特征英遭;(C)TEL001逆轉(zhuǎn)錄轉(zhuǎn)座子家族內(nèi)部基因區(qū)域的長度分布。結(jié)語
通讀全文不難發(fā)現(xiàn)文章的亮點(diǎn)有三:1)基于 SMRT 長讀長測序技術(shù)組裝了一個(gè)高度重復(fù)亦渗、雜合且相對(duì)較大的茶樹染色體級(jí)別基因組挖诸;2)高度連續(xù)且準(zhǔn)確的基因組可以完全識(shí)別所有類型全長 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子,探究了茶樹基因組大小變異和進(jìn)化動(dòng)態(tài)法精;3)研究發(fā)現(xiàn)非自治 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子的迅速崛起是競爭性利用同家族自治的 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子的逆轉(zhuǎn)錄酶來完成轉(zhuǎn)座和擴(kuò)增這一有趣現(xiàn)象多律,為后續(xù)探究 LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子的科學(xué)研究者提供了一個(gè)思路借鑒。
參考文獻(xiàn):
Zhang Qun-Jie,Li Wei,Li Kui et al. The Chromosome-Level Reference Genome of Tea Tree Unveils Recent Bursts of Non-autonomous LTR Retrotransposons to Drive Genome Size Evolution.[J] .Mol Plant, 2020.