文獻(xiàn)解讀(一):植物基因組文獻(xiàn)

前言

? ? ????小編要分享的這篇文章是2020年10月19發(fā)表在Nature Communications雜志上垦缅,很榮幸征得作者本人(北京林業(yè)大學(xué)林木分子設(shè)計高精尖創(chuàng)新中心博士生 聶帥)的同意寫一篇解讀博客,在此表示感謝懂缕,小編水平有限谣殊,要是有解讀不準(zhǔn)確的地方歡迎廣大朋友指出澄惊。文章研究的是杜鵑花,主要做了三部分內(nèi)容:(1)基因組組裝注釋 (2)基因組進(jìn)化分析 (3)轉(zhuǎn)錄組數(shù)據(jù)表達(dá)分析硬贯。文章大體的研究思路和常見的基因組文章差不多焕襟,甚至沒有做常見的群體進(jìn)化分析,但是它盡然能發(fā)表在NC上饭豹,這和該文章的分析方法創(chuàng)新有關(guān)鸵赖,文章中用到了一些比較新的方法,并且得到了不錯的結(jié)果墨状,小編斷定該文章會出現(xiàn)很多的模仿者

文章鏈接:Chromosome-level genome assembly of a parent species of widely cultivated azaleas | Nature Communications

摘要

????????杜鵑花科(Ericaceae)的杜鵑(Azaleas)構(gòu)成了最多樣化的園藝植物之一卫漫,因其文化和經(jīng)濟(jì)重要性而聞名于世。本文中肾砂,作者報道了杜鵑(Rhododendron simsii)的染色體級別基因組組裝列赎,而R. Simsii是目前栽培種杜鵑的主要祖先。基因組分析顯示在杜鵑花科植物的輻射擴(kuò)散之前發(fā)生過一次全基因組復(fù)制事件包吝,并且該WGD事件可能作用于杜鵑開花時間的基因組結(jié)構(gòu)饼煞。小范圍的基因復(fù)制事件作用于參與杜鵑花色素合成的基因家族的擴(kuò)張。作者通過詳細(xì)的時間序列基因共表達(dá)網(wǎng)絡(luò)分析诗越,重構(gòu)了杜鵑花青素和類胡蘿卜素的代謝通路砖瞧,并揭示了其潛在的調(diào)控網(wǎng)絡(luò)。MYB嚷狞、bHLH和WD40轉(zhuǎn)錄因子可能共同作用于杜鵑中花青素積累的調(diào)控块促,尤其是花著色的起始階段;另外床未,WRKY轉(zhuǎn)錄因子在后期控制花的漸進(jìn)著色竭翠。本文的工作為理解開花時間和花著色調(diào)控的遺傳機(jī)制提供了基石,可能有助于未來加速杜鵑花的選擇育種

引自:Nature Communications:杜鵑花基因組

背景

? ? ? ? 杜鵑花(Rhododendron simsii)薇搁,又名映山紅斋扰,如下圖,雙子葉植物啃洋,我國十大名花之一传货,東亞特有,世界范圍上種植最廣泛的杜鵑花種類

? ? ? ? 盡管之前研究發(fā)表過兩版杜鵑花的基因組宏娄,但是都只做了二代測序问裕,做到contig版本水平,該文章用了pacbio數(shù)據(jù)绝编,并且掛載了Hi-C僻澎,最后得到13條染色體,為杜鵑花關(guān)鍵性狀遺傳機(jī)制研究和基因組編輯等高效分子設(shè)計育種的建立提供了重要基礎(chǔ)

組裝注釋

如下圖

(1)與另外兩版發(fā)表的基因組比十饥,該基因組用了pacbio數(shù)據(jù)和Hi-C數(shù)據(jù)窟勃,最后掛載到13條染色體上,全基因組大小為528.6M逗堵,共552條scaffold

(2)contig N50為2.23M秉氧,BUSCO評估93.68%,LAI評估18.10蜒秤,這幾個常見的基因組評估指標(biāo)都挺高的

(3)注釋得到34170個編碼基因汁咏,47.48%重復(fù)序列,rcRNA的注釋(482 tRNAs,64 rRNAs,211 miRNAs, 16 tRNAs and 158 snoRNAs)作媚,并給出了一些常用數(shù)據(jù)路能注釋到的基因的比例(NR攘滩,SwissProt,TrEMBL,Pfam,GO, KO)

注:基因組注釋主要包括重復(fù)序列注釋,基因結(jié)構(gòu)注釋纸泡,rcRNA注釋漂问,重復(fù)序列注釋的時候作者詳細(xì)鑒定了LTR-TRs和solo-LTR,Gypsy 占基因組11.90% ,Copia 占基因組4.00%蚤假,整個注釋工作比較復(fù)雜栏饮,用到的軟件非常的多,小編這里不進(jìn)行講述

基因組進(jìn)化分析

(1)比較基因組分析

圖1a:文章用了15個物種加2個外群磷仰,總共聚類得到806個orthogroups單拷貝袍嬉,然后構(gòu)建了ML樹,并計算了一下分歧時間和擴(kuò)張收縮灶平,將大分支Ericales上發(fā)生的WGD以及γ-WGT事件用不同的圖標(biāo)進(jìn)行了標(biāo)注伺通,可以看到,文章研究的杜鵑花和另外兩種杜鵑花在14.54個百萬年發(fā)生分化民逼,在大約78個百萬年的時候有一次WGD事件(使用軟件:OrthoFinder聚類泵殴,MUSCLE比對,IQ-TREE建樹拼苍,MCMCTree算分歧時間,CAFé計算擴(kuò)張收縮)

圖1b:計算Ks值推測WGD事件调缨,下邊的圖計算了五個物種自己的Ks值疮鲫,可以看到,在0.65的時候三種杜鵑花有一個峰值弦叶,在此發(fā)生的WGD事件俊犯,右上角的圖是葡萄與五個物種blast比對得到一對一的orthogroups,然后計算得到伤哺,計算方法見原文燕侠,推算成百萬年后結(jié)果和下邊的圖大概是一致的

圖1c:13條染色體circos圖,由外之內(nèi)分別是Ogre(a family of Gypsy LTRRT)立莉、Tekay(a family of?Gypsy LTR-RT)绢彤、Gypsy LTR-RT、Copia LTR-RT蜓耻、基因密度茫舶、GC含量、共線性區(qū)塊刹淌,該圖特點是將每條染色體的著絲粒位置標(biāo)出來了饶氏,并且將共線性區(qū)塊分成了WGD(紅色)和WGT(藍(lán)色)(咨詢了作者挽拂,杜鵑花的共線性區(qū)塊基本上來自WGD和WGT盏缤,每個區(qū)塊到底是WGD還是WGT沒有一個標(biāo)準(zhǔn),存在主觀性煎殷,個人以為很多物種的共線性區(qū)塊不僅僅來自加倍化事件蔼卡,作者在這拓展了很好的分析思路)

(2)基因復(fù)制分析

? ? 文章這里用了DupGen_finder軟件【DupGen_finder】喊崖,該軟件能將所有的基因分為五類復(fù)制基因:

WGD:全基因組復(fù)制

TD:串聯(lián)重復(fù)(相鄰的兩個重復(fù)基因)

PD:近端重復(fù)(相隔10個以內(nèi)基因的重復(fù)基因)

TRD:轉(zhuǎn)置重復(fù)(祖先和新基因座組成的重復(fù)基因)

DSD:分散重復(fù)(不相鄰也不共線性的重復(fù)基因)

SL:單拷貝

對這幾類概念感興趣的可以參考:Gene duplication and evolution in recurring polyploidization–diploidization cycles in plants | Genome Biology | Full Text


? ? 可以看到,全基因組所有的基因有89%可以分為這五類,不足的是這個軟件分類得到的結(jié)果假陽性也挺高的贷祈,該文章驗證了假陽性結(jié)果是可以接受的趋急,小編認(rèn)為這篇文章最大的亮點也是最大的創(chuàng)新在于將基因分成了五類復(fù)制然后進(jìn)行接下里的分析

圖2a:五類復(fù)制的ka/ks值箱線圖,可以發(fā)現(xiàn)PD和TD的值較其他三類明顯要高势誊,說明這兩類復(fù)制基因發(fā)生了更多的正選擇呜达,這兩類基因在植物應(yīng)對逆境環(huán)境中有重要的作用,尤其是TD粟耻,所以文章也重點關(guān)注了這兩類復(fù)制基因

圖2b:擴(kuò)張基因(6,754個)查近、復(fù)制基因、正選擇基因(1657個)的venn圖挤忙,先看最外去個大圈和最中間的黃色圈霜威,這是正選擇(EGFs)和五類復(fù)制的venn圖,能看到每一類復(fù)制并且擴(kuò)張基因的個數(shù)册烈,然后看大圈里邊的小圈戈泼,黃線以外是正選擇和復(fù)制基因的交集,黃線以內(nèi)是正選擇和擴(kuò)張基因的交集赏僧,最后發(fā)現(xiàn)所有發(fā)生正選擇和擴(kuò)張的基因中有57.6%由TD和PD引起

圖2c:對發(fā)生擴(kuò)張基因的五類復(fù)制進(jìn)行了GO富集大猛,可以看到,尤其是TD淀零,富集得到一些重要的途徑

圖2d:通過FLOR-ID數(shù)據(jù)庫得到與花周期相關(guān)的基因家族序列挽绩,然后鑒定得到杜鵑花有424個基因與花周期相關(guān),圖片展示了五類復(fù)制中與花周期有關(guān)的基因個數(shù)驾中,最后發(fā)現(xiàn)了一個OG0000614基因家族(高親和性蔗糖轉(zhuǎn)運蛋白唉堪,轉(zhuǎn)錄表達(dá)證明在花發(fā)育過程中持續(xù)高表達(dá))

轉(zhuǎn)錄組數(shù)據(jù)表達(dá)分析

(1)類胡蘿卜素和花青素/黃酮醇生物合成基因家族轉(zhuǎn)錄表達(dá)分析

????文章用了五個不同時期的花組織測了表達(dá)量(圖4a),大多數(shù)基因組文章測的是不同組織器官上的表達(dá)肩民,文章后邊用到了一個時間序列分析軟件來分析這有連續(xù)時間差異的五個時期表達(dá)量唠亚,這里也是文章的一個亮點和創(chuàng)新點

圖3:文章鑒定了和類胡蘿卜素、花青素/黃酮醇相關(guān)通路的基因家族此改,上圖是花青素/黃酮醇生物合成的三個重要途徑(Anthocyanin 花青素趾撵、Flavonoids類黃酮素、Flavonol黃酮醇)的基因家族表達(dá)分析共啃,藍(lán)色I(xiàn)D標(biāo)簽是TD占调,棕色標(biāo)簽是PD復(fù)制,在所有這些和花青素/黃酮醇生物合成相關(guān)的基因中TD/PD占了42%移剪,可見這兩類基因在花色調(diào)節(jié)過程中有很重要的作用究珊。但是有意思的是,TD/PD在所有花周期基因家族中的占比很凶菘痢(圖2d)剿涮,總共只有13.66%言津,花周期大多數(shù)由WGD引起。

?(2)時間序列共表達(dá)網(wǎng)絡(luò)分析

? ? 文章這里用了TO-GCNs(time-ordered genecoexpression networks)軟件取试,悬槽,時間序列基因共表達(dá)分析軟件,2019年發(fā)表在PNAS上瞬浓,文章鏈接【TO-GCNs】初婆,小編沒有用過,聽作者說挺好用的猿棉,輸入文件為全部的表達(dá)基因和關(guān)注的表達(dá)基因磅叛,就能得到共表達(dá)網(wǎng)絡(luò)。文章發(fā)現(xiàn)了8067個高表達(dá)基因(618個轉(zhuǎn)錄因子TFs和7,449個結(jié)構(gòu)基因)萨赁,用來構(gòu)建共表達(dá)網(wǎng)絡(luò)

圖4a:五個不同時期的花組織弊琴,又分成了三個大的時間段initial:T1 、transitional:T2,T3 杖爽、terminal:T4,T5

圖4b:TO-GCNs軟件做出來的時間序列表達(dá)網(wǎng)絡(luò)敲董,文章做的主要是618個TFs的共表達(dá)網(wǎng)絡(luò),分成了8個系列(結(jié)合表達(dá)熱圖定義成8個系列)掂林,粉色圈內(nèi)的點是五類轉(zhuǎn)錄因子家族(紫色點:MYB臣缀,橄欖色點:bHLH,綠寶石色:WD40泻帮,藍(lán)色:WRKY ,綠色:ERF)的共表達(dá)情況计寇,可以看到尤其在initial階段共表達(dá)特別明顯

圖c:五個不同時期8個系列的表達(dá)熱圖锣杂,可以看到分成八個系列能夠很好的展示出時間序列共表達(dá)情況

(3)initial階段花色有關(guān)基因共表達(dá)網(wǎng)絡(luò)分析

? ? 上邊的時間序列共表達(dá)看到,在initial階段共表達(dá)特別明顯番宁,所以文章對這個階段進(jìn)行了與花色有關(guān)基因的共表達(dá)分析元莫,最后推測MYB、bHLH蝶押、WD40三個轉(zhuǎn)錄因子家族可能構(gòu)成復(fù)合體從而共同決定著花色形成

圖5a:類胡蘿卜素生物合成共表達(dá)網(wǎng)絡(luò)

圖5b:花青素/黃酮醇生物合成共表達(dá)網(wǎng)絡(luò)

圖5c:花青素/黃酮醇相關(guān)基因和MYB踱蠢、bHLH、WD40基因家族的共表達(dá)

圖5d:F3H棋电、MYB茎截、bHLH、WD40在五個時期的表達(dá)熱圖

(4)terminal階段花色有關(guān)基因共表達(dá)網(wǎng)絡(luò)分析

? ? 除了initial階段赶盔,terminal階段也有很強(qiáng)的共表達(dá)企锌,所以最后還做了這個階段與花色有關(guān)的共表達(dá)分析


圖6a:花青素/黃酮醇生物合成共表達(dá)網(wǎng)絡(luò)

圖6b:F3H、MYB于未、C2H2撕攒、C3H陡鹃、GRAS五類轉(zhuǎn)錄因子基因上游2kb DNA結(jié)合位點情況

圖6c:F3H基因的分級調(diào)控

注:對于各個表達(dá)網(wǎng)絡(luò)更深層次的研究意義小編也是看的很糊涂,大家感興趣可以仔細(xì)研究原文抖坪,能力有限萍鲸,不再擴(kuò)展。

總結(jié)

(1)該研究結(jié)合 Pacbio 長讀長測序與Hi-C技術(shù)擦俐,獲得了映山紅杜鵑高質(zhì)量的基因組組裝和功能注釋

(2)分析了基因組組成特點脊阴,識別了開花調(diào)控基因和花色相關(guān)代謝通路

(3)基于時間序列的基因共表達(dá)分析揭示出與花色決定相關(guān)等級基因調(diào)控網(wǎng)絡(luò),識別到 MYB, bHLH, 和 WD40 三個轉(zhuǎn)錄因子家族成員可能構(gòu)成復(fù)合體從而共同決定著花色形成


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末捌肴,一起剝皮案震驚了整個濱河市蹬叭,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌状知,老刑警劉巖秽五,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異饥悴,居然都是意外死亡坦喘,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門西设,熙熙樓的掌柜王于貴愁眉苦臉地迎上來瓣铣,“玉大人,你說我怎么就攤上這事贷揽√男Γ” “怎么了?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵禽绪,是天一觀的道長蓖救。 經(jīng)常有香客問我,道長印屁,這世上最難降的妖魔是什么循捺? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮雄人,結(jié)果婚禮上从橘,老公的妹妹穿的比我還像新娘。我一直安慰自己础钠,他們只是感情好恰力,可當(dāng)我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著珍坊,像睡著了一般牺勾。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上阵漏,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天驻民,我揣著相機(jī)與錄音翻具,去河邊找鬼。 笑死回还,一個胖子當(dāng)著我的面吹牛裆泳,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播柠硕,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼工禾,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蝗柔?” 一聲冷哼從身側(cè)響起闻葵,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎癣丧,沒想到半個月后槽畔,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡胁编,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年厢钧,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片嬉橙。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡早直,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出市框,到底是詐尸還是另有隱情霞扬,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布枫振,位于F島的核電站祥得,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏蒋得。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一乒疏、第九天 我趴在偏房一處隱蔽的房頂上張望额衙。 院中可真熱鬧,春花似錦怕吴、人聲如沸窍侧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽伟件。三九已至,卻和暖如春议经,著一層夾襖步出監(jiān)牢的瞬間斧账,已是汗流浹背谴返。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留咧织,地道東北人嗓袱。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像习绢,于是被迫代替她去往敵國和親渠抹。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容