植物泛基因組101(第二期)

繼上次介紹完泛基因的基本概念潭兽,構(gòu)建泛基因組序列的不同策略和最近發(fā)表的一系列高分文章后,本次推文主要來談?wù)勀壳爸参锓夯蚪M研究中的一些局限斗遏。 (如果還沒有看過上期文章的小伙伴山卦,歡迎點擊下面鏈接進(jìn)行一下回顧)。

植物泛基因組101(上)

無標(biāo)準(zhǔn)化分析流程

在Tao等人的有關(guān)植物泛基因組分析的綜述論文中诵次,作者從不同角度比較了目前植物泛基因組分析的特點(見下表)账蓉。從中可以看出,不同研究中使用到的樣本數(shù)量(3>3000)逾一,測序(1X>110X)铸本,構(gòu)建泛基因組的策略,序列注釋方法以及判斷基因有無變異(PAV)的方法都有很大的差別遵堵。這導(dǎo)致了即使對同一種物種來講箱玷,不同實驗室構(gòu)建的泛基因組序列及基因有無變異結(jié)果不能進(jìn)行直接的比較怨规;在不同物種之間,也無法從系統(tǒng)進(jìn)化的角度分析基因在植物進(jìn)化及農(nóng)作物馴化等生物過程中的基因流失或基因復(fù)制等現(xiàn)象锡足。所以波丰,植物的泛基因組分析亟需建立一套操作方便,結(jié)果精確舶得,可移植性強的流程呀舔,包括樣本量的選擇,基因組的測序扩灯、組裝,泛基因組的構(gòu)建霜瘪,序列注釋等一系列生物信息學(xué)標(biāo)準(zhǔn)化分析流程珠插。

技術(shù)的局限性

目前,大多數(shù)的植物泛基因組分析中使用的都是基于短讀長的二代測序數(shù)據(jù)颖对。但是捻撑,短讀長序列的一個缺點是對重復(fù)序列區(qū)域的組裝并不理想。而現(xiàn)有的植物泛基因組分析結(jié)果表明缤底,非參考基因組序列很大一部分是有重復(fù)序列組成顾患。所以,目前的泛基因組序列大都是一些長度較短的个唧,高度碎片化的序列構(gòu)成江解。一方面,這些重復(fù)序列的組裝結(jié)果并不準(zhǔn)確徙歼,另外一方面犁河,組裝出來的序列中的基因都是片段化的。非完整的基因序列為下游的基因有無變異分析帶來偏差魄梯,無法得到正確的基因有無變異圖譜桨螺。

相比之下,基于單分子實時的第三代測序技術(shù)能夠產(chǎn)生較長的讀長酿秸,能夠跨過某些重復(fù)序列灭翔,從而在一定程度上解決泛基因組分析中的重復(fù)序列問題,從而產(chǎn)生更加精準(zhǔn)的基因有無變異圖譜辣苏。但是肝箱,目前來講,三代測序技術(shù)測序錯誤率較高稀蟋,通量較低狭园,價格較貴,還無法應(yīng)用于大規(guī)模的群體遺傳學(xué)研究中糊治。隨著技術(shù)的不斷發(fā)展唱矛,一些技術(shù)壁壘被突破,如目前的CCS長讀長序列的測序準(zhǔn)確度已經(jīng)超過99.8%(Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome,2019绎谦,NBT)管闷,這為準(zhǔn)確獲取個體基因組的序列提供了技術(shù)的支持。相信隨著三代測序技術(shù)的發(fā)展和普及窃肠,我們可以構(gòu)建更加完整的植物泛基因組序列包个。

應(yīng)用的局限性

泛基因組分析分析包括兩個主要的內(nèi)容,一是構(gòu)建泛基因組序列冤留,二是基于泛基因組的基因有無變異分析碧囊,建立泛基因組序列的基因瀏覽器,及后續(xù)的應(yīng)用研究纤怒。目前糯而,大多數(shù)的植物泛基因組研究的重點放在第一部分。

在第二部分中泊窘,目前大多泛基因組的應(yīng)用就是構(gòu)建一個泛基因的數(shù)據(jù)庫熄驼。數(shù)據(jù)庫里面主要是包含了新發(fā)現(xiàn)的基因的基本信息,還有這些基因與RNA-seq比對的信息烘豹,在不同群體中基因出現(xiàn)的頻率等相關(guān)信息瓜贾。泛基因組中,新發(fā)現(xiàn)(新組裝出來參考序列沒有)的基因可以進(jìn)一步用于功能分析携悯,下游的濕實驗通路研究祭芦,基因選擇育種等一些的應(yīng)用中。目前在建立泛基因數(shù)據(jù)庫這一塊憔鬼,做的最好的有數(shù)实束,RPAN: Rice Pan-genome Browser

但實際上建立數(shù)據(jù)庫只是泛基因最基本的應(yīng)用逊彭,對于實際的育種幫助還是處于很基礎(chǔ)的階段咸灿。 為什么這樣說呢?在上次番茄泛基因組發(fā)表之后侮叮,各路植物基因?qū)W術(shù)界的大牛都在推特上議論一 番避矢。其中有大牛一針見血的提出了目前植物泛基因研究最大的局限。他說道“他所認(rèn)同的泛基因組囊榜,并不是單純的將成百上千個個體進(jìn)行測序比對审胸,然后將所有比對不上參考基因組的 reads組裝成一推新的contigs,然后將其和參考基因組拼接成泛基因組卸勺。這些新的contigs既不能準(zhǔn)確的放回到參考基因組中砂沛,進(jìn)而進(jìn)行基因定位克隆,更下游的分析曙求,并且運用于育種中碍庵。也不能很準(zhǔn)確的代表該物種所有個體的基因多樣性映企。他理想中的泛基因組是類似一個圖譜型的基因組,在每個變異位點上展示静浴,所有個體的基因(各種突變)序列信息堰氓。”

推特上的討論很準(zhǔn)確的總結(jié)了苹享,目前泛基因組在農(nóng)業(yè)育種方法應(yīng)用的最大阻礙双絮。盡管如此,八月份在自然—生物技術(shù)發(fā)表的一篇文章"HISAT2和HISAT基因型的基于圖譜型基因組比對和基因分型"為圖譜型泛基因組的出現(xiàn)帶來了曙光得问,隨著數(shù)據(jù)的結(jié)構(gòu)與分析流程的改進(jìn)囤攀,未來泛基因組定會更好的運用于育種當(dāng)中。

另外關(guān)于泛基因組未來的一些分析的思路宫纬,可以參kaolvLi Heng博客中的想法焚挠,這里就不深入具體探討了:
http://lh3.github.io/2019/07/08/on-a-reference-pan-genome-model
http://lh3.github.io/2019/07/12/on-a-reference-pan-genome-model-part-ii

小結(jié)

由于當(dāng)前技術(shù)或者其它因素的影響,當(dāng)前泛基因組的研究在農(nóng)業(yè)育種應(yīng)用具有一定的局限性哪怔,也欠缺相對可比性。但隨著三代技術(shù)的發(fā)展向抢,和圖譜型基因組的普及认境,植物泛基因組定會在未來迎來更快的發(fā)展,繼續(xù)成為測序研究的熱點話題挟鸠。

最后感謝上海交通大學(xué)的段博士的修改與潤色

參考文獻(xiàn)

  1. Tao, Yongfu, et al. "Exploring and exploiting pan-genomics for crop improvement." Molecular plant (2018).
  2. Kim, Daehwan, et al. "Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype." Nature biotechnology 37.8 (2019): 907-915.
  3. Wenger, Aaron M., et al. "Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome." Nature biotechnology (2019): 1-8.
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末叉信,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子艘希,更是在濱河造成了極大的恐慌硼身,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,366評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件覆享,死亡現(xiàn)場離奇詭異佳遂,居然都是意外死亡,警方通過查閱死者的電腦和手機撒顿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評論 3 395
  • 文/潘曉璐 我一進(jìn)店門丑罪,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人凤壁,你說我怎么就攤上這事吩屹。” “怎么了拧抖?”我有些...
    開封第一講書人閱讀 165,689評論 0 356
  • 文/不壞的土叔 我叫張陵煤搜,是天一觀的道長。 經(jīng)常有香客問我唧席,道長擦盾,這世上最難降的妖魔是什么嘲驾? 我笑而不...
    開封第一講書人閱讀 58,925評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮厌衙,結(jié)果婚禮上距淫,老公的妹妹穿的比我還像新娘。我一直安慰自己婶希,他們只是感情好榕暇,可當(dāng)我...
    茶點故事閱讀 67,942評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著喻杈,像睡著了一般彤枢。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上筒饰,一...
    開封第一講書人閱讀 51,727評論 1 305
  • 那天缴啡,我揣著相機與錄音,去河邊找鬼瓷们。 笑死业栅,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的谬晕。 我是一名探鬼主播碘裕,決...
    沈念sama閱讀 40,447評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼攒钳!你這毒婦竟也來了帮孔?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,349評論 0 276
  • 序言:老撾萬榮一對情侶失蹤不撑,失蹤者是張志新(化名)和其女友劉穎文兢,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體焕檬,經(jīng)...
    沈念sama閱讀 45,820評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡誉简,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,990評論 3 337
  • 正文 我和宋清朗相戀三年玛界,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,127評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡锈津,死狀恐怖蛤袒,靈堂內(nèi)的尸體忽然破棺而出嘹锁,到底是詐尸還是另有隱情艺糜,我是刑警寧澤,帶...
    沈念sama閱讀 35,812評論 5 346
  • 正文 年R本政府宣布兔仰,位于F島的核電站茫负,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏乎赴。R本人自食惡果不足惜忍法,卻給世界環(huán)境...
    茶點故事閱讀 41,471評論 3 331
  • 文/蒙蒙 一潮尝、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧饿序,春花似錦勉失、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至咽弦,卻和暖如春徒蟆,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背型型。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評論 1 272
  • 我被黑心中介騙來泰國打工段审, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人闹蒜。 一個月前我還...
    沈念sama閱讀 48,388評論 3 373
  • 正文 我出身青樓寺枉,卻偏偏與公主長得像,于是被迫代替她去往敵國和親绷落。 傳聞我的和親對象是個殘疾皇子姥闪,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,066評論 2 355

推薦閱讀更多精彩內(nèi)容