植物泛基因組101（第二期）

繼上次介紹完泛基因的基本概念潭兽，構(gòu)建泛基因組序列的不同策略和最近發(fā)表的一系列高分文章后，本次推文主要來談?wù)勀壳爸参锓夯蚪M研究中的一些局限斗遏。 (如果還沒有看過上期文章的小伙伴山卦，歡迎點擊下面鏈接進(jìn)行一下回顧)。

植物泛基因組101（上）

無標(biāo)準(zhǔn)化分析流程

在Tao等人的有關(guān)植物泛基因組分析的綜述論文中诵次，作者從不同角度比較了目前植物泛基因組分析的特點（見下表）账蓉。從中可以看出，不同研究中使用到的樣本數(shù)量（3_{>3000）逾一，測序(1X}>110X）铸本，構(gòu)建泛基因組的策略，序列注釋方法以及判斷基因有無變異（PAV）的方法都有很大的差別遵堵。這導(dǎo)致了即使對同一種物種來講箱玷，不同實驗室構(gòu)建的泛基因組序列及基因有無變異結(jié)果不能進(jìn)行直接的比較怨规；在不同物種之間，也無法從系統(tǒng)進(jìn)化的角度分析基因在植物進(jìn)化及農(nóng)作物馴化等生物過程中的基因流失或基因復(fù)制等現(xiàn)象锡足。所以波丰，植物的泛基因組分析亟需建立一套操作方便，結(jié)果精確舶得，可移植性強的流程呀舔，包括樣本量的選擇，基因組的測序扩灯、組裝，泛基因組的構(gòu)建霜瘪，序列注釋等一系列生物信息學(xué)標(biāo)準(zhǔn)化分析流程珠插。

技術(shù)的局限性

目前，大多數(shù)的植物泛基因組分析中使用的都是基于短讀長的二代測序數(shù)據(jù)颖对。但是捻撑，短讀長序列的一個缺點是對重復(fù)序列區(qū)域的組裝并不理想。而現(xiàn)有的植物泛基因組分析結(jié)果表明缤底，非參考基因組序列很大一部分是有重復(fù)序列組成顾患。所以，目前的泛基因組序列大都是一些長度較短的个唧，高度碎片化的序列構(gòu)成江解。一方面，這些重復(fù)序列的組裝結(jié)果并不準(zhǔn)確徙歼，另外一方面犁河，組裝出來的序列中的基因都是片段化的。非完整的基因序列為下游的基因有無變異分析帶來偏差魄梯，無法得到正確的基因有無變異圖譜桨螺。

相比之下，基于單分子實時的第三代測序技術(shù)能夠產(chǎn)生較長的讀長酿秸，能夠跨過某些重復(fù)序列灭翔，從而在一定程度上解決泛基因組分析中的重復(fù)序列問題，從而產(chǎn)生更加精準(zhǔn)的基因有無變異圖譜辣苏。但是肝箱，目前來講，三代測序技術(shù)測序錯誤率較高稀蟋，通量較低狭园，價格較貴，還無法應(yīng)用于大規(guī)模的群體遺傳學(xué)研究中糊治。隨著技術(shù)的不斷發(fā)展唱矛，一些技術(shù)壁壘被突破，如目前的CCS長讀長序列的測序準(zhǔn)確度已經(jīng)超過99.8%（Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome，2019绎谦，NBT）管闷，這為準(zhǔn)確獲取個體基因組的序列提供了技術(shù)的支持。相信隨著三代測序技術(shù)的發(fā)展和普及窃肠，我們可以構(gòu)建更加完整的植物泛基因組序列包个。

應(yīng)用的局限性

泛基因組分析分析包括兩個主要的內(nèi)容，一是構(gòu)建泛基因組序列冤留，二是基于泛基因組的基因有無變異分析碧囊，建立泛基因組序列的基因瀏覽器，及后續(xù)的應(yīng)用研究纤怒。目前糯而，大多數(shù)的植物泛基因組研究的重點放在第一部分。

在第二部分中泊窘，目前大多泛基因組的應(yīng)用就是構(gòu)建一個泛基因的數(shù)據(jù)庫熄驼。數(shù)據(jù)庫里面主要是包含了新發(fā)現(xiàn)的基因的基本信息，還有這些基因與RNA-seq比對的信息烘豹，在不同群體中基因出現(xiàn)的頻率等相關(guān)信息瓜贾。泛基因組中，新發(fā)現(xiàn)(新組裝出來參考序列沒有)的基因可以進(jìn)一步用于功能分析携悯，下游的濕實驗通路研究祭芦，基因選擇育種等一些的應(yīng)用中。目前在建立泛基因數(shù)據(jù)庫這一塊憔鬼，做的最好的有數(shù)实束，RPAN: Rice Pan-genome Browser。

但實際上建立數(shù)據(jù)庫只是泛基因最基本的應(yīng)用逊彭，對于實際的育種幫助還是處于很基礎(chǔ)的階段咸灿。為什么這樣說呢？在上次番茄泛基因組發(fā)表之后侮叮，各路植物基因?qū)W術(shù)界的大牛都在推特上議論一番避矢。其中有大牛一針見血的提出了目前植物泛基因研究最大的局限。他說道“他所認(rèn)同的泛基因組囊榜，并不是單純的將成百上千個個體進(jìn)行測序比對审胸，然后將所有比對不上參考基因組的 reads組裝成一推新的contigs，然后將其和參考基因組拼接成泛基因組卸勺。這些新的contigs既不能準(zhǔn)確的放回到參考基因組中砂沛，進(jìn)而進(jìn)行基因定位克隆，更下游的分析曙求，并且運用于育種中碍庵。也不能很準(zhǔn)確的代表該物種所有個體的基因多樣性映企。他理想中的泛基因組是類似一個圖譜型的基因組，在每個變異位點上展示静浴，所有個體的基因（各種突變）序列信息堰氓。”

推特上的討論很準(zhǔn)確的總結(jié)了苹享，目前泛基因組在農(nóng)業(yè)育種方法應(yīng)用的最大阻礙双絮。盡管如此，八月份在自然—生物技術(shù)發(fā)表的一篇文章"HISAT2和HISAT基因型的基于圖譜型基因組比對和基因分型"為圖譜型泛基因組的出現(xiàn)帶來了曙光得问，隨著數(shù)據(jù)的結(jié)構(gòu)與分析流程的改進(jìn)囤攀，未來泛基因組定會更好的運用于育種當(dāng)中。

另外關(guān)于泛基因組未來的一些分析的思路宫纬，可以參kaolvLi Heng博客中的想法焚挠，這里就不深入具體探討了：
http://lh3.github.io/2019/07/08/on-a-reference-pan-genome-model
http://lh3.github.io/2019/07/12/on-a-reference-pan-genome-model-part-ii

小結(jié)

由于當(dāng)前技術(shù)或者其它因素的影響，當(dāng)前泛基因組的研究在農(nóng)業(yè)育種應(yīng)用具有一定的局限性哪怔，也欠缺相對可比性。但隨著三代技術(shù)的發(fā)展向抢，和圖譜型基因組的普及认境，植物泛基因組定會在未來迎來更快的發(fā)展，繼續(xù)成為測序研究的熱點話題挟鸠。

最后感謝上海交通大學(xué)的段博士的修改與潤色

參考文獻(xiàn)

Tao, Yongfu, et al. "Exploring and exploiting pan-genomics for crop improvement." Molecular plant (2018).
Kim, Daehwan, et al. "Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype." Nature biotechnology 37.8 (2019): 907-915.
Wenger, Aaron M., et al. "Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome." Nature biotechnology (2019): 1-8.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末叉信，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子艘希，更是在濱河造成了極大的恐慌硼身，老刑警劉巖，帶你破解...
沈念sama閱讀 219,366評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件覆享，死亡現(xiàn)場離奇詭異佳遂，居然都是意外死亡，警方通過查閱死者的電腦和手機撒顿，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,521評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門丑罪，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人凤壁，你說我怎么就攤上這事吩屹。” “怎么了拧抖？”我有些...
開封第一講書人閱讀 165,689評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵煤搜，是天一觀的道長。經(jīng)常有香客問我唧席，道長擦盾，這世上最難降的妖魔是什么嘲驾？我笑而不...
開封第一講書人閱讀 58,925評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮厌衙，結(jié)果婚禮上距淫，老公的妹妹穿的比我還像新娘。我一直安慰自己婶希，他們只是感情好榕暇，可當(dāng)我...
茶點故事閱讀 67,942評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著喻杈，像睡著了一般彤枢。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上筒饰，一...
開封第一講書人閱讀 51,727評論 1贊 305
城市分裂傳說
那天缴啡，我揣著相機與錄音，去河邊找鬼瓷们。笑死业栅，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的谬晕。我是一名探鬼主播碘裕，決...
沈念sama閱讀 40,447評論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼攒钳！你這毒婦竟也來了帮孔？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,349評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤不撑，失蹤者是張志新（化名）和其女友劉穎文兢，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體焕檬，經(jīng)...
沈念sama閱讀 45,820評論 1贊 317
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡誉简，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,990評論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年玛界，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,127評論 1贊 351
活死人
序言：一個原本活蹦亂跳的男人離奇死亡锈津，死狀恐怖蛤袒，靈堂內(nèi)的尸體忽然破棺而出嘹锁，到底是詐尸還是另有隱情艺糜，我是刑警寧澤，帶...
沈念sama閱讀 35,812評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布兔仰，位于F島的核電站茫负，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏乎赴。R本人自食惡果不足惜忍法，卻給世界環(huán)境...
茶點故事閱讀 41,471評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一潮尝、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧饿序，春花似錦勉失、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,017評論 0贊 22
一樁弒父案乱凿，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至咽弦，卻和暖如春徒蟆，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背型型。一陣腳步聲響...
開封第一講書人閱讀 33,142評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工段审，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人闹蒜。一個月前我還...
沈念sama閱讀 48,388評論 3贊 373
代替公主和親
正文我出身青樓寺枉，卻偏偏與公主長得像，于是被迫代替她去往敵國和親绷落。傳聞我的和親對象是個殘疾皇子姥闪，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,066評論 2贊 355

植物泛基因組101（第二期）

無標(biāo)準(zhǔn)化分析流程

技術(shù)的局限性

應(yīng)用的局限性

小結(jié)

推薦閱讀更多精彩內(nèi)容