【泛基因組】進(jìn)展學(xué)習(xí)(1)

隨著越來越多的植物基因組的組裝,人們發(fā)現(xiàn)一個(gè)單一的參考組裝并不能反映一個(gè)物種的基因多樣性,這導(dǎo)致了泛基因組概念的產(chǎn)生。2020年7月20日帅刊,Nature Plants在線發(fā)表了題為“Plant pan-genomes are the new reference”的綜述文章,其回顧了泛基因組學(xué)在植物中的發(fā)展漂问,探索了基因存在和缺失變異的起源赖瞒,并展示了泛基因組如何支持植物育種和進(jìn)化研究。

泛基因組反映了基因組中的結(jié)構(gòu)變異和多態(tài)性蚤假,從而能夠深入比較物種水平或更高分類水平中的變異栏饮。隨著測序技術(shù)的發(fā)展,成本也隨之降低磷仰,使泛基因組研究更普遍袍嬉,越來越多的物種開始使用大樣本量進(jìn)行泛基因組的構(gòu)建。

物種內(nèi)有廣泛的基因組多樣性灶平,泛基因組就是需要捕獲這種多樣性伺通,同時(shí)去掉冗余的部分,生成一個(gè)整合的單個(gè)文件民逼。泛基因組一般包括核心部分(core genome)非必需部分(dispensable genome)泵殴,核心部分存在于所有個(gè)體中涮帘,而可有可無的部分只存在于某個(gè)個(gè)體中拼苍。

在一定的時(shí)間尺度內(nèi),植物基因組是動(dòng)態(tài)變化的,通常經(jīng)過多輪全基因組復(fù)制或亞全基因組的分化疮鲫∵耗悖基因串聯(lián)復(fù)制、轉(zhuǎn)座子活性俊犯、缺失妇多、基因組重排和重組等機(jī)制在植物基因組變異中也發(fā)揮著重要作用。這些可導(dǎo)致基因存在/缺失變異(PAV)和結(jié)構(gòu)變異(SV)燕侠。

植物泛基因組的發(fā)展

泛基因組最早于2005年在細(xì)菌中發(fā)展起來者祖,當(dāng)時(shí)研究發(fā)現(xiàn)幾種菌共有的核心基因組僅占80%,而剩下20%的基因組信息為個(gè)體菌獨(dú)有绢彤。然而由于昂貴的測序費(fèi)用七问,植物泛基因的構(gòu)建花費(fèi)了將近10年的時(shí)間。2007年茫舶,“泛基因組”一詞第一次應(yīng)用到植物中械巡,該研究揭示了水稻和玉米基因組短的變異區(qū)域。

泛基因組組裝方法

總的來說饶氏,植物目前構(gòu)建泛基因組的方式有三種:迭代組裝讥耗、多個(gè)體De novo、圖形基因組疹启。

迭代組裝指將多個(gè)樣本的下機(jī)數(shù)據(jù)比對(duì)到一個(gè)參考基因組后古程,將未比對(duì)上的reads組裝成新的contigs。通過將這些新的contigs添加到原始的參考序列中皮仁,就可以構(gòu)建一個(gè)泛基因組籍琳;

多個(gè)體De novo即對(duì)多個(gè)樣本同時(shí)進(jìn)行組裝注釋,從全基因組層面識(shí)別PAV贷祈,也是目前運(yùn)用最廣的方法趋急;

圖形泛基因組即在De novo的基礎(chǔ)上,將物種基因組分為Dispensable genome與Core genome區(qū)域势誊。

隨著三代測序技術(shù)的快速發(fā)展呜达,測序成本隨之大幅度降低,植物泛基因組也迎來了黃金發(fā)展期粟耻。7個(gè)野生大豆的泛基因查近,揭示了與種子成分、開花挤忙、成熟時(shí)間霜威、器官大小、生物量相關(guān)的變異信息册烈;三個(gè)水稻的泛基因組揭示了S5雜交不育位點(diǎn)戈泼、耐淹基因Sub1A在另一品種的缺失;8個(gè)從頭組裝的甘藍(lán)型油菜泛基因組揭示了兩個(gè)與開花時(shí)間相關(guān)的PAV,這些早期的植物泛基因組研究產(chǎn)生了兩個(gè)主要的發(fā)現(xiàn):在每一個(gè)被研究的物種中都有一個(gè)很大的可變基因含量(15-40%)大猛,以及顯示PAV的基因經(jīng)常被注釋為與生物和非生物脅迫耐受性相關(guān)的預(yù)測功能扭倾。

隨后基于芝麻、木豆的泛基因組分析挽绩,表明泛基因組不僅可以用來追蹤馴化和育種過程中基因頻率的變化膛壹,而且PAVs還可以補(bǔ)充單核苷酸多態(tài)性(SNP)來進(jìn)行GWAS分析。而PAV-GWAS引起了人們極大的研究興趣唉堪,先后在1083份水稻模聋、725個(gè)番茄和26個(gè)品系的2898個(gè)大豆中開展研究,這些研究檢測到了新的基因唠亚,并揭示了這些新基因在農(nóng)藝性狀中的重要性撬槽。

已發(fā)表的植物泛基因組文獻(xiàn)【Philipp et al, 2020, nature plants】

當(dāng)然還包含最近發(fā)表的一些:

2021,cell(rice):Pan-genome analysis of 33 genetically diverse riceaccessions reveals hidden genomic variations. 【對(duì)31個(gè)水稻樣本進(jìn)行De-novo組裝趾撵,并進(jìn)行了染色體掛載侄柔,得到了31個(gè)高質(zhì)量的基因組,并從各方面對(duì)基因組進(jìn)行了評(píng)估占调,特別是其中30個(gè)基因組達(dá)到了LAI評(píng)估值>20的“gold standard”級(jí)別暂题,僅一個(gè)是“reference”級(jí)別。然后對(duì)33個(gè)水稻(31個(gè)測序樣本究珊、日本晴和蜀恢498)進(jìn)行共線性分析薪者,將其他32個(gè)基因組的基因逐一比對(duì)到日本晴的基因集上,將無共線性的基因添加至泛基因組基因集中剿涮,直到來自32個(gè)基因組的所有基因都已添加到泛基因組中言津。最終獲得含有了66636個(gè)蛋白編碼基因的栽培種水稻泛基因組∪∈裕】

2021悬槽,nature plants(sorghum)Extensive variation within the pan-genome of cultivated and wild sorghum.【選取了13個(gè)高粱樣本進(jìn)行De-novo從頭組裝,其中2個(gè)樣本進(jìn)行了三代PacBio 80X的高深度測序瞬浓,其余樣本則是使用三代(較低深度三代PacBio測序初婆,大約40X)、二代數(shù)據(jù)混合組裝的策略猿棉,且均掛載至了染色體水平(其中四個(gè)有hic數(shù)據(jù)支持磅叛,其他9個(gè)根據(jù)共線性提升至染色體水平)。將16個(gè)基因組的預(yù)測基因模型使用OrthoMCL聚類成基因家族萨赁,使用MCScan對(duì)16個(gè)基因組進(jìn)行共線性分析弊琴,并對(duì)其進(jìn)行分類(Core gene families、Shell gene杖爽、Cloud gene)敲董,最后以BTx623 基因組為參考详瑞,使用 minigraph 構(gòu)建了圖形泛基因組。

2021臣缀,genome biology(Brassica rapa):Impacts of allopolyploidization and structural variation on intraspecific diversification in Brassica rapa。

2021泻帮,genome biology(cotton):Cotton pan-genome retrieves the lost sequences and genes during domestication and selection精置。

2020,nature(barley):The barley pan-genome reveals the hidden legacy of mutation breeding

泛基因組對(duì)作物育種的影響

早期構(gòu)建植物的參考基因組锣杂,往往選擇“歷史品種”脂倦,但這些品種與現(xiàn)代栽培品種存在廣泛差異,而泛基因組的出現(xiàn)有助于確定這些物種水平上基因含量的差異元莫。多項(xiàng)研究表明赖阻,選取野生近緣種(CWRs)進(jìn)行泛基因組分析,能夠檢測在馴化和育種過程中的基因保留和丟失踱蠢,支持對(duì)丟失多樣性的描述和將基因重新引入現(xiàn)代品種的潛力火欧。例如,在南美洲和中美洲番茄馴化過程中與風(fēng)味有關(guān)的基因發(fā)生丟失茎截,后來又被重新引入苇侵。

對(duì)不同環(huán)境下野生物種基因分布進(jìn)行研究,有助于培育更適應(yīng)不同環(huán)境氣候變化的作物企锌。前面提到榆浓,PAV基因容易富集在對(duì)非生物和生物脅迫反應(yīng)有關(guān)的通路中,尤其是抗病相關(guān)通路撕攒,類似的結(jié)論在單子葉陡鹃、雙子葉甚至人類中都有發(fā)現(xiàn)。這些觀察結(jié)果導(dǎo)致了pan-NLRome的概念抖坪,這是一項(xiàng)專門關(guān)注核苷酸結(jié)合富含亮氨酸重復(fù)序列受體(NLR)抗病基因的泛基因組研究萍鲸。值得注意的是,有些物種(例如無油樟)抗病基因不存在于PAV中擦俐,而存在于核心基因中猿推。

總之,PAV與非生物脅迫及環(huán)境適應(yīng)的相關(guān)性捌肴,可支持未來的作物育種策略蹬叭。

植物變異基因的起源

Variable基因的重要性已經(jīng)得到驗(yàn)證,但關(guān)于Variable基因的起源機(jī)制卻知之甚少状知。目前研究表明秽五,新基因可以通過全基因組復(fù)制(WGDs)、局部串聯(lián)復(fù)制饥悴、TE介導(dǎo)的復(fù)制坦喘、片段復(fù)制盲再、相關(guān)物種的導(dǎo)入、水平基因轉(zhuǎn)移和新生基因誕生獲得瓣铣。

研究者先后從多倍體植物的WGD事件答朋、亞基因組優(yōu)勢(shì),二倍體的同源交換事件(HE)棠笑,TE介導(dǎo)的PAV等方面論述了不同的得失機(jī)制對(duì)整個(gè)物種基因含量的相對(duì)貢獻(xiàn)梦碗,為選擇導(dǎo)致可變基因頻率的變化提供了新見解。最后蓖救,作者指出對(duì)lncRNAs的詳細(xì)注釋和分析可以擴(kuò)展植物可變基因庫洪规。

總的來說,泛基因組研究進(jìn)展非常迅速循捺,然而目前泛基因組領(lǐng)域還有很多亟需解決問題:首先斩例,如何更好地把最新的測序技術(shù)、生物信息學(xué)技術(shù)乃至數(shù)據(jù)技術(shù)應(yīng)用于泛基因組組裝从橘,更高效地構(gòu)建高質(zhì)量且具有廣泛代表性的泛基因組念赶。三代測序技術(shù)和基因組組裝技術(shù)在泛基因組組裝中的應(yīng)用,提高了泛基因組的質(zhì)量恰力。然而如何解決大規(guī)模群體的稀有遺傳變異捕獲問題晶乔,提高泛基因組的代表性,還需要綜合運(yùn)用新的組裝技術(shù)和策略牺勾,開發(fā)相應(yīng)的技術(shù)流程正罢。另一方面,人工智能技術(shù)在泛基因組組裝和研究中的應(yīng)用驻民,可以自主識(shí)別泛基因組數(shù)據(jù)中的一些模式翻具,有可能有助于解決泛基因組組裝和功能研究中的某些挑戰(zhàn)。

?

第二回还,如何更好地解析泛基因組的變異數(shù)據(jù)裆泳,并進(jìn)行重要農(nóng)藝性狀相關(guān)遺傳變異的鑒定,是泛基因組應(yīng)用研究的最大挑戰(zhàn)柠硕。構(gòu)建合適的數(shù)據(jù)框架工禾,更有效且更有邏輯地通過泛基因組呈現(xiàn)群體內(nèi)的結(jié)構(gòu)變異,并使這些變異信息更適合生物信息學(xué)算法處理蝗柔,是泛基因組應(yīng)用研究的核心框架闻葵。其中基于圖論(graph)的泛基因組數(shù)據(jù)結(jié)構(gòu)化和可視化技術(shù)是目前這方面研究的熱點(diǎn)。最新的大豆泛基因組的構(gòu)建和分析已經(jīng)利用相關(guān)技術(shù)構(gòu)建了基于圖(graph-based)的泛基因組和變異圖譜癣丧。然而這個(gè)領(lǐng)域目前還尚在發(fā)展初期槽畔,相應(yīng)的技術(shù)和算法尚未成熟,另外胁编,利用泛基因組圖(pangenome graph)作為參考基因組應(yīng)用于生物信息學(xué)分析厢钧,相對(duì)于線性參考基因組鳞尔,需要更復(fù)雜的計(jì)算和更多的計(jì)算資源,這是目前泛基因組圖在應(yīng)用上的主要困難之一早直。開發(fā)完整的泛基因組數(shù)據(jù)分析流程和工具寥假,使泛基因組數(shù)據(jù)與表型數(shù)據(jù)能有效整合,是泛基因組應(yīng)用于遺傳變異發(fā)掘研究的技術(shù)支撐霞扬,然而目前這部分研究還很少糕韧,相應(yīng)的理論和流程都不成熟。因此祥得,泛基因組變異數(shù)據(jù)結(jié)構(gòu)以及相適應(yīng)的遺傳變異發(fā)掘流程和工具的開發(fā)是未來泛基因組應(yīng)用研究的重點(diǎn)之一。

?

第三可視化工具已經(jīng)被開發(fā)用于泛基因組蒋得,雖然其中一些可以適應(yīng)于植物级及,但很難為大規(guī)模的樣本設(shè)計(jì)可伸縮的解決方案。大多數(shù)為泛基因組開發(fā)的可視化工具要么基于參考基因組結(jié)構(gòu)额衙,要么需要用雙向變異圖(VG)從頭組裝饮焦,以便正確顯示可有可無的區(qū)域和位置。例如窍侧,ppsPCP和CoGe 使用組裝好的植物基因組進(jìn)行比較县踢,然后使存在/缺失變異(PAV)等可視化。一些植物泛基因組的研究已經(jīng)發(fā)布了專門用于數(shù)據(jù)可視化的工具伟件,例如 RPAN 有 3000 個(gè)水稻基因組硼啤,GBrowse 有 16 個(gè)小麥品種,Brachypan 有 54 個(gè)二穗短柄草斧账。這些工具可以在泛基因組數(shù)據(jù)庫中搜索基因和可視化谴返,提供基因組序列、基因注釋咧织、PAV信息和基因表達(dá)信息的訪問嗓袱。開發(fā)用于其他物種的可視化工具是必要的,可以促進(jìn)更深入的綜合分析和用于作物改良习绢。

本文使用 文章同步助手 同步

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末渠抹,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子闪萄,更是在濱河造成了極大的恐慌梧却,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,548評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異花颗,居然都是意外死亡颂斜,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門三椿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來缺菌,“玉大人,你說我怎么就攤上這事搜锰“橛簦” “怎么了?”我有些...
    開封第一講書人閱讀 167,990評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵蛋叼,是天一觀的道長焊傅。 經(jīng)常有香客問我,道長狈涮,這世上最難降的妖魔是什么狐胎? 我笑而不...
    開封第一講書人閱讀 59,618評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮歌馍,結(jié)果婚禮上握巢,老公的妹妹穿的比我還像新娘。我一直安慰自己松却,他們只是感情好暴浦,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,618評(píng)論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著晓锻,像睡著了一般歌焦。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上砚哆,一...
    開封第一講書人閱讀 52,246評(píng)論 1 308
  • 那天独撇,我揣著相機(jī)與錄音,去河邊找鬼躁锁。 笑死券勺,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的灿里。 我是一名探鬼主播关炼,決...
    沈念sama閱讀 40,819評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼匣吊!你這毒婦竟也來了儒拂?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,725評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤色鸳,失蹤者是張志新(化名)和其女友劉穎社痛,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體命雀,經(jīng)...
    沈念sama閱讀 46,268評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蒜哀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,356評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了吏砂。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片撵儿。...
    茶點(diǎn)故事閱讀 40,488評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡乘客,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出淀歇,到底是詐尸還是另有隱情易核,我是刑警寧澤,帶...
    沈念sama閱讀 36,181評(píng)論 5 350
  • 正文 年R本政府宣布浪默,位于F島的核電站牡直,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏纳决。R本人自食惡果不足惜碰逸,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,862評(píng)論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望阔加。 院中可真熱鬧饵史,春花似錦、人聲如沸掸哑。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽苗分。三九已至,卻和暖如春牵辣,著一層夾襖步出監(jiān)牢的瞬間摔癣,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評(píng)論 1 272
  • 我被黑心中介騙來泰國打工纬向, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留择浊,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,897評(píng)論 3 376
  • 正文 我出身青樓逾条,卻偏偏與公主長得像琢岩,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子师脂,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,500評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容