3/15??? ??? ? 本期作者:大胖丫
“Current advances in genome sequencing of common wheat and its ancestral species (10.1016/j.cj.2017.11.001)”士聪,通訊作者為遺傳發(fā)育所的凌宏清研究員锦援。我們一起來(lái)學(xué)習(xí)一下麥類作物基因組的研究歷史和進(jìn)展以及我國(guó)科學(xué)家在這一領(lǐng)域所做出的重要貢獻(xiàn)。
? ? ? 早在2005年的時(shí)候剥悟,國(guó)際小麥基因組測(cè)序聯(lián)盟(International Wheat Genome Sequencing Consortium, IWGSC)就已經(jīng)啟動(dòng)了小麥基因組測(cè)序計(jì)劃灵寺。來(lái)自捷克的Jaroslav Dolezel(http://www.ueb.cas.cz/en/users/dolezel)教授利用流式細(xì)胞儀分離技術(shù)曼库,將普通小麥中國(guó)春(Chinese Spring)的21條染色體進(jìn)行了分離(除3B之外,其余染色體均分為長(zhǎng)臂和短臂)略板,并構(gòu)建了相應(yīng)的BAC文庫(kù)毁枯。后續(xù)物理圖譜構(gòu)建和BAC測(cè)序則由IWGSC的成員國(guó)分擔(dān),我們國(guó)家主要是負(fù)責(zé)7DL物理圖譜構(gòu)建(宋衛(wèi)寧教授叮称,西北農(nóng)林科技大學(xué))种玛。到目前為止,基于BAC by BAC策略的所有中國(guó)春染色體/臂的物理圖譜均已構(gòu)建完畢(http://www.wheatgenome.org/Projects/IWGSC-Bread-Wheat-Projects)瓤檐,相關(guān)研究于2014年在Science發(fā)表(doi:10.1126/science.1251788)赂韵。
? ? ? 英國(guó)利物浦大學(xué)Neil Hall領(lǐng)導(dǎo)的研究小組利用454焦磷酸測(cè)序技術(shù),對(duì)中國(guó)春的基因組進(jìn)行了全基因組測(cè)序挠蛉。測(cè)序深度為5X右锨,基因組組裝大小為5.42Gb,并預(yù)測(cè)了9.4~9.6萬(wàn)個(gè)基因碌秸,大約有2/3的基因能夠定位到A绍移、B和D亞基因組上,相關(guān)研究于2012年在Nature發(fā)表(doi:10.1038/nature11650讥电,這是小麥基因組的首次發(fā)表蹂窖,也是大家早期用的比較多的小麥參考基因組)。
? ? ? 2017年上半年恩敌,同樣以英國(guó)為主的的研究小組利用精準(zhǔn)大小的mate-pair文庫(kù)和優(yōu)化的組裝算法瞬测,進(jìn)一步提高了中國(guó)春基因組的組裝質(zhì)量和完整性,組裝出來(lái)的基因組大約占完整中國(guó)春基因組的78%纠炮,相關(guān)研究結(jié)果發(fā)表在Genome Research上(doi:10.1101/gr.217117.116)月趟。2017年底,美國(guó)約翰霍普金斯大學(xué)Steven L Salzberg領(lǐng)導(dǎo)的研究小組利用二代(Illunina)和三代測(cè)序(PacBio)技術(shù)恢口,組裝出來(lái)大約15Gb的物理圖譜孝宗,約占中國(guó)春全基因組的90%,這是目前為止最完整的中國(guó)春參考圖譜耕肩,相關(guān)研究結(jié)果發(fā)表在GigaScience上(doi:10.1093/gigascience/gix097)因妇。同樣,也是在2017年猿诸,IWGSC提前釋放了中國(guó)春的參考基因組“IWGSC RefSeq v1.0”(https://wheat-urgi.versailles.inra.fr/Seq-Repository/Assemblies)婚被。該版本的物理圖譜在IWGSC分染色體組裝結(jié)果的基礎(chǔ)上,整合了“IWGSC WGA v0.4”的測(cè)序結(jié)果梳虽,也就是利用NRGene技術(shù)的組裝結(jié)果址芯,將scaffold的N50值提高到22.8Mb,這也是目前小麥染色體級(jí)別組裝較好的版本,相關(guān)文章暫未發(fā)表谷炸。
? ? ? 同樣得益于NRGene的組裝技術(shù)北专,野生二粒小麥的物理圖譜也于2017年在Science發(fā)表(doi:10.1126/science.aan0032)。研究者利用Illumina測(cè)序平臺(tái)和PCR free的建庫(kù)方法淑廊,獲得相對(duì)較長(zhǎng)的二代測(cè)序數(shù)據(jù)(PE250)逗余,再利用NRGene的DenovoMAGIC2軟件進(jìn)行組裝,并結(jié)合遺傳圖譜和Hi-C技術(shù)季惩,最后得到了一個(gè)質(zhì)量非常高的AB基因組物理圖譜录粱。
? ? ? 我們國(guó)家在麥類作物基因組研究方面也做出了很多突出貢獻(xiàn)。比如画拾,小麥A基因組和D基因組供體材料基因組草圖的完成啥繁。小麥A基因組來(lái)自于烏拉爾圖小麥(Triticum urautu),2013年Nature上發(fā)表的基因組草圖一共組裝出了4.66Gb,約覆蓋了整個(gè)基因組的94%青抛,scaffold N50值為63.69Kb(doi:10.1038/nature11997)旗闽;結(jié)合PicBio的三代測(cè)序技術(shù)、BioNano以及10X Genomics技術(shù)的第二版A基因組物理圖也正在準(zhǔn)備發(fā)表蜜另,組裝效果有明顯提升适室,覆蓋度大約為98.4%。小麥D基因組來(lái)自于粗山羊草(Aegilops tauschii),早期在Nature上發(fā)表的第一版物理圖譜一共組裝出了4.23Gb的序列举瑰,scaffold N50值為57.59Kb(doi:10.1038/nature12028)捣辆;同樣得益于新技術(shù)的發(fā)展,2017年在Nature Plants上發(fā)表的第二版數(shù)據(jù)一共組裝出了4.31Gb的數(shù)據(jù)此迅,scaffold N50值為12.1Mb汽畴,整體提升了210倍(doi:10.1038/s41477-017-0067-8)。UC Davis的羅明成老師也于2017年底在Nautre上發(fā)表了小麥D基因組材料AL8/78的物理圖譜(doi:10.1038/nature24486)耸序。另外忍些,像科農(nóng)9204以及矮抗58等普通小麥材料的物理圖譜構(gòu)建也在進(jìn)行中。