高雜合陈哑、多倍體一直是組裝中的難點(diǎn),以往的做法就是構(gòu)建單倍體或雙單倍材料(double-haploid )來進(jìn)行組裝,但同時(shí)也沒有辦法獲得全面的基因信息桥言。目前主流的組裝算法傾向于將雜合 / 同源區(qū)域整合延旧,得到的組裝結(jié)果為 haploid consensus 或者 monoploid谋国。為了深入研究的需要,更多的物種需要將來自父母的遺傳信息都獲得垄潮,因此參考基因 組就需要獲得兩個(gè)單倍體基因組烹卒,也就是“單倍型”參考基因組(Haplotype-resolved genome 或 Phased diploid genome)。如今近期多篇文章都用到“單倍型”參考基因組解決生物學(xué)問題弯洗,同時(shí)多倍體物種組裝方法旅急,與組裝“單倍型”參考基因組在原理上也有著相互借鑒的地方。
案例一
Phased diploid genome assemblies and pan-genomes provide insights into the genetic history of apple domestication
蘋果(Malus domestica Borkh牡整。)是一種受歡迎的溫帶水果藐吮,其馴化由不同野生物種的雜交和具有理想性狀的基因型的無性繁殖組成。因此蘋果具有高雜合的基因組特征逃贝,目前已有的蘋果參考基因組谣辞,對(duì)于蘋果育種工作,蘋果馴化研究有一定局限性沐扳。
因此本文對(duì)M. domestica?cv.?Gala泥从、M. sieversii和M. sylvestris分別構(gòu)建不同長(zhǎng)度的Illumina paired-end和mate-pair文庫、10x?Genomics和PacBio HiFi文庫沪摄。Illumina和10x Genomics文庫測(cè)序數(shù)據(jù)躯嫉,使用DeNovoMAGIC3?組裝纱烘,產(chǎn)生一個(gè)定相二倍體組裝和一個(gè)未定相的組裝;PacBio HiFi文庫測(cè)序數(shù)據(jù)祈餐,使用Hifiiasm和HiCanu組裝;以上組裝版本擂啥,結(jié)合 遺傳圖譜數(shù)據(jù)和已發(fā)表基因組的共線性信息,對(duì) Scaffolds 進(jìn)行掛載帆阳。
表1 “單倍型”蘋果組裝結(jié)果
從上述結(jié)果可以看出哺壶,研究者組裝出單倍型基因組為 1.31-1.32 Gb,是不進(jìn)行單倍型區(qū)分的基因組序列的兩倍蜒谤。盡管雜 合度很高山宾,但所有樣本的組裝結(jié)果都有很高的連續(xù)性,單倍型組裝結(jié)果的 contig N50 為 1.2-1.9 Mb芭逝,scaffold N50 為 3.3-4.2 Mb塌碌。同時(shí)可以發(fā)現(xiàn),PacBio HiFi 數(shù)據(jù)在高雜合組裝中對(duì)連續(xù)性有非常顯著的提升旬盯。
案例二
Haplotype-resolved genome analyses of a heterozygous diploid potato
栽培馬鈴薯是同源四倍體台妆,主要靠薯塊進(jìn)行無性繁殖。這些特點(diǎn)使得馬鈴薯的基因組高度雜合胖翰,有害等位基因隱藏在四套染色體中接剩,而優(yōu)良基因的聚合要依靠復(fù)雜的遺傳重組,導(dǎo)致馬鈴薯品種改良周期漫長(zhǎng)萨咳。
本篇文章研究者利用Illumina 測(cè)序懊缺、10x Genomics (10xG) linked-read 測(cè)序、ONT 測(cè)序培他、PacBio-CCS測(cè)序鹃两、Hi-C 技術(shù)、遺傳圖譜數(shù)據(jù)舀凛,相互整合最終得到雜合二倍體馬鈴薯的兩套染色體的基因組序列俊扳,完成了單倍體組裝。
表2?組裝結(jié)果
案例三
Assembly of whole-chromosome pseudomolecules for polyploid plant genomes using outbred mapping populations
本研究報(bào)道了一種新的軟件:PolyGembler (polyploid genetic linkage assembler), 該方法是通過遺傳連鎖分析將contigs 分組和排序獲得染色體序列(pseudomolecules) 的方法猛遍。同時(shí)本方法也可以來檢測(cè)和修復(fù)組裝中的錯(cuò)誤馋记。使用該方法,本文作者結(jié)合RAD-seq數(shù)據(jù)懊烤,對(duì)已發(fā)表的結(jié)縷草(Zoysia japonica?)進(jìn)行了多倍體拆分梯醒。此外,本研究還解決了已發(fā)表的二倍體甘薯(Ipomoea trifida)基因組組裝的13個(gè)組裝錯(cuò)誤腌紧。
通過上文三個(gè)案例茸习,可以發(fā)現(xiàn)“單倍型”參考基因組解決方案不再局限于利用不同平臺(tái)/文庫測(cè)序數(shù)據(jù)和組裝軟件算法,更多的是和重測(cè)序分析中的遺傳圖譜信息相結(jié)合壁肋,借用SNP信息反過給出scaffold定相信息或contig分組信息号胚。
“單倍型”參考基因組在基因組進(jìn)化代箭,物種馴化育種,甚至性染色體研究中有著一定的必要性涕刚,也是獲得更全面的基因組信息的必要條件。新時(shí)代來了乙帮,諾禾致源的科技服務(wù)一直在與時(shí)俱進(jìn)杜漠,后續(xù)最新進(jìn)展也會(huì)實(shí)時(shí)更新,敬請(qǐng)期待察净。