16S rDNA是細(xì)菌分類學(xué)研究中最常用的“分子鐘”聚假,總長約 1540 bp,其中包含9個(gè)可變區(qū)(Variable region)和10個(gè)保守區(qū)(Constant region)峭范”窦可變區(qū)因菌種不同而異纱控,且變異程度與細(xì)菌的系統(tǒng)發(fā)育密切相關(guān)菜秦。通過檢測16S rDNA可變區(qū)的序列變異和豐度,可了解環(huán)境樣品中群落多樣性信息尔店,在微生物分類鑒定、微生態(tài)研究等方面起著重要的作用闹获。
平臺(tái)比較
集合優(yōu)勢,成本更低
Sanger測序能夠提供接近全長(Full Length, FL)的16S rDNA片段避诽,但該方法成本高且通量較低沙庐,難以滿足復(fù)雜環(huán)境研究需求鲤妥。
以Illumina為代表的二代測序技術(shù)拱雏,成本大大降低铸抑,更適合大規(guī)模測序鹊汛;但是受測序長度的限制,往往只能選擇 1-3 個(gè)可變區(qū)作為擴(kuò)增片段(目前常用擴(kuò)增子片段是V4區(qū))滥嘴,分類的準(zhǔn)確性和一致性存在問題至耻。
今天的主角是PacBio全長16S rDNA測序尘颓。我們來八一八它和其他平臺(tái)16S rDNA測序相比主要有哪些優(yōu)勢,以及全長16S rDNA測序還有哪些不完美之處疤苹。
表1. 16S rDNA測序在不同測序平臺(tái)中的比較
從上面的表格中痰催,我們可以看到,三代測序集合了Sanger測序的讀長優(yōu)勢和二代測序的高通量優(yōu)勢夸溶,可用較低的成本獲得16S rDNA全長序列凶硅,滿足全長16S rDNA研究需求缝裁。
嚴(yán)謹(jǐn)?shù)耐瑐兛赡軙?huì)說:單純的平臺(tái)優(yōu)勢并不足以說服我們選擇PacBio測序,我們更關(guān)注的是科研價(jià)值!那大家一起來看看在實(shí)際研究中韩脑,PacBio全長16S rDNA測序表現(xiàn)如何呢?
質(zhì)量優(yōu)勢
準(zhǔn)確度99%进苍、重復(fù)性0.96
2016年年初觉啊,美國能源部聯(lián)合基因組研究中心發(fā)表在ISME Journal 上的一篇文章對(duì)PacBio全長16S rDNA測序和V4測序結(jié)果進(jìn)行了系統(tǒng)的比對(duì)分析[1]
杠人。
研究人員首先選擇含有23個(gè)細(xì)菌參考基因組的模擬群落來評(píng)估PacBio全長16S rDNA測序結(jié)果的準(zhǔn)確性和重復(fù)性。通過擴(kuò)增嗡善,得到模擬群落的V4區(qū)和全長16S rDNA區(qū)域,并分別用MiSeq和PacBio測序得到16S rDNA V4區(qū)序列iTags和全長16S rDNA序列PhyloTags撩满;為了檢測PacBio測序的可重復(fù)性伺帘,對(duì)同一樣品進(jìn)行了5次重復(fù)性測序。
通過CCS(Circular Consensus Sequencing)測序模式,PhyloTags序列準(zhǔn)確度達(dá)到99%帝洪;以97%相似性進(jìn)行OTU分析得到22個(gè)OTU(有一個(gè)物種含量很低,PhyloTags和V4 iTags中均未得到)砰奕,與PacBio shotgun(作為參照標(biāo)準(zhǔn))結(jié)果具有很強(qiáng)的相關(guān)性(如圖1a)仅淑。質(zhì)量最好的PhyloTag與對(duì)應(yīng)16S rDNA參考序列基因相似度達(dá)到99.5%。此外,5個(gè)PhyloTags技術(shù)重復(fù)的相關(guān)性非常好蝇庭,相關(guān)系數(shù)均達(dá)到0.96以上(如圖1b)盗棵。從模擬群落實(shí)驗(yàn)中可以看到,PhyloTags的數(shù)據(jù)質(zhì)量可與傳統(tǒng)iTags測序質(zhì)量相媲美纹因。
CCS測序模式:PacBio測序中,當(dāng)插入片段(Reads of Insert)< PacBio測序讀長(Polymerase Reads)時(shí),測序模式為CCS颜启,插入片段將會(huì)被測到N次,PacBio測序?yàn)殡S機(jī)錯(cuò)誤模式,N次測序結(jié)果互相校對(duì)透揣,準(zhǔn)確率得到極大提升冻辩。
分析優(yōu)勢
更準(zhǔn)確的物種分類弄诲,更多的物種鑒定
一般環(huán)境的生物復(fù)雜度遠(yuǎn)高于以上模擬群體愚战,為了得到更具現(xiàn)實(shí)意義的比較結(jié)果,研究人員接下來選擇含有豐富微生物類群的Sakinaw湖水樣本進(jìn)行分析齐遵,在環(huán)境樣本研究中寂玲,PhyloTags對(duì)復(fù)雜群體分類的優(yōu)勢就凸顯出來了。
? 更準(zhǔn)確的物種分類
研究人員選取8個(gè)不同深度的湖水進(jìn)行采樣梗摇,分別對(duì)這些樣本進(jìn)行PhyloTags和V4 iTags分析拓哟。結(jié)果表明,V4 iTags數(shù)據(jù)中有0.2%-4.1%的微生物在門水平上無法區(qū)分伶授,而PhyloTags則能在門水平上將這些微生物完全區(qū)分断序。比較各個(gè)深度的PhyloTags和V4 iTags數(shù)據(jù),發(fā)現(xiàn)在物種多樣性相對(duì)較小的淺水區(qū)域谎砾,二者得到的群落結(jié)構(gòu)一致性相對(duì)較高逢倍;而在物種相對(duì)豐富的深水區(qū)域,群落結(jié)構(gòu)差異較大景图。全長16S rDNA檢測到的物種多樣性和生態(tài)結(jié)構(gòu)的復(fù)雜度更高较雕,而且模糊分類更少(如圖2所示)。
圖2. PhyloTags和V4 iTags測序的模糊分類結(jié)果展示(門水平)挚币。黑色柱代表V4 iTags模糊分類序列數(shù)占對(duì)應(yīng)門水平序列總數(shù)的百分比亮蒋;白色柱代表PhyloTags測序結(jié)果模糊分類序列百分比。柱上方的百分?jǐn)?shù)代表對(duì)應(yīng)門水平的物種豐度妆毕。
為了評(píng)估擴(kuò)增子長度對(duì)群體分析的影響慎玖,研究人員隨機(jī)抽取了Sakinaw樣本中的1818條PacBio FL序列和它們對(duì)應(yīng)的二代測序產(chǎn)生的V4區(qū)域序列進(jìn)行成組比較。結(jié)果表明笛粘,在多個(gè)實(shí)例中趁怔,相同的序列對(duì)表現(xiàn)出不同的鑒定結(jié)果湿硝。產(chǎn)生差異的原因是16S rDNA基因的突變位點(diǎn)在各區(qū)域分布并不均勻,選擇少數(shù)可變區(qū)作為擴(kuò)增片段可能會(huì)導(dǎo)致檢測結(jié)果出現(xiàn)偏差润努,高估或低估群落結(jié)構(gòu)多樣性(如圖3a,3b所示)关斜。
? 更多的物種鑒定
全長16S rDNA測序比V4區(qū)測序多鑒定到12%-25%的物種(從種到門水平),更準(zhǔn)確地將微生物與重要的生物化學(xué)循環(huán)相關(guān)聯(lián)唬复。全長16S rDNA測序檢測到了Sakinaw湖水中包括氮循環(huán)和產(chǎn)甲烷循環(huán)中的特定菌Methylocaldum矗积、Nitrospiraceae、Bacillus和Methylotenera敞咧,而在V4檢測中棘捣,這些菌的豐度被嚴(yán)重低估(如圖4所示)。
綜上所述,PacBio全長16S rDNA測序集合了Sanger測序的讀長優(yōu)勢和二代測序的高通量優(yōu)勢测砂,具有和二代測序相媲美的準(zhǔn)確度和重復(fù)性茵烈,可提供更準(zhǔn)確的物種分類和更多的物種鑒定,在系統(tǒng)發(fā)育砌些、群落鑒定和代謝通路預(yù)測方面都更有優(yōu)勢呜投。
在和MiSeq V4 rDNA測序的PK中,PacBio全長16S rDNA完勝存璃!不過全長16S rDNA測序仍有不完美之處:
不同物種的16S拷貝數(shù)存在差異仑荐,全長16S測序仍無法解決拷貝數(shù)不一致導(dǎo)致的豐度差異;
全長16S序列的獲取仍需通過PCR過程纵东,無法完全避免PCR偏好性帶來的系統(tǒng)誤差粘招。
以上兩點(diǎn)是目前16S rDNA測序固有的問題,如果對(duì)此非常介意的話偎球,科技君良心推薦您選擇宏基因組學(xué)測序洒扎。
如果您被PacBio全長16S rDNA測序的優(yōu)勢所打動(dòng)辑甜,并樂于嘗試新鮮事物,科技君為您推薦華大基因PacBio全長16S rDNA測序袍冷,絕對(duì)靠譜栈戳!想了解全長16S rDNA測序策略的童鞋們可直接留言。
參考文獻(xiàn):
1.Singer, Esther, et al. "High-resolution phylogenetic microbial community profiling." The ISME journal (2016)