作者:堯小飛
審稿:童蒙
編輯:amethyst
01 背景介紹
目前在NGS的科技服務(wù)市場上單細(xì)胞轉(zhuǎn)錄組和三代是最火的兩個方向食拜,也是由于工業(yè)技術(shù)升級帶來的研究的新方向和新視野(單細(xì)胞分篩技術(shù)和單分子全長測序)簿训。單細(xì)胞技術(shù)為我們研究細(xì)胞的異質(zhì)性、細(xì)胞發(fā)育袜漩、腫瘤微環(huán)境、精準(zhǔn)醫(yī)療帶來了巨大的進(jìn)步,大大促進(jìn)了研究從混合細(xì)胞到單細(xì)胞的水平的進(jìn)步,進(jìn)一步揭示了生物體的微觀視野的變化規(guī)律只恨。單分子全長能夠在不打斷的前提下直接測mRNA或者DNA全長序列译仗,避免了短序列的拼接可能出現(xiàn)的錯誤抬虽,發(fā)現(xiàn)了大量之前未發(fā)現(xiàn)的新的轉(zhuǎn)錄本。
那么有沒有辦法能夠?qū)烧叩募夹g(shù)結(jié)合起來纵菌,在單細(xì)胞層面研究其全長轉(zhuǎn)錄本的變化規(guī)律阐污?答案是肯定的,早在2018年10月的時候Ishaan等人就在Nature Biotechnology(https://www.nature.com/nbt)上發(fā)表了單細(xì)胞全長轉(zhuǎn)錄組的研究方法咱圆,作者主要是利用10xGenomics公司的單細(xì)胞分篩平臺笛辟,得到單個細(xì)胞的全長cDNA文庫,然后用Pacbio平臺的建庫技術(shù)進(jìn)行三代建庫序苏,然后測得單個細(xì)胞全長轉(zhuǎn)錄本手幢,通過研究不同亞群細(xì)胞的轉(zhuǎn)錄本特征,發(fā)現(xiàn)了亞群特異的轉(zhuǎn)錄本忱详,這從另外一個視野研究了細(xì)胞的異質(zhì)性围来。
雖然上面解決了沒有單細(xì)胞全長轉(zhuǎn)錄本的問題,但是Ishaan等人的方法將會具有一個巨大的成本問題匈睁,三代和單細(xì)胞轉(zhuǎn)錄組本來成本就有些較高监透,兩者結(jié)合起來,如果還要用三代定量的話航唆,一個樣品初步預(yù)計也得快20萬了胀蛮,因此此方案不太適合推廣。雖然目前三代供應(yīng)商Pacbio和ONT都有單細(xì)胞轉(zhuǎn)錄組解決方法糯钙,但都有面對成本的問題粪狼,因此亟需一個低成本的單細(xì)胞全長轉(zhuǎn)錄本或者類似的方案。
Rickard團(tuán)隊是單細(xì)胞領(lǐng)域中鼎鼎大名的團(tuán)隊任岸,在10xGenomics平臺問世之前再榄,他們團(tuán)隊開發(fā)的smart-seq是單細(xì)胞轉(zhuǎn)錄組領(lǐng)域中絕對的王者。時隔7年演闭,2020年5月6日不跟,Rickard團(tuán)隊在smart-seq2的基礎(chǔ)上,通過改進(jìn)開發(fā)了smart-seq3技術(shù)(Single-cell RNA counting at allele and isoform resolution using Smart-seq3)(https://www.nature.com/articles/s41587-020-0497-0)米碰,該技術(shù)就是低成本的單細(xì)胞全長轉(zhuǎn)錄組的解決方案窝革,并將該技術(shù)發(fā)表在Nature Biotechnology 购城。
02 Smart-seq3建庫基本原理
Smart-seq3既然號稱能夠在轉(zhuǎn)錄本水平研究單細(xì)胞的異質(zhì)性,那么它究竟是如何達(dá)到的呢虐译?我們首先看看其建庫原理瘪板。原理圖如下:
從上面的建庫原理圖來看,其建庫方式基本上與smart-seq2一致漆诽,最大的不同在于在Tn5酶的tag后面添加了UMI序列(上圖中的紅色x號表示轉(zhuǎn)錄本的突變位點)侮攀,其建庫流程如下:
- 通過oligo-dT priming釣取含有polyA尾巴的mRNA。
- 通過TSO(template-switching oligo)進(jìn)行反轉(zhuǎn)錄厢拭,合成全長cDNA文庫兰英,得到A1序列。TOS序列構(gòu)成:Tn5 motif 11 and a novel 11-bp tag sequence, followed by an 8-bp UMI sequence and three riboguanosines.
- 通過PCR擴(kuò)增供鸠,將A1序列進(jìn)行擴(kuò)增畦贸,擴(kuò)增多條序列。
- tagmentation楞捂,通過Tn5-based進(jìn)行tagmentation薄坏,然后構(gòu)建測序上機(jī)文庫。
- 通過UMI序列區(qū)分是否是internal reads寨闹,挑選5‘帶有UMI序列胶坠,構(gòu)建延伸轉(zhuǎn)錄本。
在構(gòu)建轉(zhuǎn)錄組的過程中繁堡,主要是挑選5’UMI序列的雙端序列進(jìn)行構(gòu)建沈善;由于5‘都是一樣的,但是3’不一樣(綠色的條塊)帖蔓,因此可以將具有相同的5‘端的序列矮瘟,不同3’的序列進(jìn)行合并,延伸轉(zhuǎn)錄本塑娇,得到更長的轉(zhuǎn)錄本澈侠。這種方式得到的轉(zhuǎn)錄本當(dāng)然沒有Pacbio等三大方法得到的全長轉(zhuǎn)錄本長、全埋酬,但是相對于普通單細(xì)胞轉(zhuǎn)錄組來說哨啃,轉(zhuǎn)錄本長度大大增加了,提供了單細(xì)胞水平的轉(zhuǎn)錄組的特征写妥。下圖為Smart-seq3文庫長度分布(其文庫長度分布在600-2000bp之間):
03 Smart-seq3與 PacBio 結(jié)果比較
既然smart-seq3是為了達(dá)到轉(zhuǎn)錄組水平開發(fā)的技術(shù)拳球,那就需要比較一下它與真正的三代技術(shù)具體有什么差異,到底有什么區(qū)別珍特?作者構(gòu)建了369 individual primary mouse fibroblasts ( F1 offspring from CAST/EiJ and C57/Bl6J strains ) 文庫祝峻,然后構(gòu)建全長轉(zhuǎn)錄本,并且同時使用smart-seq3構(gòu)建的cDNA文庫進(jìn)行Pacbio建庫,建庫用的是SMRTbell Template Prep Kit 1.0-SPv3試劑盒莱找,可以構(gòu)建500–2,000 bp的文庫酬姆, Circular consensus sequencing (CCS) reads were generated from raw reads using the SMRTlink pipeline。
注:Summarizing the numbers of RNA molecules (x axis, log 10 ) reconstructed to different lengths (in base pairs, y axis), showing only molecules additionally assigned to a unique transcript isoform. In total, the 1 million longest reconstructed RNA molecules are shown from one experiment with 369 mouse fibroblasts, with molecules shown in descending order.
上表格展示了Smart-seq3的轉(zhuǎn)錄本長度和數(shù)目分布的數(shù)據(jù)奥溺,從上圖可以看出辞色,smart-seq3可以構(gòu)建較長的轉(zhuǎn)錄本,可以從轉(zhuǎn)錄組水平上研究單細(xì)胞的異質(zhì)性浮定。與PacBio的數(shù)據(jù)相比相满, 有54,302 RNA分子在smart-seq3和Pacbio兩種平臺都能檢出;smart-seq3檢出的全長轉(zhuǎn)錄本數(shù)目占Pacbio的 46% 桦卒。如下圖a所示立美。
具體就 Col1a2基因來說,該轉(zhuǎn)錄本長度為2.3kb闸盔, Smart-seq3構(gòu)建轉(zhuǎn)錄本長度為1.9 kb悯辙,Pacbio的轉(zhuǎn)錄本長度為2.267kb琳省。
04 Smart-seq3其他方面的優(yōu)勢
今天在這里主要介紹了Smart-seq3構(gòu)建全長轉(zhuǎn)錄本的特點迎吵,沒有對其他的優(yōu)點進(jìn)行詳細(xì)介紹,如果對此感興趣针贬,可以翻一翻原文击费。其實Smart-seq3在Smart-seq2的基礎(chǔ)上有較大的技術(shù)改進(jìn)和提示,比如另外一個比較重要的方面就是SNP分型的問題桦他,比如做測試的 CAST and C57 alleles蔫巩,Smart-seq3的結(jié)果較Smart-seq2的結(jié)果相關(guān)性有顯著性的提高,由之前的 0.79和0.68提升到了0.94和0.75快压。
另外Smart-seq3的基因檢出較Smart-seq2有顯著性的提高圆仔,而且編碼蛋白、lncRNA檢出也有較高的提高蔫劣。
05 總結(jié)
總而言之,Smart-seq3與Smart-seq2相比較脉幢,無論是在基因分型歪沃、轉(zhuǎn)錄本長度、編碼基因和lncRNA基因的檢出數(shù)來說嫌松,都具有了較大的提升沪曙。特別是Smart-seq3可以構(gòu)建全長轉(zhuǎn)錄本,讓研究者可以研究單細(xì)胞水平上的轉(zhuǎn)錄本特性萎羔,雖然轉(zhuǎn)錄本檢出只有Pacbio的46%液走,但是其優(yōu)點在于可以在較低的成本情況下,研究單細(xì)胞水平的轉(zhuǎn)錄本特征。
目前單細(xì)胞水平的全長轉(zhuǎn)錄本解決方案較多缘眶,比如Pacbio和ONT都推出了相應(yīng)的解決方案腻窒,但是三代+單細(xì)胞的方案難以企及的成本,影響了其推廣應(yīng)用磅崭;Smart-seq3在一定程度上的解決了此問題儿子,可以在目前進(jìn)行推廣應(yīng)用;當(dāng)然如果用Smart-seq3+三代的話砸喻,其構(gòu)建的轉(zhuǎn)錄本將會更完整柔逼。
關(guān)注“生信阿拉丁”微信公眾號,第一時間查收“新款”生信學(xué)習(xí)干貨割岛。