一猾骡、什么是單細(xì)胞測序?
如果簡單地說敷搪,單細(xì)胞測序就是獲取單個細(xì)胞遺傳信息的測序技術(shù)兴想,似乎沒有多大的幫助。為了理解這個問題赡勘,咱們不妨先來了解一下測序技術(shù)到底可以做些什么嫂便。
目前,測序可以回答以下6類問題:
1. DNA的序列:ATCG怎么排列闸与,以及各序列的豐度毙替;
2. DNA的表觀遺傳修飾:比如甲基化、羥甲基化践樱,以及組蛋白的各種修飾厂画;
3. RNA的序列:AUCG怎么排列,以及各序列的豐度拷邢;
4. RNA的表觀遺傳修飾:比如近年很火的m6A修飾袱院;
5. 染色質(zhì)的結(jié)構(gòu):3C、4C瞭稼、5C等各種C忽洛;
6. 其他魔性應(yīng)用:比如DNA損傷位置、蛋白-蛋白相互作用等弛姜。
單細(xì)胞測序脐瑰,就是想辦法在單細(xì)胞層面去回答以上6類問題骡湖。
二丸相、為什么要使用單細(xì)胞測序改含?
如果把這個問題換個姿勢來問,那就變成荠商,為什么非用單細(xì)胞測序不可?
世界上沒有兩片相同的葉子续誉。對于多細(xì)胞生物來說莱没,細(xì)胞與細(xì)胞之間是有差異的。當(dāng)然了酷鸦,這個差異可大可小饰躲。
比如說牙咏,受精卵從一個細(xì)胞開始分裂,并逐漸形成囊胚嘹裂,最終發(fā)育成個體的時候妄壶,細(xì)胞與細(xì)胞之間的差異會越來越大:有的分化成神經(jīng)元,有的分化成骨骼肌寄狼,各自表達(dá)著不同的遺傳信息丁寄,承擔(dān)著不同的生理功能。
又比如在腫瘤組織中泊愧,腫塊中心的細(xì)胞伊磺,腫塊周圍的細(xì)胞,淋巴轉(zhuǎn)移灶的細(xì)胞删咱,以及遠(yuǎn)端轉(zhuǎn)移的細(xì)胞屑埋,其基因組和轉(zhuǎn)錄組等遺傳信息,是存在差異的痰滋。而這種差異摘能,在臨床上,可以決定該腫瘤對某種療法是否有效即寡。
這就是所謂的遺傳信息的異質(zhì)性徊哑。
傳統(tǒng)的研究方法,是在多細(xì)胞水平進(jìn)行的聪富。因此莺丑,最終得到的信號值,其實是多個細(xì)胞的平均墩蔓,丟失了異質(zhì)性的信息梢莽。為了讓大家能夠更加直觀地理解這個問題,我們不妨來看下面這張圖:
為了檢測某個蛋白質(zhì)的表達(dá)量奸披,我們可以用Western blot和流式細(xì)胞術(shù)來實現(xiàn)昏名。但是,用Western blot的話阵面,我們并沒有辦法區(qū)分上述的情況:目的蛋白只在10%的細(xì)胞中強(qiáng)表達(dá)轻局,還是在50%的細(xì)胞里中等表達(dá),還是在所有細(xì)胞中弱表達(dá)呢样刷?因為最終電泳跑出來仑扑,就是一條差不多強(qiáng)度的帶。但如果用流式細(xì)胞術(shù)這種在單細(xì)胞水平對熒光強(qiáng)度加以測定的技術(shù)置鼻,就能區(qū)分上述的情況了镇饮。
同樣道理,單細(xì)胞測序能夠檢出混雜樣品測序所無法得到的異質(zhì)性信息箕母。而這將帶領(lǐng)整個遺傳學(xué)領(lǐng)域進(jìn)入新的次元储藐。
三俱济、如何實現(xiàn)單細(xì)胞測序?
目前主要有兩種策略來實現(xiàn)單細(xì)胞測序钙勃。
第一種蛛碌,也就是目前大多數(shù)人所想象的那樣,將單個細(xì)胞分離出來肺缕,并獨立構(gòu)建測序文庫左医,最終進(jìn)行測序的路線。我們可以通過流式細(xì)胞術(shù)(含微流體芯片)同木,或者激光捕獲顯微切割(LCM:激光捕獲顯微切割技術(shù))來實現(xiàn)浮梢。流式細(xì)胞術(shù)估計大家比較熟悉,就不多講了彤路,它主要運(yùn)用于細(xì)胞樣品秕硝。對于組織切片樣品來說,主要是通過LCM來獲取單細(xì)胞洲尊,原理可以見下面的示意圖远豺。
不過,將單細(xì)胞挨個分離出來再分別建庫測序坞嘀,通量非常低躯护,這主要受成本的限制。隨著待測單細(xì)胞的個數(shù)的增長丽涩,測序的成本也會幾乎呈線性提升棺滞。通常做十幾二十來個細(xì)胞,就要燒掉很多錢了矢渊。然而继准,這數(shù)十個細(xì)胞,就足夠說明問題了嗎矮男?
為了克服這個困難移必,近年來多采取第二種策略:基于標(biāo)簽(barcode)的單細(xì)胞識別。它的主要思想是毡鉴,給每個細(xì)胞加上獨一無二的DNA序列崔泵,這樣在測序的時候,就把攜帶相同barcode的序列視為來自同一個細(xì)胞了猪瞬。這種策略管削,可以通過一次建庫,測得數(shù)百上千個單細(xì)胞的信息撑螺。
不過,針對具體的測序類型崎弃,給細(xì)胞加barcode的方案是有不小的區(qū)別的甘晤。對于RNA(轉(zhuǎn)錄組mRNA)來說含潘,會比較容易理解一些。由于mRNA測序前需要做逆轉(zhuǎn)錄线婚,那么我們只需要在poly T引物的5’端加入barcode即可遏弱。具體可見下面的示意圖(來自文獻(xiàn)doi:10.1038/nprot.2016.154):
首先將單細(xì)胞懸液樣品和帶有barcode的水凝膠珠子,通過微流體芯片塞弊,包裹在一個油滴之中漱逸。在油滴中進(jìn)行逆轉(zhuǎn)錄之后,每一個單細(xì)胞的cDNA文庫游沿,就帶上了獨一無二的barcode了(藍(lán)色部分)饰抒。最后,我們再將所有的單細(xì)胞cDNA文庫混在一起測序诀黍,再通過程序識別barcode袋坑,區(qū)分單細(xì)胞。
如果測序?qū)ο笫荄NA眯勾,比如全基因組枣宫,就需要用別的方式來加barcode。目前主要是通過一種經(jīng)過改造的高效轉(zhuǎn)座酶(transposase)Tn5來實現(xiàn)吃环。
基因轉(zhuǎn)座是指轉(zhuǎn)座子DNA從一個染色體座位“跳躍”到另外一個座位的過程也颤。在這個過程中,有轉(zhuǎn)座酶的參與郁轻。單細(xì)胞的DNA測序就利用了這個特性翅娶,將barcode DNA預(yù)先和轉(zhuǎn)座酶Tn5組裝好,再通過上述的微流體技術(shù)范咨,將細(xì)胞和轉(zhuǎn)座復(fù)合物包裹在一個油滴之中故觅。隨后,轉(zhuǎn)座酶會把barcode插入到基因組DNA之中渠啊。這個過程在文獻(xiàn)中也被成為tagmentation输吏。
不過,基于Tn5的barcode復(fù)雜度(即能有多少獨一無二的barcode)還是比較有限的替蛉。為了保證tagmentation的效率贯溅,上圖中紅色的barcode區(qū)域不可以過長。同時躲查,為了避免測序錯誤帶來的誤識別(如偶爾測錯了一個堿基它浅,但卻被當(dāng)成另外一個barcode),barcode的復(fù)雜度也不是4的n次方那么高镣煮,需要引入校正機(jī)制姐霍。具體就不展開講了。總地來說镊折,僅靠Tn5來做單細(xì)胞胯府,一次往往僅能識別數(shù)十到數(shù)百個單細(xì)胞。
為了提高復(fù)雜度恨胚,即一次能夠捕獲的單細(xì)胞數(shù)目骂因,目前的解決方案是走組合索引(combinatorial indexing)路線。(見下圖赃泡,來自文獻(xiàn)doi:10.1038/nmeth.4154)
它的主要思路是寒波,通過兩步反應(yīng),加兩次標(biāo)簽升熊。首先俄烁,將單細(xì)胞懸液放在多孔板中,并用轉(zhuǎn)座酶Tn5給細(xì)胞加第一個barcode僚碎,這里每個孔中的barcode是不同的猴娩。然后,再將樣品混合起來勺阐,通過流式細(xì)胞術(shù)卷中,將少量的細(xì)胞分選到含有建庫PCR引物的多孔板中。而這些引物是帶有第二輪barcode的渊抽。因此蟆豫,經(jīng)過Tn5的轉(zhuǎn)座,和PCR加標(biāo)簽懒闷,絕大部分的細(xì)胞就能帶上獨一無二的barcode了十减。
讀到這里,肯定有人發(fā)現(xiàn)這個方案存在的問題愤估。舉個例子帮辟,萬一在流式分選時,在第一個孔里分了兩個或以上橙色細(xì)胞玩焰,然后又通過PCR被加上了紅色的標(biāo)簽由驹,那這兩個單細(xì)胞就無法被區(qū)分開來了。
確實如此昔园,combinatorial indexing大概會有10%的撞車率(collision rate)蔓榄,即約有10%的機(jī)會把兩個單細(xì)胞被誤認(rèn)為是同一個。這個數(shù)值的高低默刚,取決于第一步tagmentation的復(fù)雜度(復(fù)雜度越高甥郑,撞車率越低),以及在分選時荤西,分到每一個孔里的細(xì)胞數(shù)量(數(shù)量越低澜搅,撞車率越低)伍俘。但是,combinatorial indexing卻能一次識別數(shù)千個單細(xì)胞店展,將通量提升數(shù)十至上百倍养篓。魚與熊掌,就看實驗者的取舍了赂蕴。