劉小澤寫(xiě)于19.3.16
看了一篇綜述奕谭,又加了一些擴(kuò)展知識(shí)
文章
這是一篇2017發(fā)表在Genome Medicine上的文章A practical guide to single-cell RNA-sequencing for biomedical research and clinical applications
背景
- 單細(xì)胞測(cè)序:《Nature Methods》2013年度技術(shù)绑嘹;《Nature》2017年7月刊的封面推薦 ;《Science》2018十大科學(xué)突破榜首
- 研究細(xì)胞的方法:基因組DNA序列(堿基如何排列怕吴、各個(gè)序列的豐度)喻奥、染色質(zhì)結(jié)構(gòu)(常聽(tīng)說(shuō)的3C汉买、4C滋将、5C、HiC等)症昏、mRNA序列(排列與豐度)随闽、非編碼RNA、蛋白表達(dá)肝谭、蛋白修飾掘宪、細(xì)胞代謝【因此不只有scRNA,還有sc基因組攘烛、sc表觀組】
- 一個(gè)細(xì)胞中的待研究分子是微量的魏滚,因此我們一般使用幾千細(xì)胞或直接取組織(上千萬(wàn)甚至上億),這樣就可以積累足夠的分子信息坟漱,可以開(kāi)展 Genome-wide association studies (GWASs) 鼠次、鑒定SNPs
- 主要做什么:分離新細(xì)胞亞群、構(gòu)建細(xì)胞間互作網(wǎng)絡(luò)芋齿、體內(nèi)與體外實(shí)驗(yàn)反應(yīng)腥寇、細(xì)胞在不同器官的情況、不同人群比較觅捆、不同物種比較
- 總體≠個(gè)體:細(xì)胞異質(zhì)性的存在(受精卵發(fā)育成個(gè)體赦役,最終去向十分多樣=》肌肉細(xì)胞、神經(jīng)細(xì)胞等等栅炒,why掂摔?术羔;腫塊中心、周?chē)依臁⑥D(zhuǎn)移中的細(xì)胞各異级历,分離出來(lái)判斷療法有效性)
- 挑戰(zhàn):同時(shí)檢查單個(gè)細(xì)胞中表達(dá)的數(shù)千種蛋白質(zhì)(蛋白組研究范疇),這個(gè)完整性有待提高
名詞
Barcoding
- 之前做單細(xì)胞簇秒,真的是一個(gè)個(gè)細(xì)胞取出來(lái)鱼喉,然后獨(dú)立構(gòu)建文庫(kù)測(cè)序(比如:流式細(xì)胞術(shù)、激光捕獲顯微切割LCM=》組織切片)趋观,但是這通量非常低(有點(diǎn)Sanger測(cè)序和二代測(cè)序?qū)Ρ鹊母杏X(jué))扛禽。
- 后來(lái)發(fā)展出高通量的方法,主要是給每個(gè)細(xì)胞加上獨(dú)一無(wú)二的DNA序列(就是條形碼barcode皱坛,就是為了識(shí)別)编曼,然后測(cè)序時(shí)將相同的barcode序列歸為同一個(gè)細(xì)胞來(lái)源
- 單細(xì)胞轉(zhuǎn)錄組可以在polyT引物5'端加上barcode;單細(xì)胞基因組目前主要利用高效轉(zhuǎn)座酶(transposase)Tn5實(shí)現(xiàn)
Spike-in
Spike-ins can be used for assessing the level of technical variability and for identifying genes with a high degree of biological variability
每個(gè)細(xì)胞都是獨(dú)特的剩辟,和普通的Bulk RNA-seq不同掐场,材料不容易獲得,不太好做重復(fù)贩猎,因此通過(guò)生物學(xué)重復(fù)來(lái)評(píng)價(jià)技術(shù)手段/數(shù)據(jù)質(zhì)量的方法不靠譜熊户。
但是數(shù)據(jù)質(zhì)量還是需要評(píng)價(jià)的,那么就通過(guò)向每個(gè)細(xì)胞裂解液中加入已知序列與一定數(shù)量的合成mRNA吭服,例如 external RNA control consortium (ERCC)【翻譯的話嚷堡,姑且翻譯成:外源RNA對(duì)照聯(lián)盟】開(kāi)發(fā)的“內(nèi)參”,可以根據(jù)RNA讀數(shù)判斷樣本間差異
高ERCC含量與低質(zhì)量數(shù)據(jù)相關(guān)
-
但是使用spike-in也有一些問(wèn)題要注意:
- has to carefully calibrate the concentration that results in an optimal fraction of reads from the spike-ins
- spike-in mixes are sensitive to degradation
- captured less efficiently than endogenous transcripts
- Spike-in不適用于droplet-seq的方法
-
UMI( Unique molecular identifier )
- barcoding的變體艇棕,待擴(kuò)增的RNA分子用隨機(jī)n-mer寡核苷酸標(biāo)記蝌戒。設(shè)計(jì)不同標(biāo)簽的數(shù)量,大大超過(guò)待擴(kuò)增的轉(zhuǎn)錄本沼琉,產(chǎn)生獨(dú)特標(biāo)記的分子北苟,并允許控制擴(kuò)增偏差【例如10-mer的UMI,就會(huì)有 4的十次方 約等于100萬(wàn)種變化】
- UMI是一段隨機(jī)序列打瘪,每一個(gè)DNA分子都有自己的UMI序列友鼻。可以大大降低PCR誤差(比如:原來(lái)兩個(gè)樣本中某基因表達(dá)量相同闺骚,但是由于兩個(gè)樣本擴(kuò)增效率不同桃移,樣本1為99%,樣本2只有95%葛碧,那么同時(shí)擴(kuò)增40個(gè)循環(huán)借杰,這同一個(gè)基因就有了
0.99^40 / 0.95^40 = 5.2倍
差異,因此本來(lái)沒(méi)有差異也會(huì)因?yàn)橥饨缫蛩財(cái)U(kuò)增效率的影響而產(chǎn)生“假陽(yáng)性”) - UMI只用在3'轉(zhuǎn)錄本測(cè)序的方法中进泼,如CEL-seq2, Drop-seq, MARS-seq
Dropout
- 基因在一個(gè)細(xì)胞中有表達(dá)蔗衡,但在另一個(gè)細(xì)胞中未檢測(cè)到(按照道理纤虽,每個(gè)基因應(yīng)該都可以檢測(cè)到,只是表達(dá)量多少)
- 可能源于RNA總量少導(dǎo)致擴(kuò)增建庫(kù)丟失 或者 RNA表達(dá)隨機(jī)性
Mass cytometry
- 基于流式細(xì)胞法和質(zhì)譜绞惦,其中使用元素標(biāo)簽標(biāo)記的抗體檢測(cè)蛋白質(zhì)表達(dá) - 允許在一次實(shí)驗(yàn)中對(duì)數(shù)千個(gè)單細(xì)胞上的數(shù)十種蛋白質(zhì)進(jìn)行平行測(cè)定
Split-pooling
(Rosenberg et al. ) combinatorial barcoding to profile single-cell transcriptomes without requiring the physical isolation of each cell
-
https://www.rna-seqblog.com/split-seq-single-cell-profiling-with-split-pool-barcoding/
Basic step
- The first, and most important, step in conducting scRNA-seq has been the effective isolation of viable, single cells from the tissue of interest
- Next, isolated individual cells are lysed to allow capture of as many RNA molecules as possible.
- Next, poly[T]-primed mRNA is converted to complementary DNA (cDNA) by a reverse transcriptase.
- Then, amplified and tagged cDNAfrom every cell is pooled and sequenced by NGS.
Types of material
- 理論上逼纸,任何真核生物細(xì)胞都可以
- Primary cells
- 胚胎 embryo
- 腫瘤 tumours
- 神經(jīng) nervous system
- 造血 haematopoietically derived cells
-
The Human Cell Atlas
- 2017年啟動(dòng),“媲美人類(lèi)基因組計(jì)劃”济蝉,核心技術(shù)=》單細(xì)胞組學(xué)
- 對(duì)人類(lèi)37萬(wàn)億個(gè)細(xì)胞進(jìn)行細(xì)胞采集杰刽、分類(lèi)和繪圖,側(cè)重描繪組織王滤,而不是整個(gè)器官贺嫂;后期階段可以納入器官及感興趣的疾病小群體
- 2018.3.8,Sanger研究所宣布人類(lèi)發(fā)育細(xì)胞圖譜(Human Developmental Cell Atlas 雁乡,HDCA)的初步項(xiàng)目25萬(wàn)個(gè)發(fā)育細(xì)胞測(cè)序完成
補(bǔ)充:測(cè)序平臺(tái)
-
10X Genomics
- 2016.2推出 Chromium第喳;
- 通量高(7分鐘內(nèi)完成100~80,000個(gè)細(xì)胞的捕獲),周期短踱稍,成本低曲饱,細(xì)胞捕獲效率高(單個(gè)樣本細(xì)胞捕獲率高達(dá)65%);細(xì)胞活性要求>90% =》 適用于發(fā)現(xiàn)新細(xì)胞
- 橫向孔道逐個(gè)導(dǎo)入凝膠微珠Gel beads =》 第一個(gè)縱向道輸入細(xì)胞 =》Gel吸附細(xì)胞=》微流控技術(shù)送到第二個(gè)縱向通道(“油tube”)=》油滴GEMs 【因此珠月,一個(gè)油滴就是一個(gè)Gel bead扩淀,也就是一個(gè)細(xì)胞】=》收集到EP管 =》每個(gè)Gel bead表明都放滿了各不相同的Barcode和UMI序列+polyT =》細(xì)胞裂解,polyT抓取mRNA的3'polyA
-
BD Rhapsody
- 分子標(biāo)簽技術(shù)(每個(gè)轉(zhuǎn)錄本標(biāo)記特異性分子標(biāo)簽)=》單細(xì)胞水平上基因表達(dá)譜的絕對(duì)定量
- 單次實(shí)驗(yàn)可制備100-10000個(gè)單細(xì)胞文庫(kù)
- CytoSeq特有的蜂窩板技術(shù)(20W+的微孔)啤挎,避免了10X中存在的概率碰撞影響捕獲效率問(wèn)題
- 可以多樣本混合捕獲驻谆;成像系統(tǒng);轉(zhuǎn)錄組-蛋白組聯(lián)合分析
-
Wafergen公司 ICELL8
- 基于微流控芯片侵浸,5184個(gè)反應(yīng)孔
- 每次運(yùn)行可分離500-1000個(gè)細(xì)胞
- 捕獲效率為30%,成本相對(duì)較低
-
Fluidigm公司C1
- 通量低氛谜、成本高(2000-3000細(xì)胞需要18000-100000美元)掏觉、周期慢
- 同時(shí)捕獲96個(gè)細(xì)胞
- 全長(zhǎng)轉(zhuǎn)錄組
-
llumina Bio-Rad
- ddSEQ
- 一次性檢測(cè)8個(gè)樣本,每個(gè)樣本可以得到500~10000個(gè)細(xì)胞
- 組織功能值漫、病情進(jìn)展和治療反應(yīng)方面的協(xié)同作用
- 捕獲效率低澳腹,僅為3%;成本低
- 1CellBio => InDrop
- Dolomite => μEncapsulator
歡迎關(guān)注我們的公眾號(hào)~_~
我們是兩個(gè)農(nóng)轉(zhuǎn)生信的小碩杨何,打造生信星球酱塔,想讓它成為一個(gè)不拽術(shù)語(yǔ)、通俗易懂的生信知識(shí)平臺(tái)危虱。需要幫助或提出意見(jiàn)請(qǐng)后臺(tái)留言或發(fā)送郵件到jieandze1314@gmail.com