近期的一系列際遇都再次論證了我真的是一個靠運氣闖蕩江湖的人,鬼使神差的混入了一個超棒的實驗室搭综,并且受到了同伴和室友在工作和生活上的無私的照顧战得。日子像夢一樣美好控嗜,我只想時間走的再慢一點唁毒,讓我能把這里的四季再多看一眼蒜茴,再看清楚一些。
記得之前果子老師說過浆西,靠輸出倒逼輸入粉私,我想嘗試著把我的學習過程記錄下來,理清思路近零,同時也許還能認識更多的再學習路上的小伙伴诺核。(我真的考大學都沒有這么努力過,倒著時差學習久信,哈哈)
就從這篇最經典的Drop-seq文章開始吧窖杀。
Russell 告訴我,這篇文章只需要看懂前兩個圖裙士,我們來看看它們講了什么入客。
圖一(本文的圖一,文章中的圖二)
我來嘗試以我的思路講清楚它腿椎。
無論出于什么原因桌硫,你希望能夠測到一個cell里面的轉錄組(transcriptome),根據(jù)illumina的測序儀啃炸,你是不可能在最后一步一個細胞一個細胞單獨測的(我了解的不多铆隘,不知道這句話是否正確),所以一個正常的思路是肮帐,給每一個細胞一個單獨的標記咖驮,并且,希望在標記的過程中每一個細胞都是分開的训枢,并且不會互相接觸到托修,這行在標記的過程中,才不會混恒界。
那么睦刃,我們如何實現(xiàn)這個過程呢?
首先十酣,為了保證你的細胞在標記的過程中是分開的涩拙,這波人發(fā)明了一個叫做微流體設備的東西(microfuidic device)
里面有三個上樣孔,在其中你可以分別加入1耸采、你的樣本細胞懸液兴泥,2、Gel Beads 3虾宇、partitioning oil搓彻。像下圖中一樣。
然后它就可以啟動圖一A中的流程,當細胞流過時旭贬,會被與beads結合然后被油滴包裹怔接,形成一個油包水的密閉小液滴(droplet)。細胞和microparticle(beads)相遇會裂解稀轨,釋放出里面的各種物質扼脐,RNA(mRNA,tRNA奋刽,rRNA)瓦侮,蛋白質,脂質佣谐,DNA等等各種物質脏榆。因為beads上聯(lián)接了接頭,其中有一段是ploy (dT)序列(30)個台谍,在細胞裂解釋放的核酸中,只有mRNA帶有polyA的尾巴吁断,于是這段beads上面ploy (dT)就可以從眾多的裂解產物里捕獲到mRNA趁蕊。這也就是Russell問我為什么Drop-seq要用3'端測序的原因了。
Maxter Mix中帶有反轉錄試劑仔役,當mRNA被捕獲后掷伙,就可以從它的3‘端開始作為模板,進行反轉錄出cDNA的第一條鏈又兵,這第一條鏈就沿著poly(dT)序列延申任柜,長在了beads上,形成了圖一7中的STAMPs沛厨,接著我們把序列洗脫宙地,以cDNA的第一條鏈為模板,進行PCR逆皮,合成cDNA的第二條鏈宅粥,然后就是我們熟悉的(我其實不熟悉,哈哈)cDNA擴增电谣,illumina測序啦秽梅。
我們如何知道那些序列是來自那個細胞的?或者說剿牺,single cell的RNA-seq和bulk的RNA-seq的最大區(qū)別在哪里呢企垦?是Barcode,或者說是Cell barcode晒来。每一個beads上都有著相同的Cell barcode钞诡,而beads與beads間的Cell barcode是不同的,假設每個beads只捕獲一個cell,那么則每個cell都被cell barcode 單獨標記了臭增。
如何保證每一beads只捕獲一個cell呢懂酱?第一是控制cell和beads的流速,第二是beads的數(shù)目遠遠超過cell的數(shù)目誊抛,即絕大多數(shù)的beads都是空的列牺,只有少數(shù)的才捕獲到了cell。但是還是有個別的droplet里面會兩個或者更多的細胞拗窃,這就需要我們去QC啦瞎领。
single cell RNA-seq的barcode這么神奇,我們結合10x Genomics的說明書一起來分步驟詳解一下随夸。
先來看看這些區(qū)段都是用來做什么的九默。
由內向外:
Poly(dT):用來和polyA結合,捕獲mRNA
UMI:用來標記不同的PCR產物(數(shù)count)
10xBarcode:用來標記不同的細胞
Sample Index:用來標記不同的樣本
Truseq Read 1宾毒、2 :用來進行連接beads驼修,cDNA的PCR擴增和加P7接頭
P5和P7:用來進行illumina的橋式PCR測序。
在這些序列中诈铛,P5乙各、P7、Read 1幢竹、2 的序列是已知的
和beads上連接的序列最開始只有Read1 耳峦,10x Barcode,和poly(dT)焕毫,其他的這些接頭是怎樣一步步加上蹲坷,并且發(fā)揮作用的?10xGenomics的說明書上給了具體步驟邑飒。我看下來循签,覺得最主要的思想,就是用已知的序列設計引物疙咸,PCR出未知的序列懦底。
利用Poly(dT)來捕獲mRNA,反轉錄出cDNA的第一條鏈罕扎,并且在cDNA的末端加上CCC序列聚唐,和TSO序列的GGG序列互補,并以TSO序列為模板腔召,繼續(xù)延申杆查。這其實很重要,因為中間cDNA的序列我們是不知道的臀蛛,如果不加上這個接頭亲桦,就沒有辦法設計引物崖蜜,合成cDNA的第二條鏈。
對TSO序列和Read1 設計引物客峭,合成cDNA的第二條鏈豫领,并完成cDNA的擴增。
因為II代測序illumina測序不能測很長舔琅,約為200-700bp等恐,所以不能測得mRNA全長,所以會把合成的cDNA利用酶打斷到illumina能測的長度备蚓,然后再兩邊加上接頭课蔬,Read2。 設計部分與Read1和Read2重疊的引物郊尝,加上P5二跋,P7和sample index,就可以去進行illumina測序了流昏。
我畫了一張圖(homework扎即,哈哈),加上了序列况凉,用來弄清楚這個過程铺遂。
下一步是再看一遍說明書,對著這個過程茎刚,弄懂每個操作是在干什么。
小刀老師說:好好學習撤逢,天天向上疤哦А!