測序技術(shù)發(fā)展:
1977Sanger測序--1996焦磷酸測序--2003cmPCR--2003ZMW---2012納米孔測序
RNA-seq的一些技術(shù)限制盐捷,測序誤差主要由生物學(xué)誤差(生物學(xué)重復(fù)钦幔,比如取30只小鼠采樣)和技術(shù)性誤差(技術(shù)性重復(fù)缨伊,比如對1只小鼠采樣3次)造成玄捕,如果想要得到的數(shù)據(jù)為無偏的凰盔,那么生物學(xué)重復(fù)最重要搬俊,因?yàn)樯飩€體代表著樣本拧晕,而技術(shù)手段只會造成不可控干擾隙姿。總的來說厂捞,只做技術(shù)性重復(fù)的實(shí)驗(yàn)結(jié)果偏差最大输玷,技術(shù)性重復(fù)+生物學(xué)重復(fù)的實(shí)驗(yàn)結(jié)果偏差也可能較大,除非生物學(xué)重復(fù)遠(yuǎn)大于技術(shù)性重復(fù)(因?yàn)楫?dāng)生物學(xué)重復(fù)次數(shù)不足時蔫敲,技術(shù)性重復(fù)能擴(kuò)大樣本單一的影響)饲嗽,無論如何,多做生物學(xué)重復(fù)奈嘿,這有助于你的結(jié)論被其他人復(fù)現(xiàn)。
mRNA(DNA轉(zhuǎn)錄形成)穿過細(xì)胞核進(jìn)入細(xì)胞質(zhì)進(jìn)行翻譯吞加,然后mRNA和beads結(jié)合(基于mRNA的polyA序列)成凝珠進(jìn)行測序
原理詳解:
A 為了保證細(xì)胞在標(biāo)記的過程中是單獨(dú)分開的裙犹,10X開發(fā)了微流體設(shè)備(microfuidic device)進(jìn)行預(yù)處理,設(shè)備有三個上樣孔衔憨,分別加入你的1.樣本細(xì)胞懸液(Sample) 2.凝膠小球(Beads) 3.分離液(Oil)叶圃,下圖為具體設(shè)備的示意圖。
當(dāng)我們把樣本細(xì)胞懸液加入設(shè)備時践图,每一個細(xì)胞會與凝膠小球單獨(dú)結(jié)合掺冠,然后被分離液包裹,形成一個油包水的密閉小液滴(droplet)码党。進(jìn)一步地德崭,細(xì)胞和凝膠小球相遇不久后會裂解,釋放出里面的各種物質(zhì)揖盘,RNA(mRNA眉厨、tRNA、rRNA)兽狭,蛋白質(zhì)憾股,脂質(zhì),DNA等箕慧。實(shí)際上Beads上聯(lián)接了不同的接頭服球,其中有一個接頭包含ploy(dT)序列,在細(xì)胞裂解后釋放的核酸中颠焦,只有mRNA帶有polyA tail斩熊,于是Beads的poly(dT)接頭就可以從眾多的裂解產(chǎn)物里捕獲到mRNA(實(shí)際上drop-seq采用3'端測序,就是為了檢測polyA tail)蒸健。
Master Mix中帶有反轉(zhuǎn)錄試劑座享,當(dāng)mRNA被捕獲后婉商,就可以從它的3‘端開始作為模板,進(jìn)行反轉(zhuǎn)錄出cDNA的第一條鏈渣叛,這第一條鏈就沿著poly(dT)序列延申丈秩,長在了beads上,形成了圖一7中的STAMPs淳衙,接著我們把反轉(zhuǎn)錄出來的cDNA序列洗脫蘑秽,以cDNA的第一條鏈為模板,進(jìn)行PCR箫攀,合成cDNA的第二條鏈肠牲,然后就是我們熟悉的cDNA擴(kuò)增以及illumina測序。
如何確定測序序列來自哪個細(xì)胞靴跛?single cell的RNA-seq和bulk的RNA-seq的最大區(qū)別是什么缀雳?是barcode,或者說是cell barcode(實(shí)際上DNA自帶barcode梢睛,cell barcode是人為控制的)肥印。每一種single cell的beads上都有著相同的cell barcode(beads與beads間的cell barcode是不同的),假設(shè)每個beads只捕獲一個cell绝葡,那么則每個cell都被cell barcode 單獨(dú)標(biāo)記了深碱。
如何保證每個beads只捕獲一個cell?第一是控制cell和beads的流速藏畅,第二是beads的數(shù)目遠(yuǎn)遠(yuǎn)超過cell的數(shù)目敷硅,即絕大多數(shù)的beads都是空的,只有少數(shù)的才捕獲到了cell愉阎。但是還是有個別的droplet里面會兩個或者更多的細(xì)胞绞蹦,這就需要進(jìn)行質(zhì)控(QualityControl)。
接下來可以參照10X Genomics的說明書詳解single cell RNA-seq的barcode诫硕。
實(shí)際上beads上一開始只接了Read1坦辟、Barcode、Poly(dT)章办。
名詞解釋:
Poly(dT): 用來和mRNA的polyA結(jié)合锉走,捕獲mRNA
UMI: 用來標(biāo)記不同的PCR產(chǎn)物(用于count計(jì)數(shù))。為了減少由于復(fù)制引起的誤差(重復(fù)抽樣導(dǎo)致重復(fù)計(jì)數(shù))藕届,人們在一些單細(xì)胞測序的步驟中增加了UMI(unique molecular identifiers)挪蹭,UMIs 是由 4-10 個隨機(jī)核苷酸組成的序列,在 mRNA 反轉(zhuǎn)錄后休偶,進(jìn)入到文庫中梁厉,每一個 mRNA,隨機(jī)連上一個 UMI,因此可以計(jì)數(shù)不同的 UMI词顾,最終計(jì)數(shù) mRNA 的數(shù)量八秃。
10X Barcode: 用來標(biāo)記不同的single cell
Sample Index: 用來標(biāo)記不同的sample
P5和P7: 用來進(jìn)行illumina的橋式PCR測序
Truseq Read 1、2: 用來進(jìn)行連接beads肉盹,cDNA的PCR擴(kuò)增和加P7接頭
在這些序列中昔驱,P5、P7上忍、Truseq Read 1骤肛、2 的序列是已知的。
其他的序列是怎么一步一步添加上去的窍蓝?
具體步驟:
利用Poly(dT)來捕獲mRNA腋颠,在mRNA的5'端插入TSO(Template Switch Oligo模板切換低聚糖)引物,然后從mRNA的polyA開始反轉(zhuǎn)錄吓笙,直至mRNA的DNA序列被轉(zhuǎn)錄完成淑玫,然后在beads序列的3'端插入CCC,再對mRNA的TSO進(jìn)行反轉(zhuǎn)錄面睛,至此完成了cDNA的第一條鏈(序列順序和mRNA逆序)混移。上述步驟很重要,因?yàn)橹虚gcDNA的序列我們是不知道的(儀器測序長度有限)侮穿,如果不加上這個接頭,就沒有辦法設(shè)計(jì)引物來合成cDNA的第二條鏈毁嗦。
將mRNA溶解亲茅,對cDNA的第一條鏈加入UMI引物,以cDNA的第一條鏈為模板合成cDNA的第二條鏈狗准。最后使用PCR(聚合酶鏈?zhǔn)椒磻?yīng))對cDNA(拷貝DNA)進(jìn)行擴(kuò)增(為了富集)克锣。
因?yàn)镮I代測序(NGS)的illumina測序不能測很長的seq,約為200-700bp腔长,所以不能測得mRNA全長袭祟,因此需要進(jìn)一步把合成的cDNA利用酶打斷到illumina能測的長度(長度有些隨機(jī),比如300bp的cDNA能通過頭尾150bp完整測序捞附,但700bp的cDNA只能通過頭尾150bp測序+參考基因組推斷出來)巾乳。然后在cDNA的3'端插入Truseq Read2引物(和Truseq Read1引物匹配為頭尾,中間序列就是reads)鸟召、P5胆绊、P7。
最后的測序數(shù)據(jù)(reads)從Truseq Read1后的10X Barcode開始欧募,一直到Truseq Read2為止压状。
PCR擴(kuò)增是對cDNA單鏈進(jìn)行復(fù)制,后面的橋式PCR是對完整的樣本進(jìn)行復(fù)制(增加數(shù)據(jù)深度)跟继,總的來說各個cDNA呈均勻分布种冬,然后進(jìn)行抽樣镣丑。
RNA-seq duplications有PCR duplication(最主要)、cluster duplication娱两、optical duplication莺匠。
實(shí)際上儀器會對核苷酸進(jìn)行染色,然后判斷顏色確定ATCG堿基谷婆,因此有很多原因會導(dǎo)致機(jī)器誤判慨蛙,和后續(xù)QC有關(guān)。
1.某些核苷酸對顏色附著不明顯
2.大片區(qū)域顏色相同(相同類型核苷酸)纪挎,而其中僅有幾個顏色不同的點(diǎn)(不同類型的核苷酸)