2019年7月24日锨亏,Nature Reviews Genetics上發(fā)表了一篇了RNA-seq的綜述悦即,文獻(xiàn)信息如下所示:
Stark, R., et al. (2019). "RNA sequencing: the teenage years." Nature Reviews Genetics.
摘要:在過(guò)去的十年中作谭,RNA測(cè)序(RNA-seq)已經(jīng)成為在全轉(zhuǎn)錄組范圍內(nèi)分析差異基因表達(dá)和mRNAs差異剪接的重要工具硼讽。然而捉偏,隨著下一代測(cè)序技術(shù)的發(fā)展鸳君,RNA-seq技術(shù)也在不斷發(fā)展∨┰ǎ現(xiàn)在,RNA-seq用于研究RNA生物學(xué)的許多方面,其中包括單細(xì)胞基因表達(dá)砸紊、翻譯(翻譯組,translatome)和RNA結(jié)構(gòu)(結(jié)構(gòu)體传于,structurome)。其它的應(yīng)用也在開發(fā)中醉顽,例如 空間轉(zhuǎn)錄學(xué)(Spatialomics)沼溜。加上新的長(zhǎng)片段 (long-read)和直接RNA-seq技術(shù)以及用于數(shù)據(jù)分析的更好的計(jì)算工具的整合,RNA-seq技術(shù)的創(chuàng)新有助于人們更全面地理解RNA生物學(xué)游添,例如從何時(shí)何地轉(zhuǎn)錄發(fā)生到控制RNA功能的折疊和分子間相互作用等問(wèn)題系草。
這篇綜述信息密度很高,先把文獻(xiàn)旁邊的名詞解釋給譯了一下唆涝,如下所示:
1. 差異基因表達(dá):Differential gene expression, 即DGE找都,一種分析方法,目標(biāo)是使研究者們找出不同實(shí)驗(yàn)組之間的變化的基因廊酣。
2. 讀長(zhǎng)深度:Read depth能耻,一個(gè)樣本測(cè)序后所獲得的所有測(cè)序讀長(zhǎng)(reads),注意與測(cè)試深度進(jìn)行區(qū)分亡驰。
3. 短讀長(zhǎng):short-read:一種測(cè)序技術(shù)晓猛,產(chǎn)生的讀長(zhǎng)(read)的長(zhǎng)度為500bp,但更常見(jiàn)的是100-300bp凡辱,它測(cè)的是打斷后的mRNA戒职。
4. 長(zhǎng)讀長(zhǎng):long-read,一種測(cè)序技術(shù)煞茫,能夠沒(méi)到1000bp帕涌,它代表的全長(zhǎng)或接近全長(zhǎng)的mRNA。
5. 直接RNA測(cè)序:Direct RNA sequencing,dRNA-seq续徽,一種測(cè)序技術(shù),在不用打斷RNA以及反轉(zhuǎn)錄的情況下亲澡,對(duì)RNA進(jìn)行直接測(cè)序钦扭,其目標(biāo)通常是為了檢測(cè)全長(zhǎng)或接近全長(zhǎng)的RNAs。
6. 多重回貼讀長(zhǎng):multi-mapped reads:來(lái)源于轉(zhuǎn)錄組的同源區(qū)(homologous region)的測(cè)序讀長(zhǎng)床绪,這些讀長(zhǎng)無(wú)法明確地回貼到基因組上或轉(zhuǎn)錄組上客情。
7. 合成長(zhǎng)讀長(zhǎng):synthetic long reads:一種方法,能夠通過(guò)組裝來(lái)對(duì)多個(gè)短讀長(zhǎng)進(jìn)行合成癞己,生長(zhǎng)長(zhǎng)讀長(zhǎng)膀斋。
8. 唯一分子標(biāo)簽:Unique molecular identifiers,UMIs痹雅,一種短的序列或編碼標(biāo)簽(barcodes)仰担,這些短序列通常會(huì)在RNA-seq文庫(kù)制備過(guò)程中進(jìn)行添加(在進(jìn)行PCR之前),這種序列能夠?qū)σ粋€(gè)特定的起始分子進(jìn)行標(biāo)記绩社。此方法通用用于校正RNA-seq數(shù)據(jù)的定量偏差摔蓝,在少量RNA進(jìn)行測(cè)序或單細(xì)胞測(cè)序中使用尤為廣泛赂苗。
9 。讀長(zhǎng)長(zhǎng)度:read length:每個(gè)測(cè)序讀長(zhǎng)的長(zhǎng)度贮尉,在短讀長(zhǎng)RNA測(cè)序過(guò)程中拌滋,這個(gè)長(zhǎng)度通常是50-150bp。
10. 靈敏度:Sensitivity猜谚,一種指標(biāo)败砂,它表示在每個(gè)樣本中,能夠檢測(cè)到轉(zhuǎn)錄本的比例魏铅。樣本處理昌犹,文庫(kù)制備,測(cè)序以及數(shù)據(jù)分析都會(huì)影響這個(gè)指標(biāo)沦零。
11. 特異性:specificity:?一種檢測(cè)指標(biāo)祭隔,它表示的是差異表達(dá)的轉(zhuǎn)錄本在檢測(cè)到的轉(zhuǎn)錄本中的比例。樣本處理路操,文庫(kù)制備疾渴,測(cè)序和數(shù)據(jù)分析都會(huì)影響這個(gè)指標(biāo)。
12. 標(biāo)簽讀長(zhǎng):Tag read屯仗,?對(duì)于一個(gè)轉(zhuǎn)錄本來(lái)說(shuō)搞坝,一個(gè)標(biāo)簽讀長(zhǎng)是唯一,它通常來(lái)源于mRNA的3‘末端魁袜,這種讀長(zhǎng)用于分析差異表達(dá)轉(zhuǎn)錄本桩撮,或者是來(lái)源于5'端,這種通常用于分析轉(zhuǎn)錄起始位點(diǎn)和啟動(dòng)子峰弹。
13. 重復(fù)率:duplication rates店量,?在一個(gè)RNA測(cè)序樣本中,回貼到轉(zhuǎn)錄本上同一位置的測(cè)序讀長(zhǎng)的比例鞠呈。在RNA-seq文庫(kù)中融师,對(duì)于一些轉(zhuǎn)錄本來(lái)說(shuō),重復(fù)率是比較高的蚁吝,這是因?yàn)樗鼈冊(cè)跇颖局械牡谋磉_(dá)水平比較高旱爆,同時(shí)低表達(dá)的轉(zhuǎn)錄本,重復(fù)率很低窘茁。
在RNA-seq中怀伦,重復(fù)率是一個(gè)重要問(wèn)題,因?yàn)槎鄶?shù)情況下山林,重復(fù)的讀長(zhǎng)或許代了真正高表達(dá)的轉(zhuǎn)錄本房待,而一些重復(fù)讀長(zhǎng)則是有可能來(lái)源于測(cè)序偏倚。所以,要加以判斷N庠堋张抄!
14:單端測(cè)序:single-end squencing,只測(cè)cDNA片段的一端的短讀長(zhǎng)測(cè)序手段洼怔,它通常用于基因表達(dá)分析實(shí)驗(yàn)署惯,優(yōu)勢(shì)就是便宜。
15. 雙端測(cè)序:paired-end sequencing,同時(shí)測(cè)cDNA片段的兩端短讀長(zhǎng)測(cè)序手段镣隶,通常用于基因表達(dá)分析實(shí)驗(yàn)极谊,如果是要研究剪接,則需要最大的靈敏度安岂,因?yàn)槊總€(gè)cDNA的更多堿基會(huì)被檢測(cè)到轻猖。
16. 生物學(xué)重復(fù):Biological replicates:同時(shí)檢測(cè)生物學(xué)意義上的不同樣本,例如來(lái)源于不同的3個(gè)研究對(duì)象的組織域那,生物學(xué)重復(fù)可以發(fā)現(xiàn)生物學(xué)偏差咙边,這要么代表了自身的一種研究駨,要么代表了噪音次员。相比之下败许,
技術(shù)重復(fù)則是:對(duì)同一個(gè)樣本進(jìn)行重復(fù)的要檢測(cè),例如同一個(gè)組織檢測(cè)3次淑蔚,檢查是否是因?yàn)閷?shí)驗(yàn)技術(shù)導(dǎo)致的偏差市殷。
17. 表達(dá)矩陣:Expression matrix,RNA-seq中差異表達(dá)基因的數(shù)值矩陣刹衫。行代表RNA特征醋寝,例如基因名或轉(zhuǎn)錄本名,列表示測(cè)序樣本带迟。這些值通常用與每個(gè)RNA特征相關(guān)在的讀長(zhǎng)數(shù)目表示音羞,表達(dá)矩陣可以用于估計(jì)異構(gòu)體特征,在進(jìn)行下游分析之前仓犬,通常要經(jīng)過(guò)歸一化處理(normalization)黄选。
18. 外參控制(spike-in control),處理樣本之前婶肩,spink-in ,將已知濃度的外源核酸混合物添加到一個(gè)樣本中。它們通常是各種濃度的人工合成的RNA序列貌夕,會(huì)被提前混合律歼,用于監(jiān)測(cè)反應(yīng)效率,并確定方法學(xué)的偏倚處理以及用于監(jiān)測(cè)假陰性啡专。
19. 空間轉(zhuǎn)錄組學(xué)险毁, Spatialomics, 一種轉(zhuǎn)錄組分析方法,它能保留一個(gè)樣本中每個(gè)轉(zhuǎn)錄本的空間信息畔况,例如一個(gè)組織的不同區(qū)域鲸鹦。
20. 初始RNA,Nascent RNA跷跪,剛開始被轉(zhuǎn)錄的RNA馋嗜,這些RNA與那些已經(jīng)被處理后,輸送到細(xì)胞質(zhì)的RNA不同吵瞻。
21. 4-硫尿核苷葛菇,4-Thiouridine, 4 sU橡羞,含有一個(gè)硫原子的核苷眯停,通常不并存在于真核生物的mRNA中,它很容易整合進(jìn)核酸中卿泽,用于初始RNA分析莺债。
22. 翻譯組:Translatome,一個(gè)細(xì)胞签夭,組織或機(jī)體中齐邦,所有從mRNA翻譯到蛋白質(zhì)的總和。
23. 結(jié)構(gòu)組:Structurome, 一個(gè)細(xì)胞覆致,組織或機(jī)體中侄旬,所有二級(jí)和三級(jí)結(jié)構(gòu)的RNA總和。
24. 相互作用組:Interactome煌妈,一個(gè)細(xì)胞儡羔,組織或機(jī)體中,所有分子之間相互作用的總和璧诵,包括RNA-RNA汰蜘,RNA-蛋白質(zhì)之間的相互作用。