今天的筆記是關(guān)于另一種RNA測(cè)序的方法,稱為T(mén)T-seq臼疫。其實(shí)這些測(cè)序方法在幾年前被人們所使用了扣孟,但是因?yàn)樽约翰⒉涣私膺@些知識(shí)烫堤,所以要慢慢的補(bǔ)起來(lái)凤价。
文獻(xiàn)題目:TT-seq maps the human transient transcriptome
發(fā)表時(shí)間:2016
雜志:Science
摘要
基因組的普遍轉(zhuǎn)錄產(chǎn)生穩(wěn)定的和不穩(wěn)定的RNA(瞬時(shí)的)。作者開(kāi)發(fā)了一種瞬時(shí)轉(zhuǎn)錄組測(cè)序(TT-seq)利诺,這個(gè)方法可以估測(cè)RNA合成和降解的速率。使用TT-seq對(duì)人類K562細(xì)胞進(jìn)行測(cè)序立轧,除了復(fù)原了穩(wěn)定的mRNA和長(zhǎng)非編碼RNA的map以外,還繪制了瞬時(shí)增強(qiáng)子氛改、反義RNA和啟動(dòng)子相關(guān)的RNA。TT-seq分析顯示增強(qiáng)子RNA壽命短胜卤,缺乏U1基序(motif)和二級(jí)結(jié)構(gòu)。TT-seq還能繪制短暫RNA下游的聚腺苷酸化位點(diǎn)葛躏,并揭示轉(zhuǎn)錄終止位點(diǎn)。作者發(fā)現(xiàn)败富,平均四個(gè)轉(zhuǎn)錄終止位點(diǎn)分布在平均寬度為~3300個(gè)堿基對(duì)的window中。終止位點(diǎn)與一種與RNA聚合酶暫停相關(guān)的motif一致兽叮。
正文
真核基因組的轉(zhuǎn)錄產(chǎn)生蛋白質(zhì)編碼mRNA和多種非編碼RNA(ncRNAs)芬骄,包括eRNA鹦聪。大部分的ncRNA會(huì)非常快速的被降解泽本,因此不能完全的對(duì)它們進(jìn)行map。然而對(duì)于瞬時(shí)RNA的繪制圖譜對(duì)于分析RNA序列规丽、功能和“命運(yùn)”是非常有必要的。
作者開(kāi)發(fā)了瞬時(shí)轉(zhuǎn)錄本測(cè)序(TT-seq)嘁捷,這個(gè)方法繪制轉(zhuǎn)錄的活性區(qū)域,可以估測(cè)RNA合成和降解速率。TT-seq是基于4sU-seq的一項(xiàng)技術(shù)喘蟆,將細(xì)胞暴露在核苷類似物4-硫尿核苷中(4sU)(圖1A)。4sU在轉(zhuǎn)錄過(guò)程中被整合到RNA上蕴轨,被標(biāo)記有4sU的RNA被分離出來(lái)并對(duì)其進(jìn)行測(cè)序。4sU-seq比RNA-seq更加靈敏橙弱,可以測(cè)到瞬時(shí)RNA。然而棘脐,4sU不能很好的map到人類轉(zhuǎn)錄本上,因?yàn)橹挥行律D(zhuǎn)錄本的3’端才可以在4sU暴露期間被標(biāo)記上蛀缝,而提前已經(jīng)存在的5’端區(qū)域則優(yōu)先被測(cè)序。為了去掉這個(gè)5'端的bias屈梁,TT-seq在分離被標(biāo)記的RNA之前先將RNA片段化(圖1A)。因此在讶,TT-seq方法只測(cè)定哪些最新被轉(zhuǎn)錄的RNA片段,提供了聚合酶在基因組上5分鐘內(nèi)的轉(zhuǎn)錄位置革答。
當(dāng)使用人類K562細(xì)胞時(shí),TT-seq樣品新轉(zhuǎn)錄區(qū)域是唯一的蝗碎,而4sU-seq產(chǎn)生5'bias(圖S1A)。在TT-seq測(cè)序中蹦骑,短壽命的內(nèi)含子的覆蓋率大概有60%,而在4sU-seq和RNA-seq中分別只有23%和8%(圖S1A和S2)眠菇。TT-seq是高度可重現(xiàn)的,可完整的mapping轉(zhuǎn)錄區(qū)域捎废,彌補(bǔ)GRO-cap和CAGE的方法,后二者檢測(cè)的是RNA的5’端(圖1B)登疗。TT-seq可監(jiān)測(cè)RNA合成,而PRO-seq, NET-seq和mNET-seq檢測(cè)的是RNA與聚合酶的結(jié)合辐益。因此,后面幾種的方法產(chǎn)生的信號(hào)峰在啟動(dòng)子附近(聚合酶停留的地方)(圖1B)智政,而TT-seq的峰并不是。對(duì)于暫停和激活基因续捂,TT-seq更能揭示RNA在啟動(dòng)子相關(guān)的其他區(qū)域上RNA的合成(圖S1B)。
利用TT-seq數(shù)據(jù)和分割算法GenoSTAN,作者確定了21,874個(gè)明顯非間斷的基因組間隔轉(zhuǎn)錄(轉(zhuǎn)錄單位萍肆,TUs)(圖2和圖S4A)。TT-seq高度敏感匾鸥,可復(fù)原GRO-cap的65%的轉(zhuǎn)錄起始位點(diǎn)(TSSs)。共有8543個(gè)TUs與GENCODE注釋在正義方向的轉(zhuǎn)錄重疊。該分析檢測(cè)到7810個(gè)mRNA, 302個(gè)長(zhǎng)非編碼RNA (lincRNAs)和431個(gè)反義RNA(asRNA)馏艾。與編碼注釋共享長(zhǎng)度不到50%的2916個(gè)TUs未被分類。剩下的10415(48%)代表了作者新鑒定的ncRNA琅摩。
轉(zhuǎn)錄產(chǎn)物來(lái)自啟動(dòng)子,也來(lái)自增強(qiáng)子房资,增強(qiáng)子是具有特征染色質(zhì)修飾的調(diào)控元件。為了檢測(cè)包含潛在的增強(qiáng)子和啟動(dòng)子的染色質(zhì)區(qū)域轰异,作者使用GenoSTAN算法對(duì)共激活因子p300和一系列組蛋白修飾(H3K27me3、H3K36me3搭独、H4K20me1、H3K4me1牙肝、H3K4me3嗤朴、H3K9ac和H3K27ac)的 ENCODE ChIP-seq(染色質(zhì)免疫沉淀測(cè)序)數(shù)據(jù)分析虫溜,并對(duì)脫氧核糖核酸酶I超敏數(shù)據(jù)進(jìn)行分析(圖S5A)雹姊。在強(qiáng)增強(qiáng)子狀態(tài)的區(qū)域中衡楞,81%與至少一個(gè)TSS(從GRO-cap)和68%與聚合酶Pol II的峰重疊(圖S5, B到D)。
TT-seq的動(dòng)態(tài)模型和RNA-seq 數(shù)據(jù)使我們可以估測(cè)RNA合成的降解的速率(圖3和圖S7)。作者估算在每一個(gè)轉(zhuǎn)錄位置上磷酸二酯鍵的形成和斷裂行瑞,并在TUs內(nèi)把這些平均盖文,因此獲得相對(duì)的轉(zhuǎn)錄速率和RNA的穩(wěn)定性。作者發(fā)現(xiàn)mRNA和lincRNAs有著最高的合成速率和最長(zhǎng)的半衰期轴总。mRNA的平均半衰期是50分鐘氧吐。其他類型的轉(zhuǎn)錄本合成速率比較低末盔,半衰期也更短筑舅。這就解釋了為什么ncRNA非常難以檢測(cè)庄岖。eRNA的半衰期只有幾分鐘豁翎。短的RNA半衰期也伴隨著缺少二級(jí)結(jié)構(gòu)(圖S7)。eRNA的折疊能量與其他RNA相比心剥,它們的序列只有10%是具有結(jié)構(gòu)的邦尊。
TT-seq還可以讓我們能夠發(fā)現(xiàn)轉(zhuǎn)錄終止位點(diǎn)(TTSs)优烧。TT-seq檢測(cè)了瞬時(shí)RNA下游的聚腺苷酸化(pA)位點(diǎn)(圖S9)。
這種RNA由于RNA在pA位點(diǎn)裂解而難以檢測(cè)又沾,導(dǎo)致無(wú)保護(hù)的5 '端和外切酶降解RNA≌人ⅲ總共6977個(gè)mRNA基因里作者平均得到4個(gè)TTSs,TTS是位于一個(gè)終端window滑燃,從最后一個(gè)pA位點(diǎn)延伸,直到最終的TTS表窘,在最終的TTS處,RNA覆蓋率會(huì)降到背景水平(圖4,a到C)甜滨。終止窗口的平均寬度3300 bp,最寬可達(dá)10kb寬(圖S10)衣摩,與Pol II占用位置是一致的數(shù)據(jù)(圖4 d),說(shuō)明Pol II在TTS處暫停艾扮。
沒(méi)有對(duì)該文獻(xiàn)進(jìn)行全文翻譯栏渺,只是翻譯了一些我覺(jué)得應(yīng)該了解的內(nèi)容。有興趣的同學(xué)可以自行下載原文閱讀~