文獻(xiàn)信息
標(biāo)題:Global identification of Arabidopsis lncRNAs reveals the regulation of MAF4 by a natural antisense RNA
DOI(url): 10.1038/s41467-018-07500-7
發(fā)表日期:29 November 2018
關(guān)鍵詞:lncRNA, H3K4me3, natural antisense transcripts, concordantly expressed
文獻(xiàn)概述
- 鑒定了 6510 個 lncRNA 扑庞,其中包括 4050 個 NAT-lncRNA 以及 2460 個 lincRNA
- 在不同組織或逆境處理條件下遵堵,很多 NAT-lncRNA 與鄰近蛋白編碼基因的表達(dá)呈現(xiàn)正相關(guān)趨勢剖张。
- 通過人工 miRNA 沉默部分 NAT-lncRNA 表達(dá)可導(dǎo)致鄰近蛋白編碼基因表達(dá)下降,表明 NAT-lncRNA 可正向調(diào)控鄰近基因的表達(dá)奕枝。
- 擬南芥成花抑制基因 MADS AFFECTING FLOWERING4(MAF4) 基因位點有一個 NAT-lncRNA憔恳,MAS。
- MAS 受冷處理誘導(dǎo)并在轉(zhuǎn)錄水平激活 MAF4 表達(dá),抑制擬南芥過早開花电媳。MAS 對 MAF4 的激活依賴于一類參與組蛋白 H3K4me3 修飾的 COMPASS-like 復(fù)合體。
- MAS 與復(fù)合體中的一個核心蛋白組分 WDR5a 結(jié)合并輔助該復(fù)合體招募到MAF4 基因位點帅霜,促進(jìn) H3K4me3 修飾匆背,從而促進(jìn) MAF4 表達(dá)。
筆記
文章主要內(nèi)容和結(jié)論
測序和建庫類型身冀,作者使用了三種建庫方式钝尸,分別是去rRNA, poly(A)+ 和 poly(A)? 。
using high-depth strand-specific RNA sequencing (ssRNA-seq). We generated cDNA libraries for rRNA-depleted total, polyadenylated [poly(A)+] and non-polyadenylated [poly(A)?] RNAs in whole cell extract, nuclear and cytosolic fractions
對轉(zhuǎn)錄本進(jìn)行拼接搂根,從64,987 genomic loci 找到了106,421 unique transcripts珍促。
106,421 unique transcripts from 64,987 genomic loci. Among these, 25,245 were previously annotated protein-coding transcripts
去除掉編碼 RNA,已知的非編碼 RNA剩愧,短于150bp以及最大 FPKM < 1 的轉(zhuǎn)錄本以及編碼能力大于0的轉(zhuǎn)錄本以及和編碼 RNA 在同一個方向并且有部分重疊的部分猪叙,剩下一共注釋了 6510 個 lncRNAs。這里面的數(shù)據(jù)包括了不同組織和不同脅迫處理仁卷。
找到了lncRNA之后必然需要進(jìn)行一些泛泛的統(tǒng)計和分類穴翩。首先作者把 NAT lncRNA 分成了3類:overlapping (2117), divergent (1296) and convergent (637)。具體每一類的特點如下圖所示锦积。
隨后作者統(tǒng)計了 lncRNA 特征并和可以翻譯的進(jìn)行了對比芒帕,總之就是長度短外顯子少isoforms 也少,當(dāng)然表達(dá)量也低丰介。作者也檢查了植物(擬南芥)里的lncRNA 到底有沒有 polyA 尾巴背蟆。在我之前的認(rèn)知里感覺很多 lncRNA 是沒有polyA 的,但是作者的通過對兩種建庫方式進(jìn)行嚴(yán)格篩選后發(fā)現(xiàn)大部分的lncRNA 其實是有 polyA 尾巴的哮幢。具體信息如下:
we found that 1352 lncRNAs were significantly enriched in the poly(A)+ fraction, whereas 198 lncRNAs were significantly enriched in the poly(A)? fraction
我沒有想到的一個統(tǒng)計指標(biāo)是作者對 lncRNA 的核質(zhì)分布情況進(jìn)行了分析带膀,發(fā)現(xiàn)細(xì)胞核比細(xì)胞質(zhì)多的 lncRNA 要多一些。
239 lncRNAs had significantly higher levels in the nuclear fraction than that in the cytosolic fraction, whereas only 43 lncRNAs were more abundant in the cytosolic fraction
lncRNA 的表達(dá)特異性自然肯定也是要做的橙垢,包括不同組織和不同脅迫條件垛叨,文章特別提到了也驗證出 COOLAIR 冷處理后表達(dá)量會升高。
至此都是比較平淡的信息柜某,隨后的結(jié)論就開始逐漸接觸正題嗽元。
關(guān)于 lncRNA 和 adjacent genes 的關(guān)系一直爭論,有抑制的也有促進(jìn)的莺琳,各自都有一些實驗結(jié)果支撐≡卮龋可能目前的結(jié)論就是二者都有惭等。作者計算了他找到的lncRNA 和對應(yīng)的基因之間的相關(guān)性,發(fā)現(xiàn)只要 NAT 相關(guān)性系數(shù)就要比不是 NAT 的高很多办铡,而且還是正相關(guān)辞做。
整個文章中所有的高通量分析數(shù)據(jù)作者每一步都挑了若干個 RT-qPCR 進(jìn)行驗證琳要。不知道是不是 review 的要求。
We found that the p.c.c. values of overlapping NAT-lncRNA/sense gene pairs were significantly higher than the values between adjacent protein-coding pairs (Fig. 3a), suggesting that overlapping NAT-lncRNAs have a stronger tendency to have positively correlated expression patterns with their sense overlapping genes
正相關(guān)還說明不了什么秤茅。為了證明是正調(diào)控稚补,作者使用 artificial microRNAs knocked down 21 NAT-lncRNAs。 發(fā)現(xiàn)框喳,其中 15 個 cognate sense genes顯著下調(diào)课幕,3 個上調(diào)。
有了現(xiàn)象就要解釋結(jié)論五垮,目前關(guān)于 lncRNA 的作用機(jī)制其實已經(jīng)有不少了乍惊,比如當(dāng)做一個靶點替編碼基因吸引敵人,或者通過R-loop 來發(fā)揮作用放仗。當(dāng)然润绎,如果一個現(xiàn)象用正常的方法很難解釋,有一個挺不錯的萬金油就是用表觀遺傳學(xué)來解釋诞挨,這里的萬金油是個中性詞莉撇,我自己就是做表觀遺傳的。
作者想要說明 lncRNA 能夠正向調(diào)節(jié)對應(yīng)的編碼基因惶傻,那么最好的方法就是看看是不是和一些類似于H3K4me3 的激活型修飾聯(lián)系起來棍郎。隨后作者很「自然」的focus 到了一個叫做 MAF4 的基因,對應(yīng)的NAT 叫做 MAS达罗,至于為什么要做這個基因也沒什么解釋坝撑。
首先作者用實驗證明了這兩個轉(zhuǎn)錄本到底是編碼的調(diào)控了非編碼的還是反之,然后嘗試分析了一些機(jī)制粮揉,比如會不會雙鏈RNA 產(chǎn)生的 sRNA巡李,或者影響了編碼RNA的穩(wěn)定性。然后通過若干的實驗證明了順式作用MAS在轉(zhuǎn)錄水平激活MAF4表達(dá)扶认。 因為已知H3K4me3 參與了MAF4 的激活侨拦,所以作者就像是不是可以把這個NAT 和 H3K4me3 聯(lián)系一下。然后又進(jìn)行了一系列實驗驗證辐宾。表明確實在MAS 的突變體中這個表觀修飾有變化且一個相關(guān)的復(fù)合體因子很重要狱从。
討論部分幾點信息
從討論部分可以發(fā)現(xiàn),作者找到的組蛋白 H3K4me3 修飾的 COMPASS-like 復(fù)合體核心蛋白組分 WDR5a 之前已經(jīng)在Nature 中被報道過和其它的 lncRNA 存在作用叠纹,但是找到的機(jī)制不同季研。另外,作者的結(jié)果與先前的發(fā)現(xiàn)一致誉察,即相鄰基因通常具有相關(guān)表達(dá)与涡,而與其方向無關(guān)。
另外,作者也提到了基因之間的“ripple effects ”, 至于原因可能是因為NAT-lncRNA的TSS與其配對基因之間的平均距離較小驼卖,也可能是NAT-lncRNAs在激活其配對基因的表達(dá)中確實起著至關(guān)重要的作用氨肌。
主要方法
作者在計算表達(dá)量的時候用的還是 Cuffidff, 我并不是反感 Cuffdiff 但是我看到它就會想到 Tophat2 ,果然在2018年作者使用的 mapping 軟件還是 TopHat2酌畜。轉(zhuǎn)錄組拼接用的也是cufflinks 和 cuffmerge 那一套怎囚。
R 的版本是3.1.0, 這一版 R 的更新日期要追溯到2014年4月10號了, 我猜測要么是這個文章的時間跨度確實已經(jīng)有三四年了,或者是他們實驗室沒有一個真正做生物信息且對軟件版本有強迫癥的人桥胞。不過從使用的比對軟件來看恳守,也有可能是一個 pipeline 流傳了很多年,祖?zhèn)鞔a埠戳。
相關(guān)性計算使用的是 Pearson correlation coefficients井誉,sRNA-seq 用的是 bowtie allowing no mismatches,然后定量單位是reads per million (RPM)整胃。
比較關(guān)心的幾個問題
RT-qPCR 的時候如何區(qū)分正負(fù)鏈
-
如何保證amiRNAs 影響反義鏈的時候不影響正義鏈的基因表達(dá)
關(guān)于這個問題颗圣,作者在文章中給了正面的回答
Alteration of sense gene expression in amiRNA knockdown lines was not due to targeting of sense genes by amiRNA*s. Eight out of 21 amiRNA*s do not base pair with sense mRNAs at all. The rest of the amiRNA*s have mismatches to corresponding sense mRNAs at critical positions。 Furthermore, most of the amiRNA*s do not have 5’ terminal uridine , making it less likely that they are loaded into the effector AGO1 to suppress gene expression
作者在文章中看似自然的從宏觀層面過度到了一個具體的基因屁使,然后講了一個NAT 和表觀的故事在岂。比較好奇的是其他十幾個也找到正向調(diào)控的幾組為什么都沒有提到呢?如果按照正常的套路蛮寂,一方面可能是他們先做了這個基因然后發(fā)現(xiàn)有l(wèi)ncRNA 可能參與才有了文章開頭的高通量試驗蔽午,另一方面可能是其他的基因也做了,但是似乎表觀又解釋不了酬蹋。
文章中關(guān)于 ChIP 的部分并沒有做高通量試驗及老,或者做了至少沒有放在文章中,只是用ChIP-qPCR 去驗證范抓。只要做一個ChIP-seq 的實驗很容易看看其他十幾個基因的修飾情況骄恶,甚至可以K27, K36 這些修飾都做一做。如果能有一半的基因做出表觀的相關(guān)性匕垫,我都會更相信這個機(jī)制僧鲁。
review 怎么看
nature 系列的雜志目前似乎可以公開作者和文章review 之間的質(zhì)疑和回應(yīng)內(nèi)容,在這篇文章的附件中可以看到完整的review 意見象泵,其中「如何保證amiRNAs 影響反義鏈的時候不影響正義鏈的基因表達(dá)」也是review 的問題寞秃。
個人感覺仔細(xì)閱讀 review 和 作者之間溝通的這個記錄比閱讀原文更有意思。
相關(guān)文獻(xiàn)
植物中研究的比較多的幾個lncRNA
COLDAIR: Swiezewski, S., Liu, F., Magusin, A. & Dean, C. Cold-induced silencing by long antisense transcripts of an Arabidopsis Polycomb target. Nature 462, 799–802 (2009).
APOLO: Ariel, F. et al. Noncoding transcription by alternative RNA polymerases dynamically regulates an auxin-driven chromatin loop. Mol. Cell 55, 383–396 (2014).
ELENA: Seo, J. S. et al. ELF18-INDUCED LONG-NONCODING RNA associates with mediator to enhance expression of innate immune response genes in Arabidopsis. Plant Cell 29, 1024–1038 (2017).