LncRNAs的識(shí)別
lncRNA被定義為長度超過200個(gè)核苷酸的非編碼RNA分子茧痒,最初是由Okazaki等人在2002年對(duì)小鼠全長cDNA文庫的大規(guī)模測(cè)序研究中重點(diǎn)描述的。
然而掖鱼,很難區(qū)分lncRNA和蛋白質(zhì)編碼轉(zhuǎn)錄本。盡管蛋白質(zhì)編碼轉(zhuǎn)錄本通常以含有超過100個(gè)氨基酸的開放閱讀框(open reading frame, ORF)的存在為特征援制,但一些lncRNA也可能含有如此長的ORF戏挡。
此外,一些轉(zhuǎn)錄本還可以在編碼和非編碼異構(gòu)體之間進(jìn)行轉(zhuǎn)化晨仑。例如褐墅,SRA(甾體受體RNA活化劑)是一種特征良好的lncRNA,它也可以編碼一種蛋白洪己,拮抗其替代功能為lncRNA妥凳。
另一方面,編碼腫瘤抑制因子的p53 mRNA也可以結(jié)合Mdm2 (Mouse double minute 2 homolog)蛋白答捕,在RNA水平上直接發(fā)揮調(diào)節(jié)作用逝钥。到目前為止,lncRNAs識(shí)別的系統(tǒng)方法還沒有完全建立拱镐,而一些公認(rèn)的標(biāo)準(zhǔn)已經(jīng)建立艘款,如序列結(jié)構(gòu)持际、大小、是否存在ORFs磷箕、密碼子替代頻率等选酗。
LncRNAs的分類
作為一個(gè)廣泛的概念,lncRNAs包含以下幾種類型的RNA轉(zhuǎn)錄本岳枷。根據(jù)其在基因組中的位置芒填,lncRNA可分為7大類:
- sense lncRNAs
- antisense lncRNAs
- bidirectional lncRNAs
- intronic lncRNAs
- intergenic lncRNAs
- enhancer lncRNAs。
a sense lncRNAs轉(zhuǎn)錄自同一鏈上的蛋白質(zhì)編碼基因空繁,與蛋白質(zhì)編碼基因有重疊的外顯子殿衰。
b antisense lncRNAs轉(zhuǎn)錄自反義鏈上蛋白質(zhì)編碼基因的重疊外顯子。
c 雙向lncRNA位于反義鏈盛泡,由鄰近基因(小于1000個(gè)堿基對(duì))近距離轉(zhuǎn)錄闷祥。
d 內(nèi)含子lncRNA完全來源于蛋白質(zhì)編碼基因的內(nèi)含子。
e 基因間lncRNA來自基因間區(qū)傲诵。
f 增強(qiáng)子lncRNA來源于蛋白質(zhì)編碼基因的增強(qiáng)子區(qū)域
從具體的功能來看凯砍,lncRNAs可以分為4類:(a) signal lncRNAs, (b) decoy lncRNAs, (c) guide lncRNAs and (d) scaffold lncRNAs。lncRNA存在于細(xì)胞核或細(xì)胞質(zhì)組分中拴竹。
細(xì)胞質(zhì)lncRNA可作為microRNA sponges或miRNA前體悟衩,發(fā)揮減少或增加microRNA的表達(dá)和功能。它們還可以識(shí)別目標(biāo)mRNA栓拜,與細(xì)胞翻譯機(jī)制相互作用座泳。核lncRNAs可以通過順式作用(調(diào)控鄰近基因的表達(dá))或反式作用(調(diào)控遠(yuǎn)處基因的表達(dá))來影響染色質(zhì)結(jié)構(gòu)。此外幕与,對(duì)于一些核lncRNA挑势,其功能是順式還是反式尚不清楚。
LncRNAs的功能
lncRNAs可以調(diào)控基因表達(dá)啦鸣,以多種作用影響許多重要的生理過程潮饱,如作為染色質(zhì)修飾因子、X染色體失活因子赏陵、增強(qiáng)子饼齿、轉(zhuǎn)錄調(diào)節(jié)因子和轉(zhuǎn)錄后調(diào)節(jié)因子等。
1. 染色質(zhì)修飾因子
LncRNAs已被證明以一種關(guān)鍵的方式參與染色質(zhì)修飾蝙搔,進(jìn)而影響包括神經(jīng)發(fā)生和干細(xì)胞多能性在內(nèi)的多個(gè)重要生物學(xué)過程。
LncRNAs通過招募染色質(zhì)重塑蛋白到特定的基因組位點(diǎn)來調(diào)控染色質(zhì)狀態(tài)考传。例如吃型,Hox基因是一類與時(shí)間和空間發(fā)育軸相關(guān)的同源基因,其中數(shù)百個(gè)lncRNAs被證明是關(guān)鍵因素僚楞。其中的一個(gè)lncRNA勤晚,HOTAIR (Hox transcript antisense RNA)起源于HoxC位點(diǎn)枉层,通過反式作用方式誘導(dǎo)PRC2 (Polycomb repression complex-2),沉默HoxD基因超過40kb赐写,最終導(dǎo)致染色質(zhì)抑制狀態(tài)鸟蜡。
值得注意的是,PRC2是表觀遺傳沉默所需的組蛋白甲基轉(zhuǎn)移酶挺邀,因此是重要的染色質(zhì)修飾因子揉忘。除了HOTAIR之外,在體內(nèi)仍有數(shù)千種RNA可以與PRC2結(jié)合端铛。盡管這引發(fā)了在不同染色質(zhì)背景下結(jié)合特異性和功能的問題泣矛,但這仍是一個(gè)lncRNAs與PRC2相互作用改變?nèi)旧|(zhì)狀態(tài)的原型。
其他已被充分研究并已知可結(jié)合PRC2的lncRNAs包括Xist (X-inactive specific transcript)禾蚕、Kcnq1ot1 (KCNQ1 overlapping transcript 1)您朽、Braveheart、ANRASSF1等换淆。例如Kcnq1ot1是一個(gè)印跡的重要中介lncRNA哗总。Kcnq1ot1的啟動(dòng)子映射到Kcnq1基因的ICRs(印跡控制區(qū)),該基因編碼一個(gè)負(fù)責(zé)心臟動(dòng)作電位復(fù)極的電壓門控鉀通道蛋白倍试。Kcnq1ot1與Dnmt1 (DNA(胞嘧啶-5)-甲基轉(zhuǎn)移酶1)相互作用讯屈,建立Kcnq1區(qū)域內(nèi)基因的胎盤特異性印跡。
Kcnq1ot1能夠通過招募組蛋白甲基轉(zhuǎn)移酶G9a和PRC2誘導(dǎo)組蛋白H3在賴氨酸9和賴氨酸27上的甲基化易猫。在雌性哺乳動(dòng)物的早期發(fā)育過程中耻煤,一條X染色體會(huì)發(fā)生失活,這種失活需要Xist准颓。表達(dá)Xist的X染色體將被其包裹并包裝成無轉(zhuǎn)錄活性的異染色質(zhì)結(jié)構(gòu)哈蝇。
在此過程中,Xist將招募一系列蛋白攘已,包括PRC2炮赦、SPEN、SAF-A (Scaffold Attachment Factor-A)和LBR样勃,啟動(dòng)順式作用的 X染色體失活吠勘。綜上所述,核lncRNAs主要通過與染色質(zhì)修飾蛋白相互作用來影響染色質(zhì)狀態(tài)峡眶。
2. 增強(qiáng)子
從活性增強(qiáng)子轉(zhuǎn)錄出一個(gè)lncRNA子集剧防,反過來促進(jìn)相應(yīng)蛋白編碼基因的表達(dá),因此得名增強(qiáng)子lncRNA辫樱。2010年峭拘,Kim等人根據(jù)RNA聚合酶II定位于約3000個(gè)激活的增強(qiáng)子,在蛋白質(zhì)編碼基因外的增強(qiáng)子區(qū)域可以產(chǎn)生RNA的現(xiàn)象,從而提出了增強(qiáng)子RNA的概念鸡挠。
幾乎同時(shí)辉饱,Shiekhattar lab報(bào)道了具有增強(qiáng)功能的lncRNA。他們利用人類基因組的基因組編碼注釋功能對(duì)幾種順式作用的lncRNA進(jìn)行了表征拣展,并發(fā)現(xiàn)ncRNA-a1-7介導(dǎo)的一種RNA依賴性基因表達(dá)增強(qiáng)彭沼。
HSR1(熱休克RNA-1,在人和嚙齒動(dòng)物細(xì)胞中組成性表達(dá))與eEF1A協(xié)同工作备埃,積極介導(dǎo)HSF1(熱休克轉(zhuǎn)錄因子1)的激活過程姓惑。類固醇受體RNA激活物(SRA)也作為一種非編碼轉(zhuǎn)錄本來協(xié)同激活類固醇受體。然而瓜喇,到目前為止挺益,增強(qiáng)子lncRNA的作用機(jī)制尚未明確。增強(qiáng)子lncRNA在各種生物學(xué)過程中的秘密有待進(jìn)一步揭示乘寒。
3. 轉(zhuǎn)錄調(diào)節(jié)因子
真核基因的轉(zhuǎn)錄調(diào)控通過多種方式實(shí)現(xiàn)望众,包括傳統(tǒng)的蛋白質(zhì)與DNA調(diào)控元件的直接相互作用,以及最近發(fā)現(xiàn)的RNA伞辛、DNA和/或蛋白質(zhì)之間的特定相互作用烂翰。因此,lncRNAs現(xiàn)在被認(rèn)為是這種轉(zhuǎn)錄調(diào)控的一個(gè)重要方面蚤氏。
對(duì)于順式作用的lncRNA甘耿,其基因上的來源對(duì)其功能至關(guān)重要,因?yàn)樗鼤?huì)改變附近蛋白編碼基因的表達(dá)竿滨。它可能通過其本身的轉(zhuǎn)錄活性而不是轉(zhuǎn)錄本來發(fā)揮作用:如果另一個(gè)基因的啟動(dòng)子距離它較近佳恬,可能會(huì)導(dǎo)致兩個(gè)基因上的轉(zhuǎn)錄機(jī)制發(fā)生碰撞,也稱為“轉(zhuǎn)錄干擾(transcriptional interference)”于游。
例如毁葱,酵母中l(wèi)ncRNA SRG1的轉(zhuǎn)錄激活會(huì)抑制其下游SER3基因的轉(zhuǎn)錄,因?yàn)镾RG1的3′末端與SER3啟動(dòng)子重疊贰剥。如果SRG1轉(zhuǎn)錄提前終止倾剿,SER3的抑制將得到緩解。同樣是在酵母中蚌成,一些lncRNA的轉(zhuǎn)錄是通過改變?nèi)旧|(zhì)結(jié)構(gòu)前痘,從而促進(jìn)蛋白質(zhì)編碼基因?qū)NA聚合酶的可及性,如促進(jìn)FBP1(果糖-1,6-二磷酸酶1)基因的轉(zhuǎn)錄起始担忧。
另一方面芹缔,lncRNA也可能起反式作用,通過與轉(zhuǎn)錄因子結(jié)合影響轉(zhuǎn)錄瓶盛。例如乖菱,lncRNA 7SK與延伸因子P-TEFb結(jié)合并下調(diào)其激酶活性坡锡,以抑制Pol II的轉(zhuǎn)錄延伸蓬网。
4. 轉(zhuǎn)錄后調(diào)節(jié)因子
lncRNA主要通過剪接調(diào)控和翻譯控制兩種方式進(jìn)行轉(zhuǎn)錄后調(diào)控窒所。首先,lncRNA既可以與剪接因子競(jìng)爭(zhēng)結(jié)合帆锋,也可以通過堿基配對(duì)與mRNA自身結(jié)合吵取,阻斷mRNA的剪接。
MALAT-1(肺腺癌轉(zhuǎn)移相關(guān)轉(zhuǎn)錄因子)是一種豐富的~ 7kb的lncRNA锯厢,可與富含絲氨酸/精氨酸(SR)的剪接因子相互作用皮官。這被認(rèn)為是通過調(diào)節(jié)SR蛋白的磷酸化來調(diào)節(jié)它們?cè)诤税唿c(diǎn)中的分布,從而影響pre-mRNA的選擇性剪接实辑。
MIAT(心肌梗死相關(guān)轉(zhuǎn)錄本)是另一個(gè)lncRNA(包含高度保守的串聯(lián)重復(fù)序列UACUAAC)捺氢,與SF1(剪接因子1)具有更高的親和力,從而抑制剪接和剪接體復(fù)合物在其他轉(zhuǎn)錄本上的形成剪撬。
其次摄乒,lncRNA可以結(jié)合核糖體或翻譯因子來控制蛋白質(zhì)的翻譯。例如残黑,snaR(small NF90-associated RNAs)和Gadd7 (growth arrested DNA-damage inducible gene 7)是lncRNA結(jié)合核糖體控制翻譯的兩個(gè)例子馍佑。
另一方面,BC1 (Brain plasmic RNA 1)和BC200 (200nt Brain plasmic RNA)是lncRNA通過結(jié)合翻譯因子eI4FA(真核翻譯起始因子4A)梨水、PABP (poly (A)-binding protein)等抑制翻譯的例子拭荤。
最后,lncRNA也可以對(duì)microRNA sponges或microRNA前體作用來參與轉(zhuǎn)錄后調(diào)節(jié)疫诽。MicroRNAs是一類沒有蛋白質(zhì)編碼能力的單鏈小RNA舅世。MicroRNAs通過與目標(biāo)mRNA的3′-UTR結(jié)合,可以抑制mRNA的翻譯或促進(jìn)mRNA的降解奇徒。在這種情況下雏亚,少數(shù)lncRNA可以通過影響相應(yīng)的microRNA水平來改變mRNA水平。
LncRNAs的研究方法
一般情況下逼龟,對(duì)能夠產(chǎn)生轉(zhuǎn)錄本的lncRNA進(jìn)行量化和鑒定的實(shí)驗(yàn)程序都是相似的评凝,雖然在下游實(shí)驗(yàn)過程中進(jìn)行了一些修改。
在相同的生物樣本中腺律,LncRNA通常與mRNA一起使用測(cè)序或芯片技術(shù)(RNA-seq和-chip)進(jìn)行量化奕短。RNA序列分析在鑒定新的RNA轉(zhuǎn)錄本方面具有優(yōu)勢(shì),在過去幾十年得到了迅速發(fā)展匀钧。除了普遍應(yīng)用的下一代測(cè)序(NGS)翎碑,最近發(fā)展的RNA-seq包括單細(xì)胞測(cè)序、單分子測(cè)序和固定組織原位測(cè)序之斯。
另一方面日杈,轉(zhuǎn)錄組微陣列仍然在使用,并提供了同樣豐富的數(shù)據(jù)與較低的隨機(jī)變動(dòng)性。特別是在臨床研究中莉擒,當(dāng)涉及到重現(xiàn)性和成本時(shí)酿炸,微陣列甚至比RNA-seq在基因表達(dá)的標(biāo)準(zhǔn)分析方面做得更好。
在lncRNA的功能分析方面涨冀,通過小干擾RNA或反義寡核苷酸來抑制靶向lncRNA填硕,以及通過構(gòu)建過表達(dá)來提高某些lncRNA的表達(dá)水平,是揭示其在體內(nèi)作用的傳統(tǒng)方法鹿鳖。近年來扁眯,革命性的CRISPR系統(tǒng)被用于通過CRISPR激活或CRISPR抑制(CRISPRa/i)來操縱轉(zhuǎn)錄本水平,或用于感興趣的lncRNA基因座的基因組編輯翅帜。
對(duì)于核lncRNAs來說姻檀,用于研究lncRNAs和染色質(zhì)關(guān)系的技術(shù)有:ChIRP(Chromatin Isolation by RNA Purification),CHART (capture hybridization analysis of RNA targets)涝滴,RAP (RNA antisense purification)绣版,GRID-seq (capture in situ global RNA interactions with DNA by deep sequencing),他們廣泛用于在全基因組識(shí)別lncRNAs的結(jié)合位點(diǎn)狭莱。
ChIRP僵娃、CHART和RAP只能研究已知的一個(gè)lncRNA,而GRID-seq提供了高特異性和敏感性的RNA-染色質(zhì)相互作用的全局檢測(cè)和分析腋妙。為了探索lncRNAs與蛋白質(zhì)之間的相互作用默怨,RIP (RNA immunoprecipitation),CLIP (UV crosslinking and immunoprecipitation)骤素,iCLIP (individual-nucleotide resolution CLIP)技術(shù)可以用來捕獲lncRNAs結(jié)合蛋白匙睹。
類似的策略可以應(yīng)用于細(xì)胞質(zhì)lncRNAs,它們通常作為miRNA sponges或miRNA前體發(fā)揮作用济竹。此外痕檬,隨著lncRNA研究的積累,在過去幾年中出現(xiàn)了一些數(shù)據(jù)庫送浊,它們對(duì)管理lncRNAs特別有用梦谜,比如NONCODE、ChipBase袭景、lncRNAdb唁桩、LNCipedia和LncRNADisease。
在腎臟疾病中耸棒,lncRNAs研究的潛在臨床應(yīng)用與其他人類疾病相似荒澡,關(guān)注于生物標(biāo)志物和治療靶點(diǎn),可能為腎臟疾病的診斷和治療提供新的見解与殃。