實(shí)際上,真正可用的基因只占人類基因組的3%优俘,其余97%都是非編碼序列,但是非編碼序列也是可以表達(dá)的掀序,表達(dá)產(chǎn)物就是非編碼RNA(ncRNA)帆焕。
人類基因組中約93%的DNA是能轉(zhuǎn)錄為RNA的,其中2%是mRNA不恭,98%是非編碼RNA(ncRNA)叶雹。
RNA轉(zhuǎn)錄本分類
非編碼RNA(ncRNA)可以分為調(diào)控RNA和管家RNA兩種。
調(diào)控RNA
miRNA: 微RNA (microRNA)换吧,18-25 nt.(nt=nucleotide核糖核苷酸)折晦,單鏈
siRNA: 小干擾RNA (smallinterfering RNA),21-23 nt.式散,雙鏈
piRNA: piwi相互作用RNA (piwi-interacting RNA)筋遭,26-35 nt.打颤,單鏈暴拄,這是動物生殖細(xì)胞所特有的小RNA,轉(zhuǎn)座子沉默
lncRNA: 長非編碼RNA (long non-coding RNA)编饺,>500 nt.乖篷,比如Xist、PCGEM1等
管家RNA
rRNA: 核糖體RNA (ribosome RNA)透且,26-35 nt.撕蔼,單鏈,是構(gòu)成核糖體的組成成分秽誊,有多種不同的大小鲸沮,如28S、18S锅论、5S等
tRNA: 轉(zhuǎn)運(yùn)RNA (transfer RNA)讼溺,70-80 nt.,單鏈最易,三葉草構(gòu)型怒坯,在蛋白質(zhì)合成過程中起到轉(zhuǎn)運(yùn)氨基酸的作用炫狱,對于不同的物種,其rRNA分子的大小和種類都可能有所不同
snoRNA: 核仁小RNA (smallnucleolar RNA)
sacRNA: Small Cajal body-specific RNAs剔猿,是一種特殊的核仁小RNA视译,專一位于卡哈爾體(Cajal body)上,可以催化核糖核蛋白的生成
Telomerase RNA: 端粒酶RNA归敬,是端粒酶的一部分酷含,在端粒延伸過程中,作為端粒繼續(xù)延伸的模板汪茧,由端粒酶催化實(shí)現(xiàn)端粒的延長
熱門ncRNA——lncRNA第美、miRNA、circleRNA
目前研究最熱門的ncRNA主要集中在lncRNA陆爽、miRNA什往、circleRNA三種。
IncRNA: lncRNA可通過折疊形成一定的空間結(jié)構(gòu)與多種蛋白互作慌闭,也可通過堿基互補(bǔ)配對與其它核酸進(jìn)行識別别威,這種識別又可將蛋白引導(dǎo)至特定序列位點(diǎn),這些特點(diǎn)使得lncRNA在發(fā)育和癌癥中的功能發(fā)揮得更加豐富驴剔。
lncRNA
作為RNA誘餌省古,結(jié)合轉(zhuǎn)錄因子,干擾其與基因promoter區(qū)域的結(jié)合丧失,從而調(diào)控轉(zhuǎn)錄豺妓;作為分子海綿,吸附miRNA布讹,抑制其與mRNA的結(jié)合琳拭,使得mRNA免于降解;作為蛋白互作的支架或橋梁描验,影響蛋白多聚物的形成白嘁,調(diào)控蛋白活性;招募染色質(zhì)修飾因子膘流,改變?nèi)旧|(zhì)的修飾水平絮缅,從而影響基因的轉(zhuǎn)錄和表達(dá);與mRNA配對結(jié)合呼股,抑制翻譯耕魄;與mRNA配對結(jié)合,影響剪切彭谁;與mRNA配對結(jié)合吸奴,影響mRNA的穩(wěn)定性。
circleRNA: circRNA分子呈封閉環(huán)狀結(jié)構(gòu),無游離5‘和3’末端奄抽,不易被核酸外切酶RNaseR降解蔼两,比線性RNA更加穩(wěn)定。 長度約200-2000bp逞度,主要長度分布在500bp左右额划。
circleRNA
circleRNA大多數(shù)來源于外顯子,少部分由內(nèi)含子直接環(huán)化形成档泽。其形成有四種模式: 套索驅(qū)動的環(huán)化俊戳、內(nèi)含子堿基配對驅(qū)動環(huán)化、單個內(nèi)含子成環(huán)馆匿、RNA結(jié)合蛋白驅(qū)動環(huán)化抑胎。
它可以通過競爭性結(jié)合miRNA、線性親本基因的轉(zhuǎn)錄渐北,甚至是編碼多肽來發(fā)揮生物學(xué)功能阿逃。
circRNA作為ceRNA(內(nèi)源競爭性RNA)競爭性結(jié)合miRNA;circRNA結(jié)合RNA結(jié)合蛋白(RBP)以形成RNA-蛋白復(fù)合物(RPC)赃蛛,調(diào)控線性親本基因的轉(zhuǎn)錄恃锉;編碼功能,circRNA具有內(nèi)部核糖體進(jìn)入位點(diǎn)(IRES)呕臂,能合成多肽破托。
miRNA: miRNA一類由內(nèi)源基因編碼的非編碼單鏈RNA分子,其長度約為19-25nt歧蒋,其在腫瘤發(fā)生發(fā)展土砂、生物發(fā)育、器官形成谜洽、病毒防御萝映、表觀調(diào)控以及代謝等方面起著極其重要的調(diào)控作用。
miRNA
RNA聚合酶II/III轉(zhuǎn)錄成pri-miRNA褥琐,Drosa/DGCR8復(fù)合體將其裂解為pre-miRNA(前體miRNA)锌俱;Exportin-5-Ran-GTP復(fù)合物將pre-miRNA轉(zhuǎn)運(yùn)出核晤郑;Dicer酶裂解pre-miRNA至成熟的長度(19-25nt)敌呈;雙鏈的miRNA被轉(zhuǎn)載進(jìn)AGO2,一條鏈降解造寝,一條鏈形成RISC磕洪,發(fā)揮生物學(xué)功能。生物學(xué)功能有:mRNA的裂解及降解诫龙、抑制翻譯析显。此外還有轉(zhuǎn)錄調(diào)控功能。
RNA-seq結(jié)果解讀
目前在生信里面應(yīng)用最為廣泛和成熟的RNA-seq技術(shù)就是轉(zhuǎn)錄組測序签赃,狹義上也就是指的全部mRNA的表達(dá)水平谷异,而RNA-seq完成后會生成很多的數(shù)據(jù)和圖片分尸,如火山圖、韋恩圖歹嘹、聚類熱圖等箩绍。
火山圖(Volcano Plot)顯示了兩個重要的指標(biāo): fold change和校正后的p value,利用t檢驗(yàn)分析出兩樣本間顯著差異表達(dá)的基因后尺上,以log2(fold change)為橫坐標(biāo)材蛛,以t檢驗(yàn)顯著性檢驗(yàn)p值的負(fù)對數(shù)-log10(adj p-value)為縱坐標(biāo)。
紅色代表基因上調(diào)怎抛,綠色代表基因下調(diào)卑吭。
橫軸: fold change代表檢測樣本對對照樣本(TS vs CK)的RNA表達(dá)量倍數(shù)(商)。圖中當(dāng)橫軸為1時马绝,代表表達(dá)量為2倍關(guān)系(log2(2)=1)豆赏。
縱軸: padj就是adj p-value(調(diào)整p值),代表差異是否具有顯著性富稻,統(tǒng)計學(xué)中河绽,以p<0.05代表差異具備顯著性,由于-log10(0.05)=1.3唉窃,所以圖示中1.3以上的點(diǎn)代表差異具有顯著性耙饰。
韋恩圖(Vene PLot)用于顯示元素集合重疊區(qū)域的圖示。
在RNA-seq項目中纹份,每個橢圓表示一個比較集合(處理組 vs 對照組)中的差異基因苟跪,橢圓重疊區(qū)域的數(shù)字表示對應(yīng)的多個比較集合之間的共有差異基因個數(shù)。如圖示蔓涧,集合A件已、B、C元暴、D共有差異基因有44個篷扩。
聚類熱圖(Clustered HeatMap)可用于判斷不同實(shí)驗(yàn)條件下差異基因的表達(dá)模式,熱力值表示該點(diǎn)的基因表達(dá)茉盏。
紅色: 表示基因表達(dá)水平高鉴未;藍(lán)色: 表示基因表達(dá)水平低。
橫軸代表不同的實(shí)驗(yàn)處理條件/樣本(cell)鸠姨,縱軸代表差異基因(gene)铜秆,并且差異基因已經(jīng)進(jìn)行了聚類分組,表達(dá)模式或相近的差異基因會被聚類為一組讶迁。