本文內(nèi)容
本文為筆者個(gè)人的學(xué)習(xí)筆記,包括以下內(nèi)容
- TCGA count數(shù)據(jù)下載
- count數(shù)據(jù)預(yù)處理,標(biāo)準(zhǔn)化
- 差異mRNA,miRNA, lncRNA
- 繪制熱圖,火山圖
- ceRNA網(wǎng)絡(luò)分析惑朦,輸出文件到cytoscape
- 識別出哪些基因是lncRNA, miRNA, mRNA, pseudogene
- 運(yùn)行過程中存在的問題及解決辦法
基本背景知識
注
:為方便閱讀,增加讀者對文章內(nèi)容的理解,關(guān)于miRNA背景知識轉(zhuǎn)載至維基百科 已维,僅供交流學(xué)習(xí)使用行嗤,版權(quán)歸原作者所有。
miRNA
小分子核糖核酸(英語:microRNA垛耳,縮寫為miRNA)又譯微核糖核酸栅屏,是真核生物中廣泛存在的一種長約21到23個(gè)核苷酸的核糖核酸(RNA)分子,可調(diào)節(jié)其他基因的表達(dá)[1][2]堂鲜。miRNA來自一些從DNA轉(zhuǎn)錄而來栈雳,但無法進(jìn)一步翻譯成蛋白質(zhì)的RNA(屬于非編碼RNA)。miRNA通過與目標(biāo)信使核糖核酸(mRNA)結(jié)合缔莲,進(jìn)而抑制轉(zhuǎn)錄后的基因表達(dá)[3]哥纫,在調(diào)控基因表達(dá)、細(xì)胞周期痴奏、生物體發(fā)育時(shí)序等方面起重要作用蛀骇。在動物中,一個(gè)微RNA通扯敛穑可以調(diào)控?cái)?shù)十個(gè)基因擅憔。
這些RNA是從初級轉(zhuǎn)錄本(primary transcript)出來的,也就是pri-miRNA檐晕,轉(zhuǎn)變成為稱為pre-miRNA的莖環(huán)結(jié)構(gòu)暑诸,最后成為具有功能的成熟miRNA蚌讼。
miRNA的命名規(guī)則
- miR-前綴后面所跟著的數(shù)字,代表命名的順序个榕,比如篡石,miR-124比miR-456發(fā)現(xiàn)得早。
- “miR-”代表成熟的miRNA西采、“mir-”代表pre-miRNA和pri-miRNA凰萨、“MIR”代表編碼miRNA的基因[5]。
- miRNA幾乎全是獨(dú)一的編碼順序苛让,但對于擁有一兩個(gè)堿基不同的則會被標(biāo)上字母以示沟蔑,例如,miR-124a與miR-124b狱杰。 若成熟的miRNA相同瘦材,但pre-miRNA和pri-miRNA和編碼他們的基因來自于不同的基因組,則使用數(shù)字來表示仿畸,例如食棕,mir-194-1和mir-194-2表示兩個(gè)pre-, pri-miRNA剪切后的成熟miRNA是完全相同的错沽,但卻是兩個(gè)不同的來源簿晓。
- 前綴的三個(gè)字母代表了不同的種族來源,例如千埃,hsa-miR-194代表miRNA來源于人類憔儿,oar-miR-124來源于綿羊。
- 對于形成pre-放可,pri-miRNA莖環(huán)的兩端miRNA谒臼, 通常一端在數(shù)量上遠(yuǎn)遠(yuǎn)超過另一端。數(shù)量優(yōu)勢的一端往往稱為guide strand耀里,而另一端被稱為passenger strand蜈缤,通常被大量降解,用號來表示冯挎,例如miR-124和miR-124底哥。
lncRNA基本背景
長的非編碼RNA(長的ncRNA,lncRNA)是一種類型的RNA房官,定義為轉(zhuǎn)錄與長度超過200 個(gè)核苷酸的是不翻譯成蛋白質(zhì)趾徽。[1]這種有點(diǎn)任意的限制將長ncRNA與小的非編碼RNA區(qū)分開來,例如microRNA(miRNA)翰守,小干擾RNA(siRNA)孵奶,Piwi相互作用RNA(piRNA),小核仁RNA(snoRNA)和其他短RNA潦俺。[2] 長介入/基因間非編碼RNA(lincRNA)是lncRNA的序列,其不與蛋白質(zhì)編碼基因重疊。[3]