#circRNA從入門到精通
【01】miRNA缸逃、LncRNA也殖、CircRNA靠譜小結(jié)
【02】首先了解一下circRNA背景知識(shí)
circRNA形成的3種方式:
circRNA產(chǎn)生方式包括外顯子環(huán)化和內(nèi)含子環(huán)化饲握。
circRNA的3大功能:
1.充當(dāng)miRNA“海綿”
2.調(diào)節(jié)轉(zhuǎn)錄和剪接
3.與RNA結(jié)合蛋白相互作用
收集整理好的circRNA相關(guān)數(shù)據(jù)庫【見原文】
【03】circRNA芯片分析的一般流程
臨床課題設(shè)計(jì)的一般原則
表達(dá)芯片的標(biāo)準(zhǔn)差異分析:都是走標(biāo)準(zhǔn)分析流程,火山圖,熱圖涮总,GO/KEGG數(shù)據(jù)庫注釋等等
【04】circRNA-seq分析的一般流程
【05】circRNA_ID轉(zhuǎn)化
六位數(shù)字circRNA_ID:
Agilent公司circRNA芯片我們查閱GEO數(shù)據(jù)庫發(fā)現(xiàn)碾牌,目前經(jīng)常使用的人類circRNA芯片主要有以下幾種:
GPL21825:074301 Arraystar Human CircRNA microarray V2
GPL19978:Agilent-069978 Arraystar Human CircRNA microarray V1
GPL26925:Agilent-084217 CapitalBio Technology Human CircRNA Array v2
GPL23467:Agilent-082557 CBChuman circRNA array V2.0
對(duì)我們感興趣的GSE茉盏,下載相應(yīng)的GPL信息即可獲得circRNA_ID,當(dāng)然還有其他物種的circRNA芯片隔披,可自行探索赃份。
七位數(shù)字circRNA_ID:CircBase數(shù)據(jù)庫
采用阿拉伯?dāng)?shù)字形式進(jìn)行編碼命名,如:hsa_circ_0000001(七位阿拉伯?dāng)?shù)字)
circBase數(shù)據(jù)庫提供六位/七位circRNA_ID對(duì)照表奢米,當(dāng)我們需要進(jìn)行ID轉(zhuǎn)化時(shí)抓韩,登錄http://circbase.org/cgi-bin/downloads.cgi即可下載circID與name對(duì)應(yīng)關(guān)系進(jìn)行轉(zhuǎn)化。
Host gene+三位阿拉伯?dāng)?shù)字:Circbank數(shù)據(jù)庫 當(dāng)我們需要進(jìn)行ID轉(zhuǎn)化時(shí)恃慧,登錄http://www.circbank.cn/downloads.html#即可下載circBank_id與circRNA_id對(duì)應(yīng)關(guān)系進(jìn)行轉(zhuǎn)化园蝠。
以上就是三種主流的circRNA_ID,基本涵蓋了論文中提及的ID痢士;安捷倫circRNA芯片使用6位數(shù)ID泽论,我們實(shí)驗(yàn)室測序結(jié)果使用的7位數(shù)ID,當(dāng)然除此三種外伦籍,還有一些其他的circRNA_ID命名方式搀愧,歡迎各路大神補(bǔ)充。
【06】十行代碼完成circRNA多種ID相互轉(zhuǎn)換
library(data.table)
a=fread('probeMatrix.txt',data.table = F)
a[1:4,1:4]
b=read.table('ann.txt',sep = '\t',header = T)
tail(head(b,20))
d=merge(a,b,by.x='ID_REF',by.y='ID')
e=read.table('ID.txt',header = T)
head(e)
f=merge(e,d,by='circRNA')
head(f[,1:6])