歡迎關(guān)注”生信修煉手冊(cè)”!
隨著lncRNA研究的發(fā)展,lncRNA的數(shù)量越來越多季惩,但是擁有功能注釋的lncRNA只占了其中很小一部分寸认。為了更好的開展lncRNA的功能研究纵顾,科學(xué)家收集文獻(xiàn)中人類lncRNA相關(guān)的數(shù)據(jù)洁奈,包括了表達(dá)量间唉,相關(guān)疾病,甲基化位點(diǎn)睬魂,SNP位點(diǎn)终吼,功能描述等信息镀赌,并整理成了數(shù)據(jù)庫(kù)LncBook, 網(wǎng)址如下
http://bigd.big.ac.cn/lncbook/index
該數(shù)據(jù)庫(kù)中包含以下8種lncRNA相關(guān)信息
1. LncRNAs
共包含277044個(gè)lncRNA, 既有實(shí)驗(yàn)驗(yàn)證的lncRNA,也有軟件預(yù)測(cè)的lncRNA氯哮,收集了來自Gencode
, RefSeq
, Noncode
, Lncipedia
, MiTranscriptome
等數(shù)據(jù)庫(kù)中的lncRNA, 在預(yù)測(cè)lncRNA時(shí),采用了CPAT
, PLEK
, LGC
3個(gè)軟件結(jié)果的交集商佛。
這部分提供lncRNA的ID, 染色體位置喉钢,長(zhǎng)度,外顯子個(gè)數(shù)良姆,類型等基本信息肠虽,示意如下
2. ?Featured LncRNAs
這部分只包含來自lncRNAWiki
數(shù)據(jù)庫(kù)中的有功能注釋和文獻(xiàn)支持的lncRNA, 結(jié)果示意如下
3. ?Function
這部分給出lncRNA的生物學(xué)功能注釋和參與的生物學(xué)過程,共包含以下5種類別的功能
transcriptional regulation
ceRNA
splicing regulation
protein localization
-
RNAi
示意如下
4. Diseases
這部分給出lncRNA相關(guān)的疾病信息玛追,包括了實(shí)驗(yàn)驗(yàn)證和預(yù)測(cè)兩種税课,實(shí)驗(yàn)驗(yàn)證的數(shù)據(jù)直接從lncRNADisease
和lncRNAwiki
這兩個(gè)數(shù)據(jù)庫(kù)得到闲延,預(yù)測(cè)主要是結(jié)合了其他組學(xué)的數(shù)據(jù),包括以下3種策略
相比正常樣本韩玩,如果在腫瘤樣本中某個(gè)lncRNA啟動(dòng)子區(qū)存在高甲基化區(qū)域垒玲,則認(rèn)為該lncRNA與疾病相關(guān);
如果某個(gè)lncRNA區(qū)域存在于疾病相關(guān)的SNP位點(diǎn)找颓,則該lncRNA與疾病相關(guān)合愈;
-
如果某個(gè)lncRNA與5個(gè)以上與疾病相關(guān)miRNA(miRNA相關(guān)疾病信息來自HMDD數(shù)據(jù)庫(kù))具有相互作用,則該lncRNA與疾病相關(guān)击狮;
結(jié)果示意如下
5. Expression
通過分析HPA
和GTEx
兩個(gè)公共項(xiàng)目的轉(zhuǎn)錄組數(shù)據(jù)佛析,給出lncRNA在各個(gè)組織中的FPKM表達(dá)量值,示意如下
通過分析在不同組織中的表達(dá)量彪蓬,可以用于判斷組織特異性lncRNA還是管家lncRNA, 計(jì)算公式如下
N
代表組織的個(gè)數(shù)寸莫,x
代表每個(gè)組織中歸一化之后的表達(dá)量,這里的歸一化是將每個(gè)組織中的表達(dá)量除以所有組織中最大的表達(dá)量寞焙。
6. Methylation
通過分析TCGA和ENCODE數(shù)據(jù)庫(kù)的數(shù)據(jù)储狭,給出lncRNA相關(guān)的甲基化信息,示意如下
7. Variation
將dbSNP數(shù)據(jù)庫(kù)中的SNP位點(diǎn)映射到lncRNA上捣郊,同時(shí)提供了來自COSMIC
和ClinVar
數(shù)據(jù)庫(kù)的注釋信息辽狈,以及1000G中的頻率信息,結(jié)果示意如下
8. lncRNA與miRNA的相互作用
采用tagetScan和miRanda兩款軟件來預(yù)測(cè)lncRNA與miRNA的相互作用呛牲,取交集作為最終的結(jié)果刮萌,實(shí)驗(yàn)證據(jù)主要來自于starbase數(shù)據(jù)庫(kù),結(jié)果示意如下
除此之外娘扩,還提供了一下4種工具
Blast
LGC
Classification
-
Conversion
Blast
用于將輸入序列和數(shù)據(jù)庫(kù)中的lncRNA序列進(jìn)行比對(duì)着茸,LGC
用于分析序列的蛋白編碼潛能,預(yù)測(cè)lncRNA琐旁;Classification
用于根據(jù)染色體位置對(duì)基因進(jìn)行分類涮阔,Conversion
用于提供多個(gè)lncRNA數(shù)據(jù)庫(kù)中ID的轉(zhuǎn)換,結(jié)果示意如下
lncBook和lncRNAwiki是同一個(gè)開發(fā)團(tuán)隊(duì)灰殴,lncBook可以看做lncRNAwiki的升級(jí)版本敬特,更多的用法和信息請(qǐng)參考官網(wǎng)的幫助文檔。
·end·
—如果喜歡牺陶,快分享給你的朋友們吧—
掃描關(guān)注微信號(hào)伟阔,更多精彩內(nèi)容等著你!