今天寫寫我們自己做的數(shù)據(jù)庫奥务,歡迎大家提意見欺缘,多引用。
長鏈非編碼RNA是一類廣泛存在箭阶、長度大于200 個(gè)堿基的非編碼調(diào)控分子虚茶。它深度參與植物生長發(fā)育戈鲁、逆境脅迫與次生代謝等諸多生命過程,是當(dāng)前生物學(xué)研究的熱點(diǎn)領(lǐng)域嘹叫。
長鏈非編碼RNA是一類無蛋白編碼能力或編碼能力極低的RNA轉(zhuǎn)錄本婆殿,通過靶標(biāo)模擬、轉(zhuǎn)錄干擾罩扇、甲基化等機(jī)制調(diào)控真核生物基因表達(dá)婆芦。隨著高通量測序技術(shù)的發(fā)展,越來越多的研究表明喂饥,長鏈非編碼RNA在植物中廣泛存在消约。目前擬南芥、水稻员帮、玉米或粮、小麥、番茄等重要植物均已開展全基因組長鏈非編碼RNA的鑒定與研究集侯。此前被啼,國際上雖然有包括lncRNAdb、NONCODE棠枉、EVLncRNAs浓体、PLNlncRbase、CANTATAdb辈讶、GreeNC等在內(nèi)的多個(gè)植物長鏈非編碼RNA相關(guān)數(shù)據(jù)庫被成功開發(fā)并投入使用命浴,但現(xiàn)有數(shù)據(jù)庫或多或少地均存在注釋標(biāo)準(zhǔn)不統(tǒng)一,缺乏包括表達(dá)量贱除、靶基因生闲、表觀遺傳學(xué)等重要信息的種種不足。
自從我們第一個(gè)版本發(fā)布之后(Jin et al, 2013 Bioinformatics)月幌,就獲得了大量的訪問碍讯。為創(chuàng)造性地開發(fā)一套更為科學(xué)系統(tǒng)、精準(zhǔn)實(shí)用的百科全書式長鏈非編碼RNA數(shù)據(jù)庫扯躺,我們自NCBI公共數(shù)據(jù)庫搜集整理的80種重要植物的13834個(gè)轉(zhuǎn)錄組測序數(shù)據(jù)(圖1A)捉兴,開發(fā)了適用于植物全基因組長鏈非編碼RNA的鑒定分析流程(圖1B),在全面整合其他現(xiàn)有資源的基礎(chǔ)上录语,鑒定了1246372個(gè)植物長鏈非編碼RNA(含31028個(gè)煙草長鏈非編碼RNA)倍啥,開發(fā)了植物長鏈非編碼RNA數(shù)據(jù)庫PLncDB(http://plncdb.tobaccodb.org/)(Jin et al, 2020, NAR)。
數(shù)據(jù)庫可實(shí)現(xiàn)植物長鏈非編碼RNA基因組位置澎埠、序列虽缕、結(jié)構(gòu)、表達(dá)蒲稳、表觀遺傳氮趋、調(diào)控網(wǎng)絡(luò)等信息的全方位查詢與可視化展示伍派。同時(shí),5個(gè)搜索引擎及JBrowse剩胁、eFP Browser拙已、EPexplorer等分析工具,為數(shù)據(jù)庫提供了強(qiáng)大的數(shù)據(jù)分析能力(圖2)摧冀。作為一站式數(shù)據(jù)庫,PLncDB將為植物與煙草長鏈非編碼RNA研究提供更為精準(zhǔn)系宫、全面的大數(shù)據(jù)分析平臺(tái)支撐索昂。
歡迎大家多多引用,提意見扩借。