?本章將介紹一些極簡(jiǎn)單的RNA生信分析颜说,如利用在線網(wǎng)站預(yù)測(cè)RNA分子二級(jí)結(jié)構(gòu)购岗,分析非編碼RNA(non-coding RNA)等。前面我們講過(guò)DNA门粪,蛋白質(zhì)藕畔。而RNA分子的功能則更全面,它可以像DNA一樣承載遺傳信息庄拇,也可以像蛋白質(zhì)一樣催化反應(yīng)注服。
核糖核酸(Ribonucleic Acid,RNA)根據(jù)功能和結(jié)構(gòu)不同分為信使RNA和非編碼RNA措近。而非編碼RNA又可分為非編碼大RNA(核糖體RNA(rRNA)溶弟,長(zhǎng)鏈非編碼RNA)和非編碼小RNA(轉(zhuǎn)運(yùn)RNA(tRNA),核酶瞭郑,小分子RNA(miRNA辜御,siRNA,piRNA屈张,scRNA擒权,snRNA袱巨,snoRNA等))。
一碳抄、預(yù)測(cè)愉老,建模,繪制RNA二級(jí)結(jié)構(gòu)
RNA的高級(jí)結(jié)構(gòu)的發(fā)現(xiàn)二十世紀(jì)70年代生物界的重要進(jìn)展剖效,而且人們欣喜地發(fā)現(xiàn)RNA結(jié)構(gòu)遵循的原則簡(jiǎn)單嫉入,主要是“沃森、克里克堿基互補(bǔ)配對(duì)”原則璧尸。
"
單鏈RNA就像一段膠帶咒林,很不穩(wěn)定。只有在與其他配對(duì)才可以爷光,當(dāng)然不同種類的配對(duì)的穩(wěn)定性也不同垫竞,傾向于形成最穩(wěn)定的結(jié)構(gòu),即最低能量模型(lowest-energy model)蛀序,如果要解開這個(gè)結(jié)構(gòu)就需要供能件甥。
下圖是最典型的RNA二級(jí)結(jié)構(gòu)——莖環(huán)結(jié)構(gòu)。莖的部分也不總是完美配對(duì)的哼拔,會(huì)有不配對(duì)的殘基形成凸起(bulges)引有。偽結(jié)(pseudo-knots)部分與RNA和離子、蛋白倦逐、其他RNAs互作有關(guān)譬正。
RNA結(jié)構(gòu)的穩(wěn)定性不僅受到GC含量影響,莖中堿基對(duì)和環(huán)結(jié)(loop)大小檬姥,以及偽結(jié)也會(huì)對(duì)穩(wěn)定性有影響曾我。
其他蛋白或者分子也可能干預(yù)RNA結(jié)構(gòu)的形成。目前對(duì)于RNA結(jié)構(gòu)的預(yù)測(cè)健民,都是基于“該RNA自主形成高級(jí)結(jié)構(gòu)”的假設(shè)上抒巢,所以預(yù)測(cè)也可能是錯(cuò)誤的。
"
二秉犹、使用Mfold
Mfold是一個(gè)很古老又經(jīng)典的網(wǎng)站蛉谜,1995年就有了。它利用能量最低原則崇堵,同時(shí)考慮多種可能的影響因素型诚,預(yù)測(cè)出最可能的RNA二級(jí)結(jié)構(gòu)和次優(yōu)結(jié)構(gòu)。
下面用于舉例的序列:
>Haemophilus_influenzae_Rd.trna49-AlaGGC (307354-307279)? Ala (GGC) 76 bp? Sc: 85.98GGGGATATAGCTCAGTTGGGAGAGCGCTTGAATGGCATTCAAGAGGTCGTCGGTTCGATCCCGATTATCTCCACCA
mfold等各種fold的網(wǎng)址:
http://www.unafold.org/mfold/applications/rna-folding-form-v2.php
1. 輸入序列
輸入序列鸳劳,點(diǎn)擊下面的fold RNA狰贯。如果事先不知道關(guān)于這段序列的任何信息,那么其他的參數(shù)都保持默認(rèn)。如果知道一些涵紊,那么請(qǐng)按照“2”操作傍妒。
輸入序列
2.?條件設(shè)定
若是已知序列的某一段的結(jié)構(gòu),在點(diǎn)擊fold RNA之前摸柄,可以將已知條件輸入颤练。
例如“ F 7 0 5 ”表示強(qiáng)制序列的第7~11個(gè)堿基形成雙鏈√练“ P 7 0 5 ”表示強(qiáng)制序列的第7~11個(gè)堿基形成單鏈。還有強(qiáng)制連續(xù)排列的堿基對(duì)或禁止連續(xù)排列尿贫,以及禁止某段與另一段配對(duì)等电媳。
3. 返回結(jié)果
下載結(jié)果,有多種文件格式可選庆亡,這個(gè)序列有四種可能的折疊
這里展示其中的一個(gè)
4. 調(diào)整折疊圖
展示形式可以調(diào)整匾乓。
折疊部分結(jié)構(gòu)還標(biāo)注突出顯示
5. 穩(wěn)定性分析
mfold網(wǎng)頁(yè)返回的結(jié)果不僅是這個(gè)折疊的圖,還有關(guān)于每個(gè)結(jié)構(gòu)穩(wěn)定性的解析又谋,以及一些dot plot拼缝。
三、在數(shù)據(jù)庫(kù)和基因組搜索RNA序列
1.?用tRNAscan在基因組中尋找tRNAs
TRNAscan-SE網(wǎng)址:
http://lowelab.ucsc.edu/tRNAscan-SE/
上傳FASTA格式的序列彰亥。
tRNAscan-SE結(jié)果
2. 用PatScan尋找RNA patterns
(1)PatScan UI網(wǎng)站:
https://patscan.secondarymetabolites.org/
首先將想要搜索的序列或基因組的FASTA文件上傳咧七,然后輸入要在其中尋找的Pattern。這個(gè)操作里比較麻煩的就是想要檢索的Pattern需要寫成PatScan識(shí)別的格式任斋。
(2)關(guān)于輸入pattern的格式:
官網(wǎng)教程:
https://patscan.secondarymetabolites.org/tutorial#example1-1
一個(gè)簡(jiǎn)單的例子继阻,p1=8...9 3...8 ~p1表示:【p1=8...9】stem p1包含8到9個(gè)核苷酸(省略號(hào)表示在8到9之間),【3...8】一個(gè)3到8個(gè)核苷酸的模式結(jié)構(gòu)废酷,【~p1】表示stem p1的反向互補(bǔ)瘟檩。我們可以用PatScan體寫出很多模式,還有一些書寫規(guī)則澈蟆,見下表墨辛。
網(wǎng)頁(yè)會(huì)返回結(jié)果如下:
四、尋找小RNA:miRNAs和siRNAs
它們?cè)诩?xì)胞中起到調(diào)節(jié)作用趴俘,具體的發(fā)現(xiàn)過(guò)程和功能這里就不展開了睹簇。我們已知siRNA(silencing RNA)是雙鏈,miRNA(micro-RNA)是單鏈寥闪,還往往形成莖環(huán)結(jié)構(gòu)带膀。
下面介紹一些相關(guān)網(wǎng)站和數(shù)據(jù)庫(kù),使用方法和前面的介紹大同小異:
1. miRvestigator Framework
https://mirvestigator.systemsbiology.net/
輸入一個(gè)基因序列橙垢,將會(huì)返回一個(gè)最有可能調(diào)節(jié)這個(gè)基因的miRNA垛叨。
2. MIENTURNET
http://userver.bio.uniroma1.it/apps/mienturnet/
輸入基因返回miRNA,輸入miRNA返回基因的網(wǎng)站。
3. Dietary?microRNA?Database
http://sbbi-panda.unl.edu:5000/dmd/
已發(fā)表的microRNA數(shù)據(jù)庫(kù)和相關(guān)注釋信息嗽元。
4. miRNAminer
http://groups.csail.mit.edu/pag/mirnaminer/
已發(fā)表的microRNA數(shù)據(jù)庫(kù)和相關(guān)注釋信息敛纲。
5. PVsiRNAdb
http://14.139.61.8/PVsiRNAdb/index.ph
感染不同植物的不同病毒的vsiRNA序列相關(guān)的數(shù)據(jù)庫(kù)。
6. siRNAmod
http://crdd.osdd.net/servers/sirnamod/
siRNAmod是經(jīng)過(guò)人工驗(yàn)證的經(jīng)過(guò)化學(xué)驗(yàn)證的化學(xué)修飾siRNA的數(shù)據(jù)庫(kù)剂癌。
五淤翔、一些RNA分析線上資源的介紹
1. 核糖體RNA相關(guān)數(shù)據(jù)庫(kù)
(1)RDP
http://rdp.cme.msu.edu/
細(xì)菌和古細(xì)菌16S rRNA序列,真菌28S rRNA序列佩谷,以及分析工具旁壮。
2. non-coding RNA
(1)RNAcentral
https://rnacentral.org/
非編碼RNA數(shù)據(jù)庫(kù)
(2)sRNAtools
https://bioinformatics.caf.ac.cn/sRNAtools/
非編碼小RNA數(shù)據(jù)庫(kù)
3. 通用RNA資源庫(kù)
(1)RNAcentral Expert Databases
https://rnacentral.org/expert-databases
看名字就感覺很全面。
(2)ncRNA
https://www.ncrna.org/
簡(jiǎn)易工具箱的感覺。
往期相關(guān)內(nèi)容:
【陪你學(xué)·生信】二嗅辣、一些你肯定會(huì)用到的生信工具和基本操作
【陪你學(xué)·生信】三、核苷酸序列數(shù)據(jù)庫(kù)的使用
【陪你學(xué)·生信】四麦撵、蛋白質(zhì)相關(guān)的數(shù)據(jù)庫(kù)
【陪你學(xué)·生信】五、當(dāng)你有一段待分析的DNA序列(基礎(chǔ)操作介紹)
【陪你學(xué)·生信】六溃肪、當(dāng)你有一段待分析的氨基酸序列(基礎(chǔ)操作介紹)
【陪你學(xué)·生信】七免胃、在數(shù)據(jù)庫(kù)中檢索相似的序列
【陪你學(xué)·生信】九惫撰、多序列比對(duì)-Multiple Sequence Alignment(MSA)