本科時便接觸過miRNA允青,那個時候還查過一些關于miRNA相關的內(nèi)容橄碾,準備在一個學習小組中講講颠锉,可惜的是法牲,當時的自己也沒有搞懂琼掠。而最近一次的miRNA-seq數(shù)據(jù)分析拒垃,終于讓自己對它有一些理解瓷蛙。
miRNA的長度一般在20~24 nt 之間悼瓮,通過調(diào)節(jié)下游靶基因來調(diào)控生物的發(fā)育艰猬,抗逆等谤牡。
2002年的一篇Cell中指出[1]姥宝,動物的miRNA和mRNA并沒有非常嚴格的堿基配對翅萤,因此預測比較困難腊满,但是在植物中套么,miRNA和mRNA之間存在較為嚴格的堿基匹配碳蛋。于是作者檢索了配對少于3次錯配的mRNA, 并且用實驗進行了驗證胚泌。
目前植物的miRNA的靶基因預測用psRobot就夠了, 把候選的miRNA上傳到網(wǎng)頁工具肃弟,選擇合適的轉錄本庫進行搜索玷室,用默認參數(shù)進行預測然后進行篩選就夠了笤受。
這里額外補充幾點說明:
第一: 根據(jù)miRNA Target Prediction in Plants, miRNA并非所有區(qū)域都要求嚴格匹配穷缤,其中第1位堿基和第14位以后的堿基是允許錯配(以miRNA 5'為始)箩兽。
psRobot的打分規(guī)則是, 嚴格匹配區(qū)的錯配津肛、缺失的懲罰分數(shù)為1汗贫,G:U懲罰為0.5身坐,非嚴格匹配區(qū)的懲罰分數(shù)減半
psRobot除了網(wǎng)頁版工具,還可以在http://omicslab.genetics.ac.cn/psRobot/downloads.php下載本地版部蛇, 使用方法為:
psRobot_tar -s mature.fa -t Araport11_genes.201606.cdna.fasta -o target.gTP
使用cDNA序列不用genomic序列的原因是,miRNA在細胞質(zhì)和靶基因結合發(fā)揮作用涯鲁。此時靶基因還有UTR區(qū)域但是已經(jīng)沒有內(nèi)含子區(qū)了。(考慮到UTR區(qū)域的序列特點撮竿,其實用CDS序列也行)
參數(shù)說明如下:
-
-s
: 待預測的miRNA -
-t
: 用于搜索的序列 -
-o
: 輸出文件 -
-ts
: 輸出結果的閾值 -
-fp
: 5'后第幾位開始是必要區(qū)間(1~2), 默認2 -
-gl
: 5'后第幾位開始是必要區(qū)間(8~31) 默認是17 -
-gl
: 從第幾個堿基后允許出現(xiàn)gap/bulge, 默認17 -
-gn
: 允許存在幾個gap/bulge, 默認1
其中擬南芥的cDNA序列通過如下方式下載
https://www.arabidopsis.org/download_files/Genes/Araport11_genome_release/Araport11_blastsets/Araport11_genes.201606.cdna.fasta.gz
- Prediction of Plant MicroRNA Targets
- miRNA Target Prediction in Plants
- PsRobot: a web-based plant small RNA meta-analysis toolbox