上一篇介紹了使用ChIPseeker對peaks的分布和鄰近基因的注釋距潘。除此之外壹哺,下游分析通常還包括鑒定我們感興趣的蛋白質(zhì)結(jié)合的motif;鑒定這些結(jié)合區(qū)域的基因以及這些基因的富集通路或網(wǎng)絡(luò)。
學(xué)習(xí)目標(biāo)
- 功能富集分析: [GREAT](http://bejerano.stanford.edu/great/public/html/index.php)
- motif分析:MEME套件溶其,如DREME(http://meme-suite.org/tools/dreme), MEME-ChIP (http://meme-suite.org/tools/meme-chip)
準(zhǔn)備文件
提取IDR結(jié)果文件的前3列
cut -f 1,2,3 Nanog-idr-merged.bed > Nanog-idr-merged-great.bed
使用bedtools getfasta
提取peaks的序列
bedtools getfasta -fi \
ref_genome.fa \
-bed Nanog-idr-merged-great.bed \
-fo Nanog-idr-merged-dreme.fasta
富集分析
GREAT(http://bejerano.stanford.edu/great/public/html/index.php)對peaks的功能注釋是對peaks臨近基因的注釋。
方法:
- 1.打開GREAT網(wǎng)站:http://bejerano.stanford.edu/great/public/html/index.php 敦间。上傳
Nanog-idr-merged-great.bed
文件瓶逃,選擇參考基因組,選擇Whole genome
作為背景區(qū)域廓块,然后點擊Submit
厢绝。
- 點開
Job Description
,選擇View all genomic region-gene associations
,結(jié)果中的兩個表給出peaks注釋到的基因带猴,一個是基因組區(qū)域和基因關(guān)聯(lián)的表昔汉,一個是基因和基因組關(guān)聯(lián)的表:
- 點開
-
Region-Gene Association Graphs
這欄內(nèi)容對結(jié)合位點的基因數(shù)和轉(zhuǎn)錄起始位點相關(guān)的基因做了圖形展示。
-
-
Global Controls
選擇想注釋的信息浓利,如GO注釋
-
-
探究Nanog結(jié)合位點相關(guān)的GO BP term
-
-
選擇某個term,查看具體信息
-
- 打開
This term's genomic region-gene association tables (140 regions, 116 genes)
挤庇,查看注釋到的GO term相關(guān)的基因,可以下載表格贷掖。
- 打開
- 在
This term's gene -> genomic region association table
中點擊基因相關(guān)的regions嫡秕,可以在UCSC瀏覽器上直接查看結(jié)合區(qū)域。
- 在
找Motif
motif是比較有特征的短序列苹威,會多次出現(xiàn)的昆咽,并被假設(shè)擁有生物學(xué)功能。而且,經(jīng)常是一些具有序列特異性的蛋白的結(jié)合位點(如轉(zhuǎn)錄因子)或者是涉及到重要生物過程的(如掷酗,RNA 起始调违,RNA 終止, RNA 剪切等等)泻轰。
有很多網(wǎng)頁版工具提供了找motif的方法技肩,2014年的一篇綜述列出了目前常用的網(wǎng)頁工具(https://doi.org/10.1186/1745-6150-9-4 ):
最常用的有MEME工具套件,下面主要介紹DREME浮声。DREME適用于大批量的ChIP-Seq數(shù)據(jù)找真核轉(zhuǎn)錄因子短的(4nt或8nt)核心DNA結(jié)合基序虚婿。
DREME
- 打開DREME網(wǎng)頁 http://meme-suite.org/tools/dreme ,只要輸入fasta序列
Nanog-idr-merged-dreme.fasta
即可泳挥,同時可以寫上email和每個任務(wù)的描述然痊,任務(wù)完成時如右圖所示,可以打開DREAM_HTML_output查看結(jié)果屉符。
DREME’s HTML展示的結(jié)果包括找到的motif的序列l(wèi)ogo和表示顯著性的E-value剧浸。點擊More
可以查看更多的信息。
Tomtom
為了確定鑒定到的motif與已知轉(zhuǎn)錄因子的motif是否相似矗钟,可以將找到的motif再提交到Tomtom唆香,與已知的轉(zhuǎn)錄因子數(shù)據(jù)庫搜索匹配,同時還會給出motif-motif相似性的統(tǒng)計評估真仲。
在DREAM's HTML結(jié)果中選擇某個預(yù)測到的motif袋马,點擊Submit / Download
,然后選擇Tomtom
,點擊Submit
秸应,在新打開的Tomtom界面可以選擇轉(zhuǎn)錄因子的參考數(shù)據(jù)庫虑凛,保持默認(rèn)參數(shù)不變,也可以再添加其他參數(shù)软啼,輸入郵箱和任務(wù)描述就可以開始搜索桑谍。
MEME-ChIP
MEME-ChIP是MEME套件中的另一個工具,可以實現(xiàn)DREAM和Tomtom的分析功能祸挪,還可以評估m(xù)otifs的中心富集性并整合相關(guān)的motifs合成相似性簇锣披。MEME-ChIP能夠鑒定更長的motifs(<30bp),但是運(yùn)行時間比較長。
另外可以用Homer找motif贿条,詳細(xì)用法參考找個motif嘛雹仿,簡單。