歡迎關(guān)注”生信修煉手冊(cè)”!
HOMER是一款進(jìn)行motif預(yù)測(cè)的軟件渊季,除此之外,該軟件還集成了許多其他功能,可以識(shí)別用于分析chip_seq,RNA_seq,Hi-C等數(shù)據(jù)锅棕。本文主要介紹如何通過(guò)HOMER來(lái)進(jìn)行peak calling纳像。
在HOMER中荆烈,通過(guò)findPeaks
這個(gè)命令來(lái)進(jìn)行peak calling, 這個(gè)命令有以下多種模式,對(duì)應(yīng)不同類型的peak的識(shí)別
factor
這種模式用于識(shí)DNA和蛋白質(zhì)結(jié)合位點(diǎn)竟趾,主要用于識(shí)別轉(zhuǎn)錄因子的結(jié)合位點(diǎn)憔购,預(yù)測(cè)出來(lái)的peak的長(zhǎng)度是一個(gè)固定的數(shù)值。histone
這種模式用于識(shí)別發(fā)生組蛋白修飾的區(qū)域岔帽,該模式識(shí)別到的peak長(zhǎng)度不完全相同玫鸟,是變化的數(shù)值。super
這種模式用于識(shí)別超級(jí)增強(qiáng)子犀勒。groseq
這種模式用于分析鏈特異性的GRO_seq數(shù)據(jù)tss
這種模式用于分析5’RNA_seq/CAGE/5’GRO_seq, 目的是識(shí)別promoter/TSS區(qū)域dnase
這種模式用于分析DNase_seq數(shù)據(jù)屎飘,目的是識(shí)別DNase酶超敏位點(diǎn)-
mC
這種模式用于識(shí)別DNA甲基化區(qū)域
對(duì)于chip_seq的peak calling而言,常用的模式就是factor, histone和super這3種模式贾费。具體用法如下,分為兩步
1. makeTagDirectory
比對(duì)基因組得到bam文件之后钦购,首先用通過(guò)makeTagDirectory
這個(gè)命令,生成一個(gè)文件夾褂萧,用法如下
makeTagDirectory out_dir align.bam
輸出目錄文件如下
├── chr1.tags.tsv
├── chr2.tags.tsv
├── chr3.tags.tsv
...
├── chrY.tags.tsv
├── tagAutocorrelation.txt
├── tagCountDistribution.txt
├── tagInfo.txt
└── tagLengthDistribution.txt
默認(rèn)將每條染色體的比對(duì)情況有一個(gè)tags.tsv文件來(lái)存儲(chǔ)押桃,除此之外,還有幾個(gè)以tag開(kāi)頭的文件导犹,包含了一些簡(jiǎn)單的統(tǒng)計(jì)信息怨规。
tagCountDistribution.txt包含了測(cè)序深度的分布信息陌宿,第一列為測(cè)序深度的值,第二列為對(duì)應(yīng)的reads的比例波丰。根據(jù)這個(gè)文件的前10行壳坪,在R里面可視化如下
對(duì)于chip樣本而言,unique mapping reads的比例越高越好掰烟,所以可以看到測(cè)序深度為1的比例是最高的爽蝴。
tagLengthDistribution.txt包含了reads的長(zhǎng)度分布信息,第一列為長(zhǎng)度纫骑,第二列為對(duì)應(yīng)reads的比例蝎亚, 在R里面可視化如下
可以對(duì)插入片段的長(zhǎng)度分布有一個(gè)直觀的了解。
tagAutocorrelation.txt用于評(píng)估測(cè)序數(shù)據(jù)正負(fù)鏈上測(cè)序深度分布的相關(guān)性先馆,在R里面可視化如下
正負(fù)連的峰值間距離為插入偏度的長(zhǎng)度发框。
2. findPeaks
分別對(duì)input和IP樣本建立好tagdirectory之后就可以peak calling, 用法如下
findPeaks ip_tagdir/ -i input_tagdir -style histone -o homer.peak.txt
輸出結(jié)果和macs2的類似,分成了兩部分煤墙,文件頭尾以#
開(kāi)頭的行為注釋行梅惯,部分信息如下
peak對(duì)應(yīng)的行示意如下
更多參數(shù)和細(xì)節(jié)請(qǐng)參考官方文檔。
·end·
—如果喜歡仿野,快分享給你的朋友們吧—
掃描關(guān)注微信號(hào)铣减,更多精彩內(nèi)容等著你!