雖然有人寫的挺好的了最全Bedtools使用說(shuō)明--只看本文就夠了 - 簡(jiǎn)書 (jianshu.com)害晦,還是記錄一下
bedtools英文文檔
Overview — bedtools 2.30.0 documentation
Utility | Description |
---|---|
annotate | 注釋多個(gè)文件的覆蓋特征 |
bamtobed | 將bam文件轉(zhuǎn)換為BED格式 |
bamtofastq | 將bam文件轉(zhuǎn)換為FASTQ格式 |
bed12tobed6 | 將BED12間隔轉(zhuǎn)換為BED6間隔 |
bedpetobam | 將BEDPE間隔轉(zhuǎn)化為BAM格式 |
bedtobam | 將間隔轉(zhuǎn)換為BAM記錄 |
closest | 尋找最近的潛在的非重疊區(qū)間 |
cluster | 聚類(不合并)重疊的區(qū)間 |
complement | 獲得區(qū)間的補(bǔ)集 |
coverge | 計(jì)算特定區(qū)間的覆蓋 |
expand | 根據(jù)列值重復(fù)行數(shù) |
flank | 從當(dāng)前區(qū)間側(cè)翼創(chuàng)建新的區(qū)間 |
genomecov | 從整個(gè)基因組計(jì)算覆蓋深度 |
getfasta | 根據(jù)區(qū)間從FASTA文件中提取序列 |
groupby | 按特征列進(jìn)行分組 |
igv | 創(chuàng)建一個(gè)IGV快照批處理腳本 |
intersect | 用各種不同的方式尋找重疊區(qū)域 |
jaccard | 計(jì)算b/w兩個(gè)間隔區(qū)域的Jaccard統(tǒng)計(jì)量 |
links | 創(chuàng)建一個(gè)連接UCSC位點(diǎn)的HTML頁(yè)面 |
makewindows | 創(chuàng)建基因組區(qū)間窗口 |
map | 為每個(gè)重疊區(qū)間隊(duì)列應(yīng)用一個(gè)函數(shù) |
maskfasta | 利用區(qū)間隱藏FASTA文件序列 |
merge | 合并重疊區(qū)間形成一個(gè)新的區(qū)間 |
multicov | 計(jì)算多個(gè)BAM文件在特定區(qū)間的覆蓋深度 |
multiinter | 標(biāo)記多個(gè)區(qū)間文件的公共區(qū)間 |
nuc | 分析FASTA文件某區(qū)間的核酸含量 |
overlap | 計(jì)算兩個(gè)區(qū)間重疊范圍的長(zhǎng)度 |
pairtobed | 找出以各種方式重疊區(qū)間的對(duì) |
pairtopair | 找出以各種方式重疊其他配對(duì)的配對(duì) |
random | 產(chǎn)生一個(gè)基因組的隨機(jī)區(qū)間 |
reldist | 計(jì)算兩個(gè)文件的相對(duì)距離分布 |
shift | 調(diào)整區(qū)間的位置 |
shuffle | 在基因組中隨機(jī)重新分配時(shí)間間隔 |
slop | 調(diào)整區(qū)間的大小 |
sort | 對(duì)區(qū)間進(jìn)行排序 |
subtract | 對(duì)兩個(gè)區(qū)間文件取差集 |
tag | 根據(jù)區(qū)間的重疊區(qū)域標(biāo)記BAM Tag |
unionbedg | 根據(jù)多個(gè)BEDGRAPH文件合并覆蓋區(qū)間 |
window | 在一個(gè)間隔周圍的窗口尋找重疊區(qū)間 |
取兩個(gè)bed文件的交集
- 兩個(gè)bed
bedtools intersect –a A.bed –b B.bed
sort 對(duì)區(qū)間進(jìn)行排序
- 輸入bed文件,samtools生成的基因組長(zhǎng)度文件.fai
samtools faidx XX.fa ##生成genome.fai
bedtools sort -i XX.bed -g genome.fai
random 對(duì)bed文件進(jìn)行隨機(jī)抽取;
- 輸入bed文件
bedtools random xx.bed
shuffle 根據(jù)提供的bed文件在基因組進(jìn)行隨機(jī)抽樣
- 輸入文件BED,基因組長(zhǎng)度文件.fai
bedtools shuffle -i XX.bed -g genome.fai
按照bed提取序列
bedtools getfasta [OPTIONS] -fi <input FASTA> -bed <BED/GFF/VCF>
pybedtools
直接python內(nèi)部使用bedtools
from pybedtools import BedTool
snps = BedTool('snps.bed.gz') # [1]
genes = BedTool('hg19.gff') # [1]
intergenic_snps = snps.subtract(genes) # [2]
nearby = genes.closest(intergenic_snps, d=True, stream=True) # [2, 3]
for gene in nearby: # [4]
if int(gene[-1]) < 5000: # [4]
print gene.name # [4]