bedtools (https://bedtools.readthedocs.io/en/latest/content/overview.html) 作為基因組數(shù)據(jù)處理的利器,適用于處理BED,BEDPE,GFF,GENOME,SAM/BAM及VCF類(lèi)型數(shù)據(jù)疫诽,猶他大學(xué)昆蘭實(shí)驗(yàn)室將其分成了不同的套件诚纸,以針對(duì)不同的需求。同時(shí),靈活地組合使用這些套件,又可以完成一系列的高級(jí)需求。
常用:對(duì)bed文件排序的時(shí)候總是報(bào)錯(cuò)背亥,可切換不同的sort方法
sortBed -i input.bed
bedtools sort -i input.bed
sort -k 1,1 -k2,2n input.bed
sort -V -k 1,3 input.bed
因?yàn)榻M件非常豐富,經(jīng)常使用悬赏,特列筆記在此:
suite | 描述 |
---|---|
annotate | 注釋多個(gè)文件的覆蓋特征 |
bamtobed | 將bam文件轉(zhuǎn)換為BED格式 |
bamtofastq | 將bam文件轉(zhuǎn)換為FASTQ格式 |
bed12tobed6 | 將BED12間隔轉(zhuǎn)換為BED6間隔 |
bedpetobam | 將BEDPE間隔轉(zhuǎn)化為BAM格式 |
bedtobam | 將間隔轉(zhuǎn)換為BAM記錄 |
closest | 尋找最近的潛在的非重疊區(qū)間 |
cluster | 聚類(lèi)(不合并)重疊的區(qū)間 |
complement | 獲得區(qū)間的補(bǔ)集 |
coverge | 計(jì)算特定區(qū)間的覆蓋 |
expand | 根據(jù)列值重復(fù)行數(shù) |
flank | 從當(dāng)前區(qū)間側(cè)翼創(chuàng)建新的區(qū)間 |
genomecov | 從整個(gè)基因組計(jì)算覆蓋深度 |
getfasta | 根據(jù)區(qū)間從FASTA文件中提取序列 |
groupby | 按特征列進(jìn)行分組 |
igv | 創(chuàng)建一個(gè)IGV快照批處理腳本 |
intersect | 用各種不同的方式尋找重疊區(qū)域 |
jaccard | 計(jì)算b/w兩個(gè)間隔區(qū)域的Jaccard統(tǒng)計(jì)量 |
links | 創(chuàng)建一個(gè)連接UCSC位點(diǎn)的HTML頁(yè)面 |
makewindows | 創(chuàng)建基因組區(qū)間窗口 |
map | 為每個(gè)重疊區(qū)間隊(duì)列應(yīng)用一個(gè)函數(shù) |
maskfasta | 利用區(qū)間隱藏FASTA文件序列 |
merge | 合并重疊區(qū)間形成一個(gè)新的區(qū)間 |
multicov | 計(jì)算多個(gè)BAM文件在特定區(qū)間的覆蓋深度 |
multiinter | 標(biāo)記多個(gè)區(qū)間文件的公共區(qū)間 |
nuc | 分析FASTA文件某區(qū)間的核酸含量 |
overlap | 計(jì)算兩個(gè)區(qū)間重疊范圍的長(zhǎng)度 |
pairtobed | 找出以各種方式重疊區(qū)間的對(duì) |
pairtopair | 找出以各種方式重疊其他配對(duì)的配對(duì) |
random | 產(chǎn)生一個(gè)基因組的隨機(jī)區(qū)間 |
reldist | 計(jì)算兩個(gè)文件的相對(duì)距離分布 |
shift | 調(diào)整區(qū)間的位置 |
shuffle | 在基因組中隨機(jī)重新分配時(shí)間間隔 |
slop | 調(diào)整區(qū)間的大小 |
sort | 對(duì)區(qū)間進(jìn)行排序 |
subtract | 對(duì)兩個(gè)區(qū)間文件取差集 |
tag | 根據(jù)區(qū)間的重疊區(qū)域標(biāo)記BAM Tag |
unionbedg | 根據(jù)多個(gè)BEDGRAPH文件合并覆蓋區(qū)間 |
window | 在一個(gè)間隔周?chē)拇翱趯ふ抑丿B區(qū)間 |