從UCSC下載的ref.bed:
mammal-mouse-GRCm38/mm10-genes and gene predictions-gencode XX-basic-genome-BED-gzip-gte output
一共下載了5個(gè)files:
大小
du
行數(shù):
wc
head:
一樣
# 驗(yàn)證下bed是否和ensembl搭配:
選擇3個(gè)轉(zhuǎn)錄本
1-ok
2-ok
3-ok
隨機(jī)1
隨機(jī)2
結(jié)論:與ensembl相同
后來注意到:
選擇全面看看
在UCSC中下載
查看
結(jié)論:comprehensive比basic全面,更多!
去掉id后的版本號(hào):
awk 'BEGIN{OFS="\t"} {gsub(/.[0-9]$/,"",$4); print $0}' mm10.gencode-vm18.compre.bed > mm10.gencode-vm18.compre.fine.bed
## geneid和genename關(guān)系下載:
第一步
第二步
點(diǎn)擊get output:
good!
法二:
RSeQC網(wǎng)站下載:https://sourceforge.net/projects/rseqc/files/
查
下載ref:RseQC的bedfiles下載 - 簡書