這方面的應(yīng)用場景不多,之前偶爾遇到墩弯,使用的是網(wǎng)頁工具:
http://genome.ucsc.edu/cgi-bin/hgLiftOver
一直沒有出現(xiàn)什么問題,今天突然看到這個錯誤吼鱼,暫時沒有深究是什么導(dǎo)致的韩脑,想著換個命令行工具試試(網(wǎng)頁工具體驗(yàn)一般不好)
在谷歌上搜索“genome coordinates conversion”,可以看到一個biostars上面的回答:https://www.biostars.org/p/65558/见坑。推薦了很多工具:
- UCSC liftOver
- NCBI Remap
- The Ensembl API
- Assembly Converter
- Bioconductor rtracklayer
- CrossMap
- Picard Liftover VCF
......
我試了一下CrossMap
1. 安裝
./pip install CrossMap
2. 下載Chain file
3. 使用
很簡單嚷掠,以bed為例
CrossMap.py bed chain_file input_bed_file [output_file]
./CrossMap.py bed \
NCBI36_to_GRCh38.chain.gz \
amplifications.bed \
amplifications_hg38.bed
有意思的是捏检,行數(shù)變了,說明轉(zhuǎn)換過程中對應(yīng)的基因組區(qū)間不是連續(xù)的
wc -l amplifications.bed amplifications_hg38.bed
17 amplifications.bed
43 amplifications_hg38.bed