對于同一個物種而言舟奠,會存在不同的基因組組裝版本竭缝,以human為例,UCSC有以下多個版本
hg38/GRCH38
hg19/GRCH19
hg18/NCBI18
由于版本太多沼瘫,這里就沒有一一列舉完抬纸,完整的列表可以查看以下鏈接
http://hgdownload.soe.ucsc.edu/downloads.html#human
在使用基因組瀏覽器時,必須保證導(dǎo)入的基因組版本和數(shù)據(jù)所用的基因組版本一致耿戚,比如對于一個基于hg19的vcf文件湿故,參考基因組也必須是hg19。在實際使用過程中膜蛔,會遇到基因組版本不一致的問題坛猪,此時就需要進(jìn)行基因組版本之間的轉(zhuǎn)換,最常用的工具就是UCSC出品的liftover, 該工具既有在線服務(wù)皂股,也有命令行版本墅茉。
http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64.v385/liftOver
使用liftover有一個前提,需要從UCSC下載參考基因組對應(yīng)的over.chain文件,在每個基因組組裝的版本中都提供了liftover對應(yīng)的over.chain文件就斤,以human hg19為例悍募,對應(yīng)的文件如下:
http://hgdownload.soe.ucsc.edu/goldenPath/hg19/liftOver/
除了在不同基因組版本之間轉(zhuǎn)換,還提供了不同基因組之間的轉(zhuǎn)換功能战转。liftover的基本用法如下
liftOver hg19.bed hg19ToHg38.over.chain.gz map.bed unmap.bed
第一個參數(shù)為輸入的bed文件搜立,格式為bed3, 內(nèi)容示意如下:
第二個參數(shù)為對應(yīng)的over.chain文件,第三個參數(shù)為輸出的轉(zhuǎn)換之后的bed文件槐秧,第四列為轉(zhuǎn)換失敗的bed文件啄踊。
另:
注意染色體是否帶有chr,自身準(zhǔn)備bed文件與參考基因組一致刁标。