使用liftover創(chuàng)建注釋Chain文件(基因組坐標轉(zhuǎn)換)

問題情形:

在自己組裝出一個基因組之后们颜,會想要看自己的序列的組裝情況和染色體朝向脑慧,或者是想根據(jù)已有的基因組注釋文件創(chuàng)建自己的基因組的注釋文件幌衣。這個時候需要的是一個chain file來進行坐標的轉(zhuǎn)換了嚎。
一般在ucsc的官網(wǎng)下會有一些不同版本的基因組的chain file葱色,有時我們需要利用自己的序列產(chǎn)生自己的chainfile,這里對liftover的使用方法進行記錄抹镊。

主要參考為:http://genomewiki.ucsc.edu/index.php/DoSameSpeciesLiftOver.pl

這里我們使用自己組裝的序列asm.fa和hg19來創(chuàng)建锉屈,為了避免不必要的bug,我們按照文檔說明構(gòu)建文件夾和操作垮耳。

一.構(gòu)建程序環(huán)境
####從官網(wǎng)下載需要的腳本和程序####
mkdir /home/jfh/projects/hic_analysis/data/liftover/data/bin
mkdir /home/jfh/projects/hic_analysis/data/liftover/data/scripts
chmod 755 /home/jfh/projects/hic_analysis/data/liftover/data/bin
chmod 755 /home/jfh/projects/hic_analysis/data/liftover/data/scripts
cd /home/jfh/projects/hic_analysis/data/liftover/data
rsync -a rsync://hgdownload.soe.ucsc.edu/genome/admin/exe/linux.x86_64/ ./bin
git archive --remote=git://genome-source.soe.ucsc.edu/kent.git \
  --prefix=kent/ HEAD src/hg/utils/automation \
     | tar vxf - -C ./scripts --strip-components=5 \
        --exclude='kent/src/hg/utils/automation/incidentDb' \
      --exclude='kent/src/hg/utils/automation/configFiles' \
      --exclude='kent/src/hg/utils/automation/ensGene' \
      --exclude='kent/src/hg/utils/automation/genbank' \
      --exclude='kent/src/hg/utils/automation/lastz_D' \
      --exclude='kent/src/hg/utils/automation/openStack'
wget -O ./bin/bedSingleCover.pl \
'http://genome-source.soe.ucsc.edu/gitlist/kent.git/raw/master/src/utils/bedSingleCover.pl'

將程序路徑加入到~/.bashrc后面

export PATH=/home/jfh/projects/hic_analysis/data/liftover/data/bin:/data/scripts:$PATH
export PATH=/home/jfh/projects/hic_analysis/data/liftover/data/bin:/home/jfh/projects/hic_analysis/data/liftover/data/bin/blat:/home/jfh/projects/hic_analysis/data/liftover/data/scripts:$PATH

另外颈渊,需要搭建parasol集群環(huán)境:
參考:http://genomewiki.ucsc.edu/index.php/Parasol_job_control_system
需要注意的是:文檔中并未提及需要能免密ssh localhost,需要自己手動配置免密ssh本地终佛,設置好后其余的按照文檔要求做即可俊嗽。

二.準備文件

將自己的序列分別壓縮為asm.fa.gzhg19.fa.gz形成
/home/jfh/projects/hic_analysis/data/liftover/data/genomes/hg19/hg19.fa.gz
/home/jfh/projects/hic_analysis/data/liftover/data/genomes/asm/asm.fa.gz

準備工作
genome=/home/hugo/storage/jifh/projects/liftover/data/genomes
query=hg19
target=asm
cd $genome/asm
faToTwoBit $genome/genbank/asm.fa.gz asm.2bit
twoBitInfo asm.2bit stdout | sort -k2,2nr > asm.chrom.sizes
cd $genome/hg19
faToTwoBit $genome/refseq/hg19.fa.gz hg19.2bit
twoBitInfo hg19.2bit stdout | sort -k2,2nr > hg19.chrom.sizes

創(chuàng)建ooc file
blat asm.2bit /dev/null /dev/null -tileSize=11 -makeOoc=asm.ooc -repMatch=1024

三、運行Liftover程序

data=/home/hugo/storage/jifh/projects/liftover/data
export target="asm"
export query="hg19"
cd $data/genomes/${target}
time (doSameSpeciesLiftOver.pl -verbose=2 -buildDir=`pwd`   \
  -ooc=`pwd`/${target}.ooc -fileServer=localhost -localTmp="/dev/shm" \
    -bigClusterHub=localhost -dbHost=localhost -workhorse=localhost \
      -target2Bit=`pwd`/${target}.2bit -targetSizes=`pwd`/${target}.chrom.sizes \
        -query2Bit=$data/genomes/${query}/${query}.2bit \
          -querySizes=$data/genomes/${query}/${query}.chrom.sizes ${target} ${query})

運行l(wèi)iftover的時候铃彰,可能會出現(xiàn)parasol運行停止的情況绍豁,機器提示sick machine,這時只要進入到batch所在的目錄下牙捉,運行以下命令即可:

para clearSickNodes
para try
para push

最后在自己的target文件夾下面就可以看到asmToHg19.over.chain.gz竹揍,就可以拿去用了。

Reference Link:

http://genomewiki.ucsc.edu/index.php/DoSameSpeciesLiftOver.pl
http://genomewiki.ucsc.edu/index.php/Parasol_job_control_system
https://genecats.gi.ucsc.edu/eng/parasol.html
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末邪铲,一起剝皮案震驚了整個濱河市芬位,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌带到,老刑警劉巖昧碉,帶你破解...
    沈念sama閱讀 222,681評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異揽惹,居然都是意外死亡晌纫,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,205評論 3 399
  • 文/潘曉璐 我一進店門永丝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人箭养,你說我怎么就攤上這事慕嚷。” “怎么了?”我有些...
    開封第一講書人閱讀 169,421評論 0 362
  • 文/不壞的土叔 我叫張陵喝检,是天一觀的道長嗅辣。 經(jīng)常有香客問我,道長挠说,這世上最難降的妖魔是什么澡谭? 我笑而不...
    開封第一講書人閱讀 60,114評論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮损俭,結(jié)果婚禮上蛙奖,老公的妹妹穿的比我還像新娘。我一直安慰自己杆兵,他們只是感情好雁仲,可當我...
    茶點故事閱讀 69,116評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著琐脏,像睡著了一般攒砖。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上日裙,一...
    開封第一講書人閱讀 52,713評論 1 312
  • 那天吹艇,我揣著相機與錄音,去河邊找鬼昂拂。 笑死受神,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的政钟。 我是一名探鬼主播路克,決...
    沈念sama閱讀 41,170評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼养交!你這毒婦竟也來了精算?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 40,116評論 0 277
  • 序言:老撾萬榮一對情侶失蹤碎连,失蹤者是張志新(化名)和其女友劉穎灰羽,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體鱼辙,經(jīng)...
    沈念sama閱讀 46,651評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡廉嚼,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,714評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了倒戏。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片怠噪。...
    茶點故事閱讀 40,865評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖杜跷,靈堂內(nèi)的尸體忽然破棺而出傍念,到底是詐尸還是另有隱情矫夷,我是刑警寧澤,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布憋槐,位于F島的核電站双藕,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏阳仔。R本人自食惡果不足惜忧陪,卻給世界環(huán)境...
    茶點故事閱讀 42,211評論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望近范。 院中可真熱鬧嘶摊,春花似錦、人聲如沸顺又。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,699評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽稚照。三九已至蹂空,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間果录,已是汗流浹背上枕。 一陣腳步聲響...
    開封第一講書人閱讀 33,814評論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留弱恒,地道東北人辨萍。 一個月前我還...
    沈念sama閱讀 49,299評論 3 379
  • 正文 我出身青樓,卻偏偏與公主長得像返弹,于是被迫代替她去往敵國和親锈玉。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,870評論 2 361