最近在搞基因組卑笨,前面contig的組裝難度不大,用wtdbg2仑撞、raven赤兴、mecat2、flye等組裝就可以了隧哮。
組裝完畢后桶良,contig掛載成染色體,可以采用高密度遺傳連鎖圖沮翔、bionano光學(xué)圖譜等進行掛載陨帆,但是現(xiàn)在大多數(shù)文章采用的是HI-C數(shù)據(jù)進行掛載。
目前最經(jīng)典的HI-C掛載流程應(yīng)當(dāng)是juicer-3D DNA-Juicerbox流程了。其中3D-DNA和juicerbox沒啥好說的疲牵,juicer中間有點坑承二,最近搞了幾天時間。
整個歷程大體可以參考該文章 利用3D-DNA掛載基因組纲爸。但是由于Juicer更新一下亥鸠,引入了一些bug,所以需要做一些修改识啦。
我的機器的ubuntu的系統(tǒng)负蚊,單機160核心。通過git clone而得到的juicer是2.0版本颓哮,采用的/CPU文件夾下的腳本盖桥,但是Juicer2.0中CPU下的文件目錄不對,以及腳本本身有點小問題题翻,導(dǎo)致運行出錯,需要做幾個修改:
1 juicer/cpu文件夾下新建scripts文件
mkdir scripts
2 將common文件夾整體復(fù)制到scripts下
cp /juicer/CPU/common /juicer/CPU/scripts/
3 下載Juicer_tools.jar 文件腰鬼,并放入??/juicer/CPU/scripts/文件夾下
cd?/juicer/CPU/scripts/
wget?https://github.com/aidenlab/Juicebox/releases/download/v.2.13.07/juicer_tools.jar?
這是個很神奇的設(shè)定嵌赠,juicer軟件,無論你是git clone還是直接下載包熄赡,里面都是不包含最重要的juicer_tools.jar的姜挺,不明白作者的腦洞在哪里。
/gpfs03/home/jingjing/software/juicer-master/scripts/juicer.sh -t 30 -g RT -z reference/genome.fa -y restriction_sites/genome_DpnII.txt -p restriction_sites/genome.chrom.sizes -d /xxxxx/xxxxx -D /gpfs03/home/jingjing/software/juicer-master/CPU -s DpnII --assembly
主意 -D參數(shù) 指定工作文件夾 用tab補齊最后一定會有/ 也就是 /juicer-master/CPU/ 這是不行的彼硫,不能有斜杠炊豪,運行會出錯。
-d /xxxxx/xxxxx? ? 也是一樣 不能有斜杠拧篮。