hicPro+EndHiC(二)染色體掛載

EndHic

想比較HiC-Pro,EndHic的安裝就簡(jiǎn)單很多蛛株,就是下載即可用

EndHiC的安裝

git clone git@github.com:fanagislab/EndHiC.git

要用到的腳本都在文件夾下团赁,直接調(diào)用就行

怎么使用呢?不得不說一下谨履,github上面寫的簡(jiǎn)直潦草~~

還不如直接看他給出的實(shí)例中的腳本來得直接

EndHiC的使用

給出的實(shí)例腳本

$ cat biosoft/EndHiC/z.testing_data/Arabidopsis_thalina/work.sh
##Atha.contigs.fa is generated by Hifiasm
##AthaHiC_100000_abs.bed, AthaHiC_100000.matrix, AthaHiC_100000_iced.matrix are generated by HiC-pro using Atha.contigs.fa as the reference genome

gzip -d Atha.contigs.fa.gz

##get contig length
perl ../../fastaDeal.pl -attr id:len Atha.contigs.fa > Atha.contigs.fa.len

##draw contig Hi-C heatmaps with 10*100000 (1-Mb) resolution
../../matrix2heatmap.py AthaHiC_100000_abs.bed AthaHiC_100000.matrix 10

##Run one round, when the contig assembly is quite good
perl ../../endhic.pl Atha.contigs.fa.len AthaHiC_100000_abs.bed AthaHiC_100000.matrix AthaHiC_100000_iced.matrix

ln Round_A.04.summary_and_merging_results/z.EndHiC.A.results.summary.cluster* ./


##convert cluster file to agp file
perl ../../cluster2agp.pl Round_A.04.summary_and_merging_results/z.EndHiC.A.results.summary.cluster Atha.contigs.fa.len > Atha.scaffolds.agp

##get final scaffold sequence file
perl ../../agp2fasta.pl Atha.scaffolds.agp Atha.contigs.fa > Atha.scaffolds.fa

##draw HiC heatmaps for scaffolds with 10*100000 (1-Mb) resolution
../../cluster2bed.pl AthaHiC_100000_abs.bed z.EndHiC.A.results.summary.cluster > clusterA_100000_abs.bed 2> clusterA.id.len
../../matrix2heatmap.py clusterA_100000_abs.bed AthaHiC_100000.matrix 10

##Here, Arabidopsis thalina has 5 chromosomes, and all these chromosomes can be successfully scaffolded by EndHiC

使用的數(shù)據(jù)就是我們上一步HiC-Pro輸出的數(shù)據(jù):

改良后的腳本

contig=/share/home/off/Work/Genome_assembly/Assembly/contig.fa  ##contig文件欢摄,一定要和HiC-Pro中的contig保持一致
endhic_dir=/share/home/off_wenhao/biosoft/EndHiC    ##EndHiC的安裝路徑
name=dlo    ##物種名稱,也要和HiC-Pro設(shè)置的保持一致笋粟,也是就是hic-pro的輸出文件夾`**_outdir_new`

##get contig length
perl ${endhic_dir}/fastaDeal.pl -attr id:len ${contig} > contigs.fa.len

##draw contig Hi-C heatmaps with 10*100000 (1-Mb) resolution
hic_pro_dir=/share/home/off/Work/Genome_assembly/Assembly/08.EndHiC/01.hicprp/${name}_outdir_new/hic_results/matrix/${name}


${endhic_dir}/matrix2heatmap.py ${hic_pro_dir}/raw/100000/${name}_100000_abs.bed ${hic_pro_dir}/raw/100000/${name}_100000.matrix 10

##Run one round, when the contig assembly is quite good

perl ${endhic_dir}/endhic.pl contigs.fa.len ${hic_pro_dir}/raw/100000/${name}_100000_abs.bed ${hic_pro_dir}/raw/100000/${name}_100000.matrix ${hic_pro_dir}/iced/100000/${name}_100000_iced.matrix

ln  Round_A.04.summary_and_merging_results/z.EndHiC.A.results.summary.cluster* ./

##convert cluster file to agp file
perl ${endhic_dir}/cluster2agp.pl Round_A.04.summary_and_merging_results/z.EndHiC.A.results.summary.cluster contigs.fa.len > scaffolds.agp

##get final scaffold sequence file
perl ${endhic_dir}/agp2fasta.pl scaffolds.agp ${contig} > ${name}.scaffolds.fa

##draw HiC heatmaps for scaffolds with 10*100000 (1-Mb) resolution
${endhic_dir}/cluster2bed.pl ${hic_pro_dir}/raw/100000/${name}_100000_abs.bed Round_A.04.summary_and_merging_results/z.EndHiC.A.results.summary.cluster > clusterA_100000_abs.bed 2> clusterA.id.len
${endhic_dir}/matrix2heatmap.py clusterA_100000_abs.bed ${hic_pro_dir}/raw/100000/${name}_100000.matrix 10

結(jié)果

clusterA.id.len
clusterA_100000_abs.bed   
clusterA_100000_abs.bed.pdf 
endhic.100000.10.iced.sh  
endhic.100000.20.iced.sh  
endhic.100000.5.iced.sh                            
endhic.100000.10.raw.sh   
endhic.100000.20.raw.sh   
endhic.100000.5.raw.sh   
endhic.100000.15.raw.sh   
endhic.100000.25.raw.sh   
endhic.Round_A.sh    
endhic.100000.15.iced.sh  
endhic.100000.25.iced.sh  
endhic.log
EndHic.sh     
dlo.scaffolds.fa                                                  
Round_A.01.contig_end_contact_results/
Round_A.02.GFA_contig_graph_results/
Round_A.03.cluster_order_orient_results/
Round_A.04.summary_and_merging_results/
scaffolds.agp
contigs.fa.len                 
z.EndHiC.A.results.summary.cluster
z.EndHiC.A.results.summary.cluster.GFA.v1.2.GFA
z.EndHiC.A.results.summary.cluster.GFA

文件很多怀挠,但是我們真正需要的就只有scaffolds.agpprefix.scaffolds.fa兩個(gè),一個(gè)是scaffold文件害捕,一個(gè)是map文件绿淋。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市尝盼,隨后出現(xiàn)的幾起案子吞滞,更是在濱河造成了極大的恐慌,老刑警劉巖盾沫,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件裁赠,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡赴精,警方通過查閱死者的電腦和手機(jī)佩捞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蕾哟,“玉大人一忱,你說我怎么就攤上這事√啡罚” “怎么了帘营?”我有些...
    開封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)琼富。 經(jīng)常有香客問我仪吧,道長(zhǎng),這世上最難降的妖魔是什么鞠眉? 我笑而不...
    開封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任薯鼠,我火速辦了婚禮,結(jié)果婚禮上械蹋,老公的妹妹穿的比我還像新娘出皇。我一直安慰自己,他們只是感情好哗戈,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開白布郊艘。 她就那樣靜靜地躺著,像睡著了一般唯咬。 火紅的嫁衣襯著肌膚如雪纱注。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天胆胰,我揣著相機(jī)與錄音狞贱,去河邊找鬼。 笑死蜀涨,一個(gè)胖子當(dāng)著我的面吹牛瞎嬉,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播厚柳,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼氧枣,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了别垮?” 一聲冷哼從身側(cè)響起便监,我...
    開封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎碳想,沒想到半個(gè)月后茬贵,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡移袍,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年解藻,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片葡盗。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡螟左,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出觅够,到底是詐尸還是另有隱情胶背,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布喘先,位于F島的核電站钳吟,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏窘拯。R本人自食惡果不足惜红且,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一坝茎、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧暇番,春花似錦嗤放、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至舆乔,卻和暖如春岳服,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背希俩。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來泰國(guó)打工吊宋, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人斜纪。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓贫母,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親盒刚。 傳聞我的和親對(duì)象是個(gè)殘疾皇子腺劣,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容