各種HIC處理數(shù)據(jù)之間的相互轉(zhuǎn)化
目前HI-C數(shù)據(jù)研究比較火爆族奢,出現(xiàn)了各種各樣的工具來分析HI-C姥闭。這些工具各有優(yōu)缺點,而且對應(yīng)的有不同的下游處理工具越走。但這些工具的結(jié)果數(shù)據(jù)格式大相徑庭棚品。如 juicer的.hic,hic-pro的六列文件廊敌,cool铜跑,hdf5,homer等骡澈。這些文件格式的不同給數(shù)據(jù)處理也帶來了一定的困難锅纺。之前我已經(jīng)介紹過
Hic-pro的結(jié)果文件轉(zhuǎn)化為.hic文件,在juicebox中實現(xiàn)可視化肋殴,今天我就拓展下數(shù)據(jù)轉(zhuǎn)化的范圍囤锉。
今天我們用到的是HiCExplorer
1,安裝HiCExplorer
conda install hicexplorer -c bioconda -c conda-forge
這個是官網(wǎng)寫的,但我試了幾次疼电,都用不了嚼锄。所以只好從bioconda 重新搜了下載
從三個下載命令中,隨便選擇一個就好蔽豺。
2区丑,進行轉(zhuǎn)化
hicexplorer里面工具很多,有興趣可以詳細(xì)看一下https://hicexplorer.readthedocs.io/en/latest/content/tools/hicConvertFormat.html
轉(zhuǎn)化使用的工具是它里面的hicConvertFormat
必須的幾個參數(shù)是:
-m 你需要進行轉(zhuǎn)化的文件
-o 轉(zhuǎn)化后輸出的文件
--inputFormat 輸入文件格式,就是這幾種{H5,cool,hic,homer,hicpro}
--outputFormat 輸出文件格式 {cool,h5,homer,ginteractions,mcool}
3修陡,例子
hic to cool
hicConvertFormat -m matrix.hic --inputFormat hic --outputFormat cool -o matrix.cool --resolutions 10000
--resolutions 分辨率沧侥,其中一個[2500000, 1000000, 500000, 250000, 100000, 50000, 25000, 10000, 5000]
cool to cool
hicConvertFormat -m matrix.cool --inputFormat cool --outputFormat cool -o matrix.cool --correction_name KR
homer to cool
hicConvertFormat -m matrix.homer --inputFormat homer --outputFormat cool -o matrix.cool
hicpro to cool
hicConvertFormat -m matrix.hicpro --bedFileHicpro hicpro.bed --inputFormat hicpro --outputFormat cool -o matrix.cool
這些命令都很簡單。值得注意的是 .hic只能先轉(zhuǎn)化為.cool文件魄鸦,然后借助cool文件才能轉(zhuǎn)化為其它類型
cool to h5
hicConvertFormat -m matric_5000.cool --inputFormat cool --outputFormat h5 -o matric.h5 --resolutions 5000