HiC-Pro實戰(zhàn) #3D基因組 #表觀遺傳

首先在此感謝jimmy非常詳盡的教程 HiC數(shù)據(jù)分析實戰(zhàn)之HiC-Pro
本文為三維基因組學習筆記的第二篇突硝,主要記錄HiC-pro的安裝遇到的問題及部分實戰(zhàn)。


安裝

  1. 首先根據(jù)要求說明安裝依賴,可由conda安裝速勇,注意版本
  • The bowtie2 mapper
  • Python (>2.7, python-3 is not supported) with pysam (>=0.8.3), bx-python(>=0.5.0), numpy(>=1.8.2), and scipy(>=0.15.1)libraries
  • R with the RColorBrewer and ggplot2 (>2.2.1) packages
  • g++ compiler
  • samtools (>1.1)
  • Unix sort (which support -V option) is required ! For Mac OS user, please install the GNU core utilities !
  1. HiC-Pro的安裝
    不在conda中的軟件代碼
$ pip install https://bitbucket.org/mirnylab/mirnylib/get/tip.tar.gz
$ pip install https://bitbucket.org/mirnylab/hiclib/get/tip.tar.gz 
# hicpro的安裝
$ cd ~/biosoft/hicpro
$ cd ~/biosoft/hicpro
$ git clone https://github.com/nservant/HiC-Pro.git
$ cd HiC-Pro
# 這里要改寫配置文件(見下)
$ cat config-install.txt
$ mkdir ~/biosoft/hicpro/bin
$ make configure
$ make install
### 最后安裝的時候可能會出現(xiàn)Directory does not exit!,這可能是程序默認在home目錄下有bin這個文件夾導致懊悯,新建bin文件夾即可。最后 絕對路徑/HiC-Pro -h跳出說明即安裝成功娜亿。

SYSTEM CONFIGURATION

PREFIX Path to installation folder
BOWTIE2_PATH Full path the bowtie2 installation directory
SAMTOOLS_PATH Full path to the samtools installation directory
R_PATH Full path to the R installation directory
PYTHON_PATH Full path to the python installation directory (>2.7 - python3 not supported)
CLUSTER_SYS Scheduler to use for cluster submission. Must be TORQUE, SGE, SLURM or LSF

運行

  1. 首先需要獲得消化片段的BED文件及chromosomes' size表格文件,這里需要限制酶酶切位點及參考基因組信息蚌堵。根據(jù)測試數(shù)據(jù)來源及digest_genome.py
$ /PATH/HiC-Pro-master/bin/utils/digest_genome.py -r hindiii -o Refgenome.fasta
# BED文件格式(-1)
chr1   0       16007   HIC_chr1_1    0   +
# chromosomes' size(-1)
chr1    249250621
HiC-Pro --help
usage : HiC-Pro -i INPUT -o OUTPUT -c CONFIG [-s ANALYSIS_STEP] [-p] [-h] [-v]
Use option -h|--help for more information

HiC-Pro 2.10.0
---------------
OPTIONS

 -i|--input INPUT : input data folder; Must contains a folder per sample with input files
 -o|--output OUTPUT : output folder
 -c|--conf CONFIG : configuration file for Hi-C processing
 [-p|--parallel] : if specified run HiC-Pro on a cluster
 [-s|--step ANALYSIS_STEP] : run only a subset of the HiC-Pro workflow; if not specified the complete workflow is run
    mapping: perform reads alignment
    proc_hic: perform Hi-C filtering
    quality_checks: run Hi-C quality control plots
    build_contact_maps: build raw inter/intrachromosomal contact maps
    ice_norm: run ICE normalization on contact maps
 [-h|--help]: help
 [-v|--version]: version
  1. 根據(jù)說明文檔买决,將 configuration file 'config-hicpro.txt' 復制到你的當前目錄,并修改吼畏;本次測試數(shù)據(jù)來源于來自于Tung B. K. Le et al. Science 2013 :https://www.ncbi.nlm.nih.gov/sra/?term=srr824846督赤,rawdata文件并不用編排,但是由于程序讀寫要求泻蚊,因此需要將數(shù)據(jù)放入獨立的文件夾中躲舌。

Put all input files in a rawdata folder. The input files have to be organized with one folder per sample, with ;

$ mkdir -p ~/data/project/hic/fq/s1/
$ cd ~/data/project/hic/fq/s1/
858M Jul  3 16:21 SRR824846_Q20L10_1.fastq.gz
857M Jul  3 16:22 SRR824846_Q20L10_2.fastq.gz
# 多個輸入文件
+ PATH_TO_MY_DATA
  + sample1
    ++ file1_R1.fastq.gz
    ++ file1_R2.fastq.gz
    ++ ...
  + sample2
    ++ file1_R1.fastq.gz
    ++ file1_R2.fastq.gz
  *...
  1. 運行命令如下,jimmy在推文中運用了一系列技巧性雄,可以詳細查看學習没卸。
# 配置文件主要修改內(nèi)容
BOWTIE2_IDX_PATH = # bowtie2建立的索引所在的路徑,記住絕對路徑
REFERENCE_GENOME = # bowtie2建立的索引
GENOME_SIZE = # 一個文件記錄著參考基因組中每條序列的大小
GENOME_FRAGMENT = 消化片段的BED文件所在的路徑
LIGATION_SITE = #連接位點
# 若單個測序數(shù)據(jù)則
PAIR1_EXT = SRR824846_Q20L10_1
PAIR2_EXT = SRR824846_Q20L10_2
$ MY_INSTALL_PATH/bin/HiC-Pro -i FULL_PATH_TO_DATA_FOLDER -o FULL_PATH_TO_OUTPUTS -c MY_LOCAL_CONFIG_FILE
$ cd out
$ qsub HiCPro_step1_.sh
$ qsub HiCPro_step2_.sh

這里記錄一個問題毅贮,qsub命令報錯办悟,目前使用sh命令執(zhí)行shell腳本。

$ qsub HiCPro_step1_.sh -p 20 

Unable to initialize environment because of error: cell directory "/opt/gridengine/default" doesn't exist
Exiting.

待結(jié)果出來以后滩褥,將進一步學習病蛉。

相關(guān)鏈接地址:
HiC-Pro_github
HiC-Pro: An optimized and flexible pipeline for Hi-C processing

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市瑰煎,隨后出現(xiàn)的幾起案子铺然,更是在濱河造成了極大的恐慌,老刑警劉巖酒甸,帶你破解...
    沈念sama閱讀 216,470評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件魄健,死亡現(xiàn)場離奇詭異,居然都是意外死亡插勤,警方通過查閱死者的電腦和手機沽瘦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,393評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來农尖,“玉大人析恋,你說我怎么就攤上這事∈⒖ǎ” “怎么了助隧?”我有些...
    開封第一講書人閱讀 162,577評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長滑沧。 經(jīng)常有香客問我并村,道長巍实,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,176評論 1 292
  • 正文 為了忘掉前任哩牍,我火速辦了婚禮棚潦,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘姐叁。我一直安慰自己瓦盛,他們只是感情好,可當我...
    茶點故事閱讀 67,189評論 6 388
  • 文/花漫 我一把揭開白布外潜。 她就那樣靜靜地躺著,像睡著了一般挠唆。 火紅的嫁衣襯著肌膚如雪处窥。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,155評論 1 299
  • 那天玄组,我揣著相機與錄音滔驾,去河邊找鬼。 笑死俄讹,一個胖子當著我的面吹牛哆致,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播患膛,決...
    沈念sama閱讀 40,041評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼摊阀,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了踪蹬?” 一聲冷哼從身側(cè)響起胞此,我...
    開封第一講書人閱讀 38,903評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎跃捣,沒想到半個月后漱牵,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,319評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡疚漆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,539評論 2 332
  • 正文 我和宋清朗相戀三年酣胀,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片娶聘。...
    茶點故事閱讀 39,703評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡闻镶,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出趴荸,到底是詐尸還是另有隱情儒溉,我是刑警寧澤,帶...
    沈念sama閱讀 35,417評論 5 343
  • 正文 年R本政府宣布发钝,位于F島的核電站顿涣,受9級特大地震影響波闹,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜涛碑,卻給世界環(huán)境...
    茶點故事閱讀 41,013評論 3 325
  • 文/蒙蒙 一精堕、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蒲障,春花似錦歹篓、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,664評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至毙籽,卻和暖如春洞斯,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背坑赡。 一陣腳步聲響...
    開封第一講書人閱讀 32,818評論 1 269
  • 我被黑心中介騙來泰國打工烙如, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人毅否。 一個月前我還...
    沈念sama閱讀 47,711評論 2 368
  • 正文 我出身青樓亚铁,卻偏偏與公主長得像,于是被迫代替她去往敵國和親螟加。 傳聞我的和親對象是個殘疾皇子徘溢,可洞房花燭夜當晚...
    茶點故事閱讀 44,601評論 2 353

推薦閱讀更多精彩內(nèi)容

  • Read the Standards Building on the best of existing state...
    靜_靜_閱讀 428評論 0 0
  • 2016年全球葡萄酒產(chǎn)量20年最低 今年10月底,國際葡萄酒與葡萄酒組織(OIV)在報告中指出仰迁,2016年全球葡萄...
    酒莊惠小九閱讀 203評論 0 0
  • 星期五 晴 張榮軒媽媽 放學路上甸昏,你拿著一只筆向我炫耀,說好朋友送給你的徐许,然后你問我:媽媽施蜜,我是不是也應該送...
    愛意暖人心閱讀 177評論 0 4