3D genome builder--根據(jù)hic數(shù)據(jù)和ChIP數(shù)據(jù)預(yù)測基因組3D模型

一開始覺得用hic數(shù)據(jù)預(yù)測基因組3D結(jié)構(gòu)還是挺有趣的珊楼,但是用了幾個軟件反反復(fù)復(fù)折騰效果并不好,快失去耐心了报慕。偶然間看見一篇新的文獻豆巨,覺得正是我所需要的.

  1. 安裝
    這個軟件所用的依賴關(guān)系比較多畜侦,安裝比較麻煩.可以參考github

1.1

git clone https://github.com/data-fun/3d-genome-builder.git
cd 3d-genome-builder

1.2 下載 Singularity:

sudo apt install -y ./singularity-container_3.8.7_amd64.deb

1.3 下載conda和mamba

conda install mamba -n base -c conda-forge
mamba env create -f binder/environment.yml
conda activate 3DGB

1.4 下載HiC-Pro環(huán)境

wget --ciphers=DEFAULT:@SECLEVEL=1 https://zerkalo.curie.fr/partage/HiC-Pro/hicpro_3.1.0_ubuntu.img -P images

正常下載以后會得到相應(yīng)的軟件元扔。如下所示

$ singularity exec images/hicpro_3.1.0_ubuntu.img HiC-Pro --version
[...]
HiC-Pro version 3.1.0
$ singularity exec images/hicpro_3.1.0_ubuntu.img bowtie2 --version  2>/dev/null | head -n 1
/usr/local/conda/envs/hicpro/bin/bowtie2-align-s version 2.4.4

注:最近看起來這個鏈接失效,因此可以需要自己配置HiC-Pro和修改腳本中相應(yīng)路徑!
(如該文件3d-genome-builder/Snakefile中的路徑)

  1. 準備需要的文件
    2.1 修改config 文件
workdir: "3d_genome_s_pombe_30min"

organism: "Schizosaccharomyces pombe"

sra_ids:
- SRR5149253
- SRR5149254

hicpro_restriction_sites: "^GATC"

hicpro_resolutions:
- 10000

pastis_resolutions:
- 10000

verify_contigs: False

注:workdir為你的工作目錄旋膳,organism是你研究的物種名稱澎语,sra_ids是你存放的hic數(shù)據(jù)名稱,hicpro_restriction_sites你hic實驗中用到的酶,hicpro_resolutions是hic數(shù)據(jù)的解析度咏连,pastis_resolutions是pastis軟件的解析度.
2.2 添加參考基因組
參考基因組必須在你config 文件中寫的 工作目錄下面.
因此你的工作目錄結(jié)構(gòu)必須如下:

WORKING_DIR/
├── fastq_files
│   ├── ID1
│   │   ├── ID1_R1.fastq.gz
│   │   └── ID1_R2.fastq.gz
│   ├── ID2
│   │   ├── ID2_R1.fastq.gz
│   │   └── ID2_R2.fastq.gz
│   ├── ID3
│   │   ├── ID3_R1.fastq.gz
│   │   └── ID3_R2.fastq.gz
│   └── ID4
│       ├── ID4_R1.fastq.gz
│       └── ID4_R2.fastq.gz
└── genome.fasta

注:遇到報錯請注意你工作目錄與config 文件中寫的是否一致盯孙,hic數(shù)據(jù)目錄名稱與fastq數(shù)據(jù)是否一致以及參考基因組名稱!

image.png
  1. 構(gòu)建你的基因組3D模型
snakemake --profile smk_profile -j 4 --configfile YOUR-CONFIG.yml

注:smk_profile是你的工作目錄名稱,4 是你所用的線程.YOUR-CONFIG.yml 是2.1中構(gòu)建的config 文件.
3.1 在你的3D基因組模型上增添其它定量數(shù)值(如ChIP-seq)

python3 ./scripts/map_parameter.py --pdb path/to/structure.pdb --bedgraph path/to/annotation.bedgraph --output path/to/output.pdb

注:structure.pdb是在上一步得到的pdb文件祟滴,bedgraph文件可以是你的ChIP-seq信號值振惰,請保持相同的解析度!
定量數(shù)值格式應(yīng)該如下(chromosome/start/stop/value):

chr1    0   50000   116.959
chr1    50000   100000  48.4495
chr1    100000  150000  22.8726
chr1    150000  200000  84.3106
chr1    200000  250000  113.109
  1. 結(jié)果
    結(jié)果文件應(yīng)該如下:
WORKING_DIR/
├── contact_maps
├── dense_matrix
├── fastq_files
├── HiC-Pro
├── logs
├── pastis
├── sequence
└── structure

我們主要關(guān)注的是pastis文件夾中的.pdb文件和G3D文件.因為這個軟件底層還是利用pastis軟件進行預(yù)測.
官方文檔中還提供了兩個參考示例:

5.對結(jié)果文件進行可視化
官網(wǎng)也提供了非常詳細的例子
利用該網(wǎng)站進行可視化

https://molstar.org/viewer/

示例

image.png

注意:!!!這個軟件對二倍體基因組不適用。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末垄懂,一起剝皮案震驚了整個濱河市骑晶,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌草慧,老刑警劉巖桶蛔,帶你破解...
    沈念sama閱讀 222,464評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異漫谷,居然都是意外死亡仔雷,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,033評論 3 399
  • 文/潘曉璐 我一進店門舔示,熙熙樓的掌柜王于貴愁眉苦臉地迎上來碟婆,“玉大人,你說我怎么就攤上這事惕稻∈玻” “怎么了?”我有些...
    開封第一講書人閱讀 169,078評論 0 362
  • 文/不壞的土叔 我叫張陵俺祠,是天一觀的道長公给。 經(jīng)常有香客問我,道長蜘渣,這世上最難降的妖魔是什么淌铐? 我笑而不...
    開封第一講書人閱讀 59,979評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮蔫缸,結(jié)果婚禮上腿准,老公的妹妹穿的比我還像新娘。我一直安慰自己捂龄,他們只是感情好,可當我...
    茶點故事閱讀 69,001評論 6 398
  • 文/花漫 我一把揭開白布加叁。 她就那樣靜靜地躺著倦沧,像睡著了一般。 火紅的嫁衣襯著肌膚如雪它匕。 梳的紋絲不亂的頭發(fā)上展融,一...
    開封第一講書人閱讀 52,584評論 1 312
  • 那天,我揣著相機與錄音豫柬,去河邊找鬼告希。 笑死扑浸,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的燕偶。 我是一名探鬼主播喝噪,決...
    沈念sama閱讀 41,085評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼指么!你這毒婦竟也來了酝惧?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 40,023評論 0 277
  • 序言:老撾萬榮一對情侶失蹤伯诬,失蹤者是張志新(化名)和其女友劉穎晚唇,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體盗似,經(jīng)...
    沈念sama閱讀 46,555評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡哩陕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,626評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了赫舒。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片悍及。...
    茶點故事閱讀 40,769評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖号阿,靈堂內(nèi)的尸體忽然破棺而出并鸵,到底是詐尸還是另有隱情,我是刑警寧澤扔涧,帶...
    沈念sama閱讀 36,439評論 5 351
  • 正文 年R本政府宣布园担,位于F島的核電站,受9級特大地震影響枯夜,放射性物質(zhì)發(fā)生泄漏弯汰。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,115評論 3 335
  • 文/蒙蒙 一湖雹、第九天 我趴在偏房一處隱蔽的房頂上張望咏闪。 院中可真熱鬧,春花似錦摔吏、人聲如沸鸽嫂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,601評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽据某。三九已至,卻和暖如春诗箍,著一層夾襖步出監(jiān)牢的瞬間癣籽,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,702評論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留筷狼,地道東北人瓶籽。 一個月前我還...
    沈念sama閱讀 49,191評論 3 378
  • 正文 我出身青樓,卻偏偏與公主長得像埂材,于是被迫代替她去往敵國和親塑顺。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,781評論 2 361

推薦閱讀更多精彩內(nèi)容