推薦首先研讀官方github教程 Juicebox Assembly Tools
(注意紅色圈出部分字段畸陡,仔細(xì)閱讀食磕,對照查看本文實(shí)操視頻和中文解釋)
Loading and Saving Assemblies
A note on this, .final and .FINAL are actually different suffixes: the first one does not include gaps between individual original scaffolds, and the latter does. Just make sure you load .hic and .assembly with the same suffix.
Move/Invert selection
Adjusting boundaries of superscaffolds
實(shí)操示例
注意事項(xiàng):
- Juicebox的編輯功能在導(dǎo)入了assembly文件后放大scaffold塊,放大到足夠大的時(shí)候才能出現(xiàn)編輯的剪刀(注意是在有scaffold邊界的地方進(jìn)行分割才會成功)攘已,進(jìn)行分割染色體區(qū)域(在新版1.11.08中,是采用shift點(diǎn)擊邊界后選擇add chr boundaries)
- 如果要去掉某些散在區(qū)塊中的空白區(qū)域則需要放大到足夠大后澜共,用shift+左鍵選中空白的區(qū)域進(jìn)行剪切去掉
- 這些需要剪切的空白區(qū)域其實(shí)是表明這些contig和誰都沒有關(guān)聯(lián)向叉,會在1-3.hic的步驟中被去除,相應(yīng)的最終的.hic文件得到的hic組裝結(jié)果能掛載到的基因會減少
- 但是如果0.hic的結(jié)果太差嗦董,可以試用3.hic的結(jié)果母谎,也許會更好,有提升功能京革,如果掛載的基因不太少的話奇唤,會很好
- hic的最終assembly是(rawchrom.assembly)
00.nextpolish.final.assembly -> 00.nextpolish.rawchrom.assembly
- 通常來講,用final.hic對應(yīng)的結(jié)果去進(jìn)行染色體區(qū)塊編輯后再進(jìn)行染色體水平的基因組組裝
run-asm-pipeline-post-review.sh
存崖,得到fasta的文件冻记,然后再通過已經(jīng)注釋的contig版本的基因組基因的坐標(biāo)信息,對應(yīng)上染色體水平的基因組基因信息 -
當(dāng)出現(xiàn)如下圖的3dDNA組裝偏差時(shí)来惧,即交互區(qū)域分布于對角線之外冗栗,則可人工校正,下圖中1號和3號之間有間接關(guān)聯(lián)供搀,需要將1號shift選中后放入2-3邊界處隅居,在邊界處放大到足夠大時(shí)會出現(xiàn)對角箭頭可以實(shí)現(xiàn)位移。
位移前.png
位移后.png
7.對于信號不是呈現(xiàn)對角線處最強(qiáng)的情況可進(jìn)行shift選擇色塊后用翻轉(zhuǎn)箭頭工具進(jìn)行對稱翻轉(zhuǎn)葛虐。工具.png
翻轉(zhuǎn)前.png
翻轉(zhuǎn)并且合并染色體后.png
寫在結(jié)尾
a. 關(guān)于ALLHiC組裝胎源,可以用3d-dna得到的最終基因組fasta結(jié)果再用ALLHiC進(jìn)行組裝,相當(dāng)于基因組已經(jīng)經(jīng)過了3d-dna的糾錯(cuò)屿脐,得到的可能是更加準(zhǔn)確的包含N的基因組序列涕蚤,再經(jīng)過ALLHiC進(jìn)行打斷去除N,得到更好的結(jié)果
b. 關(guān)于juicer_tools.jar的使用
java -jar ./juicer_tools.2.20.00.jar
WARN [2022-12-20T21:05:37,105] [Globals.java:138] [main] Development mode is enabled
Juicer Tools Version 2.20.00
Usage:
dump <observed/oe> <NONE/VC/VC_SQRT/KR> <hicFile(s)> <chr1>[:x1:x2] <chr2>[:y1:y2] <BP/FRAG> <binsize> [outfile]
dump <norm/expected> <NONE/VC/VC_SQRT/KR> <hicFile(s)> <chr> <BP/FRAG> <binsize> [outfile]
dump <loops/domains> <hicFile URL> [outfile]
pre [options] <infile> <outfile> <genomeID>