在上一篇筆記里瓶颠,介紹了如何從fastq文件得到.cool文件(.mcool)(Hi-C分析練習(xí)(從fastq文件到contact矩陣))墙杯,現(xiàn)在就要對這個contact矩陣進(jìn)行可視化了班缰。在哈佛醫(yī)學(xué)院的教程里法梯,可視化的這一步需要安裝docker勋磕,并且要進(jìn)行一系列的配置設(shè)置(https://docs.higlass.io/higlass_docker.html)妈候,非常的麻煩,如果電腦不給力或者比較懶的同學(xué)來說(比如我)就不好上手來練習(xí)朋凉,那么有什么簡單的方法可以簡單的了解Hi-C分析得到的cool文件的可視化嗎州丹?答案是:當(dāng)然。
作為初學(xué)者,你所遇到的所有問題墓毒,基本上google全都可以解決吓揪。比如我懶得去配置docker軟件,可以這樣:
然后就發(fā)現(xiàn)了一個網(wǎng)頁:https://www.biostars.org/p/360254/所计,這里有人提供了一個網(wǎng)址柠辞,里面介紹了很多文件進(jìn)行可視化的方法:here。
首先:安裝higlass-python:
$ pip install higlass-python
安裝好以后主胧,需要打開jupyter notebook叭首,關(guān)于如何打開jupyter notebook的網(wǎng)頁版,請移步我之前的文章:ipython的初步了解踪栋。
打開jupyter notebook:
#輸入以下代碼
import higlass
import higlass.client as hgc
import higlass.tilesets as hgti
ts1 = hgti.cooler('./output.mcool')”焊瘛#這是在前一篇筆記里得到的mcool文件的路徑
tr1 = hgc.Track('heatmap', tileset=ts1)
view1 = hgc.View([tr1])
(display, server, viewconf) = higlass.display([view1])
display
然后,點擊run夷都,就會得到一張熱圖了:
點擊右上角的加號眷唉,還可以添加track,比如RNA-seq或者Chip-Seq囤官,或者添加基因的注釋等等冬阳,添加的位置可以自己選擇是加在熱圖的上下左右:
舉個例子,這里我想給熱圖添加基因注釋党饮,添加在熱圖的上方肝陪,就點擊“top”,會彈出很多Higlass收錄的一些已經(jīng)發(fā)表的結(jié)果刑顺,比如一些人上傳的RNA-seq和Chip-seq數(shù)據(jù)氯窍,這里我選擇gene annotation,打開它的下拉菜單:
因為我們得到的這個mcool文件是根據(jù)hg38基因組比對得到的捏检,所以也選擇hg38荞驴,選中之后點擊右下角的submit:
這時顯示的基因并不全不皆,你可以用鼠標(biāo)滾輪把熱圖進(jìn)行放大贯城,隨著放大的圖像,基因的annotation會逐漸的多起來霹娄,比如我把熱圖放大很多倍:
這時你會看到熱圖中的每一個小點都被放大成了一個方框能犯,這個方框就是之前我們在上游分析中設(shè)置的分辨率。而上方的基因注釋也被放大的很清晰犬耻,你可以清楚的看到每一個基因的方向踩晶。
然后點擊右上角的“設(shè)置”:
你可以把這張圖保存,也可以導(dǎo)出json文件格式:
拿到這個json文件枕磁,你還可以到higlass網(wǎng)站渡蜻,進(jìn)行在線的可視化,網(wǎng)址:http://higlass.io/。
打開網(wǎng)站茸苇,長這樣:
注意這個熱圖是人家的例子排苍,不是你剛做的熱圖。把你之前保存的.json文件拖到上面“Drag &drop a config”那里学密,然后就自動生成一個熱圖了淘衙,和你在jupyter notebook里做的圖是一樣的~
當(dāng)然Hi-C的可視化還有其他的軟件可以用,這里我就先只介紹這一種腻暮。待今后如果涉及到Hi-C實驗會進(jìn)行更深入的了解~