用Circos華麗地展現基因組信息,能給論文的錦上添花硬萍。很多做基因組分析的文章必有一個點就是展示基因組的圈圖扩所,目前的去比較好實現這種可視化的一般依靠perl語言(最原始的版本),R語言和
0朴乖、為什么要做圈圖
- 唬人祖屏,華麗(不是);
- 更好的展現基因組結構及想要突出的信息买羞;
- 更好地展現基因組之間的差異和隱藏的信息赐劣;
1、圈圖展示的信息
- 展現基因組的結構(正負鏈)
- 正負鏈上各自的編碼序列哩都,mRNA序列魁兼,tRNA序列
- 想突出的基因名稱及所在位置
- 比較兩個基因組
2、Circos展示基因組的基礎例子
例子圖一
基因組結構事例圖二
3漠嵌、準備文件
基因組文件
Fasta咐汞,gbk,gff文件
(Prokka注釋出來的)最好使用Genbank的文件儒鹿,里面記錄了基因的名稱起始位點等等
Feature 文件(其實是網站特殊版本的gff文件化撕,此處推薦subline文本編輯器共 5 列,列的順序沒有考究網站可以自動匹配對應名稱的列约炎,但是要嚴格按照網站對列進行命名植阴,可大小寫模糊,網站只識別下面的列名)Start: 基因起始位置
Stop: 基因結束位置
Type:編碼序列的種類(CDS/mRNA/gene)
Strand:記錄正鏈還是負鏈的信息
Name:基因的名字
序列的位置信息圾浅,序列種類掠手,名字均可以在gbk中找到
網站要求的feature文件
我們還可以在網站上手動添加feature
在網站上添加feature
操作界面
-
1、這是一個上傳了fasta之后的基本操作界面狸捕,顯示了基因組的骨架喷鸽,和大小。
基本操作界面 -
2灸拍、添加track
track的添加
track的編輯
-
3做祝、添加標題
標題的設置和位置的調整 -
4、調整骨架
隱藏骨架
骨架調整前
隱藏骨架后
是不是清爽多了呢
-
5鸡岗、隱藏Label
Label隱藏前混槐、
Labels的隱藏
4、 網站可以做的程序
在網站上直接prokka注釋轩性,可以得到gff的文件(不會Prokka注釋的小伙伴不擔心)声登;
在網站上跟的序列做blast(還可以進行一定的篩選),兩兩之間的比較基因組學;
計算GC%含量 (GC% content)捌刮;
計算GC偏移(GC% skew)碰煌;
評價
- 總體來說,足夠傻瓜绅作,新手友好芦圾;
- 能在網站上手動添加feature的信息;
- 美中不足 ????還是不能像Circos這個可視化軟件一樣把多條基因序列堆疊起來俄认,一次僅能展示一條基因組的信息个少;
- 不支持和弦圖;
- feature文件的設定過于嚴謹眯杏;
- 個性化的設置依然受到限制夜焦;
- 開放閱讀框顯示的legend不分正負鏈(若是上傳fasta文件就會有正負鏈各有三條信息)
- 基因組的展示效果欠佳;
- 網站經常要排隊岂贩;
網站地址:
網站非常簡潔易學好懂茫经,入門門檻在文本數據的提取,將放在另外一篇日志記錄
-
PS
:未來會出一篇傳統(tǒng)的Circos從基礎文件準備