circos軟件在展示基因組信息方面具有十分重要的作用狰闪。關于該軟件的使用可以在網(wǎng)上找到很多教程,但關于如何準備運行circos所需要的文件則沒有軟件可以實現(xiàn)挠铲。因此筹误,特意開發(fā)了For circos軟件。首先是核型文件:
輸入文件可以從genome模塊獲取
其次是links文件逊笆,該文件的作用是展示基因組上的連線栈戳,功能實現(xiàn)如下 :
位置1放入格式化的gff文件,位置2放入共線性的collinearity文件(該文件可以在Alignment/hmm模塊生成)览露。位置3是保存與命名荧琼。然后點擊按鈕。
第三個是基因密度文件,如下:
在位置①放入格式化的gff文件命锄,位置②是規(guī)定多少bp統(tǒng)計一次堰乔,默認的是100000bp,如果還需其他長度的統(tǒng)計單位則直接輸入就好脐恩。接下來就是保存與命名(位置③)镐侯。點擊按鈕即可執(zhí)行功能。
第四驶冒,SNP位點標注苟翻。如下:
與基因密度統(tǒng)計類似,不過在位置1這里骗污,放入的是經(jīng)過格式化的SNP文件而不是 gff文件崇猫,之后設定統(tǒng)計單位(位置2),保存(位置3)需忿,點擊按鈕執(zhí)行诅炉。
接下來是數(shù)量分布。
所謂數(shù)量分布屋厘,既可在染色體上展示熱圖同時也可以展示GC含量等指標涕烧。在位置1放入的是GFF文件,在位置2放入數(shù)量文件汗洒,其基本格式為基因名稱加tab加對應數(shù)量议纯。同學們可以在excel中進行統(tǒng)計,保存文件時將其保存為以制表符格式另存即可溢谤。位置3便是保存位置瞻凤。
最后是文本展示
該功能主要是在circos圖上標注相應的基因ID。位置1放入gff文件溯香,位置2是基因ID(一個ID鲫构,一行),保存(位置3)執(zhí)行即可玫坛。