其實MCScan畫圖也可以很好看

最近發(fā)現(xiàn)了python版的MCScan,是個大寶藏割坠。由于走了不少彎路乾闰,終于畫出美圖,趕緊記錄下來

github地址 https://github.com/tanghaibao/jcvi/wiki/MCscan-(Python-version)

1叠赐、軟件安裝

需要安裝LASTAL和jcvi python包

sudo apt install last-align
pip install jcvi

2、輸入數(shù)據(jù)

輸入數(shù)據(jù)只有兩類cds和bed文件
可以自動從phytozome屡江,這點十分方便

$ python -m jcvi.apps.fetch phytozome
...
         Acoerulea               Alyrata             Athaliana
       Bdistachyon                 Brapa           Cclementina
           Cpapaya          Creinhardtii              Crubella
          Csativus             Csinensis Csubellipsoidea_C-169
          Egrandis                Fvesca                  Gmax
        Graimondii        Lusitatissimum            Mdomestica
        Mesculenta             Mguttatus     Mpusilla_CCMP1545
   Mpusilla_RCC299           Mtruncatula          Olucimarinus
           Osativa               Ppatens              Ppersica
      Ptrichocarpa             Pvirgatum             Pvulgaris
         Rcommunis              Sbicolor              Sitalica
     Slycopersicum       Smoellendorffii            Stuberosum
            Tcacao            Thalophila              Vcarteri
         Vvinifera                 Zmays         early_release

以水稻和擬南芥為例

$ python -m jcvi.apps.fetch phytozome Osativa,Athaliana
$ ls
Athaliana_167_cds.fa.gz  Athaliana_167_gene.gff3.gz Osativa_204_cds.fa.gz  Osativa_204_gene.gff3.gz

其中g(shù)ff3文件不需要解壓 一鍵轉(zhuǎn)換成bed格式

python -m jcvi.formats.gff bed --type=mRNA --key=Name Osativa_204_gene.gff3.gz -o osa.bed

cds解壓后需要去掉|分隔符 b并要修改id 以基因而不是轉(zhuǎn)錄本命名

$ gunzip Athaliana_167_cds.fa.gz
$ mv Athaliana_167_cds.fa ath.cds
$ sed 's/\.*$//g' -i ath.cds  #也可以這么做 python -m jcvi.formats.fasta format --sep="|" Athaliana_167_cds.fa.gz  ath.cds
$ sed 's/\.//g' -i ath.cds 

如果是其他物種或者自己組裝的基因組數(shù)據(jù)芭概,記得基因id需要遵循在染色體上的位置從大到小排序的命名原則,否則軟件會在gff3轉(zhuǎn)bed的時候自動命名惩嘉,務(wù)必要和cds里的id對應(yīng)罢洲。

3、Pairwise synteny 分析

$ python -m jcvi.compara.catalog ortholog osa ath

分析過程很快,結(jié)果包括.anchors文件惹苗,點陣圖殿较,如果遇到報錯,多半是要安裝python包桩蓉,更新Latex淋纲。結(jié)果文件的含義“The .last file is raw LAST output, .last.filtered is filtered LAST output, .anchors is the seed synteny blocks (high quality), .lifted.anchors recruits additional anchors to form the final synteny blocks.”

$ ls osa.ath.*
osa.ath.lifted.anchors  osa.ath.anchors  osa.ath.last.filtered  osa.ath.last

4、可視化

重頭戲來了

a 共線性圖

首先生成.simple文件

python -m jcvi.compara.synteny screen --minspan=30 --simple osa.ath.anchors osa.ath.anchors.new

再編輯兩個配置文件seqids和layout

$ vi seqids #設(shè)置需要展示等染色體號 
Chr1,Chr2,Chr3,Chr4,Chr5,Chr6,Chr7,Chr8,Chr9,Chr10,Chr11,Chr12 #osa
Chr1,Chr2,Chr3,Chr4,Chr5,Chr6,Chr7,Chr8,Chr9,Chr10,Chr11,Chr12 #ath

$ vi layout #設(shè)置顏色院究、長寬等
# y, xstart, xend, rotation, color, label, va,  bed
 .6,     .1,    .8,       0,      , Osa, top, osa.bed
 .4,     .1,    .8,       0,      , Ath, top, ath.bed
# edges
e, 0, 1, osa.ath.anchors.simple

接下來就是見證奇跡的時刻


還有許多高能操作洽瞬,大家可以試試
真好看

突出顯示

$ vi XXX.XXXanchors.simple 
g*GSVIVT01012028001 GSVIVT01000604001   ppa011886m  ppa008534m  392 +
GSVIVT01010441001   GSVIVT01000970001   ppa022891m  ppa001358m  115 -
GSVIVT01000555001   GSVIVT01003228001   ppa002809m  ppa010569m  359 +
...
$ python -m jcvi.graphics.karyotype seqids layout
突出顯示.png
$ vi layout
# y, xstart, xend, rotation, color, label, va,  bed
 .7,     .1,    .8,      15,      , Grape, top, grape.bed
 .5,     .1,    .8,       0,      , Peach, top, peach.bed
 .3,     .1,    .8,     -15,      , Cacao, bottom, cacao.bed
# edges
e, 0, 1, grape.peach.anchors.simple
e, 1, 2, peach.cacao.anchors.simple

$ vi seqids
chr1,chr2,chr3,chr4,chr5,chr6,chr7,chr8,chr9,chr10,chr11,chr12,chr13,chr14,chr15,chr16,chr17,chr18,chr19
scaffold_1,scaffold_2,scaffold_3,scaffold_4,scaffold_5,scaffold_6,scaffold_7,scaffold_8
scaffold_1,scaffold_2,scaffold_3,scaffold_4,scaffold_5,scaffold_6,scaffold_7,scaffold_8,scaffold_9,scaffold_10r

$ python -m jcvi.graphics.karyotype seqids layout
扇形.png
局部展示.png
多物種單個block展示.png

b dotplot

親測點陣圖是自動出來的,當(dāng)然也可以用命令行

$ python -m jcvi.graphics.dotplot osa.ath.anchors
還是很漂亮的

可以看到水稻和擬南芥基因組的syntenic很差业汰,github示例里葡萄和桃子的syntenic regions不錯伙窃,可以推斷出一些染色體genome triplication事件

查看synteny depth分布

python -m jcvi.compara.synteny depth --histogram osa.ath.anchors
osa.ath.depth.pdf

anyway,先介紹到這里啦

更多請參考
基因組共線性工具MCScanX使用說明
基因組間共線性分析想學(xué)嗎?
無限個蔬胯!物種共線性分析結(jié)果可視化

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末对供,一起剝皮案震驚了整個濱河市位他,隨后出現(xiàn)的幾起案子氛濒,更是在濱河造成了極大的恐慌,老刑警劉巖鹅髓,帶你破解...
    沈念sama閱讀 221,430評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件舞竿,死亡現(xiàn)場離奇詭異,居然都是意外死亡窿冯,警方通過查閱死者的電腦和手機骗奖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,406評論 3 398
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來醒串,“玉大人执桌,你說我怎么就攤上這事∥叨模” “怎么了仰挣?”我有些...
    開封第一講書人閱讀 167,834評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長缠沈。 經(jīng)常有香客問我膘壶,道長,這世上最難降的妖魔是什么洲愤? 我笑而不...
    開封第一講書人閱讀 59,543評論 1 296
  • 正文 為了忘掉前任颓芭,我火速辦了婚禮,結(jié)果婚禮上柬赐,老公的妹妹穿的比我還像新娘亡问。我一直安慰自己,他們只是感情好肛宋,可當(dāng)我...
    茶點故事閱讀 68,547評論 6 397
  • 文/花漫 我一把揭開白布州藕。 她就那樣靜靜地躺著万矾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪慎框。 梳的紋絲不亂的頭發(fā)上良狈,一...
    開封第一講書人閱讀 52,196評論 1 308
  • 那天,我揣著相機與錄音笨枯,去河邊找鬼薪丁。 笑死,一個胖子當(dāng)著我的面吹牛馅精,可吹牛的內(nèi)容都是我干的严嗜。 我是一名探鬼主播,決...
    沈念sama閱讀 40,776評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼洲敢,長吁一口氣:“原來是場噩夢啊……” “哼漫玄!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起压彭,我...
    開封第一講書人閱讀 39,671評論 0 276
  • 序言:老撾萬榮一對情侶失蹤睦优,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后壮不,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體汗盘,經(jīng)...
    沈念sama閱讀 46,221評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,303評論 3 340
  • 正文 我和宋清朗相戀三年询一,在試婚紗的時候發(fā)現(xiàn)自己被綠了隐孽。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,444評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡健蕊,死狀恐怖菱阵,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情缩功,我是刑警寧澤晴及,帶...
    沈念sama閱讀 36,134評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站掂之,受9級特大地震影響抗俄,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜世舰,卻給世界環(huán)境...
    茶點故事閱讀 41,810評論 3 333
  • 文/蒙蒙 一动雹、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧跟压,春花似錦胰蝠、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,285評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽躲庄。三九已至,卻和暖如春钾虐,著一層夾襖步出監(jiān)牢的瞬間噪窘,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,399評論 1 272
  • 我被黑心中介騙來泰國打工效扫, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留倔监,地道東北人。 一個月前我還...
    沈念sama閱讀 48,837評論 3 376
  • 正文 我出身青樓菌仁,卻偏偏與公主長得像浩习,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子济丘,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,455評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 基因組組裝完成后谱秽,或者是完成了草圖,就不可避免遇到一個問題摹迷,需要對基因組序列進行注釋疟赊。注釋之前首先得構(gòu)建基因模型,...
    xuzhougeng閱讀 50,999評論 11 184
  • 這個故事仿佛已經(jīng)過去很久泪掀,仿佛仍然還在繼續(xù)听绳。就像你若相信這世間的美好,就能夠看見彩虹异赫;你若信仰心有靈犀的感情,那么...
    心中的藍蓮花閱讀 725評論 0 0
  • 2017头岔,親愛的媽咪59歲塔拳。最近一次與她出境旅行在2014年,三年前的巴厘島假期一直讓她念念不忘峡竣。 我尋思著今年也...
    穎穎潛行閱讀 316評論 1 3
  • 一靠抑、我的障礙 1、人際關(guān)系中的障礙 我很難走近權(quán)威适掰,害怕與強人接觸颂碧,在他們身上會照見我的不堪和失敗。 我很難接受與...
    上善若水澤萬物閱讀 658評論 0 1