這篇文章更多是記錄性質(zhì)的,因?yàn)闆]有詳細(xì)說明如何從WGDI, MCScan, MCscanX中獲取基因?qū)ε扒铮矝]介紹如何整理出記錄基因坐標(biāo)的bed文件蓖租,因此如果閱讀此文的您看不懂,是我寫的問題觅闽,不是您的原因艘儒。
本文主要介紹如何使用JCVI的synteny子命令基于已有的共線性分析結(jié)果聋伦,展現(xiàn)局部的共線性夫偶。
需要準(zhǔn)備的三個(gè)輸入文件
- 記錄物種內(nèi)或者物種間的共線性基因?qū)?/li>
- 記錄基因坐標(biāo)的bed文件
- 布局文件
第一步界睁,基于已有的共線性分析結(jié)果(WGDI, MCscan, MCscanX等軟件的分析結(jié)果),整理出你需要展示的區(qū)間的基因?qū)Ρ!W⒁夥指舴侵票矸澹覀儽4鏋閎locks.txt
AL1G16390 AT1G06380
AL1G16400 AT1G06390
AL1G16410 AT1G06400
AL1G16420 AT1G06410
AL1G16430 AT1G06420
AL1G16440 AT1G06430
AL1G16450 AT1G06440
AL1G16460 AT1G06450
AL1G16470 AT1G06460
AL1G16480 AT1G06470
AL1G16490 AT1G06475
AL1G16510 AT1G06490
AL1G16520 AT1G06500
AL1G16530 AT1G06515
AL1G16540 AT1G06510
AL1G16550 AT1G06520
AL1G16560 AT1G06530
AL1G16570 AT1G06540
AL1G16580 AT1G06550
AL1G16590 AT1G06560
AL1G16600 AT1G06570
AL1G16610 AT1G06580
第二步,整理記錄基因坐標(biāo)的bed文件说铃。bed要求是6列访惜,記錄基因的坐標(biāo)和朝向,第五列填0即可腻扇。 我們命名為genes.bed
1 3631 5899 AT1G01010 0 +
1 6788 9130 AT1G01020 0 -
...
scaffold_9 1792941 1795545 AL9U12210 0 -
scaffold_9 1796870 1801565 AL9U12220 0 -
scaffold_9 1810180 1812874 AL9U12230 0 +
scaffold_9 1836100 1837535 AL9U12240 0 -
兩個(gè)要求:
- 第4列的基因名必須對應(yīng)共線性對的基因
- 文件里必須包含你需要展示物種的所有基因(至少是共線性區(qū)塊的基因)
第三步债热,提供布局文件, 命名為layout.csv
# x, y, rotation, ha, va, color, ratio, label
0.5, 0.4, 0, center,top, , 1, A.lyrata Chr1
0.5, 0.3, 0, center, top, , 1, A.thaliana Chr1
# edges
e, 0, 1
該文件分為兩個(gè)部分:上半部分是track在圖中的相對位置(x,y)和旋轉(zhuǎn)角度(rotation),以及l(fā)abel的對齊方式幼苛, ha( left, center, right) va( top, button) 和顏色(color)
下半部分是不同track的共線性關(guān)系窒篱,e,0,1表示第一個(gè)和第二個(gè)track有關(guān)聯(lián)。
最后運(yùn)行程序
python -m jcvi.graphics.synteny blocks.txt genes.bed layout.csv
輸出結(jié)果為一個(gè)pdf舶沿,如下所示
因?yàn)槲覀兊墓簿€性基因里面是A.lyrata是第一列墙杯,所以畫圖的時(shí)候也是A.lyrata在第一行。
案例僅展示了2條序列之間的共線性括荡,實(shí)際上jcvi.graphics.synteny
是可以展示多條序列的結(jié)果高镐,比如說jcvi案例展示graph, peach, cacao三者之間的共線性,提供的兩兩之間的共線性如下
GSVIVT01012261001 . .
GSVIVT01012259001 . .
GSVIVT01012258001 . .
GSVIVT01012257001 . .
GSVIVT01012255001 Prupe.1G290900.1 Thecc1EG011472t1
GSVIVT01012253001 Prupe.1G290800.2 Thecc1EG011473t1
GSVIVT01012252001 Prupe.1G290700.1 Thecc1EG011474t1
GSVIVT01012250001 Prupe.1G290600.1 Thecc1EG011475t1
GSVIVT01012249001 Prupe.1G290500.1 Thecc1EG011478t1
GSVIVT01012248001 Prupe.1G290400.1 Thecc1EG011482t1
通過調(diào)整布局(注意布局文件里面的坐標(biāo)x,y, 以及edge)
# x, y, rotation, ha, va, color, ratio, label
0.5, 0.6, 0, center, top, , 1, grape Chr1
0.3, 0.4, 0, center, bottom, , .5, peach scaffold_1
0.7, 0.4, 0, center, bottom, , .5, cacao scaffold_2
# edges
e, 0, 1
e, 0, 2
就能輸出如下效果的共線性
參考資料
https://github.com/tanghaibao/jcvi/wiki/MCscan-(Python-version)