首先非常感謝Cj大神開發(fā)出來的TBtools生信工具籍琳,為生信分析做圖帶來了極大的便利。作為生信小白哩盲,在做多物種間共線性分析時,嘗試了多種方法狈醉,苦于沒有計算機基礎廉油,一直沒能完成,最后鎖定TBtools的零命令行作圖苗傅,幾經(jīng)摸索抒线,終于成功,賊開心渣慕。
話不多說先上效果圖
一嘶炭、準備工作
1.下載各個物種的.gff文件和基因組序列文件
示例
數(shù)據(jù)下載地址:[http://plants.ensembl.org/info/website/ftp/index.html]
1
2:右擊,復制鏈接逊桦,用迅雷下載比較快
3
2.工具TBtools:歡迎加入開發(fā)作者的QQ交流學習群(553679029)眨猎,先看群公告哈。
二强经、將文件進行ID prefix睡陪,統(tǒng)一染色體名稱。
沒統(tǒng)一的草圖匿情,染色體前綴由系統(tǒng)命名
打開TBtools
1gff文件進行ID prefix
2
3.fa文件進行ID prefix
4:注意兩次輸入的字符必須一樣兰迫。例圖中是:AT-
按步驟操作完成后,每個物種得到新的.gff文件和.fa文件炬称,用于后續(xù)的共線性分析汁果。
三、確定物種間的親緣遠近關系
目的:給各個物種安排的排序位置玲躯,例如我做的5個物種擬南芥据德、大豆鲸伴、水稻、小麥和玉米晋控,其中水稻汞窗、小麥和玉米屬于禾本科植物,這三個物種之間的共線性關系自然是比較好的赡译,但是具體的怎末連線還是不清楚仲吏,當然可以通過文獻查找來確定,這里為了保險起見蝌焚,我決定將所有物種兩兩組合裹唆,看共線性關系,先做兩物種間共線性只洒,再來排列许帐。
兩個物種間的共線性,請參考:http://www.reibang.com/p/6c5a5a2d8fa7
注意:
1:OnestepMCscanX的比對時間因物種而已毕谴,比如小麥這種超大基因組的物種成畦,我用小筆記本跑了兩天,start后就靜靜等待了涝开,建議最好多用幾臺電腦循帐。
2:兩物間共線性分析時,用ID prefix后的文件舀武,只是鏈接里我用的原始文件拄养。
按照高亮基因共線性條目多少進行排序(水稻做了秈稻和粳稻的可以忽視,5個物種也就10種組合)
結果:確定這幾個物種的前后順序為擬南芥银舱、大豆瘪匿、水稻、小麥寻馏、玉米棋弥,得到兩兩之間的比對結果文件。
四操软、比對文件合并與修改
多物種共線性需要用到的文件
1
2
3:所需文件合并結果
4:查看合并文件嘁锯,將文件拖入即可
5:將碎片刪除,將染色體保留并排序
6:表示圖片顏色的數(shù)字可以刪除
7:整理自己的Highlight基因ID聂薪,依舊是全英狀態(tài)下輸入
8:可視化啦
9:最終圖片
10:我將顏色數(shù)字代碼去除的亞子