首先非常感謝Cj大神開發(fā)出來的TBtools生信工具籍琳,為生信分析做圖帶來了極大的便利。作為生信小白哩盲,在做多物種間共線性分析時,嘗試了多種方法狈醉,苦于沒有計算機基礎廉油,一直沒能完成,最后鎖定TBtools的零命令行作圖苗傅,幾經(jīng)摸索抒线,終于成功,賊開心渣慕。
一嘶炭、準備工作
1.下載各個物種的.gff文件和基因組序列文件
數(shù)據(jù)下載地址:[http://plants.ensembl.org/info/website/ftp/index.html]
2.工具TBtools:歡迎加入開發(fā)作者的QQ交流學習群(553679029)眨猎,先看群公告哈。
二强经、將文件進行ID prefix睡陪,統(tǒng)一染色體名稱。
打開TBtools
按步驟操作完成后,每個物種得到新的.gff文件和.fa文件炬称,用于后續(xù)的共線性分析汁果。
三、確定物種間的親緣遠近關系
目的:給各個物種安排的排序位置玲躯,例如我做的5個物種擬南芥据德、大豆鲸伴、水稻、小麥和玉米晋控,其中水稻汞窗、小麥和玉米屬于禾本科植物,這三個物種之間的共線性關系自然是比較好的赡译,但是具體的怎末連線還是不清楚仲吏,當然可以通過文獻查找來確定,這里為了保險起見蝌焚,我決定將所有物種兩兩組合裹唆,看共線性關系,先做兩物種間共線性只洒,再來排列许帐。
兩個物種間的共線性,請參考:http://www.reibang.com/p/6c5a5a2d8fa7
注意:
1:OnestepMCscanX的比對時間因物種而已毕谴,比如小麥這種超大基因組的物種成畦,我用小筆記本跑了兩天,start后就靜靜等待了涝开,建議最好多用幾臺電腦循帐。
2:兩物間共線性分析時,用ID prefix后的文件舀武,只是鏈接里我用的原始文件拄养。
結果:確定這幾個物種的前后順序為擬南芥银舱、大豆瘪匿、水稻、小麥寻馏、玉米棋弥,得到兩兩之間的比對結果文件。