首先利用mega進行多序列(clustalw)比對然后用最大似然法建樹
樹文件另存為*.nwk
clustalw結(jié)果另存為fas結(jié)尾的fasta格式文件
利用ggtree進行可視化
library(ggtree)
tree <- read.tree("tree.nwk") # 讀入樹文件
p1 <- ggtree(tree) +
geom_tiplab(size = 4) + # 加物種名稱
geom_treescale(fontsize=4, linesize=0.5) + # 加標尺
geom_nodelab() + # 加bootstrap值
xlim(0,15) #物種名字太長让蕾,調(diào)整x軸范圍至完全顯示
p1
msaplot(p1, "clustalw.fas",
offset = 4)
msaplot(p1, "clustalw.fas",
offset = 4,
window = c(100, 120)) # window指定可視化范圍罢荡,即序列長度范圍
image.png
image.png
這里蛋白序列侧纯,種類比較多骄崩,所以不如核酸序列信息簡潔明了恰力。
其實真想看保守序列還是把多序列比對后的結(jié)果上傳到espript3上吧,結(jié)果清晰明了
image.png