1. synteny 和 collinearity 用來描述基因組的共線性
synteny 共線性:同源基因在相應染色體上的保留
collinearity 同線性:在synteny的基礎上球恤,要求基因方向的保守性。
2. identity(一致度)和similarity(相似度)這兩個指標來定量描述這兩個序列有多相似
如何定量描述呢荡澎?簡單來說雏搂,就是比較兩條序列相同位置上的殘基是否相同或相似,這些相同或相似的殘基所占的比例驼唱。
怎么判斷兩個堿基或氨基酸是否相似藻茂?——
替換記分矩陣是反映殘基之間相互替換率的矩陣,它描述了殘基兩兩相似的量化關系玫恳。核酸和蛋白質的替換記分矩陣不可混用辨赐。根據表中兩兩比對的得分可知是否相似。
≥0 的得分代表對應的一對氨基酸為相似氨基酸京办,<0 的是不相似的氨基酸
怎么判斷是在相同位置掀序?——
全局比對,計算在哪個位置插入空格會使得分最大惭婿。(長度相同的兩個序列也要先進行全局比對不恭,可以在兩條序列中都插入空格叶雹,長度不同的也要先全局比對。最后保證序列長度相同即可换吧。)
空位罰分(gap)就是當字母對空位的時候應該得幾分折晦,設置為負值,如-5沾瓦。
則:
- identity :全局比對中一致字符的個數满着,除以全局比對的長度
- similarity:全局比對中一致字符的個數加相似字符的個數,再除以全局比對的長度
- homology 同源性:來源于共同祖先的相似序列贯莺,只能定性描述风喇,不能定量描述÷铺剑可以說有同源性或無同源性响驴,也可以說同源性性遠,同源性近撕蔼,但不存在同源性百分之多少的說法(但目前有很多人犯這個錯誤)豁鲤。可以用系統(tǒng)進化樹重建的方法進行分類鲸沮,看是否同源琳骡。
Homoeologs are pairs of genes that originated by speciation and were brought back together in the same genome by allopolyploidization. Homoeologs are not necessarily one-to-one or positionally conserved.