序列比對和序列特征分析總目錄
序列比對的根本是發(fā)現(xiàn)潛在的同源序列,為所查詢的序列進行功能預(yù)測及三維結(jié)構(gòu)建模奠定基礎(chǔ)遥巴。
序列比對sequence alignment
概念:運用某種特定的數(shù)學(xué)模型或算法怀估,找出兩個(雙序列比對)或多個序列(多序列比對)之間的最大匹配堿基或殘基數(shù)元咙,比對的結(jié)果反應(yīng)算法在多大程度上提供序列之間的相似性關(guān)系及生物學(xué)特性共啃。
目的: 通過對比不同物種序列的相似性判斷他們沒之間是否具有同源性濒析。通過比較兩個序列之間的相似區(qū)域和保守型位點,可以尋找兩者之間的分子進化關(guān)系蝌焚。
進一步比對將多個蛋白質(zhì)和核酸同時進行比較裹唆,尋找這些有進化關(guān)系的序列之間共同的保守區(qū)域,位點和模式只洒,從而探索導(dǎo)致它們產(chǎn)生共同功能的序列模式许帐。
此外,蛋白質(zhì)與具有三維結(jié)構(gòu)的蛋白質(zhì)比較可以獲得蛋白質(zhì)結(jié)構(gòu)和折疊類型的信息毕谴。
相似性similarity和同源性homology是序列比較和分析的基礎(chǔ)成畦。
關(guān)于兩者區(qū)別和聯(lián)系請參照我之前的博文。
簡單來說涝开,
相似性指序列比對過程中用來描述檢測序列和目標(biāo)序列之間相同DNA堿基或氨基酸殘基順序占的比例高低循帐。
同源性是序列同源或不同源的一種論斷,是個定性的概念舀武,沒有度的差異拄养,而相似性是量化的。
也就是說兩條序列要么同源要么不同源银舱,不可能具有多或少的數(shù)量關(guān)系瘪匿。
同源序列分為直系同源和旁系同源跛梗。直系同源體通常有相同或相似的功能,但旁系同源提不一定棋弥,進化上講核偿,由于缺乏原始的自然選擇的力量,繁殖出的基因副本可以自由的變異并獲得新的功能顽染。
比對的序列數(shù)量可以分為雙序列比對和多序列比對
比對范圍來說可以分為全局比對(global alignment)和局部比對(local alignment)
全局比對考慮序列的全局相似性宪祥,局部比對考慮序列片段之間的相似性