“25%的同源性”這種說(shuō)法是不科學(xué)的,如果要引入同源性,那么需要考慮序列長(zhǎng)度躏仇、時(shí)間和突變速率。
同源性(homology)愕鼓、相似性(similarity)钙态、一致性(identity)這三個(gè)概念是極易混淆的,三者蘊(yùn)含的意思有相關(guān)聯(lián)的地方也有明顯的不同之處菇晃,它們是不一樣的册倒。
同源序列是指從某一共同祖先經(jīng)過(guò)趨異進(jìn)化而形成的不同序列。
相似性是指序列比對(duì)過(guò)程中檢測(cè)序列和目標(biāo)序列之間相同堿基或氨基酸殘基序列所占比例的大小磺送。
當(dāng)兩條序列同源時(shí)驻子,它們的氨基酸或核苷酸序列通常有顯著的一致性(identity)灿意。如果兩條序列有一個(gè)共同的進(jìn)化祖先,那么它們是同源的崇呵,這里不存在同源性(homology)的程度問(wèn)題缤剧,兩條序列要么是同源的要么是不同源的。
Similarity does not imply homology!(相似不代表同源); Non-homology cannot from non-similarity.(但不同源肯定不會(huì)相似); Do not use the term “percent homology”. (不要用百分之多少同源性)
總結(jié):
1域慷、一般情況下荒辕,我們的序列是論述A這個(gè)基因的同源性,所以比較的對(duì)象是DNA或者蛋白質(zhì)序列犹褒。要注意文獻(xiàn)說(shuō)的是物種抵窒、個(gè)體、還是序列叠骑。
2李皇、同源性大部分情況十足是一個(gè)推論,記住是一個(gè)推論宙枷,我們觀察不到掉房。我們能觀察到的是相似性和一致性。同源性的結(jié)果就是要么同源慰丛,要么非同源卓囚,而且要在一定的時(shí)間尺度下,同時(shí)要推斷進(jìn)化速率诅病。
3捍岳、當(dāng)相似程度高于50%時(shí),比較容易得到兩條序列可能是在一個(gè)比較近的時(shí)間段內(nèi)是同源序列睬隶;而當(dāng)相似性程度低于20%時(shí)锣夹,就難以確定或者根本無(wú)法確定其在特定時(shí)間段內(nèi)是否具有同源性。當(dāng)然還要綜合突變速率和長(zhǎng)度苏潜∫迹總之進(jìn)化推斷是個(gè)比較難的統(tǒng)計(jì)問(wèn)題,很難給出確切的定論恤左。
4贴唇、所謂“具有50%同源性”,或“這些序列高度同源”等說(shuō)法飞袋,都是不確切的戳气,應(yīng)該避免使用。
或者如果你不做進(jìn)化巧鸭,那就干脆直接說(shuō)比較對(duì)象的相似性吧瓶您。不要扯上同源性,讓進(jìn)化研究者去推斷。你就說(shuō)一個(gè)相似性呀袱,序列保守性就好了贸毕,這是你直接觀察到的現(xiàn)象啊。
原文鏈接:不要再出現(xiàn)25%的同源性這種說(shuō)法了——生物知識(shí)科普-騰訊云開(kāi)發(fā)者社區(qū)-騰訊云 (tencent.com)