基因組不同區(qū)域在進(jìn)化上的速率是不同的旱捧。在編碼區(qū)的堿基突變可能會(huì)導(dǎo)致氨基酸性質(zhì)發(fā)生改變導(dǎo)致后代死亡踩麦,以及插入缺失導(dǎo)致開放讀碼框(ORF)變化,因此編碼區(qū)更有可能是同義的點(diǎn)突變贫橙。但是對于非編碼區(qū)卢肃,比如說內(nèi)含子或者是基因間隔區(qū)星压,突變對生物體的生存影響不大娜膘,因此更容易出現(xiàn)插入、缺失军洼、倒置和重復(fù)這些變異匕争。
在1940~1950年期間甘桑,Barbara McClintock 在玉米中發(fā)現(xiàn)了轉(zhuǎn)座子現(xiàn)象歹叮,并證明許多基因組重排是因?yàn)檗D(zhuǎn)座子在基因組上移動(dòng)引起咆耿。
下圖表明基因組原本只有兩個(gè)轉(zhuǎn)座子,由于姊妹染色單體之間的Tn插入重拍最后形成了三個(gè)轉(zhuǎn)座子窄做。
基因組上的轉(zhuǎn)座子不需要完全一致就能夠發(fā)生重拍椭盏,因此無法使用傳統(tǒng)的局部聯(lián)配找到序列中的多個(gè)重復(fù)庸汗,因?yàn)樗粫?huì)找到最優(yōu)的聯(lián)配蚯舱。比如說"AAAATTTTT"和"TTTTTAAAA"的局部最優(yōu)聯(lián)配只會(huì)得到
001 1 TTTTT 5
|||||
002 5 TTTTT 9
為了找到序列中AAAA部分的聯(lián)配陈肛,我們就需要用到次最優(yōu)聯(lián)配技術(shù)句旱,它能獲取不止一個(gè)的不同位點(diǎn)局部聯(lián)配晰奖,因此還能在上面的基礎(chǔ)上得到如下的聯(lián)配
001 6 AAAA 9
||||
002 1 AAAA 4
實(shí)現(xiàn)亞最優(yōu)聯(lián)配的工具為FASTA/Lalign
谈撒,輸出結(jié)果和EMBOSS的Needle
和Water
類似
問題: 給定兩條DNA序列(A,B),兩者存在32~40 bp的不精確重復(fù)序列C匾南。使用Lalign的網(wǎng)頁工具 啃匿,請給出長度在32~40之間的C序列分別在A和B里出現(xiàn)了幾次
學(xué)會(huì)看結(jié)果圖就行了。