科學(xué)就是整理事實(shí)猪杭,以便從中得出普遍的規(guī)律和結(jié)論。from 達(dá)爾文
原文鏈接:神秘的細(xì)菌基因組:GC skew每當(dāng)我們拼接出一個(gè)完整的細(xì)菌基因組時(shí)妥衣,總是迫不及待地畫(huà)出它的圖譜皂吮,一個(gè)常見(jiàn)的細(xì)菌基因組圖譜如下所示:
最外圈為正負(fù)鏈上的編碼區(qū)及結(jié)構(gòu)RNA基因戒傻,其內(nèi)為基因組不同區(qū)域GC含量的變化,最內(nèi)圈就是GC skew蜂筹。其中綠色為skew+需纳,紫色為skew-,這時(shí)候我們看到GC skew具有很明顯的規(guī)律性艺挪。
GC skew也即GC歪斜或GC偏倚不翩,用來(lái)衡量在單鏈DNA中堿基G和C相對(duì)含量的不同。雙鏈DNA其G的含量一定等于C的含量麻裳,然而G和C在每條單鏈的含量不一定相同口蝠,在每條單鏈中G與C含量的偏移就叫GC skew。其具體的計(jì)算方法為(nG–nC)/(nG+nC)津坑,因此GC skew+就表示G的含量大于C妙蔗,GC skew-表示G的含量小于C。
在大多數(shù)細(xì)菌基因組中疆瑰,DNA復(fù)制中的前導(dǎo)鏈(leading strand)和對(duì)應(yīng)的滯后鏈(lagging strand)在堿基組成上存在著很明顯的不同眉反,表現(xiàn)出堿基組成上的不對(duì)稱性(compositional asymmetry)。前導(dǎo)鏈富含G和T乃摹,而滯后鏈中的A和C更多一些禁漓,打破A=T和C=G的堿基概率期望而發(fā)生偏移,而且通常GC偏移比AT偏移發(fā)生的更明顯孵睬,所以習(xí)慣上更多地只考慮GC偏移播歼。因此從復(fù)制起點(diǎn)延伸的前導(dǎo)鏈中是GC skew+,而在滯后鏈中為GC skew-掰读,所以GC skew值是前導(dǎo)鏈起點(diǎn)秘狞、終點(diǎn)以及轉(zhuǎn)變成滯后鏈的信號(hào),這使得GC skew分析成為在環(huán)狀DNA中標(biāo)記復(fù)制起點(diǎn)的一個(gè)有用工具蹈集。
環(huán)狀DNA分子的復(fù)制一般是單起點(diǎn)雙向進(jìn)行的(也叫θ型復(fù)制)烁试,也即在復(fù)制起點(diǎn)啟動(dòng)解旋后,兩套復(fù)合體分別向兩個(gè)不同的方向同時(shí)進(jìn)行復(fù)制拢肆,但是分別以不同的鏈作為前導(dǎo)鏈减响。因此在復(fù)制起點(diǎn)處兩條DNA鏈分別向左右兩邊呈現(xiàn)由GC skew-到GC skew+的明顯變化,而在環(huán)狀DNA的復(fù)制起點(diǎn)的對(duì)稱處郭怪,也即雙向復(fù)制的匯合處支示,也會(huì)有GC skew+到GC skew-的變化,使得細(xì)菌基因組單鏈呈現(xiàn)較明顯的一半GC skew+而另一半GC skew-的現(xiàn)象鄙才。
造成復(fù)制起始區(qū)前導(dǎo)鏈G颂鸿、T較豐富的原因并不是非常清楚,但有幾個(gè)理論可以討論攒庵。第一個(gè)是由于在DNA復(fù)制時(shí)雙鏈解旋而成單鏈狀態(tài)嘴纺,但前導(dǎo)鏈與滯后鏈維持單鏈的時(shí)間不同败晴,使得兩條鏈因暴露環(huán)境中而可能產(chǎn)生突變的機(jī)率也有所不同。而一但突變產(chǎn)生栽渴,則必須使用錯(cuò)配修復(fù)(mismatch repair尖坤,MMR)機(jī)制,而在錯(cuò)配修復(fù)中產(chǎn)生G-T錯(cuò)配比A-C錯(cuò)配有較大的概率闲擦,使得錯(cuò)配修復(fù)的單鏈DNA會(huì)有較多的G以及T存在[1]糖驴。
另一個(gè)理論則是堿基C的水解去胺(hydrolytic deamination)作用,胞嘧啶C可以脫去氨基變成U佛致,在雙鏈中堿基C被保護(hù)而不發(fā)生水解,但在單鏈DNA上水解概率大大提高[2]辙谜。在DNA復(fù)制過(guò)程中俺榆,前導(dǎo)鏈保持單鏈的時(shí)間較長(zhǎng),因此其堿基C容易變成U装哆,若未被修正罐脊,長(zhǎng)久下來(lái)則使得前導(dǎo)鏈DNA上的G及T含量相對(duì)增加。還有就是信號(hào)序列(signal sequence)的分布蜕琴,例如chi序列(chi sequence)萍桌。Chi序列是一個(gè)重組過(guò)程當(dāng)中需要的序列,其為GT相當(dāng)豐富的序列凌简,并且成涎祝可以在前導(dǎo)鏈中發(fā)現(xiàn)其蹤跡[3]。
參考文獻(xiàn):
[1] Eppinger M, Baar C, Raddatz G, et al. Comparative analysis of four Campylobacterales[J]. Nature Reviews Microbiology, 2004, 2(11): 872.
[2]? Guo F B, Yu X J. Separate base usages of genes located on the leading and lagging strands in Chlamydia muridarum revealed bythe Z curve method[J]. Bmc Genomics, 2007, 8(1): 366.
[3]?Tillier E R M, Collins R A. The Contributions of Replication Orientation, Gene Direction, and Signal Sequences to Base-Composition Asymmetries in Bacterial Genomes[J]. Journal of Molecular Evolution, 2000, 50(3): 249-257.