基因的基本組成
基因是具有功能的DNA序列片段,由編碼序列和非編碼序列交替構(gòu)成,我們又稱為割裂基因 split gene。人類基因主要由 外顯子杯缺、內(nèi)含子和側(cè)翼序列組成。
外顯子與內(nèi)含子
- 外顯子 exon 是基因內(nèi)的編碼序列奈虾;內(nèi)含子 intron 是基因內(nèi)的非編碼序列夺谁。
- 外顯子平均長度小于200bp;內(nèi)含子平均長度3000bp肉微。無內(nèi)含子的基因較小匾鸥,較大的基因,序列中內(nèi)含子也較大碉纳。高表達的基因中勿负,內(nèi)含子較短。
- GT-AG法則劳曹,外顯子與內(nèi)含子接頭的位置奴愉,都有高度保守的共有序列,為剪切識別信號铁孵,即內(nèi)含子5’端核苷酸是GT锭硼,3’端是AG。
- 基因內(nèi)基因蜕劝,即內(nèi)含子中存在若干小基因檀头。
- 基因家族 gene family 轰异,即基因組中一些功能相似的基因成簇的排列在一起(一條染色體上),這些基因可能同時發(fā)揮作用暑始,也可能在不同發(fā)育階段表達搭独。
例:人類α和β珠蛋白基因簇。前者與ζ基因排列在16號染色體上廊镜,組成α珠蛋白基因簇牙肝;后者與其他四個基因排列在11號染色體上,組成β珠蛋白基因簇嗤朴。在胚胎發(fā)育的不同階段表達配椭。 - 基因超家族 gene superfamily,即一些基因編碼相似功能的蛋白雹姊,成簇的分布于幾條不同的染色體上颂郎。
例:人類HOX基因是由38個相關(guān)基因組成的四個基因簇,分布于2容为、7、12和17號染色體上寺酪。 - 假基因 pseudogene坎背,是一些與某些有功能的基因結(jié)構(gòu)相似但不能表達基因產(chǎn)物的基因〖娜福可能是進化中得滤,編碼序列或調(diào)控元件發(fā)生突變、或cDNA插入盒犹,一般缺少啟動子序列懂更。
例:人類α珠蛋白基因簇中的假基因ψα與α基因相比,沒有內(nèi)含子急膀,可能是cDNA插入導(dǎo)致沮协。
基因家族與超家族的區(qū)別是,是否存在于同一條染色體上卓嫂。此外慷暂,現(xiàn)在的教材相比我大學(xué)的教材,在具體細節(jié)上更豐富晨雳。
側(cè)翼序列
側(cè)翼序列 flanking sequence行瑞,即在每個基因序列的5’和3’端兩側(cè)的不轉(zhuǎn)錄序列。啟動子在5’餐禁,終止子和多聚腺苷酸信號在3’血久,增強子兩側(cè)都可能存在。側(cè)翼序列與基因的轉(zhuǎn)錄調(diào)控有關(guān)帮非。
啟動子 promoter
由一組段序列元件簇集在一個基因編碼序列的上游構(gòu)成氧吐,多位于基因起始點上游100-200bp范圍讹蘑;轉(zhuǎn)錄因子與之結(jié)合后峡谊,激活RNA聚合酶坑匠,啟動RNA合成辕羽。- TATA框 TATA box
在轉(zhuǎn)錄起始點5’端上游-25~-30bp處有高度保守序列医窿,由7個堿基構(gòu)成绢记,即TATAA(T)AA(T)吱窝,兩個堿基可變化调衰。轉(zhuǎn)錄因子TFⅡ與之結(jié)合养葵,再與RNA聚合酶Ⅱ形成復(fù)合物心剥,識別轉(zhuǎn)錄起始點邦尊,啟動基因轉(zhuǎn)錄。
- TATA框 TATA box
- CAAT框 CAAT box
在轉(zhuǎn)錄起始點5’端上游-70~-80bp處有高度保守序列优烧,由9個堿基構(gòu)成蝉揍,即GGC(T)CAATCT,一個堿基可變化畦娄。轉(zhuǎn)錄因子CTF與之結(jié)合又沾,提高轉(zhuǎn)錄效率。
- CAAT框 CAAT box
- GC框 GC box
某些基因沒有上述兩種元件熙卡,但含GC框杖刷,即GGCGGG,轉(zhuǎn)錄因子Sp1與之結(jié)合驳癌,促進轉(zhuǎn)錄滑燃。
- GC框 GC box
增強子 enhancer
- 短序列元件,特異性與調(diào)節(jié)蛋白結(jié)合颓鲜,在啟動子和增強子間形成DNA環(huán)表窘,使增強子的結(jié)合蛋白與啟動子的結(jié)合蛋白相互作用、或與RNA聚合酶相互作用甜滨,增強基因的轉(zhuǎn)錄活性乐严。
- 啟動子位于基因上游,起始點相對恒定艳吠;增強子可以位于任何位置麦备,且功能與位置和序列方向無關(guān),可以5’-3’方向昭娩,也可以是3’-5’方向凛篙。
沉默子 silencer
與增強子具有相似的性質(zhì),但是栏渺,是抑制特定基因轉(zhuǎn)錄活性的調(diào)節(jié)元件呛梆。終止子 terminater
由AATAAA和一段回文序列組成,AATAAA是多聚腺苷酸(polyA)的附加信號磕诊,回文序列轉(zhuǎn)錄后形成發(fā)夾結(jié)構(gòu)填物,阻礙RNA聚合酶繼續(xù)移動纹腌,轉(zhuǎn)錄終止。
側(cè)翼序列是個新名詞滞磺,實際是一段有效地基因序列中升薯,不負責(zé)編碼的那些部分。
基因的表達
基因的表達是DNA序列的遺傳信息通過轉(zhuǎn)錄產(chǎn)生的mRNA經(jīng)過翻譯击困,最終形成蛋白質(zhì)的過程涎劈。基因的表達遵循共線性原理 colinearity principle 阅茶,即DNA的線性核苷酸序列以堿基三聯(lián)體 base triple 形式被轉(zhuǎn)錄為RNA的線性核苷酸序列蛛枚,RNA以密碼子 condon 形式被解碼形成特定多肽的線性氨基酸序列,這種DNA-RNA-Protein的信息傳遞方式被稱為中心法則脸哀。反轉(zhuǎn)錄酶的存在蹦浦,使DNA-RNA間為雙向信息傳遞。
轉(zhuǎn)錄 transcription
指以DNA雙鏈中的一條鏈為模板撞蜂,以ATP盲镶、CTP、GTP和UTP為原料蝌诡,在RNA聚合酶催化下徒河,按堿基互補方式合成RNA單鏈的過程。
這一過程發(fā)生于細胞核內(nèi)送漠,方向為5’-3’,轉(zhuǎn)錄產(chǎn)物RNA的序列與DNA模板鏈互補由蘑,與非模板鏈相同(T換成U)闽寡。前者稱為 有義鏈 sense strand,后者稱為 反義鏈 antisense strand尼酿。
真核細胞中爷狈,僅有少部分DNA處于轉(zhuǎn)錄中,轉(zhuǎn)錄單位無規(guī)律分布于基因組DNA中裳擎。轉(zhuǎn)錄產(chǎn)物有:mRNA(RNA聚合酶Ⅱ)涎永,核糖體RNA ribosoma RNA;rRNA(RNA聚合酶Ⅰ)鹿响,轉(zhuǎn)運RNA transfer RNA羡微;tRNA(RNA聚合酶Ⅲ)。
mRNA傳遞遺傳信息給蛋白質(zhì)惶我。過程如下:
剪接 splice
原始RNA轉(zhuǎn)錄本稱為異質(zhì)核RNA heterogeneous nuclear RNA妈倔,hnRNA,序列中包含外顯子和內(nèi)含子绸贡。剪接過程就是剪除內(nèi)含子盯蝴,將外顯子連接的過程毅哗。- 剪接發(fā)生于二者交界處的GT和AG處;剪接起始的GT和相鄰的保守序列組成 剪接供體位點 splice donor site捧挺,剪接終止的AG和相鄰的保守序列組成 剪接受體位點 splice receptor site虑绵;在內(nèi)含子末端有一個保守序列,稱為 分支部位 branch site闽烙,位于AG上游40核苷酸處翅睛,這些序列構(gòu)成剪接信號。
- 細胞核內(nèi)的小核RNA蛋白 snRNP 識別這些信號(RNA-RNA堿基配對)鸣峭,形成剪接體 splicesome 切除內(nèi)含子宏所。前者由5種snRNA(snRANU1,U2,U4,U5和U6)和特定蛋白質(zhì)構(gòu)成。
加帽 capping
指在RNA轉(zhuǎn)錄本5’端連接上一個7-甲基鳥苷酸摊溶,封閉RNA的5’端爬骤,保護RNA轉(zhuǎn)錄本免受磷酸酶和核酸酶消化,增加穩(wěn)定性莫换。加尾 tailing
RNA轉(zhuǎn)錄本3’端在腺苷酸聚合酶作用下霞玄,經(jīng)多聚腺苷酸化 polyadenylation 附加大約200個腺苷酸的長鏈,即多聚腺苷酸 polyA 尾拉岁。增加了mRNA穩(wěn)定性坷剧,有利于核糖體識別。- 位置在3’非編碼區(qū)6核苷酸信號AAUAAA的下游15-30bp的位置加上polyA喊暖。
翻譯 translation
mRNA中間序列被翻譯為氨基酸惫企,5’和3’端是非翻譯區(qū) UTR,多數(shù)為第一和最后外顯子序列陵叽,含有加帽和加尾序列狞尔。
翻譯過程
多肽鏈是在mRNA、tRNA和核糖體協(xié)作下完成巩掺。核糖體是一個rRNA-Protein復(fù)合物偏序,由60s和40s亞基構(gòu)成。- 小亞基識別mRNA 5’的帽胖替,沿序列移動到第一個起始密碼子AUG研儒,特別是,當(dāng)AUG位于起始密碼子識別序列GCCPuCCAUGG時才可以有效識別独令,尤其是AUG后的G端朵,以及之前第三個核苷酸的嘌呤Pu,最好是A燃箭。
- 多種tRNA攜帶不同的氨基酸逸月,tRNA上的反密碼子與mRNA上的密碼子識別互補,大小亞基結(jié)合合成肽鏈遍膜。直至終止密碼子 UAA\UAG\UGA碗硬。
- 這個過程是多枚核糖體同時進行的瓤湘,可形成多種肽鏈。mRNA 5’端對應(yīng)氨基末端 NH2恩尾;3’端對應(yīng)羧基端 COOH
遺傳密碼的兼并性
密碼子共64個弛说,但氨基酸僅20種,因此翰意,不同密碼子編碼同一種氨基酸的特性稱為遺傳密碼子的兼并性 degeneracy木人。- 此外,mRNA的密碼子64個冀偶,細胞質(zhì)tRNA的反密碼子有30個醒第,線粒體的tRNA的反密碼子有22個。但翻譯的過程仍可正常進行进鸠。因此稠曼,有觀點認為存在搖擺假說 wobble hypothesis,即第一和二堿基遵循A-U客年,G-C規(guī)律霞幅,第三堿基可以發(fā)生搖擺。
翻譯后修飾
多肽鏈在翻譯后會發(fā)生復(fù)雜的修飾量瓜。有脫乙跛究遥基、乙跎馨粒化扔傅、磷酸化、糖基化和切割烫饼,以及多條肽鏈的折疊連接等铅鲤。
這部分是分子生物學(xué)的內(nèi)容,所以很簡單枫弟。也有一些名詞被改變。
基因表達與調(diào)控
多數(shù)細胞中都表達的基因稱為管家基因 housekeeping gene鹏往。
組蛋白乙醯化與DNA甲基化
細胞核中的染色質(zhì)分為常染色質(zhì)和異染色質(zhì)兩種(舊名詞),現(xiàn)多按有無轉(zhuǎn)錄活性進行區(qū)別伊履。前者松弛韩容,與組蛋白結(jié)合弱,在S期早期復(fù)制唐瀑;后者致密群凶,與組蛋白結(jié)合緊密,在S期晚期復(fù)制哄辣。- 組蛋白乙跚肷遥化后赠尾,對DNA親和力下降,使染色質(zhì)松弛毅弧,適合基因表達气嫁;基因啟動子區(qū)的CpG序列出現(xiàn)甲基化后,會與甲基化CpG結(jié)合蛋白 MeCP2 結(jié)合够坐,抑制基因的表達寸宵。
順式作用元件與反式作用因子
- 基因啟動子區(qū)的保守序列能與TF特異性結(jié)合,調(diào)節(jié)基因轉(zhuǎn)錄元咙,這些元件稱為順式作用元件 cis-acting element梯影,位于5’端側(cè)翼序列。
- 轉(zhuǎn)錄因子可以結(jié)合到這些序列庶香,稱為反式作用因子 trans-acting factor甲棍。TF之間也有復(fù)雜的作用,結(jié)構(gòu)中都有一些相似的結(jié)構(gòu)域基序脉课,是蛋白與cis-acting element作用的基礎(chǔ)救军。
- 根據(jù)結(jié)構(gòu)域基序的不同,TF分為四種:
1)螺旋-轉(zhuǎn)角-螺旋蛋白 helix-turn-helix 倘零,一個氨基酸鍛煉鏈接兩個α螺旋結(jié)構(gòu)
2)鋅指蛋白 zinc finger
3)亮氨酸拉鏈蛋白 leucine zipper
4)螺旋-環(huán)-螺旋蛋白 helix-loop-helix
- 根據(jù)結(jié)構(gòu)域基序的不同,TF分為四種:
剪接與多聚核苷酸化
一個基因的轉(zhuǎn)錄本可以通過剪接改變形成許多異構(gòu)蛋白唱遭。參與主要調(diào)節(jié)因子是RNA結(jié)合蛋白的SR家族(C端含絲氨酸和精氨酸);還有一些snRNP蛋白呈驶。
此外拷泽,某些基因的轉(zhuǎn)錄本的3’UTR區(qū)可能存在多個多聚腺苷酸信號,體現(xiàn)了組織特異性袖瞻,發(fā)揮不同的作用司致。
所謂順式,反式的概念來自經(jīng)典遺傳學(xué)聋迎,也就是發(fā)現(xiàn)基因之前的遺傳學(xué)脂矫。這些概念表達的是一種現(xiàn)象,而不是機理霉晕。所以某些被保留庭再,某些被廢除(同一種現(xiàn)象下,機理可能不同)牺堰。當(dāng)初讓我困惑了好久拄轻。TF是細胞內(nèi)重要的信號分子,相關(guān)的文獻讀起來會很吃力伟葫。