基礎(chǔ)知識(shí) — Exons,Introns,ORF,CDS,UTR,lncRNA,轉(zhuǎn)錄本,可變剪切,密碼子,啟動(dòng)子,順式調(diào)控元件,轉(zhuǎn)錄起始位點(diǎn),終止子,轉(zhuǎn)錄因子,結(jié)構(gòu)基因

?1.核酸,基因疟暖,DNA卡儒,染色體,基因組俐巴,同源染色體骨望,等位基因

????核酸,基因欣舵,DNA擎鸠,染色體

????核酸:一種通常位于細(xì)胞核內(nèi)的大型生物分子,主要負(fù)責(zé)生物體遺傳信息的攜帶和傳遞缘圈。核酸有兩大類劣光,分別是脫氧核糖核酸(DNA)和核糖核酸(RNA)。核酸的單體結(jié)構(gòu)為核苷酸糟把。每一個(gè)核苷酸分子由三部分組成:一個(gè)五碳糖绢涡、一個(gè)含氮堿基(A,T,C,G,U)和一個(gè)磷酸基。如果五碳糖是脫氧核糖則為脫氧核糖核苷酸遣疯,此單體之聚合物是DNA雄可。如果其五碳糖是核糖則為核糖核苷酸,此單體之聚合物是RNA。? ? ? ??

????基因(gene):是指一段能夠編碼基因產(chǎn)物(RNA或蛋白質(zhì))的核苷酸序列(ATCG)数苫。能編碼出蛋白質(zhì)的是編碼基因聪舒,能編碼出RNA的是非編碼基因。弄清其序列本身的過程叫基因測(cè)序虐急。基因產(chǎn)物可以是蛋白質(zhì)(蛋白質(zhì)編碼基因)及RNA过椎,從而控制生物個(gè)體的性狀(差異)表現(xiàn)。在一個(gè)個(gè)體當(dāng)中所有的基因總和叫基因組戏仓。在一個(gè)物種中所有等位基因的總合叫基因庫疚宇。在大多數(shù)真核生物中,基因分為細(xì)胞核基因及線粒體基因赏殃,綠色植物的葉綠體也含有獨(dú)立于細(xì)胞核的葉綠體基因組敷待。

????在某一細(xì)胞類型當(dāng)中所有被表達(dá)的基因叫轉(zhuǎn)錄組,所有編碼蛋白質(zhì)的基因叫蛋白質(zhì)組仁热。

????管家基因:在生物體生命的全過程都是必須的榜揖,且在一個(gè)生物個(gè)體的幾乎所有細(xì)胞中持續(xù)表達(dá)的基因。

????C值悖論:物種的基因組大小與遺傳復(fù)雜性并不是線性關(guān)系抗蠢,與進(jìn)化的復(fù)雜性也并不一致举哟。

? ??DNA:是一種生物大分子,由四種脫氧核苷酸分子按照一定數(shù)目和順序組合而成,是一條長(zhǎng)鏈分子⊙该基因則是DNA分子上具有遺傳效應(yīng)的DNA片段(一般來說)妨猩。一個(gè)DNA分子上有很多個(gè)基因。

? ??DNA復(fù)制:以DNA為模板秽褒,在DNA聚合酶的催化作用下壶硅,將四種游離的dNTP(ATCG)按照堿基互補(bǔ)配對(duì)原則合成新鏈DNA,DNA復(fù)制:模板為雙鏈DNA,合成的新鏈與模板鏈一模一樣销斟,原料為四種dNTP庐椒,為半保留復(fù)制。

脫氧核苷酸是DNA的基本組成單位蚂踊,基因是DNA上有遺傳效應(yīng)的DNA片段约谈,DNA是染色體上的存在物±缰樱基因是直線排列在染色體上棱诱。

基因是具有遺傳效應(yīng)的DNA片段,存在于DNA上特纤,真核生物的DNA存在于染色體上军俊,基因是構(gòu)成染色體的最小單位,染色體只能存在于真核生物的細(xì)胞核中捧存。基因存在于細(xì)胞核和細(xì)胞質(zhì)中,也存在于真核生物和原核生物中昔穴,真核生物的DNA存在于細(xì)胞核镰官、葉綠體和線粒體中。

相互關(guān)系

? ??染色質(zhì):由組蛋白和 DNA 組成吗货,147 個(gè)堿基對(duì)的 DNA 纏繞在 8 個(gè)核心組蛋白周圍泳唠,形成基本染色質(zhì)單元,即核小體宙搬。

????染色質(zhì)的功能是將 DNA 高效包裝成小體積笨腥,以適合進(jìn)入細(xì)胞的細(xì)胞核,保護(hù) DNA 結(jié)構(gòu)和序列勇垛。將 DNA 包裝到染色質(zhì)中可確保有絲分裂和減數(shù)分裂脖母,防止染色體斷裂,并控制基因表達(dá)和 DNA 復(fù)制闲孤。

染色質(zhì)形成

????DNA 纏繞在組蛋白周圍谆级,形成核小體;核小體再結(jié)合成染色質(zhì)纖維讼积。1)未包裝的 DNA肥照。2)DNA 纏繞組蛋白八聚體,形成核小體勤众。3)核小體壓縮成染色質(zhì)纖維舆绎。

????異染色質(zhì)是染色質(zhì)的 緊密排列 形式,可以沉默基因轉(zhuǎn)錄们颜。異染色質(zhì)構(gòu)成 著絲粒亿蒸、端粒、中心周圍區(qū)域和富含重復(fù)序列的區(qū)域掌桩。常染色質(zhì) 凝縮 較少边锁,含有活性最強(qiáng)的轉(zhuǎn)錄基因〔ǖ海可看下圖理解常染色質(zhì)和異染色質(zhì)茅坛。

??端粒(Telomere):存在于真核細(xì)胞線狀染色體末端的一小段DNA-蛋白質(zhì)復(fù)合體,作用是保持染色體的完整性和控制細(xì)胞分裂周期则拷。端粒贡蓖、著絲粒和復(fù)制原點(diǎn)是染色體保持完整和穩(wěn)定的三大要素。端粒學(xué)說:處于染色體末端的端粒會(huì)隨著細(xì)胞的分裂復(fù)制不斷縮短煌茬,直至臨界長(zhǎng)度斥铺,此時(shí)細(xì)胞失去活性而死亡,因此端粒的縮短意味著細(xì)胞的衰老坛善。

? ? 著絲粒:又稱中節(jié)晾蜘,?染色質(zhì)的結(jié)構(gòu)邻眷,將染色體分成分為短臂(p)和長(zhǎng)臂(q),主要作用是使復(fù)制的染色體在有絲分裂和減數(shù)分裂中可均等地分配到子細(xì)胞中剔交。由高度重復(fù)的異染色質(zhì)組成肆饶,其主要成分為DNA和蛋白質(zhì)。

????在很多高等真核生物中岖常,著絲裂蹦鳎看起來像是在染色體一個(gè)點(diǎn)上的濃縮區(qū)域,這個(gè)區(qū)域包含著絲點(diǎn)竭鞍,又稱主縊痕板惑。著絲粒和動(dòng)粒是存在于主縊痕的兩個(gè)特殊結(jié)構(gòu)。中期染色體的兩條姐妹染色單體的連接處偎快,有一向內(nèi)凹陷冯乘、著色較淺的縊痕,稱為主縊痕(初級(jí)縊痕primary constriction)滨砍。

????隨體(satellite):位于染色體末端的往湿、圓形或圓柱形的染色體片段, 通過 次縊痕 與染色體主要部分相連惋戏,主要由異染色質(zhì)組成领追,含高度重復(fù)的DNA序列,不具有常染色質(zhì)的功能活性响逢。

????基因組绒窑,同源染色體,等位基因

????基因組:細(xì)胞或生物體的一套完整單倍體的遺傳物質(zhì)總和舔亭。

????單倍體:物種的細(xì)胞中只有一套染色體的為單倍體些膨。(例:人的精子和未受精的卵子中都只有一套23條染色體,精子細(xì)胞和未受精的卵子細(xì)胞為單倍體)

????雙倍體:物種的細(xì)胞中有兩套染色體的為雙倍體钦铺。(例:人的體細(xì)胞有23對(duì)共46條染色體订雾,每23條為一套,人的體細(xì)胞為雙倍體)

????多倍體:細(xì)胞中有n套染色體的為多倍體(n大于或等于3)矛洞。

????同源染色體:

????國外教材:真核生物體細(xì)胞中成對(duì)存在的染色體稱為同源染色體洼哎。一對(duì)同源染色體上有控制同一性狀的基因,這些基因的排列順序相同沼本,等位基因之間具有相似的序列噩峦,所以一對(duì)同源染色體彼此具有高度相似的序列,但不一定完全相同抽兆。

????國內(nèi)教材:同源染色體在二倍體生物細(xì)胞中识补,形態(tài)、結(jié)構(gòu)基本相同辫红,在減數(shù)第一次分裂的四分體時(shí)期中彼此聯(lián)會(huì)(若是三倍體及其他奇數(shù)倍體生物細(xì)胞凭涂,聯(lián)會(huì)時(shí)會(huì)發(fā)生紊亂)祝辣,在這一對(duì)染色體其中的一條來自母方,另一條來自父方导盅。

????染色體組:一組非同源染色體较幌,攜帶著控制生物體生長(zhǎng)揍瑟,發(fā)育白翻,遺傳和變異的一套信息。

????交叉互換:在四分體時(shí)期绢片,非姐妹染色單體之間發(fā)生交叉互換滤馍,導(dǎo)致基因重組。

1和2底循,3和4 分別是同源染色體巢株,1.1和1.2 是姐妹染色單體

????區(qū)分同源染色體與姐妹染色單體:姐妹染色單體是由一個(gè)著絲點(diǎn)連著的兩條染色單體,是在細(xì)胞分裂的間期由同一條染色體經(jīng)復(fù)制后形成的熙涤,兩條染色單體的DNA序列完全一致阁苞。它們形狀大小,DNA序列完全相同(不考慮復(fù)制出差錯(cuò))祠挫,但并非一條來自父方那槽、一條來自母方,所以姐妹染色單體不是同源染色體等舔。同源染色體的兩條單體的DNA序列不相同骚灸,并且分別來源于父母體。

? ??等位基因:在真核生物中慌植,染色體在體細(xì)胞中是成對(duì)存在的甚牲。每條染色體上都帶有一定數(shù)量的基因。等位基因(allele)蝶柿,是指位于一對(duì)同源染色體相同位置上控制同一性狀不同形態(tài)的基因丈钙。等位基因依所攜帶性狀的表現(xiàn),又可分為顯性基因A和隱性基因a交汤。每個(gè)個(gè)體分別遺傳自父方和母方的等位基因的不同雏赦,兩等位基因 A 和 a 四種組合方式,決定表現(xiàn)出來的性狀也就不同蜻展,所以生物與生物之間長(zhǎng)得就有一樣之處也有不一樣之處喉誊。

2.轉(zhuǎn)錄,翻譯纵顾,mRNA伍茄,轉(zhuǎn)錄組,轉(zhuǎn)錄本施逾,可變剪切敷矫,最長(zhǎng)轉(zhuǎn)錄本例获,lncRNA

????基因表達(dá):生物基因組中結(jié)構(gòu)基因所攜帶的遺傳信息經(jīng)過轉(zhuǎn)錄、翻譯等一系列過程曹仗,合成特定的蛋白質(zhì)榨汤,進(jìn)而發(fā)揮其特定生物學(xué)功能和生物學(xué)效應(yīng)的全過程。說白了基因表達(dá)就是轉(zhuǎn)錄怎茫,翻譯收壕。

? ??轉(zhuǎn)錄:遺傳信息從DNA流向RNA的過程。即以雙鏈DNA中的確定的模板鏈(模板鏈用于轉(zhuǎn)錄轨蛤,編碼鏈不用于轉(zhuǎn)錄)為模板蜜宪,以A,U,C,G四種核糖核苷酸為原料,在RNA聚合酶催化下合成RNA的過程祥山。合成的新鏈除了把DNA上的T改為U外圃验,其他與編碼鏈一樣。生成的mRNA攜有的密碼子缝呕,進(jìn)入核糖體后實(shí)現(xiàn)蛋白質(zhì)的合成澳窑。

????轉(zhuǎn)錄僅以DNA的一條鏈作為模板,被選為模板的單鏈稱為模板鏈供常,亦稱無義鏈摊聋;另一條單鏈稱為非模板鏈,即編碼鏈话侧,因編碼鏈與轉(zhuǎn)錄生成的RNA序列T變?yōu)閁外其他序列一致栗精,所以又稱有義鏈。

? ? 翻譯:以mRNA為模板瞻鹏,在核糖體內(nèi)合成蛋白質(zhì)悲立。原料為20種游離的氨基酸,3個(gè)堿基決定一個(gè)氨基酸新博。將成熟的mRNA分子(由DNA通過轉(zhuǎn)錄而生成)中“堿基的排列順序” 解碼薪夕,生成對(duì)應(yīng)的特定氨基酸序列的過程。但轉(zhuǎn)錄生成的非編碼RNA赫悄,如長(zhǎng)鏈非編碼RNA(lncRNA)原献、轉(zhuǎn)運(yùn)RNA(tRNA)、核糖體RNA(rRNA)和小核RNA(snRNA)等并不被翻譯為氨基酸序列埂淮。

? ??譯過程需要的原料:mRNA姑隅、tRNA、20種氨基酸倔撞、能量讲仰、酶、核糖體痪蝇。翻譯的過程大致可分作三個(gè)階段:起始鄙陡、延長(zhǎng)冕房、終止。

????翻譯主要在細(xì)胞質(zhì)內(nèi)的核糖體中進(jìn)行趁矾,氨基酸分子在氨基酰-tRNA合成酶的催化作用下與特定的轉(zhuǎn)運(yùn)RNA(tRNA)結(jié)合并被帶到核糖體上耙册。生成的多肽鏈(即氨基酸鏈)需要通過正確折疊形成蛋白質(zhì),許多蛋白質(zhì)在翻譯結(jié)束后還需要在內(nèi)質(zhì)網(wǎng)上進(jìn)行翻譯后修飾才能具有真正的生物學(xué)活性毫捣。

????mRNA:messengerRNA详拙,信使RNA是由DNA經(jīng)hnRNA剪接而成,攜帶遺傳信息的能指導(dǎo)蛋白合成的一類單鏈核糖核酸培漏。 在細(xì)胞內(nèi)溪厘,mRNA通過核糖體的翻譯作用胡本,將基因編碼的信息轉(zhuǎn)化為氨基酸序列牌柄,從而合成相應(yīng)的蛋白質(zhì)。

? ??反義RNA:堿基序列正好與有意義的 mRNA 互補(bǔ)的 RNA侧甫。

? ??轉(zhuǎn)錄組:一般是指從細(xì)胞或組織的基因組所轉(zhuǎn)錄出來的RNA的總和珊佣,包括編碼蛋白質(zhì)的mRNA和各種非編碼RNA? ??(rRNA,tRNA,snRNA,snoRNA,lncRNA,microRNA等)

? ??轉(zhuǎn)錄本:是指由一條基因通過轉(zhuǎn)錄,由于可變剪切形成的一種或多種可供編碼蛋白質(zhì)的成熟mRNA(狹義)非編碼RNA(Non-coding RNA)如lncRNA也有轉(zhuǎn)錄本的說法

????tRNA(轉(zhuǎn)運(yùn)RNA):tRNA是一種較小的RNA分子披粟,其主要功能是將mRNA編碼的氨基酸序列轉(zhuǎn)運(yùn)到核糖體上咒锻,幫助合成蛋白質(zhì)。tRNA分子上有與氨基酸對(duì)應(yīng)的“反密碼子”守屉,通過與mRNA上的密碼子互補(bǔ)配對(duì)惑艇,確保核糖體合成蛋白質(zhì)時(shí)按正確的順序添加氨基酸。

????rRNA(核糖體RNA):rRNA是構(gòu)成核糖體的RNA分子拇泛,核糖體是細(xì)胞中負(fù)責(zé)蛋白質(zhì)合成的重要器官滨巴。rRNA通過與蛋白質(zhì)相互作用,形成核糖體的功能中心俺叭,具有將tRNA和mRNA組裝在一起恭取,并促進(jìn)氨基酸的連接,從而合成蛋白質(zhì)的作用熄守。

????蛋白質(zhì):蛋白質(zhì)是基因表達(dá)的最終產(chǎn)物蜈垮,承擔(dān)著細(xì)胞結(jié)構(gòu)和功能的重要作用。蛋白質(zhì)的合成依賴于mRNA裕照、tRNA和rRNA的協(xié)同作用攒发,經(jīng)過翻譯過程從氨基酸序列合成成形。不同的蛋白質(zhì)在細(xì)胞中扮演著不同的功能晋南,包括酶的催化惠猿、結(jié)構(gòu)支撐、免疫應(yīng)答等多種生物學(xué)功能搬俊。

? ??可變剪切(Alternative splicing):一條未經(jīng)剪接的前體hnRNA紊扬,要將非編碼蛋白質(zhì)的內(nèi)含子(intron)切除(并不是所有長(zhǎng)度的內(nèi)含子都被切除了蜒茄,對(duì)應(yīng)可變剪切類型之一內(nèi)含子保留,retained Intron與兩側(cè)的外顯子一起形成了新的外顯子)餐屎,同一基因中的很多個(gè)外顯子以不同形式進(jìn)行隨機(jī)組合(在剪切的過程中是有可能剪切掉一些外顯子的)檀葛,使一個(gè)基因在不同時(shí)間、不同環(huán)境中能夠制造出不同的蛋白質(zhì)腹缩,增加生理狀況下系統(tǒng)的復(fù)雜性或適應(yīng)性屿聋。這個(gè)過程有多種多樣的剪切和拼接方式(選擇不同的剪接位點(diǎn)),從而產(chǎn)生不同的剪切異構(gòu)體(isoform)藏鹊。

? ??7種可變剪切類型:https://www.biowolf.cn/m/view.php?aid=258

????理論上润讥,來自成熟mRNA的reads應(yīng)該比對(duì)到外顯子區(qū)。但是盘寡,由于基因組注釋水平高低或者可變剪切導(dǎo)致的內(nèi)含子序列保存(內(nèi)含子保留RI)楚殿,以及很多RNA(比如lncRNA)就來自基因間區(qū)和內(nèi)含子,因此有比對(duì)到內(nèi)含子和基因間區(qū)的reads竿痰。受物種等的影響RNA-seq測(cè)序reads數(shù)外顯子覆蓋所占比例不同脆粥,一般情況下外顯子區(qū)域所占比例超過70%即比較理想。

? ??最長(zhǎng)轉(zhuǎn)錄本:由于可變剪切一個(gè)基因得到好多個(gè)序列長(zhǎng)度不同的轉(zhuǎn)錄本影涉,應(yīng)該挑選出序列最長(zhǎng)的最長(zhǎng)轉(zhuǎn)錄本作為數(shù)據(jù)的分析

? ??lncRNA:和mRNA一樣变隔,是由對(duì)應(yīng)的基因轉(zhuǎn)錄而成,通過剪接形成成熟體的lncRNA蟹倾,具有5'帽子和poly尾巴(有些會(huì)沒有)匣缘。同一基因可以形成不同的轉(zhuǎn)錄本的lncRNA。在lncRNA所對(duì)應(yīng)的的DNA序列上鲜棠,包含內(nèi)含子和外顯子肌厨,轉(zhuǎn)錄之后的轉(zhuǎn)錄本,經(jīng)過剪接等作用岔留,外顯子夏哭,內(nèi)含子拼接到一起成為一個(gè)成熟的lncRNA(lncRNA對(duì)應(yīng)的轉(zhuǎn)錄本剪切會(huì)保留內(nèi)含子)。但是它因?yàn)槿狈勺R(shí)別的閱讀框献联,所以不表達(dá)蛋白竖配。

編碼基因和非編碼基因

? ??除了用于指導(dǎo)合成蛋白的基因,即通常所說的編碼基因里逆,還有終產(chǎn)物是RNA的基因进胯;后者不指導(dǎo)生成蛋白質(zhì),而是以RNA的形式起作用原押,常被稱為非編碼基因胁镐。非編碼基因通常起調(diào)控作用。

https://www.163.com/dy/article/DLG3JSU2051488M7.html

?

3.外顯子,內(nèi)含子

? ??基因DNA分為編碼區(qū)和非編碼區(qū)盯漂,編碼區(qū)包含外顯子和內(nèi)含子颇玷,非編碼區(qū)包括前導(dǎo)區(qū)(5‘UTR)、尾部區(qū)(3‘UTR)就缆、調(diào)控區(qū)帖渠,調(diào)控區(qū)又包括啟動(dòng)子、增強(qiáng)子竭宰、終止子等空郊。真核生物非編碼區(qū)位于編碼區(qū)的上游和下游,故又稱側(cè)翼序列切揭。編碼區(qū)則轉(zhuǎn)錄為mRNA并最終翻譯成蛋白質(zhì)狞甚。真核生物的基因含有外顯子和內(nèi)含子,是前者區(qū)別原核生物的特征之一廓旬。

? ??基因轉(zhuǎn)錄之后哼审,首先是形成前體mRNA(或pre-mRNA),通過剪切內(nèi)含子連接外顯子嗤谚,5’端加帽及3’端加尾之后形成成熟的mRNA棺蛛。真正編碼蛋白質(zhì)的是外顯子,內(nèi)含子無編碼功能巩步。內(nèi)含子存在于DNA中,在轉(zhuǎn)錄的過程中桦踊,DNA上的內(nèi)含子也會(huì)被轉(zhuǎn)錄到前體RNA中椅野,但前體RNA上的內(nèi)含子會(huì)在RNA離開細(xì)胞核進(jìn)行翻譯前被切除。

? ??內(nèi)含子和外顯子的概念都是針對(duì)DNA序列而不是RNA序列的籍胯。內(nèi)含子和外顯子的分界線在于:GU-AG法則竟闪。即每個(gè)內(nèi)含子的開始兩個(gè)堿基都是GU(或GT),最后兩個(gè)是AG杖狼。

? ??基因經(jīng)過轉(zhuǎn)錄形成Pre mRNA炼蛤,這里面包含著內(nèi)含子和外顯子(5端是以外顯子打頭,但是這段外顯子不僅包含CDS蝶涩,還包含5' UTR理朋;3端是以外顯子結(jié)束,但是這段外顯子不僅包含CDS绿聘,還包含3' UTR)嗽上,經(jīng)過剪接形成成熟mRNA,內(nèi)含子已減掉胁编,如果拋開后來加上去的cap和poly A的話级乐,這時(shí)全是外顯子,但是不全是CDS屡律,因?yàn)橹挥兄虚g的那部分以起始密碼子AUG開始、以終止密碼子結(jié)束的片段才是CDS浅萧,只有這部分才會(huì)被翻譯成蛋白質(zhì)逐沙。

??外顯子拼接形成成熟的mRNA,mRNA的長(zhǎng)度要大于CDS洼畅,只有CDS才編碼蛋白酱吝,即 外顯子不一定都能翻譯成蛋白: mRNA包括UTR和CDS

? ?外顯子與CDS區(qū)不是完全一致的,cds區(qū)一定屬于外顯子土思,但是外顯子不一定是CDS區(qū)务热,可能還包括UTR

? ??一個(gè)外顯子經(jīng)常編碼蛋白的一個(gè)蛋白質(zhì)結(jié)構(gòu)域。蛋白質(zhì)結(jié)構(gòu)域(protein domain)是蛋白質(zhì)中的一類結(jié)構(gòu)單元己儒,是構(gòu)成蛋白質(zhì)(三級(jí))結(jié)構(gòu)的基本單元崎岂。


4.ORF,CDS闪湾,起始密碼子冲甘,終止密碼子

? ??CDS Sequence :蛋白質(zhì)編碼區(qū)?coding for amino acids in protein ,是編碼一段蛋白產(chǎn)物的序列途样,是結(jié)構(gòu)基因組學(xué)術(shù)語江醇。它就是與蛋白序列一一對(duì)應(yīng)的DNA序列,并且序列中間不存在其他與蛋白無關(guān)的序列何暇,即:

? ??CDS沒有任何內(nèi)含子陶夜,5‘UTR,3‘UTR

????ORF 開放閱讀框:Open Reading Frame裆站。是從一個(gè)起始密碼子開始到一個(gè)終止密碼子結(jié)束的一段序列条辟,它是理論上的蛋白編碼區(qū),一般是先在DNA序列中尋找起始密碼子(AUG)對(duì)應(yīng)的序列ATG宏胯,然后按每3個(gè)堿基一組(密碼子以三個(gè)堿基為一單位)向后延伸羽嫡,一直到出現(xiàn)終止密碼子(UAG、UGA肩袍、UAA)對(duì)應(yīng)的序列杭棵。

????由于密碼子讀寫起始位點(diǎn)的不同,mRNA序列可能按六種ORF閱讀和翻譯(每條鏈三種氛赐,對(duì)應(yīng)三種不同的起始位點(diǎn))魂爪。在6種潛在ORF中,一般選擇中間沒有被終止密碼子隔開的最大的閱讀框?yàn)檎_結(jié)果鹰祸。(可能不好懂甫窟,舉個(gè)例子

? ??CDS與開放閱讀框ORF的區(qū)別:CDS可以是開放閱讀框(ORF)的子集。

? ? 負(fù)責(zé)翻譯的DNA區(qū)域合起來就是ORF序列蛙婴,而轉(zhuǎn)錄本逆轉(zhuǎn)錄就是cDNA序列

????密碼子(codon)是指 mRNA 分子中每相鄰的三個(gè)核苷酸編成一組粗井,在蛋白質(zhì)合成時(shí),代表某一種氨基酸的規(guī)律。

????信使RNA在細(xì)胞中能決定蛋白質(zhì)分子中的氨基酸種類和排列次序浇衬。mRNA分子中的四種核苷酸(堿基)的序列(AUCG)能決定蛋白質(zhì)分子中的20種氨基酸的序列懒构。而在信使RNA分子上的三個(gè)堿基能決定一個(gè)氨基酸。

????密碼子的簡(jiǎn)并性:分子生物學(xué)中耘擂,同一種氨基酸具有兩個(gè)或更多個(gè)密碼子的現(xiàn)象稱為密碼子的簡(jiǎn)并性(degeneracy)胆剧。對(duì)應(yīng)于同一種氨基酸的不同密碼子稱為同義密碼子(synonymous codon),只有色氨酸與甲硫氨酸僅有1個(gè)密碼子醉冤。

? ??起始密碼子和終止密碼子都是mRNA上的三聯(lián)體堿基序列秩霍,分別決定翻譯的起始和終止。

? ??起始密碼子 start codon:指定 mRNA 上開始合成蛋白質(zhì)的密碼子蚁阳,也是第一個(gè)被核糖體翻譯的mRNA上的密碼子铃绒,位于編碼區(qū)內(nèi),緊鄰5′UTR螺捐。較為常見的起始密碼子是AUG颠悬。

? ??起始密碼子 start codon 和起始子 Initiator 不是一個(gè)概念。真核生物中蛋白質(zhì)編碼基因的核心啟動(dòng)子元件有4類:傳統(tǒng)的TATA盒定血、上游核心啟動(dòng)子元件BRE赔癌、下游啟動(dòng)子元件DPE和起始子(initiator,Inr)澜沟。Initiator元件指的是一段富含嘧啶的序列——PyPyA+1NT/ApyPy灾票,轉(zhuǎn)錄起始位點(diǎn)位于其中的+1位。

? ??終止密碼子 stop codon:終止肽鏈合成的信使核糖核酸(mRNA)的三聯(lián)體堿基序列倔喂,UAA铝条、UAG和UGA,它們不編碼氨基酸席噩。

5.UTR

? ??UTR? ?Untranslated Regions 非翻譯區(qū),代表Exon的非蛋白質(zhì)編碼部分贤壁, mRNA 分子兩端的非蛋白編碼片段

????5'-UTR從mRNA起點(diǎn)的 甲基化鳥嘌呤核苷酸帽 延伸至 AUG起始密碼子

????3'-UTR從編碼區(qū)末端的 終止密碼子 延伸至 多聚A尾巴(Poly-A)的前端

下圖為DNA直接轉(zhuǎn)錄產(chǎn)物(hnRNA)不含非編碼區(qū)含有內(nèi)含子

DNA直接轉(zhuǎn)錄產(chǎn)物(hnRNA)
真核生物基因結(jié)構(gòu)示意圖(順序=序列)
真核生物基因結(jié)構(gòu)示意圖


6. 基因組學(xué)文件說明悼枢,從基因組注釋文件整理出基因蛋白編碼區(qū)、起始密碼子上游幾KB和內(nèi)含子信息gff3文件

? ??genome.fasta? ? 即基因組每條染色體/scanffold/contig的DNA序列(ATCG)

????final.gene.longest.gff3????基因組 gff 注釋文件? ??一般基因的位置信息與mRNA位置信息相同脾拆,就只包括了5‘UTR到3‘UTR之間的區(qū)域(即只包括編碼區(qū)不包括非編碼區(qū)),注釋文件中也可能會(huì)有一些基因?5‘UTR馒索,3‘UTR區(qū)域鑒定不出來沒有細(xì)寫

????final.gene.longest.gff3.transcript.fa? ? 即最長(zhǎng)轉(zhuǎn)錄本每條轉(zhuǎn)錄本對(duì)應(yīng)的每個(gè)基因的核苷酸序列 (ATCG)

????final.gene.longest.gff3.cds.fa????即最長(zhǎng)轉(zhuǎn)錄本每條轉(zhuǎn)錄本對(duì)應(yīng)的編碼蛋白質(zhì)的核苷酸序列(ATCG)

????final.gene.longest.gff3.pep.fa????即最長(zhǎng)轉(zhuǎn)錄本每條轉(zhuǎn)錄本的CDS序列翻譯出來的蛋白序列(氨基酸序列)(CLESRKVFVG等)

? ??用python從基因組注釋文件(gff3格式)整理出基因蛋白編碼區(qū)、起始密碼子上游幾KB和內(nèi)含子信息的gff3文件(這里的起始密碼子上游幾KB尋找代碼用要注意名船,作者注釋文件中mRNA的起始位置和第一個(gè)CDS起始位置一致绰上,即無5‘UTR信息)


7.非編碼區(qū),調(diào)控區(qū)渠驼,啟動(dòng)子蜈块,終止子,回文序列

? ??非編碼區(qū)(Non-coding region)是不能夠轉(zhuǎn)錄為相應(yīng)信使RNA,不能指導(dǎo)蛋白質(zhì)合成(也就是不能編碼蛋白質(zhì))的區(qū)段百揭。非編碼區(qū)位于編碼區(qū)前后爽哎,同屬于一個(gè)基因,控制基因的表達(dá)和強(qiáng)弱器一。真核生物非編碼區(qū)位于編碼區(qū)的上游和下游课锌,故又稱側(cè)翼序列。

????側(cè)翼序列(非編碼區(qū))包括前導(dǎo)區(qū)(5‘UTR)祈秕、尾部區(qū)(3‘UTR)渺贤、調(diào)控區(qū)。側(cè)翼序列(非編碼區(qū))雖然不能編碼蛋白質(zhì)请毛,但一般非編碼區(qū)具有調(diào)控基因表達(dá)的功能志鞍。

? ??調(diào)控區(qū)又稱調(diào)控序列調(diào)控序列(Regulatory sequence)可以是DNA中的啟動(dòng)子获印、終止子述雾、增強(qiáng)子、沉默子兼丰,以及一些調(diào)節(jié)蛋白(如轉(zhuǎn)錄因子)附著位點(diǎn)的核酸片段玻孟。這些序列調(diào)控了基因的表達(dá),進(jìn)而影響蛋白質(zhì)的合成鳍征,調(diào)節(jié)轉(zhuǎn)錄的水平黍翎。

? ??順式作用(順式調(diào)控):cis-acting,同一染色體上的DNA序列直接調(diào)控其他鄰近基因的表達(dá)艳丛。即DNA對(duì)DNA匣掸,強(qiáng)調(diào)的是距離近,并且是DNA對(duì)DNA的調(diào)控氮双。常見的順式調(diào)控元件是啟動(dòng)子碰酝,增強(qiáng)子,沉默子戴差,絕緣子等? ??

????反式作用(反式調(diào)控):trans-acting送爸,DNA通過其產(chǎn)物(mRNA或蛋白質(zhì))間接調(diào)節(jié)基因的表達(dá)。用以描述基因元件的專有名詞暖释,如阻遏物基因與轉(zhuǎn)錄因子基因袭厂,它們可以影響位于不同染色體上的其他基因。這些反式作用基因通過產(chǎn)生能遠(yuǎn)距離作用的可擴(kuò)散物質(zhì)發(fā)揮功能球匕。

????順式調(diào)控元件(cis-regulatory elements):CREs纹磺, 能影響基因表達(dá),但不編碼RNA和蛋白質(zhì)的DNA序列亮曹。

????按功能特性橄杨,真核基因順式調(diào)控元件分為啟動(dòng)子秘症、增強(qiáng)子、沉默子讥珍、絕緣子历极。

????順式調(diào)控元件可以為反式作用因子提供結(jié)合位點(diǎn), 當(dāng)反式作用因子結(jié)合到順式調(diào)控元件的序列上衷佃, 轉(zhuǎn)錄調(diào)控將順利進(jìn)行趟卸, 轉(zhuǎn)座元件可以插入順式調(diào)控元件的序列之中破壞轉(zhuǎn)錄因子的結(jié)合位點(diǎn)來阻止它結(jié)合到對(duì)應(yīng) DNA 序列上, 造成基因的異常表達(dá)

????反式作用因子:能識(shí)別和結(jié)合特定的順式調(diào)控元件,并影響基因轉(zhuǎn)錄的一類蛋白質(zhì)或RNA氏义,如轉(zhuǎn)錄因子

? ? 啟動(dòng)子:promoter锄列,指一段能使特定基因進(jìn)行轉(zhuǎn)錄的DNA序列。與RNA聚合酶結(jié)合并形成轉(zhuǎn)錄起始復(fù)合體惯悠,并開始轉(zhuǎn)錄合成RNA邻邮。一般啟動(dòng)子位于5‘UTR上游(編碼區(qū)上游),緊靠著轉(zhuǎn)錄起點(diǎn)克婶,引導(dǎo)RNA聚合酶與基因的正確部位結(jié)合筒严,其本身不被轉(zhuǎn)錄,長(zhǎng)約100~1000堿基對(duì)(nt)情萤。有一些啟動(dòng)子 (如tRNA啟動(dòng)子) 位于轉(zhuǎn)錄起始點(diǎn)的下游鸭蛙,這些DNA序列可以被轉(zhuǎn)錄。轉(zhuǎn)錄因子結(jié)合位點(diǎn)(TFBS)通常位于基因的啟動(dòng)子區(qū)域筋岛。

????增強(qiáng)子:enhancer娶视,與反式作用因子結(jié)合,增強(qiáng)轉(zhuǎn)錄活性睁宰,在基因任意位置都有效肪获,相對(duì)于啟動(dòng)子的任何方向和位置上發(fā)揮作用,無方向性柒傻,遠(yuǎn)離轉(zhuǎn)錄起始位點(diǎn)孝赫,可位于轉(zhuǎn)錄起始點(diǎn)的上游或下游。從功能上講红符,沒有增強(qiáng)子存在寒锚,啟動(dòng)子通常不能表現(xiàn)活性;沒有啟動(dòng)子時(shí)违孝,增強(qiáng)子也無法發(fā)揮作用。根據(jù)南京大學(xué)陳迪俊老師的研究表明增強(qiáng)子比啟動(dòng)子能結(jié)合更多的轉(zhuǎn)錄因子(Nature Communications)

????沉默子:silencer泳赋,降低基因啟動(dòng)子轉(zhuǎn)錄活性的一段順式調(diào)控元件(序列)雌桑,與增強(qiáng)子相反。基因表達(dá)負(fù)調(diào)控元件祖今,與反式作用因子結(jié)合校坑,抑制轉(zhuǎn)錄活性拣技。

????絕緣子:insulator????能夠妨礙真核基因調(diào)節(jié)蛋白對(duì)遠(yuǎn)距離的基因施加影響的順式調(diào)控元件。?

????這幾個(gè)開放元件都對(duì)基因的轉(zhuǎn)錄調(diào)控起著至關(guān)重要的作用

? ??如下圖耍目,可以看到不同的調(diào)控序列:

????

????轉(zhuǎn)錄起始位點(diǎn)與啟動(dòng)子:

????1.轉(zhuǎn)錄起始位點(diǎn)(transcription start site膏斤,TSS )是指一個(gè)基因的5'端轉(zhuǎn)錄的第一個(gè)堿基(是指 5'UTR 頭的第一個(gè)堿基,不是尾)邪驮,它是與新生RNA鏈第一個(gè)核苷酸相對(duì)應(yīng)DNA鏈上的堿基莫辨,通常為一個(gè)嘌呤(A或G)。在一個(gè)典型的基因內(nèi)部毅访,排列順序?yàn)檗D(zhuǎn)錄起始位點(diǎn)(TSS沮榜,一個(gè)堿基)-起始密碼子編碼序列 (ATG)-終止密碼子編碼序列-轉(zhuǎn)錄終止位點(diǎn) (TTS),即TSS-ATG-TGA-TTS

? ??通常把轉(zhuǎn)錄起始位點(diǎn)前即 5'末端(5'UTR 頭的末端喻粹,不是尾)的序列稱為上游蟆融,而把其后即 3'末端(3'UTR 尾的末端) 的序列稱為下游。

? ? 2.啟動(dòng)子(promoter):是指一段能使特定基因進(jìn)行轉(zhuǎn)錄的DNA序列守呜。啟動(dòng)子可以被RNA聚合酶辨認(rèn)型酥,并開始轉(zhuǎn)錄合成RNA。在RNA合成中查乒,啟動(dòng)子可以和調(diào)控基因轉(zhuǎn)錄的轉(zhuǎn)錄因子產(chǎn)生相互作用弥喉,控制基因表達(dá)(轉(zhuǎn)錄)的起始時(shí)間和表達(dá)的程度,包含核心啟動(dòng)子區(qū)域和調(diào)控區(qū)域侣颂,就像“開關(guān)”档桃,決定基因的活動(dòng),繼而控制細(xì)胞開始生產(chǎn)哪一種蛋白質(zhì)憔晒。其核心部分是非編碼區(qū)上游的RNA聚合酶結(jié)合位點(diǎn)藻肄,指揮聚合酶的合成,這種酶指導(dǎo)RNA的復(fù)制合成拒担。

????一般啟動(dòng)子位于5‘UTR上游(編碼區(qū)上游)嘹屯,緊靠著轉(zhuǎn)錄起點(diǎn),引導(dǎo)RNA聚合酶與基因的正確部位結(jié)合从撼,其本身不被轉(zhuǎn)錄州弟,長(zhǎng)約100~1000堿基對(duì)(nt)。有一些啟動(dòng)子 (如tRNA啟動(dòng)子) 位于轉(zhuǎn)錄起始點(diǎn)的下游低零,這些DNA序列可以被轉(zhuǎn)錄婆翔。

????強(qiáng)啟動(dòng)子(strong promoter):對(duì)RNA聚合酶有很高親和力的啟動(dòng)子,可以指導(dǎo)合成大量的mRNA掏婶。

????真核生物體內(nèi)具有三種保守的RNA聚合酶(Pol I啃奴,II,和III)雄妥,它們可以將核基因組轉(zhuǎn)錄成各種編碼和非編碼轉(zhuǎn)錄本(植物還使用另外兩種酶最蕾,Pol IV和Pol V來產(chǎn)生非編碼轉(zhuǎn)錄本如lncRNA)依溯。Pol I,II瘟则,和III?三類聚合酶能夠識(shí)別不同的啟動(dòng)子黎炉,即啟動(dòng)子有三類。其中II類啟動(dòng)子傳統(tǒng)的TATA盒醋拧、上游核心啟動(dòng)子元件BRE慷嗜、下游啟動(dòng)子元件DPE 和 起始子(initiator,Inr) 四部分組成趁仙,轉(zhuǎn)錄起始位點(diǎn)位于起始子內(nèi)洪添。

? ? 3.啟動(dòng)子是一段序列,轉(zhuǎn)錄起始位點(diǎn)是一個(gè)堿基雀费。不能相等同干奢。RNA聚合酶II(pol II)所識(shí)別的啟動(dòng)子(II類啟動(dòng)子)包含轉(zhuǎn)錄起始位點(diǎn),兩者屬包含與被包含的關(guān)系盏袄。


? ??終止子 terminator :位于編碼區(qū)下游忿峻,是轉(zhuǎn)錄過程中能夠終止RNA聚合酶轉(zhuǎn)錄的DNA序列。緊靠著轉(zhuǎn)錄的終點(diǎn)位置辕羽,阻礙RNA聚合酶的移動(dòng)逛尚,并使其從DNA模板鏈上脫離下來。終止子可分為兩類:一類不依賴于蛋白質(zhì)輔因子就能實(shí)現(xiàn)終止作用刁愿。另一類則依賴蛋白輔因子才能實(shí)現(xiàn)終止作用绰寞。

? ??基因非編碼區(qū)的堿基的插入、缺失和替代也屬于基因突變事件铣口,盡管大多數(shù)的研究是局限在編碼區(qū)突變滤钱。

????回文序列:是一段長(zhǎng)約7-20個(gè)核苷酸對(duì)的反向重復(fù)順序,也稱為終止信號(hào)脑题,是RNA聚合酶轉(zhuǎn)錄終止的信號(hào)件缸,位于AATAAA的下游,其對(duì)稱軸距轉(zhuǎn)錄終止點(diǎn)約16-24bp叔遂。因?yàn)榛匚男蛄械奶厥馀帕兴叮浯蠖喽嘉挥诜蔷幋a區(qū)。

舉例已艰,DNA序列ACCTAGGT 是回文序列痊末,因?yàn)樗幕パa(bǔ)序列是TGGATCCA,而反向互補(bǔ)序列是ACCTAGGT哩掺,和其原來序列一致

8.轉(zhuǎn)錄因子及結(jié)合位點(diǎn)舌胶,結(jié)構(gòu)基因,調(diào)節(jié)基因疮丛,操縱基因

????轉(zhuǎn)錄因子(transcription factor):一群能與基因5'端上游特定序列專一性結(jié)合幔嫂,從而保證目的基因以特定的強(qiáng)度在特定的時(shí)間與空間表達(dá)的蛋白質(zhì)分子,這些蛋白質(zhì)能調(diào)控其基因的轉(zhuǎn)錄誊薄。調(diào)控方法是轉(zhuǎn)錄因子可以調(diào)控核糖核酸聚合酶(RNA聚合酶履恩,或叫RNA合成酶)與DNA模板的結(jié)合。?更詳細(xì)的轉(zhuǎn)錄因子介紹:https://cloud.tencent.com/developer/article/1376739

????轉(zhuǎn)錄因子與RNA聚合酶Ⅱ形成轉(zhuǎn)錄起始復(fù)合體呢蔫,共同參與轉(zhuǎn)錄起始的過程切心。

????TF結(jié)合位點(diǎn) transcription factor binding site,TFBS:轉(zhuǎn)錄因子調(diào)節(jié)基因表達(dá)時(shí)片吊,與基因模板鏈結(jié)合的區(qū)域绽昏。一般應(yīng)該分布在基因前端(但:人21和22號(hào)染色體上,只有22%的轉(zhuǎn)錄因子結(jié)合位點(diǎn)分布在蛋白編碼基因的5'端)

? ??三種基因是對(duì)基因的功能所作的區(qū)分俏脊,是以直線形式排列在染色體上:

????結(jié)構(gòu)基因:是決定合成某一種蛋白質(zhì)或RNA分子結(jié)構(gòu)相應(yīng)的一段DNA全谤。結(jié)構(gòu)基因的功能是把攜帶的遺傳信息轉(zhuǎn)錄給mRNA(信使核糖核酸),再以mRNA為模板合成具有特定氨基酸序列的蛋白質(zhì)或RNA爷贫。

1)原核生物結(jié)構(gòu)基因:連續(xù)的认然,RNA合成不需要剪接加工;

2)真核生物結(jié)構(gòu)基因:由外顯子(編碼序列) 和內(nèi)含子(非編碼序列) 兩部分組成漫萄。

????非結(jié)構(gòu)基因:結(jié)構(gòu)基因兩側(cè)的一段不編碼的DNA片段(即側(cè)翼序列)卷员,參與基因表達(dá)調(diào)控。

? ??調(diào)節(jié)基因:是調(diào)節(jié)蛋白質(zhì)合成的基因 腾务。它能使結(jié)構(gòu)基因在需要某種酶時(shí)就合成某種酶毕骡,不需要時(shí),則停止合成岩瘦,它對(duì)不同染色體上的結(jié)構(gòu)基因有調(diào)節(jié)作用未巫。

????操縱基因:位于結(jié)構(gòu)基因的一端,是操縱結(jié)構(gòu)基因的基因担钮。當(dāng)操縱基因“開動(dòng)”時(shí)橱赠,處于同一染色體上的,由它所控制的結(jié)構(gòu)基因就開始轉(zhuǎn)錄箫津、翻譯和合成蛋白質(zhì)狭姨。當(dāng)“關(guān)閉”時(shí),結(jié)構(gòu)基因就停止轉(zhuǎn)錄與翻譯苏遥。操縱基因與一系列受它操縱的結(jié)構(gòu)基因合起來就形成一個(gè)操縱子饼拍。

????在正常情況下,在需要某種或其有關(guān)的酶時(shí)田炭,在調(diào)節(jié)基因和操縱基因的控制下等候在啟動(dòng)子 (Promotor) 位置上的RNA聚合酶開始轉(zhuǎn)錄师抄,從而產(chǎn)生了與這些酶有關(guān)的結(jié)構(gòu)基因的信使RNA,并由后者合成所需的酶教硫。若結(jié)構(gòu)基因發(fā)生突變叨吮,便會(huì)產(chǎn)生失去活性的蛋白質(zhì)辆布,從而造成差錯(cuò)。


9.表觀遺傳

????epigenetics:表觀遺傳學(xué)茶鉴。表觀遺傳學(xué)修飾在不改變DNA序列的情況下控制著基因的表達(dá)锋玲,包括染色質(zhì)重塑、組蛋白修飾涵叮、DNA甲基化和microRNA通路等惭蹂。

? ??ChIP-seq:檢測(cè)目標(biāo)蛋白質(zhì)所結(jié)合的DNA序列。如可以知道某種組蛋白修飾在基因組上的分布信息割粮,某個(gè)轉(zhuǎn)錄因子可以調(diào)控哪些基因https://www.bilibili.com/video/BV1dG411h74Q?spm_id_from=333.337.search-card.all.click&vd_source=c818105625602034942e80808994e94a

? ??ATAC-seq:研究開放染色質(zhì)區(qū)盾碗,開放染色質(zhì)區(qū)通常包含的功能元件有啟動(dòng)子、增強(qiáng)子舀瓢,沉默子廷雅、絕緣子等。調(diào)控蛋白(如轉(zhuǎn)錄因子)過來結(jié)合氢伟,可以影響細(xì)胞內(nèi)基因復(fù)制以及調(diào)控基因的轉(zhuǎn)錄活性榜轿。開放染色質(zhì)區(qū)沒有核小體結(jié)合。

? ??ATAC?peaks: 峰朵锣。常用來表示染色質(zhì)的開放程度谬盐,因?yàn)槭菧y(cè)序的reads落在了染色質(zhì)的開放區(qū),堆疊后被可視化的一種豐度的體現(xiàn)诚些。

? ??THSs飞傀,ACRs: DNA內(nèi)切酶可以對(duì)染色質(zhì)進(jìn)行切割,這些切割位點(diǎn)稱為DNA超敏感位點(diǎn)诬烹。沒有核小體結(jié)合的DNA區(qū)域容易被核酸酶切割砸烦,DNA超敏感位點(diǎn)就位于這個(gè)區(qū)域
(轉(zhuǎn)座酶超敏感位點(diǎn),transposase hypersensitive sites)绞吁。
這些位點(diǎn)的分布往往具有一定的規(guī)律性——切割后的DNA片段都在100-200bp左右幢痘。這些DNA片段就稱為染色質(zhì)開放區(qū)或者開放染色質(zhì)(accessible chromatin regions,ACRs)家破。(開放染色質(zhì)區(qū)沒有核小體結(jié)合)
NP | 2019】根據(jù)ACRs距離最近基因的距離將ACRs分為三種類型:genic (gACRs; overlapping a gene), proximal (pACRs; within 2?kb of a gene) or distal (dACRs; >2?kb from a gene)颜说,分別是跨越基因的,近端的汰聋,遠(yuǎn)端的染色質(zhì)開放區(qū)门粪。

組蛋白修飾

? ??細(xì)胞核中的染色體是高度壓縮的,而折疊時(shí)DNA就是纏繞在組蛋白上烹困,形成核小體玄妈。組蛋白通常含有H2A,H2B,H3拟蜻,H4绎签,在組蛋白N端都有一段富含賴氨酸和精氨酸的“尾巴”,尾巴上的氨基酸可以被修飾酶催化添加各種修飾基團(tuán)瞭郑,如甲基辜御、磷酸基、乙跚牛基和泛素等,這個(gè)過程就稱為“組蛋白修飾”袱巨。組蛋白H3是修飾最多的組蛋白阁谆。

? ??組蛋白甲基化:甲基化可發(fā)生在組蛋白的賴氨酸和精氨酸殘基上,而且賴氨酸殘基能夠發(fā)生單愉老、雙场绿、三甲基化,而精氨酸殘基能夠單嫉入、雙甲基化焰盗,這些不同程度的甲基化極大地增加了組蛋白修飾和調(diào)節(jié)基因表達(dá)的復(fù)雜性

????組蛋白乙酰化:四種類型的組蛋白相互作用咒林,將細(xì)胞核里的DNA緊緊地包裝起來熬拒。這樣的緊密包裝能夠有效阻止酶讀取DNA上的遺傳信息。然而垫竞,乙跖焖冢基連到組蛋白上能削弱它們對(duì)DNA的占據(jù)。因此局部乙趸兜桑化能暴露出相應(yīng)的基因活烙,讓它們更容易激活

? ??H3K27ac是對(duì)核小體組蛋白H3的表觀遺傳修飾。它指示組蛋白H3蛋白N末端位置27處賴氨酸殘基乙跚补模化的標(biāo)記啸盏。H3K27ac與更高的轉(zhuǎn)錄激活相關(guān),因此被定義為活性增強(qiáng)子標(biāo)記骑祟。在轉(zhuǎn)錄起始位點(diǎn)的近端和遠(yuǎn)端區(qū)域都發(fā)現(xiàn)了H3K27ac回懦。

? ??H3K4me3是對(duì)DNA包裝蛋白組蛋白H3的表觀遺傳修飾。該名稱表示在組蛋白H3蛋白的賴氨酸4上添加了三個(gè)甲基曾我。H3用于在真核細(xì)胞中包裝DNA粉怕,對(duì)組蛋白的修飾會(huì)改變基因轉(zhuǎn)錄的可及性。H3K4me3通常與附近基因的轉(zhuǎn)錄激活有關(guān)抒巢,用來識(shí)別基因啟動(dòng)子贫贝。

? ??H3K9me2H3K9me3是對(duì)DNA包裝蛋白組蛋白H3的表觀遺傳修飾。它表示組蛋白H3蛋白第9個(gè)賴氨酸殘基發(fā)生二甲基化稚晚,三甲基化崇堵。H3K9me2H3K9me3與轉(zhuǎn)錄抑制密切相關(guān)客燕。與轉(zhuǎn)錄起始位點(diǎn)周圍10kb區(qū)域中的活性基因相比鸳劳,沉默時(shí)H3K9me2的水平更高。


Hi-C? ? TAD? ? CTCF

????染色質(zhì)構(gòu)象捕獲技術(shù)(Hi-C)的發(fā)展揭示了在間期細(xì)胞核中也搓,基因組可以劃分為以Mb為單位的拓?fù)潢P(guān)聯(lián)域(TAD)赏廓。TADs可以限制增強(qiáng)子只在相同的TAD區(qū)域內(nèi)激活啟動(dòng)子,因而被認(rèn)為在限定CRE的功能方面有重要作用傍妒。然而TADs在基因調(diào)控方面的具體作用仍存在爭(zhēng)議幔摸。TAD邊界元件的刪除可以導(dǎo)致鄰近基因表達(dá)紊亂,在某些情況下甚至?xí)a(chǎn)生表型后果颤练。然而既忆,有些重要的TAD-組織蛋白如CTCF的紊亂卻對(duì)轉(zhuǎn)錄只有極小影響。

? ??染色質(zhì)結(jié)構(gòu)蛋白CTCF是一種重要的轉(zhuǎn)錄抑制因子嗦玖,通過多種機(jī)制調(diào)控基因表達(dá)患雇。其最具特色的功能是通過同源二聚引起DNA成環(huán),參與基因組拓?fù)浣Y(jié)構(gòu)域(TAD)邊界形成宇挫,改變?nèi)旧|(zhì)空間結(jié)構(gòu)苛吱。早期的研究表明很多哺乳動(dòng)物基因組中大部分的CTCF的結(jié)合位點(diǎn)衍生自幾個(gè)不同種TEs。例如捞稿,CTCF結(jié)合位點(diǎn)在人類中衍生于靈長(zhǎng)類特異的內(nèi)源性逆轉(zhuǎn)錄病毒又谋,而在小鼠中主要來自B2短散在核元件(SINEs)。TEs能夠?yàn)镃TCF提供TFBS娱局,因而產(chǎn)生了新的拓?fù)浣Y(jié)構(gòu)域邊界彰亥,調(diào)節(jié)染色質(zhì)三維結(jié)構(gòu)。

10.正向遺傳學(xué)? ? 反向遺傳學(xué)

????簡(jiǎn)單地說衰齐,正向遺傳學(xué)是從表型變化研究基因變化任斋,反向遺傳學(xué)則是從基因變化研究表型變化。

? ??正向遺傳學(xué)的研究是指開始于良好表征的表型耻涛,然后鑒定影響表型的基因废酷。即通過生物個(gè)體或細(xì)胞的基因組的自發(fā)突變或人工誘變,尋找相關(guān)的表型或性狀改變抹缕,然后從這些特定性狀變化的個(gè)體或細(xì)胞中找到對(duì)應(yīng)的突變基因澈蟆,并揭示其功能。常用的方法如:T-DNA標(biāo)簽卓研,轉(zhuǎn)座子標(biāo)簽等趴俘,以某種方式改變目標(biāo)基因的表達(dá)睹簇,從而揭示與通過插入外源基因而改變的特定表型的關(guān)系。數(shù)量性狀基因座(QTL)圖譜和關(guān)聯(lián)定位等遺傳作圖方法也是

????反向遺傳的研究起始于一個(gè)基因寥闪,通過一定的手段確定基因決定的表型太惠。即改變某個(gè)特定的基因或蛋白質(zhì),然后再去尋找有關(guān)的表型變化疲憋。反向遺傳方法如RNA干擾(RNAi)凿渊、反義RNA的基因沉默等,單個(gè)基因的表達(dá)在某種程度上被破壞可能導(dǎo)致植物中可見的突變


聲明:本篇多為資料整理總結(jié)缚柳,僅用于自學(xué)記錄和交流埃脏,侵刪,謝謝大佬們秋忙。參考:

素錦時(shí)年_1b00?http://www.reibang.com/p/df37d5f56bca

米妮愛分享?http://www.reibang.com/p/65e2c2ad19a6

劉小澤 http://www.reibang.com/p/2ba85c5306e7

Han_zh?http://www.reibang.com/p/91241c82ba5e

LeoinUSA?http://www.reibang.com/p/a56ba94eaf36

劉小澤?https://www.jieandze1314.com/post/cnposts/169/

叩響生信之門?https://mp.weixin.qq.com/s/Fs0wogah7G9u-lCZeo4tdw

https://www.abcam.cn/epigenetics/chromatin-structure-and-function-a-guide-2

轉(zhuǎn)錄起始位點(diǎn)與啟動(dòng)子

Sc_RNA_seq?http://www.reibang.com/p/a2c0d5b0dbc1

https://zhuanlan.zhihu.com/p/63596994????端粒

一抹_暖光????http://www.reibang.com/p/a56eec423237

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末剂癌,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子翰绊,更是在濱河造成了極大的恐慌,老刑警劉巖旁壮,帶你破解...
    沈念sama閱讀 206,602評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件监嗜,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡抡谐,警方通過查閱死者的電腦和手機(jī)裁奇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,442評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來麦撵,“玉大人刽肠,你說我怎么就攤上這事∶馕福” “怎么了音五?”我有些...
    開封第一講書人閱讀 152,878評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)羔沙。 經(jīng)常有香客問我躺涝,道長(zhǎng),這世上最難降的妖魔是什么扼雏? 我笑而不...
    開封第一講書人閱讀 55,306評(píng)論 1 279
  • 正文 為了忘掉前任坚嗜,我火速辦了婚禮,結(jié)果婚禮上诗充,老公的妹妹穿的比我還像新娘苍蔬。我一直安慰自己,他們只是感情好蝴蜓,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,330評(píng)論 5 373
  • 文/花漫 我一把揭開白布碟绑。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪蜈敢。 梳的紋絲不亂的頭發(fā)上辜荠,一...
    開封第一講書人閱讀 49,071評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音抓狭,去河邊找鬼伯病。 笑死,一個(gè)胖子當(dāng)著我的面吹牛否过,可吹牛的內(nèi)容都是我干的午笛。 我是一名探鬼主播,決...
    沈念sama閱讀 38,382評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼苗桂,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼药磺!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起煤伟,我...
    開封第一講書人閱讀 37,006評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤癌佩,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后便锨,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體围辙,經(jīng)...
    沈念sama閱讀 43,512評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,965評(píng)論 2 325
  • 正文 我和宋清朗相戀三年放案,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了姚建。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,094評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡吱殉,死狀恐怖掸冤,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情友雳,我是刑警寧澤稿湿,帶...
    沈念sama閱讀 33,732評(píng)論 4 323
  • 正文 年R本政府宣布,位于F島的核電站沥阱,受9級(jí)特大地震影響缎罢,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜考杉,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,283評(píng)論 3 307
  • 文/蒙蒙 一策精、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧崇棠,春花似錦咽袜、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,286評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽谜嫉。三九已至,卻和暖如春凹联,著一層夾襖步出監(jiān)牢的瞬間沐兰,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,512評(píng)論 1 262
  • 我被黑心中介騙來泰國打工蔽挠, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留住闯,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,536評(píng)論 2 354
  • 正文 我出身青樓澳淑,卻偏偏與公主長(zhǎng)得像比原,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子杠巡,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,828評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容