劉小澤寫(xiě)于2020.2.8
大概回顧一下基礎(chǔ)知識(shí)
一:ORF與CDS
ORF:open reading frame(開(kāi)放閱讀框)
它是理論上的蛋白編碼區(qū)茬祷,一般是先在DNA序列中尋找起始密碼子(AUG)對(duì)應(yīng)的序列ATG清焕,然后按每3個(gè)堿基一組向后延伸,一直到出現(xiàn)終止密碼子(UAG、UGA秸妥、UAA)對(duì)應(yīng)的序列
注意:起始密碼子和啟動(dòng)子不是一回事滚停!
CDS:coding sequences (編碼區(qū))
它就是與蛋白序列一一對(duì)應(yīng)的DNA序列,并且序列中間不存在其他與蛋白無(wú)關(guān)的序列粥惧,和真實(shí)情況最接近
舉個(gè)例子:
例如這個(gè)序列:AACGCATGCAGC
如果用預(yù)測(cè)的方法得到ORF键畴,它會(huì)先找到ATG;然后會(huì)以中間的字母T為核心突雪,推測(cè)三種可能:
- 第一種:T就是在中心起惕,即ATG,然后按每三個(gè)一組咏删,得到:CGC惹想、ATG、CAG
- 第二種:T在左側(cè)饵婆,即TGC,同樣得到AAC戏售、GCA侨核、TGC、AGC【這就是真實(shí)的CDS組合】
- 第三種::T在右側(cè)灌灾,即CAT搓译,得到ACG、CAT锋喜、GCA
還因?yàn)镈NA雙鏈些己,所以總共有32=6種不同密碼子組合方式*
補(bǔ)充
CDS 與 UTR:
A typical CDS starts with ATG and ends with a stop codon, it doesn't have any introns, 5'- and 3'-UTR
CDS與ORF:
CDS can be a subset of an open reading frame (ORF).
二:?jiǎn)?dòng)子&起始密碼子;終止子&終止密碼子**
實(shí)際上二者之間沒(méi)有任何關(guān)聯(lián)
- 啟動(dòng)子和終止子都是一段特殊的DNA序列嘿般,屬于基因的非編碼區(qū)段标,分別位于編碼區(qū)的上游和下游,負(fù)責(zé)調(diào)控基因的轉(zhuǎn)錄
- 起始密碼子和終止密碼子都是mRNA上的三聯(lián)體堿基序列炉奴,分別決定翻譯的起始和終止逼庞。
啟動(dòng)子 promoter
DNA分子上能與RNA聚合酶結(jié)合并形成轉(zhuǎn)錄起始復(fù)合體的區(qū)域
與RNA聚合酶結(jié)合并能起始mRNA合成的序列。做生信分析時(shí)瞻赶,有的選擇上游1 kb赛糟,下游 500 nt,也有選上下游各1 kb的
強(qiáng)啟動(dòng)子(strong promoter):對(duì)RNA聚合酶有很高親和力的啟動(dòng)子砸逊,可以指導(dǎo)合成大量的mRNA
起始密碼子 start codon
指定信使RNA(mRNA)上開(kāi)始合成蛋白質(zhì)的密碼子璧南,也是第一個(gè)被核糖體翻譯的mRNA上的密碼子,位于編碼區(qū)內(nèi)师逸,緊鄰5′非翻譯區(qū)司倚。較為常見(jiàn)的起始密碼子是AUG
終止子 terminator
- 轉(zhuǎn)錄過(guò)程中能夠終止RNA聚合酶轉(zhuǎn)錄的DNA序列
- 終止子可分為兩類:一類不依賴于蛋白質(zhì)輔因子就能實(shí)現(xiàn)終止作用。另一類則依賴蛋白輔因子才能實(shí)現(xiàn)終止作用
終止密碼子 stop codon
終止肽鏈合成的信使核糖核酸(mRNA)的三聯(lián)體堿基序列,UAA对湃、UAG和UGA崖叫,它們不編碼氨基酸
三:轉(zhuǎn)錄因子 及結(jié)合位點(diǎn)
轉(zhuǎn)錄因子(transcription factor)
一群能與基因5`端上游特定序列專一性結(jié)合,從而保證目的基因以特定的強(qiáng)度在特定的時(shí)間與空間表達(dá)的蛋白質(zhì)分子拍柒,這些蛋白質(zhì)能調(diào)控其基因的轉(zhuǎn)錄心傀。
調(diào)控方法是轉(zhuǎn)錄因子可以調(diào)控核糖核酸聚合酶(RNA聚合酶,或叫RNA合成酶)與DNA模板的結(jié)合
更詳細(xì)的轉(zhuǎn)錄因子介紹:https://cloud.tencent.com/developer/article/1376739
TF結(jié)合位點(diǎn) transcription factor binding site拆讯,TFBS
轉(zhuǎn)錄因子調(diào)節(jié)基因表達(dá)時(shí)脂男,與基因模板鏈結(jié)合的區(qū)域。一般應(yīng)該分布在基因前端【但:人21和22號(hào)染色體上种呐,只有22%的轉(zhuǎn)錄因子結(jié)合位點(diǎn)分布在蛋白編碼基因的5'端】
四:UTR (Untranslated Regions)
非翻譯區(qū)宰翅,是信使RNA(mRNA)分子兩端的非編碼片段
- 5'-UTR從mRNA起點(diǎn)的甲基化鳥(niǎo)嘌呤核苷酸帽延伸至AUG起始密碼子
- 3'-UTR從編碼區(qū)末端的終止密碼子延伸至多聚A尾巴(Poly-A)的前端
最后補(bǔ)充幾張圖
關(guān)于表達(dá)調(diào)控
BIOL2060: Regulation of Gene Expression
歡迎關(guān)注我們的公眾號(hào)~_~
我們是兩個(gè)農(nóng)轉(zhuǎn)生信的小碩,打造生信星球爽室,想讓它成為一個(gè)不拽術(shù)語(yǔ)汁讼、通俗易懂的生信知識(shí)平臺(tái)。需要幫助或提出意見(jiàn)請(qǐng)后臺(tái)留言或發(fā)送郵件到jieandze1314@gmail.com