明晰概念
- 基因是染色體上一段可以發(fā)生轉錄的區(qū)域
- 基因≠CDS
- 基因應該包括:CDS 內(nèi)含子 UTR 啟動子
- 可轉錄的區(qū)域是多變的
- 我們做分析的時候常用的是蛋白序列,而蛋白序列是某個轉錄本翻譯而來的
- 蛋白序列≠某個基因的序列
蛋白序列=某個轉錄本翻譯過來的蛋白質(zhì) - 而這個轉錄本對應的是染色體上一段可轉錄的序列——基因
- 而這段序列可以轉錄各種不同的轉錄本
- 我們常常說克隆了AA基因BB基因褐荷,所指的其實是這個基因的某個轉錄本(主要轉錄本primary transcript)聋袋,而不是真實的這段基因的序列
- 轉錄本才是基因的研究實體
基因家族是什么
官方定義
- 來源同一祖先
- 由一個基因通過基因重復得到兩個或更多拷貝構成的一組基因
- 結構和功能具有明顯相似性
- 編碼相似的蛋白質(zhì)
- 可能形成基因簇或在染色體上的不同位置
從序列相似度看
- 高度相似的序列就互為同源基因宠纯,即歸屬為同一個基因家族(即拷貝數(shù)一定大于1)
從結構域上看
- 具有一個或幾個保守結構域/功能域的序列伐坏,就為某個基因家族的序列(特征)
禀综?mid/midlite - caution:等位基因不能算是基因家族掠廓,做研究時注意(二倍體)