記錄Ensemble的GTF注釋文件時(shí)的一些內(nèi)容
Biotype 指的是基因或轉(zhuǎn)錄本的分類馋劈。
- IG gene: 發(fā)生體細(xì)胞基因重組的免疫球蛋白基因欣硼,由IMGT注釋(http://www.imgt.org/.)
- IG C gene: C區(qū)(constant chain) 發(fā)生重組的免疫球蛋白基因
- IG D gene: D區(qū)(diversity chain)發(fā)生重組的免疫球蛋白基因
- IG J gene: J區(qū)(joining chain)發(fā)生重組的免疫球蛋白基因
- IG V gene: V區(qū)(variable chain)發(fā)生重組的免疫球蛋白基因
Nonsense Mediated Decay: 指的是具有提前的終止密碼子的轉(zhuǎn)錄本铝量,這會(huì)使得翻譯提前終止。通常的預(yù)測(cè)方法是判斷該轉(zhuǎn)錄本最終的剪接位點(diǎn)上游50bp是否存在閱讀框內(nèi)的終止密碼子(核糖體對(duì)轉(zhuǎn)錄本的讀取以三個(gè)堿基為單位,所謂的框內(nèi)(in-frame)密碼子指的便是符合核糖體讀取規(guī)則的三聯(lián)堿基)俯艰。
-
Processed transcript: 不具有開放閱讀框(open reading frame, ORF)的基因或轉(zhuǎn)錄本盒犹。
- Long non-coding RNA (lncRNA): 長度大于200nt的非編碼RNA
- ncRNA: 非編碼RNA
- miRNA: 長度約為22nt的非編碼RNA懂更,執(zhí)行轉(zhuǎn)錄負(fù)調(diào)控作用
- miscRNA (Miscellaneous RNA): 暫時(shí)未分類的非編碼RNA
- piRNA: 與piwi 蛋白相互作用的RNA,參與到基因沉默的調(diào)控
- rRNA: 核糖體RNA
- siRNA: 長度約為20-25bp的非編碼RNA急膀,通過RNAi 途徑沉默靶mRNA的表達(dá)
- snRNA: 小核RNA沮协,定位于細(xì)胞核內(nèi),參與到pre-mRNA的加工過程
- snoRNA: 小核仁RNA脖阵,定位于核仁皂股,于其他RNA的轉(zhuǎn)錄后修飾相關(guān)
- tRNA: 轉(zhuǎn)運(yùn)RNA
- vaultRNA: 短的非編碼RNA,是 vault ribonucleoprotein complex的組成部分
Protein coding: 具有開放閱讀框(open reading frame, ORF)的基因或轉(zhuǎn)錄本命黔。
-
Pseudogene: 與已知的蛋白編碼基因具有同源性的假基因呜呐,但基因序列含有移碼突變和/或具有提前終止密碼子。目前認(rèn)為是由于基因的重復(fù)或功能喪失突變而產(chǎn)生的悍募。
IG pseudogene: 不具有活性的免疫球蛋白基因
Polymorphic pseudogene: 多態(tài)性假基因蘑辑,由于單核苷酸多態(tài)性(SNP)導(dǎo)致的假基因,在其他的個(gè)體坠宴、單倍型(haplotypes)或品系中該基因是表達(dá)洋魂。
Processed pseudogene: 加工過的假基因,該類假基因缺少內(nèi)含子喜鼓,可能是由于mRNA反轉(zhuǎn)錄后插入到基因組中所產(chǎn)生的副砍。
Transcribed pseudogene: 可轉(zhuǎn)錄的假基因,能檢測(cè)到轉(zhuǎn)錄本但檢測(cè)不到蛋白或基因序列特征也表明它是假基因的類型庄岖。這類假基因也可被歸類到 'Processed', 'Unprocessed' 和 'Unitary'.
Translated pseudogene: 可翻譯的假基因豁翎,能在質(zhì)譜檢測(cè)到其編碼的蛋白。這類假基因也可被歸類到 'Processed', 'Unprocessed'
Unitary pseudogene: 一類特殊的沒有祖先基因的假基因隅忿,同時(shí)在其他物種中還具有活躍表達(dá)的直系同源物心剥。
Unprocessed pseudogene: 由于基因復(fù)制產(chǎn)生的假基因,可能包含內(nèi)含子
Readthrough: 讀通現(xiàn)象背桐,即該轉(zhuǎn)錄本的外顯子與其它轉(zhuǎn)錄本的外顯子有重疊導(dǎo)致核糖體可以跨越終止密碼子繼續(xù)往下游(另外的轉(zhuǎn)錄本)閱讀优烧。
-
Stop codon readthrough: 編碼序列包含被翻譯的終止密碼子(由實(shí)驗(yàn)證據(jù)支持),而終止發(fā)生在更下游的經(jīng)典終止密碼子上链峭。 目前尚不清楚哪個(gè)密碼子可用來替代被翻譯的終止密碼子畦娄,因此在蛋白質(zhì)序列中以“ X”表示
- TEC (To be Experimentally Confirmed): 具有一定可轉(zhuǎn)錄特征的基因,還需要實(shí)驗(yàn)手段驗(yàn)證其轉(zhuǎn)錄本。
-
TR gene: 發(fā)生體細(xì)胞基因重組的T細(xì)胞受體基因纷责,由IMGT注釋(http://www.imgt.org/.)
- TR C gene: C區(qū)(constant chain) 發(fā)生重組的T細(xì)胞受體基因
- TR D gene: D區(qū)(diversity chain)發(fā)生重組的T細(xì)胞受體基因
- TR J gene: J區(qū)(joining chain)發(fā)生重組的T細(xì)胞受體基因
- TR V gene: V區(qū)(variable chain)發(fā)生重組的T細(xì)胞受體基因
ref:
http://asia.ensembl.org/info/genome/genebuild/index.html
http://asia.ensembl.org/info/genome/genebuild/annotation_merge.html
完捍掺。