Genbank:核酸序列Features

FEATURES 是非常重要的注釋內(nèi)容焕参,它描述了核酸序列中各個(gè)已確定的片段區(qū)域张吉,包含 很多子條目齿梁,比如來(lái)源,啟動(dòng)子肮蛹,核糖體結(jié)合位點(diǎn)等等勺择。

1.原核生物大腸桿菌的基因序列features解讀:

大腸桿菌的基因序列
  • source 說(shuō)明了核酸序列的來(lái)源,據(jù)此可以容易的分辨出這條序列是來(lái)源于克隆載體還 是基因組伦忠∈『耍可以看到,當(dāng)前序列來(lái)源于大腸桿菌的基因組 DNA昆码。

  • regulatory

    • promoter 列出了啟動(dòng)子的位置气忠。細(xì)菌有兩個(gè)啟動(dòng)子區(qū),-35 區(qū)和-10 區(qū)赋咽。-35 區(qū)位于第 286 個(gè)堿基到第 291 個(gè)堿基 旧噪,-10 區(qū)位于第 310 個(gè)堿基到第 316 個(gè)堿基。

    • RBS 是核糖體結(jié)合位點(diǎn)的位置脓匿。

  • misc_feature 列出了一些雜項(xiàng)淘钟,比如,這條說(shuō)明了從第 322 個(gè)堿基到第 324 個(gè)堿基是一個(gè)推測(cè)的陪毡,無(wú)實(shí)驗(yàn)證實(shí)的轉(zhuǎn)錄起始位置米母。

CDS(Coding Segment):編碼區(qū)

對(duì)于原核生物來(lái)講勾扭,CDS 記錄了一個(gè)開(kāi)放閱讀框ORF,從 第 343 個(gè)堿基開(kāi)始的起始密碼子 ATG 到第 798 個(gè)堿基結(jié)束的結(jié)束密碼子 TAA铁瞒。除了位置信息妙色,還包括翻譯產(chǎn)物的諸多信息。

  • 翻譯產(chǎn)物蛋白的名字是 dUTPase精拟,這個(gè)編碼區(qū)編碼該蛋白的第 1 到第 151 個(gè)氨基酸燎斩。

  • 事實(shí)上,蛋白質(zhì)數(shù)據(jù)庫(kù)中的大多數(shù)蛋白質(zhì)序列都是根據(jù)核酸序列由計(jì)算機(jī)根據(jù)翻譯密碼本自動(dòng)翻譯出來(lái)的蜂绎。

  • 中間部分是翻譯出的蛋白在各種蛋白質(zhì)數(shù)據(jù)庫(kù)中對(duì)應(yīng)的檢索號(hào)栅表。 通過(guò)這些檢索號(hào)可以輕松的鏈接到其他數(shù)據(jù)庫(kù)。

此外师枣,X01714 這條核酸序列還包含第二個(gè)“潛在的”基因怪瓶,也就是計(jì)算機(jī)預(yù)測(cè)出來(lái)的 基因。它編碼的蛋白目前的數(shù)據(jù)庫(kù)里沒(méi)有詳細(xì)記錄践美,是個(gè)未知的蛋白洗贰。

image-20200420152224200

像這樣,一條核酸序列包含多個(gè)基因的情況在 Genbank 里是很常見(jiàn)的陨倡。

ORIGIN 作為最后一個(gè)條目記錄的是核酸序列敛滋,并以雙斜線作為整條記錄的結(jié)束符。至此整條記錄就瀏覽完了兴革。
ORIGIN

有時(shí)你可能會(huì)想要保存這條序列绎晃,但是直接從這里拷貝,序列里既有空格杂曲,又有數(shù)字庶艾, 不是純序列,手動(dòng)刪除這些又很麻煩擎勘。

這時(shí)咱揍,你可以在這條記錄的標(biāo)題下面找到一個(gè)叫做 FASTA 的鏈接:
FASTA 的鏈接

點(diǎn)擊他,你會(huì)獲得 FASTA 格式的核酸序列棚饵。

FASTA 格式的核酸序列

FASTA 格式是最常用的序列書(shū)寫(xiě)格式煤裙,他由兩部分組成。
第一行:以大于號(hào)開(kāi)始噪漾。后面接序列的名稱(chēng)或注釋
第二行:純序列部分积暖,每行 60 個(gè)字母。(這部分只能寫(xiě)序列怪与,不能有其他內(nèi)容夺刑,比如空格,注釋?zhuān)刑?hào)之類(lèi)的都不能在序列部分出現(xiàn)。)

早期的 FASTA 格式要求序列部分每行 60 個(gè)字母遍愿。但這個(gè)規(guī)定早已被打破存淫,每行 80,或每行100都可以沼填。

標(biāo)題下方桅咆,除了 FASTA 鏈接,還有一個(gè)圖形化鏈接:
Features 里的注釋信息

點(diǎn)擊可以看到 Features 里的注釋信息以圖形的形式更直觀的展示出來(lái)坞笙。

Features 里的注釋信息

可以看到這條序列包含的兩個(gè)基因岩饼,他們的啟動(dòng)子的位置,核糖體結(jié)合位點(diǎn)的位置等薛夜。其中一條基因是編碼 dUTPase 的 dUT基因籍茧,另一個(gè)是編碼未知蛋白的潛在的通過(guò)計(jì)算預(yù)測(cè)出的基因。

如果想要保存這條記錄梯澜,最好的方法是像保存 PubMed 文獻(xiàn)列表那樣寞冯,點(diǎn)擊發(fā)送鏈接, 然后選擇以純文本文件的形式保存整條記錄到本地電腦上晚伙。
保存記錄

現(xiàn)在我們來(lái)看真核生物基因組的DNA序列 (:

2.真核生物人的dUTPase 的成熟 mRNA 序列

Features 里的注釋內(nèi)容與原核生物的數(shù)據(jù)庫(kù)記錄相似吮龄。

人的dUTPase 的成熟 mRNA 序列
  • CDS 指出了從 63 到 821 是一 段編碼區(qū),在這段編碼區(qū)里基因是連續(xù)的咆疗,因?yàn)槭墙?jīng)過(guò)剪切后的成熟 mRNA漓帚,它將被翻譯 成線粒體型 dUTPase 蛋白。

  • /translation 里給出的是計(jì)算機(jī)翻譯出的該蛋白的序列午磁。

  • 在 Features 里還有兩個(gè)新的條目sig_peptide 和 mat_peptide之前沒(méi)有見(jiàn)到過(guò)尝抖。

    • sig_peptide,也就是 signal peptide漓踢,指出了編碼信號(hào)肽的堿基的位置。信號(hào)肽決定了蛋白質(zhì)的亞細(xì)胞定位漏隐,也就是蛋白質(zhì)工作的地方喧半。

    • mat_peptide,也就是 mature peptide青责,指 出了編碼成熟肽鏈的堿基的位置挺据。他從信號(hào)肽后面開(kāi)始,到編碼區(qū)結(jié)尾提前三個(gè)堿基結(jié)束脖隶。

  • 編碼區(qū)一直到第 821 號(hào)堿基扁耐,而編碼成熟蛋白的最后一個(gè)堿基是第 818 號(hào)堿基,這中間差了 3 個(gè)堿基产阱,那最后的這三個(gè)堿基干嘛去了呢婉称?

    • 編碼區(qū)的最后三個(gè)堿基是終止密碼子,不翻譯。

這條真核生物序列的 Genbank 注釋看起來(lái)和原核生物的差不多王暗,這是因?yàn)槲覀兒苄⌒牡奶袅艘粭l成熟 mRNA 的序列悔据。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請(qǐng)通過(guò)簡(jiǎn)信或評(píng)論聯(lián)系作者俗壹。
  • 序言:七十年代末科汗,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子绷雏,更是在濱河造成了極大的恐慌头滔,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件涎显,死亡現(xiàn)場(chǎng)離奇詭異坤检,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)棺禾,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)缀蹄,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人膘婶,你說(shuō)我怎么就攤上這事缺前。” “怎么了悬襟?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵衅码,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我脊岳,道長(zhǎng)逝段,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任割捅,我火速辦了婚禮奶躯,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘亿驾。我一直安慰自己嘹黔,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布莫瞬。 她就那樣靜靜地躺著儡蔓,像睡著了一般。 火紅的嫁衣襯著肌膚如雪疼邀。 梳的紋絲不亂的頭發(fā)上喂江,一...
    開(kāi)封第一講書(shū)人閱讀 51,125評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音旁振,去河邊找鬼获询。 笑死涨岁,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的筐付。 我是一名探鬼主播卵惦,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼瓦戚!你這毒婦竟也來(lái)了沮尿?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤较解,失蹤者是張志新(化名)和其女友劉穎畜疾,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體印衔,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡啡捶,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了奸焙。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片瞎暑。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖与帆,靈堂內(nèi)的尸體忽然破棺而出了赌,到底是詐尸還是另有隱情,我是刑警寧澤玄糟,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布勿她,位于F島的核電站,受9級(jí)特大地震影響阵翎,放射性物質(zhì)發(fā)生泄漏逢并。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一郭卫、第九天 我趴在偏房一處隱蔽的房頂上張望砍聊。 院中可真熱鬧,春花似錦贰军、人聲如沸玻蝌。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)灶伊。三九已至疆前,卻和暖如春寒跳,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背竹椒。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來(lái)泰國(guó)打工童太, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓书释,卻偏偏與公主長(zhǎng)得像翘贮,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子爆惧,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 一:To-B到To-C的補(bǔ)課 筆者之前的工作都在銀行狸页,沒(méi)有從事過(guò)互聯(lián)網(wǎng)這個(gè)行業(yè),倒是作為終端用戶(hù)對(duì)這些產(chǎn)品都知道扯再,...
    ForeverXiaofeng閱讀 458評(píng)論 0 1
  • 怎么做能讓我們的小孩贏在起跑線上?這是作為父母的我們秃殉,都關(guān)心的問(wèn)題坝初。 特別是具體怎么操作,或有什么簡(jiǎn)單...
    樹(shù)毛竹閱讀 199評(píng)論 0 0
  • 葉酸代謝障礙钾军,到底有什么大不了鳄袍? 懷孕了要吃葉酸,相信很多孕媽媽都知道巧颈。但是我們中國(guó)人由于遺傳問(wèn)題畦木,葉酸代謝基因(...
    愛(ài)孕樂(lè)寶閱讀 773評(píng)論 0 0
  • 很小的時(shí)候我就知道奶奶信神,雖然那時(shí)候我還不知道神為何物砸泛。我嬉笑著看著那幾個(gè)家族視為寶物的人偶十籍,披著紅綢,工工整...
    波波的簡(jiǎn)書(shū)閱讀 633評(píng)論 0 3
  • 這是一個(gè)名叫露易絲海的作者寫(xiě)的一本書(shū)唇礁,她被譽(yù)為最接近圣人的人勾栗。她寫(xiě)的這本書(shū)非常刻骨銘心盏筐,如果有機(jī)會(huì)我希望大家能讀一...
    琉璃雨滴閱讀 425評(píng)論 1 2