如何利用NCBI預(yù)測基因的結(jié)構(gòu)域和保守位點(diǎn)

1. 使用CD-Search工具來可以鑒定蛋白質(zhì)或者核酸序列內(nèi)的保守結(jié)構(gòu)域或功能單位响疚。該工具位于NCBI中国撵。具體我們可以進(jìn)入NCBI后選擇Conserved Domain然后點(diǎn)擊Search。

出現(xiàn)如下界面成黄,黃色部分即是本次要講的工具呐芥。其中CD-search只能提交單條序列,Batch CD-Search可以上傳多條序列奋岁。

2. 我們先以CD-Search為例思瘟,預(yù)測單條序列的結(jié)構(gòu)域。

點(diǎn)擊上圖中的CD-Search厦取,輸入蛋白質(zhì)/核酸查詢序列潮太,可以是FASTA格式的序列數(shù)據(jù),或者輸入GI或Accession號虾攻,同時在右方OPTIONS中選擇要搜索的數(shù)據(jù)庫铡买,Expect Value等,或者使用默認(rèn)設(shè)置霎箍,然后按“提交”按鈕奇钞。

3. 一分鐘后,運(yùn)行結(jié)果產(chǎn)生漂坏,見下圖景埃。搜索結(jié)果將顯示在默認(rèn)條件下使用簡要顯示模式(圖中右上方View可以下拉選擇其他模式),該模式僅顯示查詢序列最高得分的區(qū)域顶别。如果您想查看所有匹配的區(qū)域谷徙,請在View中更改為完整顯示。

搜索結(jié)果中有四種類型的匹配:特定匹配(specific hits)驯绎,非特定匹配(non-specific hits)完慧,這些匹配所屬的超家族(superfamily),以及多結(jié)構(gòu)域(multi-domains)剩失。保守特征/位點(diǎn)的氨基酸用小三角形標(biāo)識屈尼,這些位點(diǎn)可能為催化位點(diǎn)或者結(jié)合位點(diǎn)等。具體參見上圖中的注解拴孤。

如果CD-Search發(fā)現(xiàn)特定匹配脾歧,則查詢序列與命中的保守結(jié)構(gòu)域之間的關(guān)聯(lián)具有高置信度,進(jìn)推斷查詢序列的功能也是高可信的演熟。其他類型的匹配也可以揭示查詢蛋白的假定功能鞭执,其可信度由E值來評價。

4.批量遞交。點(diǎn)擊Batch CD-Search兄纺,如下:

可以選擇文件來上上傳免猾,文件序列數(shù)目不超過4000條。其他選項選擇后囤热,填入郵箱,程序運(yùn)行完會將結(jié)果發(fā)送郵件获三。

以下為結(jié)果頁面旁蔼,可以點(diǎn)擊Download下載:

其中對結(jié)果解釋如下:

| Query | 你輸入的序列ID |

| Hit type | CD-Search results can include hit types that represent various confidence levels (specific hits, non-specific hits) and domain model scope (superfamilies, multi-domains). They can be seen in both the Concise display and Full display, except for non-specific hits, which are shown only in the Full Display. |

| PSSM-ID | A PSSM ID is the unique identifier for a domain model's position-specific scoring matrix (PSSM). |

| From..To | The range of amino acids in the query protein sequence to which the domain model aligns. (Note: If the alignment found by RPS-BLAST omitted more than 20% of the CD's extent at either the n- or c-terminus or both, the partial nature of the hit is indicated in the "Incomplete" column of the hit table. Partial hits can also be spotted in the graphical display as domain model cartoons with jagged edges (illustrated example).) |

| E-value | The expect value, or E-value, indicates the statistical significance of the hit as the likelihood the hit was found by chance. |

| Bit Score | 比對得分分 |

| Accession | The accession number of the hit, which can either be a domain model or a superfamily cluster. (If the hit is a domain model, then the accession number (cl) of the superfamily cluster to which it belongs is listed in the "Superfamily" column of the output file.)* |

| Short name | The short name of a conserved domain, which concisely defines the domain. For example, "Voltage gated ClC" is the short title of the NCBI-curated conserved domain model for the voltage gated chloride channel (cd00400). |

| Incomplete | If the hit to a conserved domain is partial (i.e., if the alignment found by RPS-BLAST omitted more than 20% of the CD's extent at either the n- or c-terminus or both), this column will be populated with one of the following values:
N: incomplete at the N-terminus
C: incomplete at the C-terminus
NC: incomplete at both the N-terminus and C-terminus
If the hit to a conserved domain is complete, then this column will be populated with a dash (-).
(Note: Partial hits can also be spotted in the graphical display as domain model cartoons with jagged edges (illustrated example).) |

| Superfamily | This column is populated only for domain models that are specific or non-specific hits, and it lists the accession number of the superfamily to which the domain model belongs.
(If the hit is to a superfamily itself, then this column is simply populated with a dash because the superfamily accession is already listed in the preceding "Accession" column.) |

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市疙教,隨后出現(xiàn)的幾起案子棺聊,更是在濱河造成了極大的恐慌,老刑警劉巖贞谓,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件限佩,死亡現(xiàn)場離奇詭異,居然都是意外死亡裸弦,警方通過查閱死者的電腦和手機(jī)祟同,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來理疙,“玉大人晕城,你說我怎么就攤上這事〗严停” “怎么了砖顷?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長赃梧。 經(jīng)常有香客問我滤蝠,道長,這世上最難降的妖魔是什么授嘀? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任物咳,我火速辦了婚禮,結(jié)果婚禮上粤攒,老公的妹妹穿的比我還像新娘所森。我一直安慰自己,他們只是感情好夯接,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布焕济。 她就那樣靜靜地躺著,像睡著了一般盔几。 火紅的嫁衣襯著肌膚如雪晴弃。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天,我揣著相機(jī)與錄音上鞠,去河邊找鬼际邻。 笑死,一個胖子當(dāng)著我的面吹牛芍阎,可吹牛的內(nèi)容都是我干的世曾。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼谴咸,長吁一口氣:“原來是場噩夢啊……” “哼轮听!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起岭佳,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤血巍,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后珊随,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體述寡,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年叶洞,在試婚紗的時候發(fā)現(xiàn)自己被綠了鲫凶。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡京办,死狀恐怖掀序,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情惭婿,我是刑警寧澤不恭,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站财饥,受9級特大地震影響换吧,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜钥星,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一沾瓦、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧谦炒,春花似錦贯莺、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至还蹲,卻和暖如春爹耗,著一層夾襖步出監(jiān)牢的瞬間耙考,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工潭兽, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留倦始,地道東北人。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓山卦,卻偏偏與公主長得像鞋邑,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子账蓉,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內(nèi)容