序列標(biāo)識(shí)圖
sequencelogo 工具使用
使用在線的工具,WebLogo3
http://weblogo.threeplusone.com/
字母大小都是根據(jù)上方的運(yùn)算求得的,通常來說出現(xiàn)次數(shù)多的字母材泄,體積也就越大,而如果某一列只有一個(gè)大字母吨岭,說明該列非常保守拉宗。
因?yàn)樵谟?jì)算過程中設(shè)計(jì)了熵值,因此如果某列序列字母越混亂辣辫,熵值越大旦事,則字母越矮。越有規(guī)律急灭,熵值越小姐浮,字母越高。
開始比對(duì)
目前weblogo 已經(jīng)支持大多數(shù)的多序列比對(duì)結(jié)果格式化戳。
解讀結(jié)果
找尋保守序列的基序
在核酸/蛋白質(zhì) 序列中存在有特定模式的序列片段单料,這些片段稱為序列的基序(motif)埋凯。序列基序與序列功能密切相關(guān)。
比如在BLAST 時(shí)所說到的“精準(zhǔn)版BLAST”扫尖,即PHI-BLAST白对,便是找尋序列基序。
MEME
MEME 便是一款可以自動(dòng)從一組相關(guān)的DNA或蛋白質(zhì)序列中發(fā)現(xiàn)序列基序的軟件换怖。
http://meme-suite.org/
MEME 包含了各種軟件甩恼,我們暫時(shí)只用MEME。
http://meme-suite.org/tools/meme
MEME 支持格式為FASTA沉颂。
輸入界面介紹
結(jié)果顯示
還可將基序提交到數(shù)據(jù)庫(kù)条摸,進(jìn)行針對(duì)該基序的序列相似性搜索
蛋白質(zhì)的指紋圖譜
一個(gè)蛋白質(zhì)的指紋(prints)就是一組保守的序列基序,用于刻畫蛋白質(zhì)家族的特征铸屉。這些基序由多序列比對(duì)結(jié)果獲得钉蒲,且它們?cè)诎被嵝蛄猩鲜遣幌噜彽模谌S結(jié)構(gòu)中彻坛,它們可能緊密結(jié)合在一起顷啼。
PRINTS 是蛋白質(zhì)序列指紋圖譜數(shù)據(jù)庫(kù),存儲(chǔ)了目前已發(fā)現(xiàn)的絕大多數(shù)的蛋白質(zhì)家族的指紋圖譜昌屉。對(duì)于一個(gè)陌生的蛋白質(zhì)钙蒙,只要看看它的序列是否符合某個(gè)家族的圖譜,就可以對(duì)它進(jìn)行分類并預(yù)測(cè)它的功能间驮。
PRINT 數(shù)據(jù)庫(kù)
http://130.88.97.239/PRINTS/index.php
我們可以通過文本搜索
比如我們搜索"TRANSFERRIN"
解讀結(jié)果信息
查看指紋圖譜所使用的多序列比對(duì)結(jié)果
ps: 我使用的數(shù)據(jù)搜索結(jié)果欄目中躬厌,沒有view structure 一項(xiàng)了。
還可以進(jìn)行指紋匹配
即搜索某一序列所匹配的指紋圖譜
這里只能輸入純序列
分別顯示排名前三和前十的指紋圖譜
可以看到匹配的蛋白指紋圖譜各個(gè)基序在輸入序列中匹配的位置
后面一個(gè)表格還提供了匹配蛋白質(zhì)家族的基序在輸入序列中具體的匹配片段竞帽。