寫在前面
前天芦劣,在學(xué)位論文的完善中,有兩個(gè)疑似ERF成員始終令我困擾说榆。
植物轉(zhuǎn)錄因子中有個(gè)超家族AP2虚吟,包括兩個(gè)亞家族,一個(gè)也叫AP2签财,另一個(gè)叫ERF串慰。前者往往含有兩個(gè)AP2結(jié)構(gòu)域,后者則只含有一個(gè)AP2結(jié)構(gòu)域唱蒸。但這句話邦鲫,并不全面。在很多物種中,AP2大家族往往還包括了極少數(shù)只含有一個(gè)AP2結(jié)構(gòu)域但又不是ERF亞家族的成員庆捺。對(duì)于這些成員古今,唯一的操作是建進(jìn)化樹,隨后定分支滔以。
那么到底這些成員跟AP2亞家族或者ERF亞家族成員有什么區(qū)別捉腥?
MEME suite做motif分析,當(dāng)然能看得出區(qū)別你画。但這個(gè)區(qū)別是否存在特定的功能抵碟,這個(gè)只能通過結(jié)構(gòu)域來知曉。
我試了常用的pfam和NCBI CDD坏匪,無法得到有用的答案拟逮。無意之下,想起了SMART适滓。
這個(gè)網(wǎng)站敦迄,我研一研二(五六年前)的時(shí)候就知道也用過了×J可以說颅崩,這是我認(rèn)為最為全面的序列特征預(yù)測(cè)軟件几于。
SMART 的使用困惑
SMART 確實(shí)是最強(qiáng)的蕊苗,但是在使用時(shí),卻相對(duì)麻煩沿彭。整個(gè)網(wǎng)站的整體運(yùn)行邏輯朽砰,我個(gè)人猜想是:
- 收到用戶提交的ID或者序列
- 查看后臺(tái)是否保存了對(duì)應(yīng)的ID和序列
- 如果保存了,那么就直接返回保存的結(jié)果喉刘,無需重復(fù)計(jì)算
- 如果沒找到可用結(jié)果瞧柔,那么就預(yù)測(cè),然后再返回
具體這個(gè)網(wǎng)站有兩種運(yùn)行模式:
- Single模式睦裳,支持輸入ID造锅,輸入序列
- Batch模式,也支持輸入ID和輸入序列
其中廉邑,Single模式支持沒找到結(jié)果就預(yù)測(cè)并返回哥蔚。而Batch模式,則只支持?jǐn)?shù)據(jù)庫(kù)中已收錄結(jié)果的返回蛛蒙。換句話說糙箍,如果你輸入的序列集合來自于數(shù)據(jù)庫(kù)未收錄的物種,那么你得不到結(jié)果牵祟∩詈唬或者這么說,只有你使用的序列或者ID正好是數(shù)據(jù)庫(kù)已經(jīng)收錄了的诺苹,你才會(huì)得到結(jié)果咕晋。
存在少數(shù)兩三個(gè)公眾號(hào)雹拄,沒搞清楚就推文說能批量,估計(jì)到現(xiàn)在他們都不知道被打臉~~畢竟捡需,只要能忽悠新手办桨,就達(dá)到他們的要求 。
然而站辉,我并不是一個(gè)喜歡做信息推廣的呢撞,相反,我更喜歡提供解決方案饰剥。既然我發(fā)現(xiàn)SMART確實(shí)可以找到不同殊霞,那么手上一百多個(gè)序列,我一個(gè)一個(gè)提交是不可能的汰蓉。于是绷蹲,我又寫了一個(gè)功能 ,即 Batch SMART
Batch SMART 的使用
多年前顾孽,我曾經(jīng)在 TBtools 中實(shí)現(xiàn)了插件模式祝钢。后來由于JDK的不斷變化,我發(fā)現(xiàn)并不穩(wěn)定若厚,一直沒開放拦英。但伴隨著 TBtools 用戶的增加,不同的用戶有不同的需求测秸,確實(shí)沒必要一直讓所有人每次更新 TBtools 軟件疤估。于是,在之前更新【即更新搜索框功能】的同時(shí)霎冯,TBtools的插件模式已經(jīng)釋放铃拇。
本次開放的 Batch SMART ,即 TBtools 的第一個(gè)插件沈撞。對(duì)于安裝慷荔,比較簡(jiǎn)單。
打開 TBtools 【建議右鍵圖標(biāo)缠俺,以管理員身份運(yùn)行 - 主要考慮到用戶寫入權(quán)限的問題】
點(diǎn)擊安裝插件菜單
選擇獲得的插件包
點(diǎn)擊 Open 即可完成安裝
安裝完成显晶,即可打開
具體的使用更為簡(jiǎn)單,
- 設(shè)置蛋白序列集合
- 設(shè)置輸出的序列特征文件路徑
注意晋修,點(diǎn)擊Start之后 吧碾,就等在進(jìn)度條加載。一般一個(gè)序列要至少15s墓卦。由于 SMART 提供的是網(wǎng)站計(jì)算服務(wù)倦春,如果排隊(duì),那么等待時(shí)間就更長(zhǎng)。我提交了100多個(gè)序列睁本,大體半個(gè)小時(shí)尿庐。【注:好東西不怕等】
SMART 做序列特征預(yù)測(cè)的優(yōu)勢(shì)
先看一張 pfam 的呢堰。
可以發(fā)現(xiàn)抄瑟,非常干凈。當(dāng)然枉疼,如果用NCBI CDD皮假,那么得到的結(jié)果比 pfam 全面一點(diǎn)。然而一般骂维。
再看看 SMART 的結(jié)果
注意看右上角惹资,如果圖片往下走,于是得到結(jié)果
寫在最后
Emmm... 沒有太多想說的航闺。感興趣的朋友褪测,就到QQ使用交流群下載插件吧【相信,任何人都是秒下】潦刃。
具體侮措,記得先更新到 TBtools 的最新版本。以后可能更多功能以插件的方式來釋放乖杠。這樣也免得軟件更新麻煩分扎。