插件 | 地表最強(qiáng) Hmmer Search 界面工具

寫在前面

從某個物種中鑒定某個家族的全部成員缘缚,一般有兩種操作:

  1. 基于Domain,用hmmsearch等軟件
  2. 基于序列相似性桥滨,用BLAST等軟件

事實(shí)上,我個人是推薦第二種齐媒,尤其是目前絕大多數(shù)物種的基因結(jié)構(gòu)注釋存在問題纷跛。使用第一種,遺漏的幾率更大忽舟,比如正好保守結(jié)構(gòu)域區(qū)段沒有被注釋出來。當(dāng)然,使用第二種叮阅,則有一定可能引入假陽性刁品。當(dāng)然了,后者完全可以通過進(jìn)一步多類證據(jù)整合查看浩姥。這也就是可視化存在的意義(TBtools 的三圖合一)挑随。
然而,第一種確實(shí)是很快勒叠,也一直被更多人推崇兜挨。我也并不反對。所以眯分,很久以前拌汇,在 TBtools 中放了一個功能。


具體可以參考推文《使用HMM進(jìn)行基因家族鑒定弊决?無人不能》噪舀。兩年后,再來看實(shí)現(xiàn)邏輯飘诗,Ugly!
于是与倡,我一邊帶娃,一邊寫了今天這個插件(其實(shí)是委托運(yùn)營團(tuán)隊(duì)的 Feature Request)昆稿。

寫完這個插件纺座,我個人還是比較滿意。畢竟從某個角度來說溉潭,TBtools又少了一些被人吐槽的點(diǎn)(盡管我還是不明白净响,不就HMM,有啥好吐槽的)岛抄,也多了一個極度友好的功能别惦!

使用極其簡單

正如上圖,用戶只需要關(guān)心:

  1. 輸入文件 - 查詢信息 和 序列庫
  2. 輸出文件

對于輸入文件一夫椭,支持三類掸掸,且自動識別:

  1. PFAM ID,如 WRKY 結(jié)構(gòu)域?yàn)?PF03106蹭秋,MYB 結(jié)構(gòu)域?yàn)?code>PF00249扰付,這些可以直接在 PFAM 數(shù)據(jù)庫上找到,更或者在一些文獻(xiàn)中會注明羽莺。
  2. 多序列比對結(jié)果洞豁,如果果膠甲基酯酶 PME 家族,這類結(jié)構(gòu)蛋白刁卜,常常不像轉(zhuǎn)錄因子蛔趴,不一定有保守結(jié)構(gòu)域在PFAM上孝情。可以自己拿不同物種已知的PME蛋白序列魁亦,用TBtools 的MUSCLE Wrapper或者其他多序列比對軟件吉挣,得到的比對結(jié)果(無需注意比對結(jié)果格式睬魂,兼容幾乎所有多序列比對格式氯哮,如Fasta喉钢,Clustal肠虽,PAML等)税课,直接用作輸入韩玩。
  3. HMM庫陆馁,比如整個Pfam_A.hmm數(shù)據(jù)庫叮贩,當(dāng)然也可能是某幾個感興趣的保守結(jié)構(gòu)域的HMM。

而對于輸入文件二彪蓬,簡單寞焙,反正就是一個蛋白序列庫捣郊,下文我們直接使用香蕉所有蛋白序列集合呛牲。
至于輸出文件...給個路徑就行了娘扩。
下面琐旁,用三個使用實(shí)例來介紹具體使用方法灰殴。

實(shí)例一 - 直接使用 PFAM ID 列表

前述提到牺陶,轉(zhuǎn)錄因子WRKY和MYB家族的Pfam IDs分別為 PF03106 和 PF00249掰伸。這些可以直接在Pfam數(shù)據(jù)庫查到



使用這兩個Pfam ID狮鸭,我們就可以直接篩選出所有香蕉可能的WRKY和MYB家族成員怕篷。使用方法如下



非忱任剑快

點(diǎn)擊確定春弥,即可直接跳轉(zhuǎn)到輸出文件



一般 TBtools 用戶只需要看 XLS匿沛,打開就知道了

堪稱完美逃呼!這個格式者娱,可以直接用于結(jié)構(gòu)域可視化黄鳍。畢竟是 TBtools 用不,應(yīng)該知道怎么獲取對應(yīng)序列的序列長度藏古,然后用 Simple BioSequence Viewer 或者 Advanced Gene View 做可視化拧晕。
我鼓搗鼓搗防症,大概是這樣一張圖

實(shí)例二 - 直接使用多序列比對結(jié)果

正如前面提到的蔫敲,有一些家族并沒有保守的 Pfam IDs炭玫,我們可以直接使用一些已知家族成員蛋白序列(即使他們來自于不同物種)吞加,做一個多序列比對之后衔憨,用于輸入。



下載完了就用MUSCLE比對




如果你沒聽我的勸告,點(diǎn)擊“Directly Viz...”德崭,那么會看到

或許這里面就有保守結(jié)果域吧眉厨,肉眼看看比對效果也挺好的。
保險(xiǎn)起見鹿蜀,還是直接比對輸出 clutalw 格式(試了下耻姥,似乎TBtools Fasta2Clutal在特殊字符下會失效)



OK,繼續(xù)

自動彈出結(jié)果....

Emmm,似乎數(shù)目有點(diǎn)多似忧。對比了下HMM的結(jié)果和香蕉基因組注釋的結(jié)果

當(dāng)然我們有理由相信淳衙,假陽性沒那么高(HMM得到的多了46個饺著,得詳細(xì)看看了)幼衰,盡管存在。多少估計(jì)還是要精細(xì)看看梢睛,不過偏離主題了绝葡。

實(shí)例三 - 使用已有的HMM庫藏畅,如Pfam_A.hmm

有些時候,用戶會自己下載一些.hmm庫墓赴,或者從其他什么地方拿到。比如實(shí)例一中坦辟,用戶也可以自己下載WRKY結(jié)構(gòu)域的.hmm和MYB的.hmm文件章办,合并之后用這種方式來輸入藕届。這個模式的開放休偶,其實(shí)對我來說,估計(jì)還是直接上Pfam_A.hmm全庫词顾。比如我鑒定了某個家族肉盹,香蕉的某某家族上忍。這里我們就用香蕉基因組注釋的PME蛋白序列窍蓝,大概也就75個基因它抱。我們看看注釋得如何朴艰,都有什么結(jié)構(gòu)域祠墅。
于是可以直接下載Pfam_A.hmm全庫毁嗦,跑上



Emmm克锣,大概也就一兩分鐘。



也可以做個可視化

寫在后面

Emmm,整完了巾乳。又是一個插件胆绊。作為委托團(tuán)隊(duì)的Feature Request压状。這個插件納入眾籌系列(未定價)。先想想再說~~ 感興趣的朋友镣丑,可看看這兩天插件商店的更新。對插件商店不了解的谷婆,建議看看推文《Plugin | 高速版插件商店辽聊!我又有一個絕妙的 idea》异袄。
是誰玛臂?說 TBtools 不好用了~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末讽营,一起剝皮案震驚了整個濱河市橱鹏,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌挑围,老刑警劉巖杉辙,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件奏瞬,死亡現(xiàn)場離奇詭異,居然都是意外死亡泉孩,警方通過查閱死者的電腦和手機(jī)硼端,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來寓搬,“玉大人珍昨,你說我怎么就攤上這事【渑纾” “怎么了镣典?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長唾琼。 經(jīng)常有香客問我兄春,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任倡蝙,我火速辦了婚禮,結(jié)果婚禮上躬贡,老公的妹妹穿的比我還像新娘。我一直安慰自己魄懂,他們只是感情好填帽,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著层宫,像睡著了一般。 火紅的嫁衣襯著肌膚如雪米死。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼藐翎。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播乓旗,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼浦箱!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤红选,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡殷绍,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡掌唾,死狀恐怖贝乎,靈堂內(nèi)的尸體忽然破棺而出挽拔,到底是詐尸還是另有隱情亭枷,我是刑警寧澤答倡,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布度帮,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏鼻由。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一哈误、第九天 我趴在偏房一處隱蔽的房頂上張望箭阶。 院中可真熱鬧仇参,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽娄猫。三九已至,卻和暖如春虽缕,著一層夾襖步出監(jiān)牢的瞬間始藕,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工氮趋, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留伍派,地道東北人。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓剩胁,卻偏偏與公主長得像拙已,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子摧冀,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內(nèi)容