基因家族分析（2）：基因家族鑒定與蛋白質(zhì)性質(zhì)簡單分析

本文主要工作內(nèi)容：

（1）使用HMM和NCBI-CDD對基因家族進(jìn)行鑒定

（2）使用幾個網(wǎng)站對基因家族表達(dá)蛋白質(zhì)的簡單性質(zhì)進(jìn)行分析

2.基因家族鑒定與基本特征探究

2.1 基因家族鑒定

2.1.1 軟件下載

鑒定基因家族需要使用到hmmer這款軟件，我們可以直接使用conda進(jìn)行安裝公黑，若使用源碼安裝立磁，提供網(wǎng)址如下：http://www.hmmer.org/

2.1.2 利用HMM鑒定

在鑒定過程中需要用到兩個文件，一個是我們之前下載的基因家族HMM模型文件，另外一個是處理后的蛋白質(zhì)序列文件。我們用軟鏈接在新的目錄下操作。

當(dāng)鑒定完成后寸爆。可以看到在—domtblout參數(shù)的輸出文件中，第一列即為我們需要的基因序列id赁豆。但是可以看到存在有重復(fù)id的情況仅醇，這是因為可能一個蛋白序列上存在有多個相似的結(jié)構(gòu)域，因此我們需要在提取id時去重復(fù)魔种。此外根據(jù)一般文獻(xiàn)要求析二，我們還得保證提取出來的基因this sequence中E-value小于1e-5，根據(jù)我的理解這表示比對的可信度更高节预。最后提取出序列id后我們再到蛋白質(zhì)序列文件中提取蛋白質(zhì)序列叶摄。這里使用的是seqtk這款軟件，我們也直接用conda安裝就好心铃。

aco.domtblout

2.1.3利用NCBI-CDD驗證

本質(zhì)上來說，鑒定基因家族其實依據(jù)的就是它的保守結(jié)構(gòu)域挫剑。NCBI-CDD（Conserved Domain）保存了大量的蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)去扣。我們使用HMM模型鑒定出候選基因家族成員后，不妨再使用NCBI-CDD數(shù)據(jù)庫對鑒定到的成員進(jìn)行驗證樊破，看看是否存在假陽性的情況愉棱。這里提供NCBI-CDD的網(wǎng)址：https://www.ncbi.nlm.nih.gov/cdd

在這里我們選擇CD-Search，進(jìn)入到鑒定界面

顯然這個操作界面比較容易理解哲戚。我們把提取到的蛋白質(zhì)序列文件的內(nèi)容全都復(fù)制下來奔滑，然后在左邊對話框中粘貼。然后在右邊的Expect Value threshold中改為0.00001顺少，使其與我們的e-value標(biāo)準(zhǔn)一致朋其。最后我們點(diǎn)擊submit，讓它自己運(yùn)行脆炎。

鑒定成功后梅猿，我們點(diǎn)擊Download下載結(jié)果文件，并將它上傳(復(fù)制)到服務(wù)器上秒裕。我們這里認(rèn)定SBT蛋白質(zhì)家族都含有Peptidases_S8這一保守結(jié)構(gòu)域袱蚓，因此我們依據(jù)結(jié)果文件對每條序列中是否含有保守結(jié)構(gòu)域進(jìn)行篩選，發(fā)現(xiàn)第十條序列中并不存在相應(yīng)的保守序列几蜻，因此我們結(jié)合這一結(jié)果得到最后的蛋白質(zhì)序列喇潘。對其中的序列數(shù)進(jìn)行統(tǒng)計，發(fā)現(xiàn)共有54條序列梭稚，與文獻(xiàn)中鑒定數(shù)量保持一致颖低。

2.2 基本特征探究

2.2.1 蛋白質(zhì)物理與化學(xué)特征

所謂的特征，也就是如等電點(diǎn)弧烤，分子質(zhì)量等簡單描述蛋白質(zhì)性質(zhì)的一些數(shù)據(jù)表征枫甲。這里僅提供網(wǎng)站鏈接，具體使用相對簡單，就不再贅述想幻。https://www.expasy.org/

2.2.2 信號肽鑒定

信號肽的鑒定同樣可通過網(wǎng)站進(jìn)行粱栖。文獻(xiàn)當(dāng)中使用TargetP和SignalP用于此類鑒定。由于有現(xiàn)成的網(wǎng)站脏毯，這里僅提供鏈接地址：https://services.healthtech.dtu.dk/service.php?TargetP-2.0闹究，https://services.healthtech.dtu.dk/service.php?SignalP-5.0

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市食店，隨后出現(xiàn)的幾起案子渣淤，更是在濱河造成了極大的恐慌，老刑警劉巖吉嫩，帶你破解...
沈念sama閱讀 206,839評論 6贊 482
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件价认，死亡現(xiàn)場離奇詭異，居然都是意外死亡自娩，警方通過查閱死者的電腦和手機(jī)用踩，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,543評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來忙迁，“玉大人脐彩，你說我怎么就攤上這事℃⑷樱” “怎么了惠奸？”我有些...
開封第一講書人閱讀 153,116評論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長恰梢。經(jīng)常有香客問我佛南，道長，這世上最難降的妖魔是什么嵌言？我笑而不...
開封第一講書人閱讀 55,371評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任共虑，我火速辦了婚禮，結(jié)果婚禮上呀页，老公的妹妹穿的比我還像新娘妈拌。我一直安慰自己，他們只是感情好蓬蝶，可當(dāng)我...
茶點(diǎn)故事閱讀 64,384評論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布尘分。她就那樣靜靜地躺著，像睡著了一般丸氛。火紅的嫁衣襯著肌膚如雪培愁。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,111評論 1贊 285
城市分裂傳說
那天缓窜，我揣著相機(jī)與錄音定续，去河邊找鬼谍咆。笑死，一個胖子當(dāng)著我的面吹牛私股，可吹牛的內(nèi)容都是我干的摹察。我是一名探鬼主播，決...
沈念sama閱讀 38,416評論 3贊 400
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼倡鲸，長吁一口氣：“原來是場噩夢啊……” “哼供嚎！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起峭状，我...
開封第一講書人閱讀 37,053評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤克滴，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后优床，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體劝赔，經(jīng)...
沈念sama閱讀 43,558評論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,007評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年胆敞，在試婚紗的時候發(fā)現(xiàn)自己被綠了着帽。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 38,117評論 1贊 334
活死人
序言：一個原本活蹦亂跳的男人離奇死亡竿秆，死狀恐怖启摄，靈堂內(nèi)的尸體忽然破棺而出稿壁，到底是詐尸還是另有隱情幽钢，我是刑警寧澤，帶...
沈念sama閱讀 33,756評論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布傅是，位于F島的核電站匪燕，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏喧笔。R本人自食惡果不足惜帽驯，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,324評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望书闸。院中可真熱鬧尼变，春花似錦、人聲如沸浆劲。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,315評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽牌借。三九已至度气，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間膨报，已是汗流浹背磷籍。一陣腳步聲響...
開封第一講書人閱讀 31,539評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工适荣，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人院领。一個月前我還...
沈念sama閱讀 45,578評論 2贊 355
代替公主和親
正文我出身青樓弛矛，卻偏偏與公主長得像，于是被迫代替她去往敵國和親栅盲。傳聞我的和親對象是個殘疾皇子汪诉，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,877評論 2贊 345