基因家族分析(3):序列比對與進化樹構(gòu)建

本文主要工作:

(1) 按前期處理鳳梨所需分析數(shù)據(jù)下載并處理擬南芥分析數(shù)據(jù)

(2) 對擬南芥和鳳梨 SBT?基因家族cds序列進行比對,并構(gòu)建進化樹文件

3.序列比對與進化樹構(gòu)建

3.1數(shù)據(jù)準備

由于在序列比對構(gòu)建進化樹過程中需要使用擬南芥數(shù)據(jù),在這里我們?nèi)匀话凑詹ぬ}所需基因組數(shù)據(jù)下載擬南芥相關(guān)數(shù)據(jù)胎署,并先對部分進行處理猖吴。可以看到cds和蛋白質(zhì)序列中的序列數(shù)和基因數(shù)量是相等的,因此我們不需要對其進行更改。只有g(shù)ff3文件需要對mRNA進行更改,保留在cds序列中的ID钞螟,但是由于這一大步不涉及gff3文件,而更改起來又需要自己寫個腳本谎碍,故而放在之后的過程中應(yīng)用鳞滨。最后本大步需要改動的是cds和pep序列中的id名。我們在這里只使用sed命令加正則表達式就好蟆淀。

隨后我們?nèi)匀恍枰貜?fù)之前對菠蘿的操作拯啦,鑒定擬南芥中的SBT基因家族澡匪。由于原理是相同的,我在這里就不多加以說明褒链,僅給出代碼唁情。順便一提,根據(jù)我個人的看法甫匹,在進行序列比對與構(gòu)建進化樹時甸鸟,仍然需要使用cds即基因組編碼序列。因為對基因家族的研究使用要回歸到基因組序列上兵迅,基因家族的變化實質(zhì)上是基因編碼序列的堿基變化抢韭。那么為什么我們前面要用蛋白質(zhì)序列鑒定呢?因為Pfam上保存的實際上是蛋白質(zhì)保守結(jié)構(gòu)域模型喷兼。


3.2 序列比對

在這里篮绰,我們僅進行菠蘿和擬南芥之間的序列比對后雷,而在文章中作者也添加了其它物種構(gòu)建了另一個進化樹季惯,我們并不涉及此。多序列比對我們使用的是muscle軟件臀突,也可以使用conda 安裝勉抓。而在比對時,我們只需要輸入合并了的菠蘿和擬南芥SBT?家族cds序列就可以得到新的比對文件了候学。

3.3 進化樹構(gòu)建

在得到序列比對文件后藕筋,我們?nèi)匀恍枰M行一定的處理。比對過后的文件仍然是類似fasta格式的梳码,但是我們在本章使用的建樹軟件iqtree需要輸入phylip格式文件隐圾。此外,通過less命令查看比對文件可以發(fā)現(xiàn)掰茶,比對后的文件存在大片段gap暇藏,這對于進化樹構(gòu)建的計算資源消耗較大,因此我們需要對比對文件進行處理濒蒋。以上需求我們可以通過trimal軟件實現(xiàn)盐碱,該軟件可通過conda 安裝。

在得到處理好的進化樹文件后沪伙,我們就可以構(gòu)建進化樹了瓮顽。這里用到的軟件是iqtree,它是基于最大似然法構(gòu)建進化樹的围橡。具體內(nèi)容我計劃在之后專門開專欄學(xué)習(xí)并闡明暖混。這款軟件也是可以通過conda安裝。


當(dāng)iqtree運行完成后翁授,我們會得到一系列以剛才我們規(guī)定前綴的文件拣播,在這里我們選取的主要是以treefile結(jié)尾的文件善绎,它是newick格式的樹文件,可以直接使用該文件在MEGA或是iTol等建樹專業(yè)地址進行進化樹構(gòu)建诫尽。有關(guān)它們的使用方法可以參考:iTOL美化系統(tǒng)發(fā)育樹 - 簡書禀酱;MEGA 美化進化樹 - 簡書。在這里我僅對樹文件細節(jié)做一下說明牧嫉,通過預(yù)覽可以發(fā)現(xiàn)每個基因的id都帶有類似于.1這樣的東西存在剂跟,它代表的是對可變剪切保留最長轉(zhuǎn)錄本后由某個基因編碼的第n個rna id。但是我們在構(gòu)建進化樹時為了美觀酣藻,同時也為了更符合基因id這個概念曹洽,我們選擇把它們刪去。這里結(jié)合sed命令實現(xiàn)辽剧。





最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末送淆,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子怕轿,更是在濱河造成了極大的恐慌偷崩,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件撞羽,死亡現(xiàn)場離奇詭異阐斜,居然都是意外死亡,警方通過查閱死者的電腦和手機诀紊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門谒出,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人邻奠,你說我怎么就攤上這事笤喳。” “怎么了碌宴?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵杀狡,是天一觀的道長。 經(jīng)常有香客問我唧喉,道長捣卤,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任八孝,我火速辦了婚禮董朝,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘干跛。我一直安慰自己子姜,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布楼入。 她就那樣靜靜地躺著哥捕,像睡著了一般牧抽。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上遥赚,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天扬舒,我揣著相機與錄音,去河邊找鬼凫佛。 笑死讲坎,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的愧薛。 我是一名探鬼主播晨炕,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼毫炉!你這毒婦竟也來了瓮栗?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤瞄勾,失蹤者是張志新(化名)和其女友劉穎费奸,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體丰榴,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡货邓,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年秆撮,在試婚紗的時候發(fā)現(xiàn)自己被綠了四濒。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡职辨,死狀恐怖盗蟆,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情舒裤,我是刑警寧澤喳资,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站腾供,受9級特大地震影響仆邓,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜伴鳖,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一节值、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧榜聂,春花似錦搞疗、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽桩皿。三九已至,卻和暖如春幢炸,著一層夾襖步出監(jiān)牢的瞬間泄隔,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工宛徊, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留梅尤,地道東北人。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓岩调,卻偏偏與公主長得像巷燥,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子号枕,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容