hyphy計算選擇壓力(+pal2nal的使用)

官網(wǎng):http://www.hyphy.org/
http://www.bork.embl.de/pal2nal/
參考:[hyphy]http://www.reibang.com/p/2e8f7f7d545a
[pal2nal]https://blog.csdn.net/qq_50637636/article/details/120226785?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2

1 所需要的

  • 基因組序列(案例是野生稻和栽培稻)
  • GFF3基因組注釋文件
  • 蛋白質(zhì)序列
  • CDS序列(有ATG起始密碼子维哈,沒有TAG, TAA, TGA終止密碼子)
  • 樹文件(.nwick格式文件)
  • 在python2.7的conda環(huán)境下使用

2 步驟

  1. 得到野生稻和栽培稻的CDS文件
  2. 得到野生稻和栽培稻的蛋白質(zhì)文件
  3. 比對蛋白質(zhì)文件
  4. 用pal2nal軟件將已經(jīng)比對好的蛋白及其對應(yīng)的DNA多序列轉(zhuǎn)化為密碼子比對的程序。

舉例:
本來用CDS序列直接去比對履磨,順序可能是:-AGTTG-GGAATAAT-TT--TAT-
但通過pal2nal后
蛋白質(zhì)序列:-SWE--LF-Y-
將CDS反向比對回去就變成:-AGTTGGGAA--TAATTT-TAT- (三個三個密碼子成對出現(xiàn))

  1. 構(gòu)建系統(tǒng)發(fā)育樹
  2. 使用hyphy計算選擇壓力

2 安裝

pal2nal的安裝

conda create -n pal2nal
conda activate pal2nal
conda install pal2nal

hyphy的安裝

conda create -n python2.7 python=2.7 # 創(chuàng)建環(huán)境
conda activate python2.7 # 進(jìn)入環(huán)境
conda install hyphy # 安裝hyphy

3 序列的準(zhǔn)備

因為該軟件要求蛋白質(zhì)序列和CDS序列要保持一致性,所以我用gffread軟件從基因組文件中提取出CDS文件,再翻譯成蛋白質(zhì)文件偷厦。

gffread test.gff3 -g test.genomic.fasta  -x test.cds -y test.pep

我之前試過直接用網(wǎng)上下的數(shù)據(jù)展氓,會報錯,數(shù)據(jù)比較混亂割去。如下圖窟却,第一個密碼子AGC應(yīng)該翻譯成S(絲氨酸),但卻翻譯成了E劫拗。


2fee0f2b9cb9278ade538f9ac30c514.png

4 序列的比對

4.1 蛋白質(zhì)序列的比對

mafft --auto --thread 10 test.pep > test.pep.aln   # 線程數(shù)可以自己看著改

4.2 pal2nal的使用

perl /Path/To/pal2nal.pl pep.fas nuc.fas -output fasta 
# 輸入文件间校,兩個,分別是比對好的PEP和原始的CDS序列
# -output 輸出文件格式页慷,默認(rèn)為clustal

4.3 過濾一些gap(可選)

為什么要過濾憔足?

  1. 前后會產(chǎn)生很多gap,對選擇壓力的計算沒有用酒繁,徒增計算壓力滓彰,也會浪費(fèi)時間;
  2. 有些序列可能會全都是gap州袒,在后面構(gòu)樹的時候也會被濾掉的揭绑。這樣的話,在最后hyphy計算選擇壓力的時候,就會出現(xiàn)樹的支(即序列數(shù))比文件的序列數(shù)少1的錯誤他匪。

怎么過濾菇存?

trimal -in test.pal2nal.fasta -out test.pal2nal.gappyout.fasta -gappyout

5 構(gòu)建系統(tǒng)發(fā)育樹

iqtree -s test.pal2nal.gappyout.fasta -m MFP -bb 1000 -nt AUTO --prefix test
# -s 輸入比對序列
# -m MFP 選擇最佳模型后構(gòu)樹
# -bb 1000 快速自展1000次
# 因為快速自展1000次支持值結(jié)果可能會偏大,所以時間比較寬裕的話可以加上-bnni
# -nt AUTO 線程數(shù)邦蜜,給iqtree自行安排和選擇
# --prefix 輸出文件前綴

6 hyphy的使用

  1. 選擇方法
    使用hyphy -i依鸥,一步一步選擇合適你目的的方法
  2. 開始計算(我這里用的方法是absrel)
hyphy absrel --alignment test.pal2nal.gappyout.fasta -tree test.treefile CPU=10 > hyphy.out
# 如果是新版本的話,hyphy會自動根據(jù)需求采用多線程
# 你可以加上foreground或者branchs信息悼沈,詳細(xì)的使用可以看官網(wǎng)贱迟。
  1. 輸出結(jié)果
    Hyphy運(yùn)行的時候,默認(rèn)打印到屏幕上的結(jié)果是以markdown格式輸出的絮供,而保存到本地文件的結(jié)果是以json格式輸出的(json格式可以很方便的用python的json模塊提取各種信息衣吠,例如pvalue和正選擇位點,適合多個任務(wù)批量操作)壤靶。默認(rèn)是輸出到和多序列比對文件相同的文件夾缚俏,可以用--output來改變輸出位置。
  2. 結(jié)果可視化
    可以去官網(wǎng)http://vision.hyphy.org/來可視化輸出結(jié)果萍肆。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末袍榆,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子塘揣,更是在濱河造成了極大的恐慌包雀,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件亲铡,死亡現(xiàn)場離奇詭異才写,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)奖蔓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進(jìn)店門赞草,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人吆鹤,你說我怎么就攤上這事厨疙。” “怎么了疑务?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵沾凄,是天一觀的道長。 經(jīng)常有香客問我知允,道長撒蟀,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任温鸽,我火速辦了婚禮保屯,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己姑尺,他們只是感情好竟终,可當(dāng)我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著切蟋,像睡著了一般衡楞。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上敦姻,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天,我揣著相機(jī)與錄音歧杏,去河邊找鬼镰惦。 笑死,一個胖子當(dāng)著我的面吹牛犬绒,可吹牛的內(nèi)容都是我干的旺入。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼凯力,長吁一口氣:“原來是場噩夢啊……” “哼茵瘾!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起咐鹤,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤拗秘,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后祈惶,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體雕旨,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年捧请,在試婚紗的時候發(fā)現(xiàn)自己被綠了凡涩。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡疹蛉,死狀恐怖活箕,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情可款,我是刑警寧澤育韩,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站筑舅,受9級特大地震影響座慰,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜翠拣,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一版仔、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦蛮粮、人聲如沸益缎。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽莺奔。三九已至,卻和暖如春变泄,著一層夾襖步出監(jiān)牢的瞬間令哟,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工妨蛹, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留屏富,地道東北人。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓蛙卤,卻偏偏與公主長得像狠半,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子颤难,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內(nèi)容