選擇壓力(dn/ds)計算

dn/ds又叫ka/ks偎痛,具體的概念,意義百度上都有〔嚷螅現(xiàn)主要介紹最近用到的三種計算途徑枚赡,分別是maga7,datamonkey谓谦,paml贫橙。

做選擇壓力分析的序列文件,需要先clustal和剔除終止密碼子反粥,這步可以在MAGA里完成卢肃。

1.MAGA7

MAGA7疲迂,是通過分別求取dn,ds的值莫湘,然后得到dn/ds尤蒿。

將fasta格式的序列文件導(dǎo)入MAGA, 然后選擇Distance——computer overall mean distance進入圖一頁面:仔細看下面的選項卡,在substitutions type 中選擇 Syn-Nonsynonymous逊脯;Genetic code table 按照自己的序列選擇优质;modle/method 選擇 Nei-Gojobori method (No. of Differences);Substitutions to include 選擇要計算的dn或者ds军洼。下一步巩螃,就能得到dn或者ds,兩者相比得到結(jié)果匕争。

如果在distance——computer pairwise#####避乏,然后按照后面步驟操作,結(jié)果會得到一個兩兩比較的矩陣(三角)甘桑,我還不知道這個要怎么用拍皮。

如果只計算dn/ds,第一種應(yīng)該夠用了跑杭。

圖一

2.Datamonkey

官網(wǎng):https://www.datamonkey.org/

三種方式铆帽,按照你的序列條件選擇其中一種。以FEL為例:

圖二

在method and tool 里選擇適合的方式德谅,如FEL爹橱,選擇文件導(dǎo)入sqe序列,選擇genetic code窄做。 RUN~ 選擇select all —— save branch selection 運行

圖三
圖四

得到結(jié)果后愧驱,前面兩行表示的是positive和negative的位點數(shù),以及p值椭盏。向下滑组砚,最后的表格的左下角是dn/ds的結(jié)果。更多的結(jié)果都在這個結(jié)果頁面和export的annalyze log里掏颊。

圖五
圖六

3.PAML-codeml

楊子恒教授開發(fā)并免費提供的一個軟件糟红。paml現(xiàn)在已經(jīng)開發(fā)到4.9h版了,這是一個命令行軟件乌叶,現(xiàn)在已經(jīng)有圖形操作界面-pamlX改化,但是因為命令行操作起來很簡單,而且學(xué)會也不難枉昏,就沒有學(xué)習(xí)pamlX陈肛。

paml官網(wǎng):http://abacus.gene.ucl.ac.uk/software/paml.html#PAMLx

參照官網(wǎng)信息可以完成下載,安裝和運行示例文件兄裂。示例文件在下載的paml4.9h的example文件夾里句旱。這里需要注意阳藻,可以將所有的’.exe‘文件和codeml.ctl (控制文件)復(fù)制到paml 的bin的文件夾里。方便運行谈撒,減少出錯腥泥。

按照要求準(zhǔn)備序列文件和樹文件(樹文件可以直接用maga做),有提示序列文件需要 .phy或者.paml格式啃匿,但是實踐證明用.fasta格式也可以(注意文件名中不能有空格)蛔外。

windows系統(tǒng)打開cmd:win+R,輸入cmd溯乒,回車

輸入paml4.9h所在的盤夹厌,如:d: ,回車

輸入cd裆悄, cd的命令查詢文件矛纹,

輸入bin文件夾所在位置,回車光稼,>后 需要輸入運行的程序codemL

回車就是運行的結(jié)果或南。

windows不區(qū)別大小寫,都可以艾君。

下面是codeml.ctl文件的設(shè)置

seqfile =aa.fas * sequence data filename

?treefile =aa.nwk? ? ? * tree structure file name

?outfile = aa.txt? ? ? ? ? * main result file name

? ? ? ? noisy = 3? * 0,1,2,3,9: how much rubbish on the screen

? ? ? verbose = 0? * 0: concise; 1: detailed, 2: too much

? ? ? runmode = 0? * 0: user tree;? 1: semi-automatic;? 2: automatic

? ? ? ? ? ? ? ? ? * 3: StepwiseAddition; (4,5):PerturbationNNI; -2: pairwise

? ? ? seqtype = 1? * 1:codons; 2:AAs; 3:codons-->AAs

? ? CodonFreq = 2? * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon table

*? ? ? ? ndata = 10

? ? ? ? clock = 0? * 0:no clock, 1:clock; 2:local clock; 3:CombinedAnalysis

? ? ? aaDist = 0? * 0:equal, +:geometric; -:linear, 1-6:G1974,Miyata,c,p,v,a

? aaRatefile = dat/jones.dat? * only used for aa seqs with model=empirical(_F)

? ? ? ? ? ? ? ? ? * dayhoff.dat, jones.dat, wag.dat, mtmam.dat, or your own

? ? ? ? model = 0? 【這個是branch/branch-site/site的選項采够,site選擇0,具體區(qū)別可另外檢索】

? ? ? ? ? ? ? ? ? * models for codons:

? ? ? ? ? ? ? ? ? ? ? * 0:one, 1:b, 2:2 or more dN/dS ratios for branches

? ? ? ? ? ? ? ? ? * models for AAs or codon-translated AAs:

? ? ? ? ? ? ? ? ? ? ? * 0:poisson, 1:proportional, 2:Empirical, 3:Empirical+F

? ? ? ? ? ? ? ? ? ? ? * 6:FromCodon, 7:AAClasses, 8:REVaa_0, 9:REVaa(nr=189)

? ? ? NSsites = 0? 1? 2 3 7 8? 【下面附上的結(jié)果解讀鏈接里有區(qū)別冰垄,其中包含零假設(shè)和替代假設(shè)】* 0:one w;1:neutral;2:selection; 3:discrete;4:freqs;

? ? ? ? ? ? ? ? ? * 5:gamma;6:2gamma;7:beta;8:beta&w;9:betaγ

? ? ? ? ? ? ? ? ? * 10:beta&gamma+1; 11:beta&normal>1; 12:0&2normal>1;

? ? ? ? ? ? ? ? ? * 13:3normal>0

? ? ? ? icode = 1? 【根據(jù)密碼子選擇】* 0:universal code; 1:mammalian mt; 2-10:see below

? ? ? ? Mgene = 0

? ? ? ? ? ? ? ? ? * codon: 0:rates, 1:separate; 2:diff pi, 3:diff kapa, 4:all diff

? ? ? ? ? ? ? ? ? * AA: 0:rates, 1:separate

? ? fix_kappa = 0? * 1: kappa fixed, 0: kappa to be estimated

? ? ? ? kappa = 2? * initial or fixed kappa

? ? fix_omega = 0? * 1: omega or omega_1 fixed, 0: estimate

? ? ? ? omega = .4 * initial or fixed omega, for codons or codon-based AAs

? ? fix_alpha = 1? * 0: estimate gamma shape parameter; 1: fix it at alpha

? ? ? ? alpha = 0. * initial or fixed alpha, 0:infinity (constant rate)

? ? ? Malpha = 0? * different alphas for genes

? ? ? ? ncatG = 8? * # of categories in dG of NSsites models

? ? ? ? getSE = 0? * 0: don't want them, 1: want S.E.s of estimates

RateAncestor = 1? * (0,1,2): rates (alpha>0) or ancestral states (1 or 2)

? Small_Diff = .5e-6

? ? cleandata = 1? * remove sites with ambiguity data (1:yes, 0:no)?

*? fix_blength = 0? * 0: ignore, -1: random, 1: initial, 2: fixed, 3: proportional

? ? ? method = 0? * Optimization method 0: simultaneous; 1: one branch a time

* Genetic codes: 0:universal, 1:mammalian mt., 2:yeast mt., 3:mold mt.,

* 4: invertebrate mt., 5: ciliate nuclear, 6: echinoderm mt.,

* 7: euplotid mt., 8: alternative yeast nu. 9: ascidian mt.,

* 10: blepharisma nu.

* These codes correspond to transl_table 1 to 11 of GENEBANK.


圖七
圖八
圖九

ps:教程:http://www.reibang.com/u/214b3ff96d82

B站視頻教程:https://www.bilibili.com/video/av10469605 from=search&seid=4867078036525249250

如何解讀結(jié)果:http://blog.sina.com.cn/s/blog_65ba09d90102x4ua.html

ps:我覺得視頻教程里up主說做的是branch蹬癌,然后取model=0是零假設(shè),與我理解的有出入播演,我以為model=0是site冀瓦,NSsite可以決定那個是零假設(shè)那個是替代假設(shè)伴奥。

另外写烤,在對結(jié)果解讀的過程中,很多文章都提到M1a拾徙,M2a洲炊,但是NSsite里沒有M1a,M2a尼啡,只有M1, M2, 不解暂衡。

視頻UP主是branch test ,另一種計算模型崖瞭,并非兩者有錯誤狂巢。

所有內(nèi)容不保證正確,有錯就改书聚。



建議忽略NEB的輸出唧领,選用BEB的輸出藻雌,BEB只在正向選擇的M2/M8中存在。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末斩个,一起剝皮案震驚了整個濱河市胯杭,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌受啥,老刑警劉巖做个,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異滚局,居然都是意外死亡居暖,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門核畴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來膝但,“玉大人,你說我怎么就攤上這事谤草「” “怎么了?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵丑孩,是天一觀的道長冀宴。 經(jīng)常有香客問我,道長温学,這世上最難降的妖魔是什么略贮? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮仗岖,結(jié)果婚禮上逃延,老公的妹妹穿的比我還像新娘。我一直安慰自己轧拄,他們只是感情好揽祥,可當(dāng)我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著檩电,像睡著了一般拄丰。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上俐末,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天料按,我揣著相機與錄音,去河邊找鬼卓箫。 笑死载矿,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的烹卒。 我是一名探鬼主播闷盔,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼魂挂,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了馁筐?” 一聲冷哼從身側(cè)響起涂召,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎敏沉,沒想到半個月后果正,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡盟迟,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年秋泳,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片攒菠。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡迫皱,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出辖众,到底是詐尸還是另有隱情卓起,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布凹炸,位于F島的核電站戏阅,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏啤它。R本人自食惡果不足惜奕筐,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望变骡。 院中可真熱鬧离赫,春花似錦、人聲如沸塌碌。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽誊爹。三九已至蹬刷,卻和暖如春瓢捉,著一層夾襖步出監(jiān)牢的瞬間频丘,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工泡态, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留搂漠,地道東北人。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓某弦,卻偏偏與公主長得像桐汤,于是被迫代替她去往敵國和親而克。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容