如何計算kaks值和4dtv值


前期準備

  • 不同物種的蛋白和cds序列:
    os.pep, os.cds, sb.pep, sb.cds
  • 依賴程序:
    blast+, clustalw2, ParaAT, KaKs_Calculator
    注:所依賴程序需提前安裝好羊苟,并添加到環(huán)境變量中
  • 所用腳本:
    axt2one-line.py, calculate_4DTV_correction.pl

獲得不同物種之間的同源序列

對參考物種的蛋白序列構(gòu)建索引

makeblastdb -in sb.pep -dbtype prot

將目標物種的蛋白序列與參考物種進行比對喘垂,并保留最優(yōu)匹配結(jié)果

blastp -query os.pep -db sb.pep -evalue 1e-5 -max_target_seqs 1 -num_threads 12 -out os2sb.blastp_out.m6 -outfmt 6

提取最優(yōu)匹配的同源序列基因?qū)?/p>

cut -f1-2 os2sb.blastp_out.m6|sort|uniq > os2sb.homolog

合并目標物種和參考物種的蛋白序列和cds序列

cat os.cds sb.cds >os_sb.cds
cat os.pep sb.pep >os_sb.pep

使用ParaAT程序?qū)⒌鞍仔蛄斜葘Y(jié)果轉(zhuǎn)化為cds序列比對結(jié)果

# 新建proc文件, 設定12個線程
echo "12" >proc
# -m參數(shù)指定多序列比對程序為clustalw2,-p參數(shù)指定多線程文件央渣,-f參數(shù)指定輸出文件格式為axt
ParaAT.pl -h os2sb.homolog -n os_sb.cds -a os_sb.pep -m clustalw2 -p proc -f axt -o os2sb_out

計算kaks值和4dtv值

cd os2sb_out
# 使用KaKs_Calculator計算kaks值, -m參數(shù)指定kaks值的計算方法為YN模型
for i in `ls *.axt`;do KaKs_Calculator -i $i -o ${i}.kaks -m YN;done
# 將多行axt文件轉(zhuǎn)換成單行
for i in `ls *.axt`;do axt2one-line.py $i ${i}.one-line;done
# 使用calculate_4DTV_correction.pl腳本計算4dtv值
ls *.axt.one-line|while read id;do calculate_4DTV_correction.pl $id >${id%%one-line}4dtv;done
# 合并所有同源基因?qū)Φ?dtv
for i in `ls *.4dtv`;do awk 'NR>1{print $1"\t"$2}' $i >>all-4dtv.txt;done
# 合并所有同源基因?qū)Φ膋aks值
for i in `ls *.kaks`;do awk 'NR>1{print $1"\t"$3"\t"$4"\t"$5}' $i >>all-kaks.txt;done
# 給結(jié)果文件排序并去冗余
sort all-4dtv.txt|uniq >all-4dtv.results
sort all-kaks.txt|uniq >all-kaks.results
# 清除中間文件
rm *one-line
rm all-4dtv.txt
rm all-kaks.txt
# 將kaks結(jié)果文件和4dtv結(jié)果文件進行合并
join -1 1 -2 1 all-kaks.results all-4dtv.results >all-results.txt
# 給結(jié)果文件添加標題
sed -i '1i\Seq\tKa\tKs\tKa/Ks\t4dtv_corrected' all-results.txt

使用calc_kaks_4dtv.sh腳本一步計算kaks值和4dtv值

nohup sh calc_kaks_4dtv.sh os sb &

查看腳本文件

#!/bin/bash
set -e
set -u

if [ $# -lt 2 ];then
    echo "Two parameters needed, but only $# given!"
    echo "Usage: sh calc_kaks_4dtv.sh <Species1> <Species2>"
exit 1;
fi

Species1=$1
Species2=$2

# 對參考物種的蛋白序列構(gòu)建索引
makeblastdb -in ${Species2}.pep -dbtype prot
# 將目標物種的蛋白序列與參考物種進行比對,并保留最優(yōu)匹配結(jié)果
blastp -query ${Species1}.pep -db ${Species2}.pep -evalue 1e-5 -max_target_seqs 1 -num_threads 10 -out ${Species1}2${Species2}.blastp_out.m6 -outfmt 6
# 提取最優(yōu)匹配的同源序列基因?qū)?cut -f1-2 ${Species1}2${Species2}.blastp_out.m6|sort|uniq > ${Species1}2${Species2}.homolog
# 合并目標物種和參考物種的蛋白序列和cds序列
cat ${Species1}.cds ${Species2}.cds >${Species1}_${Species2}.cds
cat ${Species1}.pep ${Species2}.pep >${Species1}_${Species2}.pep
# 使用ParaAT程序?qū)⒌鞍仔蛄斜葘Y(jié)果轉(zhuǎn)化為cds序列比對結(jié)果
ParaAT.pl -h ${Species1}2${Species2}.homolog -n ${Species1}_${Species2}.cds -a ${Species1}_${Species2}.pep -p proc -m clustalw2 -f axt -o ${Species1}2${Species2}_out
cd ${Species1}2${Species2}_out
# 使用KaKs_Calculator計算kaks值
for i in `ls *.axt`;do KaKs_Calculator -i $i -o ${i}.kaks -m YN;done
# 將多行axt文件轉(zhuǎn)換成單行
for i in `ls *.axt`;do axt2one-line.py $i ${i}.one-line;done
# 使用calculate_4DTV_correction.pl腳本計算4dtv值
ls *.one-line|while read id;do calculate_4DTV_correction.pl $id >${id%%one-line}4dtv;done
# 合并所有同源基因?qū)Φ?dtv值
for i in `ls *.4dtv`;do awk 'NR>1{print $1"\t"$2}' $i >>all-4dtv.txt;done
# 合并所有同源基因?qū)Φ膋aks值
for i in `ls *.kaks`;do awk 'NR>1{print $1"\t"$3"\t"$4"\t"$5}' $i >>all-kaks.txt;done
# 排序并去冗余
sort all-4dtv.txt|uniq >all-4dtv.results
sort all-kaks.txt|uniq >all-kaks.results
# 清除中間文件
rm *one-line
rm all-4dtv.txt
rm all-kaks.txt
# 將kaks結(jié)果文件和4dtv結(jié)果文件進行合并
join -1 1 -2 1 all-kaks.results all-4dtv.results >all-results.txt
# 給結(jié)果文件添加標題
sed -i '1i\Seq\tKa\tKs\tKa/Ks\t4dtv_corrected' all-results.txt

腳本運行完后會生成以下結(jié)果文件


image.png

最終得到的結(jié)果在os2sb_out文件夾中的all-results.txt文件中


image.png

繪制kaks值和4dtv值的密度分布圖

setwd("/Users/Davey/Desktop")
library(ggplot2)
library(patchwork)
data <- read.table("all-results.txt",header=T,check.names=F)
head(data)
                       Seq        Ka       Ks     Ka/Ks 4dtv_corrected
1 Os01g0276600-Sb03g022840 0.2954040 2.146660 0.1376110      0.3852584
2 Os01g0276700-Sb03g022860 0.0372221 0.586840 0.0634280      0.2272330
3 Os01g0276800-Sb03g022870 0.1293250 0.560683 0.2306560      0.2456600
4 Os01g0721900-Sb03g158830 0.0769183 0.849214 0.0905759      0.1966413
5 Os01g0723100-Sb03g158910 0.1109170 1.198870 0.0925176      0.4060341
6 Os01g0723200-Sb03g158920 0.0398003 0.941168 0.0422882      0.1695289
p1 <- ggplot(data,aes(Ks))+ geom_line(stat="density",color="red")+theme_classic()+theme(axis.title = element_text(size=24),axis.text = element_text(size = 22,color = "black"))
p2 <- ggplot(data,aes(Ka/Ks))+ geom_line(stat="density",color="blue")+theme_classic()+theme(axis.title = element_text(size=24),axis.text = element_text(size = 22,color = "black"))
p3 <- ggplot(data,aes(`4dtv_corrected`))+ geom_line(stat="density",color="orange")+theme_classic()+theme(axis.title = element_text(size=24),axis.text = element_text(size = 22,color = "black"))
p1 + p2 + p3
image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末统屈,一起剝皮案震驚了整個濱河市叉存,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌伪阶,老刑警劉巖煞檩,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異栅贴,居然都是意外死亡斟湃,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進店門檐薯,熙熙樓的掌柜王于貴愁眉苦臉地迎上來凝赛,“玉大人,你說我怎么就攤上這事坛缕∧沽裕” “怎么了?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵祷膳,是天一觀的道長陶衅。 經(jīng)常有香客問我,道長直晨,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任膨俐,我火速辦了婚禮勇皇,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘焚刺。我一直安慰自己敛摘,他們只是感情好,可當我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布乳愉。 她就那樣靜靜地躺著兄淫,像睡著了一般。 火紅的嫁衣襯著肌膚如雪蔓姚。 梳的紋絲不亂的頭發(fā)上捕虽,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天,我揣著相機與錄音坡脐,去河邊找鬼泄私。 笑死,一個胖子當著我的面吹牛备闲,可吹牛的內(nèi)容都是我干的晌端。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼恬砂,長吁一口氣:“原來是場噩夢啊……” “哼咧纠!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起泻骤,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤漆羔,失蹤者是張志新(化名)和其女友劉穎乳幸,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體钧椰,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡粹断,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了嫡霞。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片瓶埋。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖诊沪,靈堂內(nèi)的尸體忽然破棺而出养筒,到底是詐尸還是另有隱情,我是刑警寧澤端姚,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布晕粪,位于F島的核電站,受9級特大地震影響渐裸,放射性物質(zhì)發(fā)生泄漏巫湘。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一昏鹃、第九天 我趴在偏房一處隱蔽的房頂上張望尚氛。 院中可真熱鬧,春花似錦洞渤、人聲如沸阅嘶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽讯柔。三九已至,卻和暖如春护昧,著一層夾襖步出監(jiān)牢的瞬間魂迄,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工捏卓, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留极祸,地道東北人。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓怠晴,卻偏偏與公主長得像遥金,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子蒜田,可洞房花燭夜當晚...
    茶點故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內(nèi)容