Fst菩颖、PI样漆、TajimaD值的計(jì)算

Fst值的計(jì)算

群體間分化指數(shù)fst,取值范圍0~1,值越大表明群體間分化程度越高位他,親緣關(guān)系越遠(yuǎn)氛濒。

#按照窗口模式計(jì)算(更準(zhǔn)確)
vcftools --vcf Filter.snp.vcf --weir-fst-pop 1-population.txt --weir-fst-pop 2-population.txt --out p1_p2_window --fst-window-size 500000 --fst-window-step 50000
vcftools --vcf Filter.snp.vcf --weir-fst-pop 1-population.txt --weir-fst-pop 3-population.txt --out p1_p3_window --fst-window-size 500000 --fst-window-step 50000
vcftools --vcf Filter.snp.vcf --weir-fst-pop 2-population.txt --weir-fst-pop 3-population.txt --out p2_p3_window --fst-window-size 500000 --fst-window-step 50000
#參數(shù)
#weir-fst-pop 需要計(jì)算的群體ID名,與vcf文件里的群體ID名一致鹅髓,該文件必須是txt格式舞竿,每個(gè)ID占一行
#--fst-window-size  --fst-window-step 設(shè)置窗口大小和步長(zhǎng)的參數(shù),按自己的需求而定
#根據(jù)加權(quán)fst為Fst排序
sort -k 5 -g p1_p2_window.windowed.weir.fst > p1_p2.sorted.fst
#窗口計(jì)數(shù)
wc -l p1_p2.sorted.fst #假設(shè)為20000
#取前1%
tail -n 200 p1_p2.sorted.fst > p1_p2.sorted.1%.fst
#找出前1%中最小的加權(quán)fst值

這個(gè)窗口大小和步長(zhǎng)不影響結(jié)果

曼哈頓圖

#處理數(shù)據(jù)文件格式(sed '1d' 去掉表頭窿冯,awk 如果加權(quán)FST<0,則取0
sed '1d' p1_p2_window.windowed.weir.fst|awk '{if($5<0)print $1"\t"$2"\t0";else print $1"\t"$2"\t"$5}' > p1_p2_fst.txt

首先上傳數(shù)據(jù)骗奖,每列數(shù)據(jù)類型都為數(shù)值型

e39aedd80d2e84249fa4ba37590e335.png
library(qqman)
filt=data.frame(p1_p2_fst)
SNP <- paste(filt[,1],filt[,2],sep = ":")
Fstfile <- cbind(SNP,filt)#合并
colnames(Fstfile)<-c("SNP","CHR","POS","FST")#添加列名
colorset<-c("#FF0000","#FFD700","#2E8B57","#7FFFAA","#6495ED","#0000FF")
manhattan(Fstfile,chr="CHR",bp="POS",p="FST",snp="SNP",col=colorset,logp=F,genomewideline=0.9,ylab="Fst",font.lab=2,cex.lab=1,main="G1vsG2",cex=0.8)
#genomewideline=0.9 前1%的最小值

計(jì)算總體PI值和TajimaD

核酸多樣性PI,值越大說(shuō)明核苷酸多樣性越高
TajimaD用于檢驗(yàn)DNA序列在演化國(guó)產(chǎn)過(guò)程中是否遵循中性演化模型。D>0:平衡選擇执桌,突然群體收縮鄙皇;D<0:最近的選擇性清除,最近瓶頸后的群體擴(kuò)張仰挣,與消除基因連鎖伴逸;D=0:群體根據(jù)突變-漂移平衡演變,沒(méi)有選擇膘壶。

vcftools --vcf Filter.snp.vcf --window-pi 500000 --out total
vcftools --vcf Filter.snp.vcf --TajimaD 500000 --out total

計(jì)算每個(gè)亞群的PI值和TajimaD值

#創(chuàng)建bash腳本
vi test.sh
#寫(xiě)入以下內(nèi)容:
   for i in {1..3};do
   #根據(jù)ID错蝴,從vcf文件中提取每個(gè)亞群的信息
   vcftools --vcf Filter.snp.vcf --keep ${i}-population.txt --recode -- 
   recode-INFO-all --out p${i}
   #根據(jù)提取的信息計(jì)算每個(gè)亞群的PI值
   vcftools --vcf p${i}.recode.vcf --out q${i}_pi_500kb --window-pi 
   500000 --window-pi-step 50000
   #根據(jù)提取的信息計(jì)算每個(gè)亞群的TajimaD值
   vcftools --vcf p${i}.recode.vcf --out q${i}_500kb.TajimaD --TajimaD 
   500000
   done
#給bash腳本添加可執(zhí)行權(quán)限
chmod +x test.sh
#運(yùn)行腳本
./test.sh

根據(jù)pi值畫(huà)箱線圖和小提琴圖

#添加分組信息G1、G2颓芭、G3
data=data.frame(q1_500kb_pi_windowed)
data
Group=c("G1")
data1=data.frame(data,Group)
data=data.frame(q2_500kb_pi_windowed)
data
Group=c("G2")
data2=data.frame(data,Group)
data=data.frame(q3_500kb_pi_windowed)
data
Group=c("G3")
data3=data.frame(data,Group)
#將三組數(shù)據(jù)合并
library(dplyr)
total_data<-dplyr::bind_rows(data1,data2,data3)
#畫(huà)箱線圖+小提琴圖
p <- ggplot(total_data,aes(Group,PI,fill=Group))+geom_boxplot(width=.2)+geom_violin()
mytheme <- theme(plot.title = element_text(face = "bold.italic", size = "14", colour = "brown"), axis.title = element_text(face = "bold.italic", size = "10",color = "blue"), axis.text.x = element_text(face = "bold", size = 8, angle = 45, hjust = 1, vjust = 1), axis.text.y = element_text(face = "bold",size = 8), panel.background = element_rect(fill = "white", color = "black"), panel.grid.major.y = element_blank(), panel.grid.minor.y = element_blank(), legend.text = element_text(size = 8), legend.title = element_text(size = 10, face = "bold"), panel.grid.minor.x = element_blank())
p + mytheme

根據(jù)PI值畫(huà)折線圖

#輸入數(shù)據(jù)時(shí)顷锰,每列必須是數(shù)值型數(shù)據(jù),尤其是染色體那一列
data=data.frame(q1_500kb_pi_windowed)
Group=c("G1")
data1=data.frame(data,Group)
data=data.frame(q2_500kb_pi_windowed)
Group=c("G2")
data2=data.frame(data,Group)
data=data.frame(q3_500kb_pi_windowed)
Group=c("G3")
data3=data.frame(data,Group)
#將三組數(shù)據(jù)合并
library(dplyr)
library(ggplot2)
total_data<-dplyr::bind_rows(data1,data2,data3)
for (i in 1:7){ 
  result_name = paste("chr",i,".png",sep="") 
  png(result_name,width=1500,height=300) 
  chrom = subset(total_data,CHROM==i) 
  xlab = paste("Chromosome",i,"(MB)",sep="") 
  p <- ggplot(chrom,aes(x=BIN_END/1000000,y=PI,color=Group,shape=Group)) + geom_line(size=0.5) + xlab(xlab)+ ylab("Pi") + theme_bw() 
  print(p) 
  dev.off() 
  }

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末亡问,一起剝皮案震驚了整個(gè)濱河市官紫,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌州藕,老刑警劉巖束世,帶你破解...
    沈念sama閱讀 206,968評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異慎框,居然都是意外死亡良狈,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)笨枯,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)薪丁,“玉大人,你說(shuō)我怎么就攤上這事馅精⊙鲜龋” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 153,220評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵洲敢,是天一觀的道長(zhǎng)漫玄。 經(jīng)常有香客問(wèn)我,道長(zhǎng)压彭,這世上最難降的妖魔是什么睦优? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,416評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮壮不,結(jié)果婚禮上汗盘,老公的妹妹穿的比我還像新娘。我一直安慰自己询一,他們只是感情好隐孽,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,425評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布癌椿。 她就那樣靜靜地躺著,像睡著了一般菱阵。 火紅的嫁衣襯著肌膚如雪踢俄。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,144評(píng)論 1 285
  • 那天晴及,我揣著相機(jī)與錄音都办,去河邊找鬼。 笑死虑稼,一個(gè)胖子當(dāng)著我的面吹牛脆丁,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播动雹,決...
    沈念sama閱讀 38,432評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼跟压!你這毒婦竟也來(lái)了胰蝠?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,088評(píng)論 0 261
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤震蒋,失蹤者是張志新(化名)和其女友劉穎茸塞,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體查剖,經(jīng)...
    沈念sama閱讀 43,586評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡钾虐,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,028評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了笋庄。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片效扫。...
    茶點(diǎn)故事閱讀 38,137評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖直砂,靈堂內(nèi)的尸體忽然破棺而出菌仁,到底是詐尸還是另有隱情,我是刑警寧澤静暂,帶...
    沈念sama閱讀 33,783評(píng)論 4 324
  • 正文 年R本政府宣布济丘,位于F島的核電站,受9級(jí)特大地震影響洽蛀,放射性物質(zhì)發(fā)生泄漏摹迷。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,343評(píng)論 3 307
  • 文/蒙蒙 一郊供、第九天 我趴在偏房一處隱蔽的房頂上張望峡碉。 院中可真熱鬧,春花似錦颂碘、人聲如沸异赫。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,333評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)塔拳。三九已至鼠证,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間靠抑,已是汗流浹背量九。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,559評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留颂碧,地道東北人荠列。 一個(gè)月前我還...
    沈念sama閱讀 45,595評(píng)論 2 355
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像载城,于是被迫代替她去往敵國(guó)和親肌似。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,901評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容