這里有一份群體的學習課程脏里,這篇推送主要基于這個作為參考骄恶,
群體課程
Fst值
以下例子來自于:Fst值
Fst值
在群體里面Fst是衡量種群分化程度啊研,取值從0到1,為0則認為兩個種群間是隨機交配的整葡,基因型完全相似虏缸;為1則表示是完全隔離的,完全不相似
實際
1計算各等位基因的頻率
對于某一個基因的等位基因(位點)來說蚁堤,分別統(tǒng)計各物種AA醉者,Aa和aa的數(shù)量,然后計算各等位基因的頻率
分別計算p1和q1的基因頻率
2利用哈溫平衡二項式預測基因型頻率期望
然后可以利用期望和實際做對比
3計算每個亞群實際觀察到的雜合度
4計算每個亞群實際雜合度的期望
根據(jù)公式:
5計算每個亞群的近交系數(shù)
利用卡方測驗的思想披诗,我們有:
6在全基因組范圍計算基因頻率
7計算三種雜合性指數(shù)
8計算Fst值
接下來就直接計算相應(yīng)的值即可
Fst值如圖所求
計算Fst值的軟件
一般首推vcftools撬即,我們根據(jù)兩個亞種的vcf文件進行比較:
##對每一個SNP變異位點進行計算
vcftools --vcf test.vcf --weir-fst-pop 1_population.txt --weir-fst-pop 2_population.txt --out p_1_2—single
##按照區(qū)域來計算
vcftools --vcf test.vcf --weir-fst-pop 1_population.txt --weir-fst-pop 2_population.txt --out p_1_2_bin --fst-window-size 500000 --fst-window-step 50000
# test.vcf是SNP calling 過濾后生成的vcf 文件;
# p_1_2_3 生成結(jié)果的prefix
# 1_population.txt是一個文件包含同一個群體中所有個體呈队,一般每行一個個體剥槐。個體名字要和vcf的名字對應(yīng)。
# 2_population.txt 包含了群體二中所有個體宪摧。
#計算的窗口是500kb粒竖,而步長是50kb (根據(jù)你的需其可以作出調(diào)整)。我們也可以只計算每個點的Fst几于,去掉參數(shù)(--fst-window-size 500000 --fst-window-step 50000)即可蕊苗。
1_population.txt和2_population.txt格式一樣,只有一列樣品信息沿彭,個體名字要和vcf的名字對應(yīng)
1_population.txt
代碼參考:Fst的計算原理與實戰(zhàn)
如果是按區(qū)間計算的朽砰,那么它以你定義的滑動窗口為單位,計算這個窗口內(nèi)的平均Fst值
輸出結(jié)果為:
那么此時的Fst值(最后一列)代表一個窗口內(nèi)的平均Fst值
參考:
http://wap.sciencenet.cn/blog-1094241-1104923.html?mobile=1