計算成對的Fst值后的無偏估計-di統(tǒng)計量(di statistic)
2010年锅知,Joshua M. Akey在文章“Tracking footprints of artificial selection in the dog genome | PNAS”中提出通過簡單的匯總統(tǒng)計來測量每個品種等位基因頻率的位點特異性差異
1.首先計算出每個SNP位點的Fst值
2.對每個SNP位點的Fst值進行計算劃分窗口的di統(tǒng)計量。
-
計算每個SNP的di統(tǒng)計量1665571179461.png
补履,其中1665571112522.png
和1665571135568.png
表示從所有21,114個SNP計算出的品種i和j之間的FST的期望值和標(biāo)準(zhǔn)差。 對于每個品種较木,在非重疊1 mb窗口的snp上取di平均值载碌。每個窗口的平均snp數(shù)為9.5,snp數(shù)小于4個的窗口被丟棄胁后。
在R中使用“l(fā)m”函數(shù)進行標(biāo)準(zhǔn)線性回歸挟阻,以調(diào)整SNP標(biāo)記數(shù)量和平均雜合度的di的窗口特異性估計值琼娘,并發(fā)現(xiàn)它對結(jié)果沒有顯著影響(P >0.05)。
文獻(xiàn):Genomic Signatures Reveal New Evidences for Selection of Important Traits in Domestic Cattle | Molecular Biology and Evolution | Oxford Academic (oup.com)
根據(jù)對成對FST的無偏估計附鸽,即di脱拼,如前所述,測量了每個品種等位基因頻率的位點特異性差異(Akey et al. 2010)簡而言之坷备,對于581熄浓,820個SNP中的每一個,我們計算了品種i和j之間FST的預(yù)期值和SD省撑。對于每個品種赌蔑,在50個SNP的非重疊窗口中包含的SNP上對di進行了平均。牛的基因組中共有11丁侄,651個窗口惯雳。下游分析使用了平均di得分最高的前1%(117)或5%(583)區(qū)域朝巫。
參考:[1] Tracking footprints of artificial selection in the dog genome | PNAS
[2] Genomic Signatures Reveal New Evidences for Selection of Important Traits in Domestic Cattle | Molecular Biology and Evolution | Oxford Academic (oup.com)
[3] Genome-wide scan reveals genetic divergence and diverse adaptive selection in Chinese local cattle | BMC Genomics | Full Text (biomedcentral.com)