1.連鎖不平衡(LD)概念
連鎖不平衡(LD)是指不同位點(diǎn)等位基因的非隨機(jī)關(guān)聯(lián)它碎。LD 的衰減是受重組率和重組代數(shù)影響的俺驶,研究 LD 的衰減可以揭示群體重組的歷史医窿。
假如位于同一染色體的兩個(gè)等位基因(AB)同時(shí)存在的概率大于人群中因隨機(jī)分布而同時(shí)出現(xiàn)的概率硕噩,稱這兩點(diǎn)處于LD狀態(tài)咱娶。
2.LD的度量
一般在LD的度量中最常見的是D'和r2臀规。
當(dāng)D'=0滩援,r2=0時(shí),處于完全連鎖平衡狀態(tài)
當(dāng)D'=1塔嬉,r2=1時(shí)玩徊,處于完全連鎖不平衡狀態(tài)。
其中谨究,從0-1之間的度量越高恩袱,LD越高,如果兩個(gè)位點(diǎn)連鎖胶哲,連鎖程度也越高畔塔。
3.計(jì)算LD的軟件和使用方法:PopLDdecay
3.1.安裝:Linux系統(tǒng)
#下載
git clone https://github.com/BGI-shenzhen/PopLDdecay.git? ?
# 安裝
cd PopLDdecay? ? ? ? ?
chmod 755?./configure
./configure
make
cd ./bin/
./PopLDdecay
# 添加到環(huán)境變量
echo 'PATH=$PATH:/data1/home/Software/RAxML-8.2.12'? >> ~/.bashrc
source??~/.bashrc
3.2.計(jì)算LD Decay
#單群體:產(chǎn)生“Out.Prefix.png” and “Out.Prefix.pdf”
PopLDdecay -InVCF ALLchr.vcf.gz -OutStat LDDecay.stat.gz?
Plot_OnePop.pl -inFile LDDecay.stat.gz -output Out.Prefix
#多個(gè)群體
PopLDdecay -InVCF In.vcf.gz -OutStat wild.stat.gz -SubPop wildName.list?
PopLDdecay -InVCF In.vcf.gz -OutStat cul.stat.gz -SubPop culName.list
Plot_MultiPop.pl -inList multi.list -output OutputPrefix
Note:
#一個(gè)群體多條染色體
PopLDdecay -InVCF Chr1.vcf.gz -OutStat Chr1.stat.gz PopLDdecay -InVCF Chr2.vcf.gz -OutStatChr2.stat.gz PopLDdecay -InVCFChr3.vcf.gz -OutStatChr3.stat.gz ls`pwd`/Chr*.stat.gz > chr.list?
Plot_OnePop.pl -inList chr.list -output OutputPrefix
#多個(gè)群體多條染色體
PopLDdecay -InVCF Chr1.vcf.gz -OutStat W.Chr1.stat.gz -SubPop wildName.list?
PopLDdecay -InVCF Chr2.vcf.gz -OutStat W.Chr2.stat.gz -SubPop wildName.list?
PopLDdecay -InVCF Chr1.vcf.gz -OutStat C.Chr1.stat.gz -SubPop culName.list
PopLDdecay -InVCF Chr2.vcf.gz -OutStat C.Chr2.stat.gz -SubPop culName.list?
ls `pwd` /W.Chr*.stat.gz > W.chr.list?
Plot_OnePop.pl -inList W.chr.list -output Wild.cat?
Note:
軟件參數(shù)使用:
參考:https://github.com/BGI-shenzhen/PopLDdecay/blob/master/Manual.pdf