連鎖不平衡(linkage disequilibrium)是進(jìn)化生物學(xué)與人類遺傳學(xué)中一個(gè)十分重要的概念须揣,因?yàn)檫z傳過程中很多因素能夠影響它,而它又會(huì)作用于很多因素藕漱,包括選擇锅劝,重組頻率,突變率疫粥,遺傳漂變茬斧,交配模式,群體結(jié)構(gòu)等等梗逮。反過來看项秉,連鎖不平衡就是反應(yīng)群體遺傳過程的一個(gè)強(qiáng)有力的信號。
連鎖不平衡 是指不同基因座(loci)的等位基因(allele)之間非隨機(jī)(nonrandom)的關(guān)聯(lián)慷彤。
首先考慮簡單的兩基因座情況娄蔼,設(shè)有A, B兩個(gè)基因座,每個(gè)基因做各有兩個(gè)等位基因底哗,分別用1,2表示岁诉。假設(shè)每個(gè)單倍體型的頻率如下所示:
由上 單倍體型的頻率 ,我們也可以簡單計(jì)算得到各個(gè)等位基因的頻率:
如果這兩個(gè)基因座互相獨(dú)立不相關(guān)(也就是連鎖平衡 linkage equilibrium 的狀態(tài))跋选,那么各個(gè)單倍型的頻率就可以直接算出涕癣,為p1q1 ,p1,q2 , p2q1, p2q2
而實(shí)際情況中單倍型的頻率對于不相關(guān)情況下的理論值會(huì)產(chǎn)生偏離(deviation),這個(gè)偏離原因即為連鎖不平衡( linkage disequilibrium )前标,偏離的程度通常記為 D (連鎖不平衡系數(shù)坠韩,coefficient of linkage disequilibrium)
下圖表示了各單倍型頻率,各等位基因頻率與D之間的關(guān)系炼列。
但要注意的是只搁,D值并不是一個(gè)用來衡量LD的很好的指標(biāo),因?yàn)镈值會(huì)受等位基因頻率影響俭尖,這使得我們無法比較不同頻率的等位基因?qū)χg連鎖不平衡的大小氢惋。
Lewontin提出通過標(biāo)準(zhǔn)化D值來解決該問題,即用D值除以理論上D可能的最大絕對值目溉。
但更多的時(shí)候我們使用相關(guān)系數(shù)(correlation coefficient)r2來衡量LD明肮。r2=0:獨(dú)立遺傳;r2=1:完全連鎖缭付。
也就是我們常常在局部曼哈頓圖中所看到的LD r2
參考
https://gwaslab.org/2021/04/04/連鎖不平衡-linkage-disequilibrium-ld/
https://en.wikipedia.org/wiki/Linkage_disequilibrium