Multiple Sequentially Markovian Coalescent (MSMC)是一種利用馬爾可夫模型推斷群體動態(tài)歷史和群體結(jié)構(gòu)的算法医窿。能夠通過輸入基因組序列推斷群體分歧時間饶碘,預(yù)測有效群體大小虑灰。此算法下常用的軟件包括PSMC纫谅,SMC++和MSMC偎漫。對于幾款軟件的使用和優(yōu)劣勢比較可以參考DumplingLucky大佬的博客:
MSMC2估計歷史有效群體大小
SMC++估計歷史有效群體大小
MSMC算法回答兩個問題:
- 物種的有效群體大小如何隨時間變化?
- 物種之間是何時方篮,以何種方式分歧名秀?
根據(jù)分子鐘理論,物種所積累的變異量由變異速度和分歧時間決定藕溅。變異速度越快匕得,變異經(jīng)歷的時間越長的兩個物種,在序列上的差異應(yīng)當越大巾表。那么按照相同的邏輯汁掠,如果已知兩個物種的突變速度/傳代速度,就可以通過兩個物種序列上的變異集币,反推其所經(jīng)歷的分歧時間和可能的祖先物種考阱。
MSMC推斷種群動態(tài)歷史和分歧時間
MSMC推斷群體動態(tài)歷史
MSMC能夠從多序列變異文件中推斷有效群體大小隨時間的變化,結(jié)果圖如下鞠苟,MSMC分別基于不同數(shù)量單倍型(最多8個)所模擬的有效群體大小和時間的關(guān)系乞榨,整張圖按照時間順序應(yīng)當從右往左看秽之,分別經(jīng)歷了種群擴張-收縮-再擴張-再收縮-擴張的過程。研究古生物學(xué)的伙伴還可以結(jié)合對應(yīng)時間下的地質(zhì)和氣候事件分析群體變化的原因姜凄。
MSMC推斷種群分歧
有了上述分子鐘理論的鋪墊趾访,理解MSMC推斷種群分歧并不算難态秧。如果MSMC輸入的個體來自兩個群體,動態(tài)馬爾可夫模型會得到三個溯祖率(coalescent rate)用以推斷分歧事件扼鞋,分別是群體1的種內(nèi)溯祖率申鱼,群體2的種內(nèi)溯祖率以及群體1和2的種間溯祖率。三個率有點抽象云头,因此Schiffels和Durbin將其整合成一個參數(shù):交叉溯祖率(the relative cross coalescence rate捐友,rCCR)。
交叉溯祖率的值在0-1之間溃槐,越接近1代表兩群體此時還是一個群體匣砖,rCCR跌倒0就代表兩群體完全分歧成為兩個獨立的群體。因此昏滴,rCCR的中點(rCCR=0.5)就被看作是兩群體的分歧時間(split time)猴鲫。
為什么有圖的rCCR大于1
按照rCCR的定義谣殊,rCCR的值理論上會落在0-1之間拂共,體現(xiàn)一個“相對”的含義。在運行MSMC程序的時候可以自行選擇是否標準化CCR姻几,也就是是否進行0-1回歸宜狐。如不進行標準化則會出現(xiàn)大于1的情況。
總結(jié)一下
MSMC估計目標群體溯祖率能得到兩個結(jié)果蛇捌,群體規(guī)模(population size)和交叉溯祖率(rCCR)抚恒。二者分別可以反映單一群體規(guī)模動態(tài)變化和群體間分歧事件。對于研究物種演化和遷徙具有很大幫助络拌。
參考信息:
1. MSMC and MSMC2: The Multiple Sequentially Markovian Coalescent.https://experiments.springernature.com/articles/10.1007/978-1-0716-0199-0_7