參考
大型基因組SLAF-seq
蕨類植物孢子強擴散能力下生態(tài)適應(yīng)塑造的遺傳分化格局
Ecological adaptation shaped the genetic structure of homoploid ferns against strong dispersal capacity
方法:
為了理解A. sinense復(fù)合群的進化歷史弛秋,我們使用了fastsimcoal v2.6(Excoffier等,2013)中的共祖模擬方法來測試不同的假說牵现,以確定分化的順序和時間铐懊,每對鄰近譜系之間是否存在非對稱基因流,以及近期有效種群大小的變化瞎疼。通過遺傳聚類確定的六個譜系中(見結(jié)果部分)科乎,SK2和ALT為NEA譜系分布范圍邊緣的地方特有種,并且在ADMIXTURE中顯示出混合祖先的模式贼急。因此茅茂,我們將它們從模型中移除以簡化模型。首先使用easySFS.py(https://github.com/isaacovercast/easySFS)從中性SNPs中構(gòu)建了一個多維位點頻率譜(SFS)太抓。投射中NEA空闲、JAP、QIN走敌、HEN譜系的基因拷貝數(shù)分別為24碴倾、10、22和18〉疲考慮到A. sinense在第一年無法產(chǎn)生孢子(張异雁,2011),以及在人工環(huán)境中A. filix-femina的十年生存率很高(Schneller & Holderegger僧须,1997)纲刀,我們假設(shè)一代時間為五年。使用r8s(Sanderson担平,2003)估計了每位點每代的突變率為1.7e-9示绊,通過設(shè)置13.5至19.3 Ma范圍內(nèi)分類群根的年齡限制(數(shù)據(jù)未發(fā)表),包括A. filix-femina群組和其他類群的1,056個SLAF位點的比對(包含14個個體的255,745 bp)暂论。
我們設(shè)計了總共14個場景(見圖S1)來測試不同的假設(shè)面褐。我們對每個模型運行了50次,每次包括100,000次模擬取胎,用于計算復(fù)合似然值盆耽,并進行了40個期望-條件最大化(ECM)周期。選擇具有最小赤池信息準則(AIC)值的模型作為最優(yōu)模型扼菠。最終摄杂,模型13被選為最佳模型。我們選擇了具有最高最大復(fù)合似然值的運行中的點估計循榆,并通過從點估計的模擬SFS中進行100次參數(shù)化自舉重復(fù)實驗析恢,獲得參數(shù)估計的置信區(qū)間(CIs)。
結(jié)果文件
可視化
解讀
參考運行
fastsimcoal2 是一個復(fù)雜的軟件秧饮,使用它需要編寫多個文件并執(zhí)行多步操作映挂。以下是對于一個包含五個亞群的基本分析流程的詳細指導(dǎo),包括示例代碼:
準備數(shù)據(jù)文件
首先盗尸,您需要準備遺傳數(shù)據(jù)文件柑船。這通常是序列數(shù)據(jù)、SNP數(shù)據(jù)或者其他分子標記數(shù)據(jù)泼各。數(shù)據(jù)文件應(yīng)該是 fastsimcoal2 可以接受的格式鞍时,如 .arp 文件(Arlequin項目文件)。您需要轉(zhuǎn)換您的原始數(shù)據(jù)到這個格式扣蜻。創(chuàng)建模擬參數(shù)文件 (.par)
參數(shù)文件是一個描述您的種群模型和模擬設(shè)置的文本文件逆巍。對于五個亞群,您的 .par 文件可能看起來如下:
// Parameter file for a model with five subpopulations
5 number of population samples
// Population effective sizes (Ne)
1000 pop1_Size
2000 pop2_Size
1500 pop3_Size
1200 pop4_Size
800 pop5_Size
// Sample sizes
30 pop1_SampleSize
30 pop2_SampleSize
30 pop3_SampleSize
30 pop4_SampleSize
30 pop5_SampleSize
// Growth rates: 0 for all populations (no growth)
0 pop1_GrowthRate
0 pop2_GrowthRate
0 pop3_GrowthRate
0 pop4_GrowthRate
0 pop5_GrowthRate
// Number of migration matrices : set to 1 if migration rates are constant over time
1 numberOfMigrationMatrices
// Migration matrix: rows are source populations, columns are destination populations
0 M12 M13 M14 M15
M21 0 M23 M24 M25
M31 M32 0 M34 M35
M41 M42 M43 0 M45
M51 M52 M53 M54 0
// Historical events: format is time, source population, sink population, new size of sink population, migration rate change, new migration matrix
// Add your historical events here
// Number of independent runs
10 number of independent runs
每個 Mxy 都代表從群體 x 到群體 y 的遷移率莽使,需要根據(jù)您的數(shù)據(jù)和假設(shè)來設(shè)定這些值锐极。
- 執(zhí)行模擬
在命令行界面中,您將調(diào)用 fastsimcoal2 并指定您的 .par 文件芳肌,如下:
fastsimcoal2 -t my_parameter_file.par -n 100000 -m -e
這里 -t 后面跟著參數(shù)文件名灵再,-n 后面跟著模擬次數(shù)(例如這里是100000次)肋层,-m 表示在每次模擬之后最大似然估計的執(zhí)行,-e 表示模擬結(jié)束后保留每次模擬產(chǎn)生的文件翎迁。
評估結(jié)果
模擬完成后槽驶,fastsimcoal2 將生成多個文件,包括估計的參數(shù)值鸳兽、似然度和模擬的遺傳數(shù)據(jù)。您可以查看這些文件來評估不同參數(shù)的擬合度罕拂。可視化結(jié)果
您可以使用 R 或 Python 等工具來可視化這些結(jié)果揍异。例如,您可以繪制估計的種群大小隨時間的變化爆班,或者遷移率的變化衷掷。
由于 fastsimcoal2 的使用涉及到多種復(fù)雜的生物統(tǒng)計方法,具體代碼和參數(shù)需要根據(jù)您的具體數(shù)據(jù)和研究目標進行調(diào)整柿菩。上述示例僅僅提供一個基礎(chǔ)的框架戚嗅。實際使用時,還需要閱讀 fastsimcoal2 的官方文檔以了解所有命令和參數(shù)的具體含義枢舶,并根據(jù)自己的需求進行調(diào)整懦胞。對于初學者,建議先從簡單的模型開始凉泄,逐步增加躏尉。