前一段時(shí)間進(jìn)行了Bayes培訓(xùn),所以想總結(jié)和進(jìn)一步學(xué)習(xí)Bayes方法烘浦。
主要是用來估計(jì)SNP的效應(yīng)(GWAS)和應(yīng)用不同生物信息給SNP權(quán)重槽华,提高GP的準(zhǔn)確性
Bayes算法簡單介紹
BayesRR:貝葉斯嶺回歸忙灼,所有SNP都具有非零效應(yīng)并具有相同的方差,等于RRBLUP或GBLUP家夺。
BayesA:所有 SNP 都具有非零效應(yīng)脱柱,并采用遵循反卡方分布的不同方差。
BayesB:只有一小部分 SNP (1-Pi) 具有非零效應(yīng)拉馋,并采用遵循反卡方分布的不同方差褐捻。
BayesBpi:與“BayesB”相同,但“Pi”不固定椅邓。
BayesC:只有一小部分 SNP (1-Pi) 具有非零效應(yīng),并且具有相同的方差昧狮。
BayesCpi:與“BayesC”相同景馁,但“Pi”不固定。
BayesL:BayesLASSO逗鸣,所有SNP都具有非零效應(yīng)合住,并采取不同的方差,遵循指數(shù)分布撒璧。
BSLMM:所有SNP都具有非零效應(yīng)透葛,并采用相同的方差,但一小部分SNP具有額外的共享方差卿樱。
BayesR:只有一小部分SNP具有非零效應(yīng)僚害,并且將SNP分配到不同的組中,每個(gè)組具有相同的方差繁调。
以下介紹的包基本可以完成上述的算法萨蚕,并且部分進(jìn)行優(yōu)化。
一. R包
1 BGLR
文檔:https://github.com/gdlc/BGLR-R
可以進(jìn)行上述算法的單性狀和多性狀模型分析
具有的例子:
單性狀:
多性狀:
- 1. 非結(jié)構(gòu)化協(xié)方差矩陣的隨機(jī)效應(yīng)模型
- 2. 對角殘差協(xié)方差矩陣
- 3.因素分析
- 4. 遞歸模型
- 5. 混合效應(yīng)模型
- 6.嶺回歸
- 7.嶺回歸+加性關(guān)系矩陣
- 8. 尖刺板
- 9. 固定效應(yīng)
2 hibayes
文檔:https://github.com/YinLiLin/hibayes
可使用個(gè)體級別岳遥、摘要級別和個(gè)體加譜系級別(單步)數(shù)據(jù)來擬合 3 種類型的貝葉斯模型,用于基因組預(yù)測/選擇( GS)和全基因組關(guān)聯(lián)研究(GWAS)裕寨,旨在估計(jì)復(fù)雜性狀的聯(lián)合效應(yīng)和遺傳參數(shù)
(1) 固定效應(yīng)和協(xié)變量系數(shù)
(2) 環(huán)境隨機(jī)效應(yīng)及其相應(yīng)的方差
(3) 遺傳方差
(4) 殘差方差
(5) 遺傳力
(6) 基因分型和非基因分型個(gè)體的基因組估計(jì)育種值 ( GEBV )
(7) SNP 效應(yīng)大小
(8) 單個(gè)個(gè)體的表型/遺傳方差解釋 ( PVE )或多個(gè)SNP
(9) 基因組窗口關(guān)聯(lián)后驗(yàn)概率( WPPA )
(10) 后驗(yàn)包含概率( PIP )
特別:可以使用summary-level 分析
二. Julia 包
1 JWAS
文檔: https://reworkhow.github.io/JWAS.jl/latest/浩蓉;例子:https://github.com/reworkhow/JWAS.jl/wiki
可以應(yīng)用以下多個(gè)模型
特別的算法: 神經(jīng)網(wǎng)絡(luò)-混合模型 (NN-LMM);GWAS 的結(jié)構(gòu)方程模型
2 NextGP
文檔: https://github.com/datasciencetoolkit/NextGP.jl
特別算法:Bayesian log-linear variance model(BayesLV) - 非重疊和/或重疊注釋 + GWAS 結(jié)果(與BayesRC, BayesRCπ類似)- 目前未發(fā)表
- 使用功能信息的通用模型宾袜,基于對數(shù)線性模型中的 SNP 方差建模捻艳。
- 這些模型在遺傳學(xué)的其他應(yīng)用中也被描述為雙層次廣義線性模型。
- 對數(shù)線性模型可以直接處理重疊的功能組试和,并且可以包括基因作圖結(jié)果作為匯總統(tǒng)計(jì)的回歸讯泣。
主要的兩個(gè)方向:
- 多品種(群體、品系等)分析模型
- 基因調(diào)控網(wǎng)絡(luò)估計(jì)
三. Fortran 軟件
1. BayesRCO
此軟件給出的的算法可以加入更多的多組學(xué)注釋信息(對SNP 分組)來進(jìn)行GS或GP
文檔連接: https://github.com/FAANG/BayesRCO阅悍;https://github.com/FAANG/BayesRCO/blob/main/doc/BayesRCO.pdf
BayesRCO 包括三種最先進(jìn)的貝葉斯分層模型的實(shí)現(xiàn):
BayesCpi:二類模型好渠,對應(yīng)于遺傳變異的無效效應(yīng)和非無效效應(yīng)
BayesR:四類模型昨稼,對應(yīng)于遺傳變異的無效效應(yīng)、小效應(yīng)拳锚、中效應(yīng)和大效應(yīng)
BayesRC:一種包含遺傳變異的不相交先驗(yàn)類別的 BayesR 模型假栓。
另外拓展的兩個(gè)算法
BayesRC+:BayesR 模型,其中假設(shè)多個(gè)類別會累積影響變量估計(jì)
BayesRCpi:BayesR 模型霍掺,其中多注釋變體的分類是隨機(jī)建模的匾荆。
上述5個(gè)算法的圖示:
2. BLUF90家族軟件-wss-GBLUP
雖然不是Bayes算法,但是能估計(jì)SNP效應(yīng)和p值杆烁。使用BLUPF90+ & postGSf90 軟件
更系統(tǒng)學(xué)習(xí)的新書籍
其主要使用R代碼進(jìn)行舉例實(shí)現(xiàn)講解
PDF下載(有條件的推薦買書): https://link.springer.com/book/10.1007/978-3-031-35851-7