- Hallander J, Waldmann P, Wang C, Sillanp?? MJ. Bayesian inference of genetic parameters based on conditional decompositions of multivariate normal distributions. Genetics [Internet]. 2010 [cited 2016 Nov 14];185:645–54. Available from: http://www.genetics.org/cgi/doi/10.1534/genetics.110.114249
人們廣泛認(rèn)識(shí)到甚牲,混合線性模型是用于在復(fù)雜譜系的分析中的參數(shù)估計(jì)的重要工具义郑,其包括譜系和基因組信息,并且其中相互依賴(lài)的遺傳因子通常假定遵循高維的多變量正態(tài)分布丈钙。我們已經(jīng)開(kāi)發(fā)了一種基于多變量正態(tài)分布的條件單變量分布產(chǎn)物的貝葉斯統(tǒng)計(jì)方法非驮。這個(gè)過(guò)程允許在用戶(hù)友好的計(jì)算機(jī)軟件包WinBUGS內(nèi)對(duì)復(fù)雜譜系的計(jì)算要求的遺傳評(píng)價(jià)。為了證明和評(píng)價(jià)該方法的靈活性雏赦,我們分析了兩個(gè)示例性家系:包括加性和顯性多基因關(guān)系的蘇格蘭松(Pinus sylvestris L.)的大的非種系譜系和模擬的系譜劫笙,其中基于計(jì)算的基因組關(guān)系密集標(biāo)記圖芙扎。分析表明,我們的方法是快速的邀摆,并提供準(zhǔn)確的估計(jì)纵顾,因此它應(yīng)該是一個(gè)有用的工具,用于快速栋盹,可靠地估計(jì)復(fù)雜譜系的遺傳參數(shù)施逾。
遺傳學(xué)的大量努力一直致力于揭示定量或復(fù)雜性狀的基礎(chǔ)遺傳結(jié)構(gòu)。傳統(tǒng)上例获,多態(tài)模型已廣泛用于估計(jì)天然和繁殖種群的遺傳變異和育種值汉额,其中無(wú)數(shù)的基因被假定為用于感興趣的性狀(Bulmer 1971; Falconer和Mackay 1996)。數(shù)量性狀的遺傳方差可以分解為對(duì)應(yīng)于單個(gè)等位基因的影響的加性部分和由于等位基因之間的相互作用而是非加性的部分榨汤。注意力一般集中在加性遺傳方差(和遺傳力)的估計(jì)蠕搜,因?yàn)榧有宰儺惻c通過(guò)育種者方程選擇的反應(yīng)成正比(FalconerandMackay1996,第11章)收壕。然而妓灌,為了準(zhǔn)確地估計(jì)加性遺傳變異和遺傳力,在遺傳評(píng)價(jià)中識(shí)別潛在的非加性來(lái)源可能是重要的(Misztal 1997; Ovaskainenet al蜜宪。2008; Waldmannet al虫埂。2008),特別是如果被分析的譜系包含大比例的全同胞和克缕匝椤(LynchandWalsh1998掉伏,第145頁(yè))。使用譜系和表型信息(即動(dòng)物模型(Henderson 1984))的多源模型是用于估計(jì)遺傳參數(shù)的選擇模型在育種和自然種群中(Abney等人2000; Sorensen和Gianola 2002; O9Hara等人2008)澳窑。
分子技術(shù)的最近突破使得有可能創(chuàng)建全基因組單核苷酸多態(tài)性(SNP)圖斧散。這些圖譜已經(jīng)幫助揭示了大量的負(fù)責(zé)性狀表達(dá)的新基因座,并且提供了關(guān)于數(shù)量性狀的遺傳結(jié)構(gòu)的一般見(jiàn)解(例如摊聋,Valdar等人2006; Visscher 2008; Flint和Mackay 2009)鸡捐。這些見(jiàn)解有助于在計(jì)算人類(lèi)的疾病風(fēng)險(xiǎn)時(shí),嘗試提高育種計(jì)劃的產(chǎn)量麻裁,以及在評(píng)估保護(hù)計(jì)劃的相關(guān)性時(shí)闯参。例如,在小鼠(Valdar等人2006)悲立,雞(Muir等人2008)和奶牛(VanRaden等人2008)中,可以快速且相對(duì)便宜地對(duì)對(duì)科學(xué)和農(nóng)業(yè)重要的許多物種的高密度SNP進(jìn)行評(píng)分等人2009)新博。
在繁殖種群的分析中薪夕,包含密集標(biāo)記數(shù)據(jù)與模擬中的傳統(tǒng)表型模型相比,提高了遺傳評(píng)價(jià)的預(yù)測(cè)能力(即可靠性)(Meuwissen等人2001; Calus等人2008 ; Hayes等人2009)和當(dāng)使用真實(shí)數(shù)據(jù)時(shí)(Legarra等人2008; VanRaden等人2009; Gonza'lez-Recio等人2009).Meuwissen等人(2001)建議所有標(biāo)記的影響應(yīng)首先估計(jì)赫悄,然后相加原献,以獲得基因組估計(jì)育種值(GEBV)馏慨。還提出了一種替代方法,其中所有標(biāo)記物用于計(jì)算基因組關(guān)系矩陣(代替加性多基??因關(guān)系矩陣)(例如姑隅,Villanueva等人2005; VanRaden 2008; Hayes等人2009);然后將該矩陣結(jié)合到統(tǒng)計(jì)分析中以估計(jì)GEBV写隶。兩種方法的比較(VanRaden 2008)在個(gè)體等位基因的作用小的情況下產(chǎn)生類(lèi)似的GEBV估計(jì)。此外讲仰,如果不是所有譜系成員都具有標(biāo)記信息慕趴,則可以計(jì)算來(lái)自基因型和未基因型個(gè)體的組合關(guān)系矩陣;這已顯示增加GEBV的準(zhǔn)確性(Legarra等人2009; Misztal等人2009)。納入標(biāo)記信息的另一個(gè)合理的選擇是在家族中使用低密度SNP板鄙陡,并追蹤來(lái)自高密度基因型祖先的SNP的影響冕房,如Habier等人所建議的。 (2009)和Weigel et al趁矾。 (2009)耙册。然而,需要快速和強(qiáng)大的計(jì)算機(jī)算法毫捣,其可以在數(shù)量性狀的分析中盡可能有效地使用標(biāo)記信息详拙,以從全基因組標(biāo)記數(shù)據(jù)獲得精確的GEBV。
本研究描述了一種將一般關(guān)系納入遺傳評(píng)價(jià)程序的高效貝葉斯方法的開(kāi)發(fā)蔓同。該方法基于將多變量正態(tài)分布表示為一維正態(tài)分布的乘積饶辙,每個(gè)正則分布都取決于下降變量 - bles。當(dāng)評(píng)價(jià)自然和繁殖種群的遺傳參數(shù)時(shí)牌柄,高維分布通常用作各種遺傳效應(yīng)的先驗(yàn)分布畸悬,如加性多基因效應(yīng)(Wang等,1993)珊佣,多變量加性多基因效應(yīng)Tassell和Van Vleck 1996)蹋宦,以及通過(guò)同樣矩陣的數(shù)量性狀基因座(QTL)效應(yīng)(Yi和Xu 2000)。采用貝葉斯框架來(lái)獲得所有未知參數(shù)的后驗(yàn)分布咒锻,通過(guò)使用軟件包WinBUGS中的馬爾科夫鏈蒙特卡羅(MCMC)采樣算法來(lái)估計(jì)冷冗。(Lunn等人,2000惑艇,2009)蒿辙。通過(guò)執(zhí)行先前的計(jì)算的簡(jiǎn)單單變量條件分布的因式分解產(chǎn)物,MCMC估計(jì)程序的計(jì)算時(shí)間大大減少滨巴。這個(gè)特征允許對(duì)多基因模型和基因組關(guān)系模型的快速干擾思灌。此外,分解允許不同程度的近交恭取,因?yàn)檎_的遺傳協(xié)方差結(jié)構(gòu)可以推斷到分析中泰偿。在本文中,我們測(cè)試了兩個(gè)以前發(fā)表的譜系數(shù)據(jù)集的方法:來(lái)自Scots pine的大型譜系的表型數(shù)據(jù)蜈垮,加入和優(yōu)勢(shì)遺傳關(guān)系的信息(Waldmann等人2008);和從模擬動(dòng)物群體的全基因組掃描獲得的基因組信息(Lund等人2009)耗跛。