- Waldmann P, Hallander J, Hoti F, Sillanp?? MJ. Efficient Markov chain Monte Carlo implementation of Bayesian analysis of additive and dominance genetic variances in noninbred pedigrees. Genetics [Internet]. 2008 [cited 2016 Nov 14];179:1101–12. Available from: http://sci-hub.cc/http://www.genetics.org/content/179/2/1101.short
準(zhǔn)確和快速計(jì)算定量遺傳方差參數(shù)在自然和繁殖群體中都非常重要。對于具有復(fù)雜關(guān)系結(jié)構(gòu)的實(shí)驗(yàn)設(shè)計(jì),在統(tǒng)計(jì)模型中包括加性和顯性方差分量可能是重要的赞弥。在這項(xiàng)研究中,我們引入了貝葉斯吉布斯抽樣方法映胁,用于估計(jì)傳統(tǒng)的無窮小模型中的加性和顯性遺傳變異。該方法可以在沒有近親的情況下處理一般家系甲雅。為了優(yōu)化計(jì)算時(shí)間和馬爾可夫鏈蒙特卡羅(MCMC)鏈的良好混合解孙,我們使用混合Gibbs采樣器,其結(jié)合單個位點(diǎn)和封閉的Gibbs采樣器务荆。通過使用預(yù)轉(zhuǎn)換變量妆距,進(jìn)一步改善了混合取樣器的速度和單位點(diǎn)取樣器的混合。從先前公布的蘇格蘭松(Pinus sylvestris L.)的雙列后代測試和具有不同顯性方差水平的兩個大模擬數(shù)據(jù)集分析了兩個性狀(高度和樹干直徑)函匕。我們還在后驗(yàn)預(yù)測損失法的基礎(chǔ)上進(jìn)行貝葉斯模型比較娱据。結(jié)果表明,具有加性和顯性分量的模型對于高度和直徑以及具有高顯性的模擬數(shù)據(jù)具有最佳擬合盅惜。對于具有低顯性的模擬數(shù)據(jù)中剩,我們需要一個信息,以避免顯性方差分量被高估抒寂。蘇格蘭松林?jǐn)?shù)據(jù)中的狹義遺傳力估計(jì)與較早的結(jié)果相比較低结啼,這是不奇怪的,因?yàn)轱@性方差的水平相當(dāng)高屈芜,尤其是直徑郊愧。通常朴译,混合采樣器比阻塞采樣器快得多,并顯示出比單位點(diǎn)采樣器更好的混合特性属铁。
前言
與自然適應(yīng)相關(guān)的多數(shù)性狀和育種改良受許多基因(多基因性狀; Lynch和Walsh 1998)的影響眠寿。在定量遺傳學(xué)中,多基因性狀的遺傳變異通常被估計(jì)為加性遺傳方差(和遺傳力)焦蘑。遺傳力的估計(jì)具有根本重要性盯拱,因?yàn)檫@個比率影響可以預(yù)期在所考慮的群體中的自然和人工選擇的反應(yīng)(Falconer和Mackay 1996)。因此例嘱,相當(dāng)關(guān)注用于估計(jì)育種值和遺傳力的統(tǒng)計(jì)方法的發(fā)展(Henderson 1984; Searle等1992; Lynch和Walsh 1998)狡逢。
遺傳方差可以進(jìn)一步分成加性遺傳成分和非累加遺傳成分。顯性方差由同一基因座處等位基因之間的相互作用引起拼卵,而上位方差由不同基因座處等位基因的相互作用引起奢浑。傳統(tǒng)上,已經(jīng)進(jìn)行了復(fù)雜的交叉設(shè)計(jì)以估計(jì)顯性和上位性方差间学,例如北卡羅來納(NC)II設(shè)計(jì)和三重測試跨線; Kearsey和Pooni 1996; Lynch和Walsh 1998殷费?.Henderson(1985a印荔,b)表明基于多基因成分和譜系信息(通常稱為動物或個體模型)的混合效應(yīng)模型如何可用于推導(dǎo)非加性遺傳效應(yīng)和方差設(shè)計(jì)低葫。由于加性,顯性和上位性遺傳效應(yīng)在未選擇的仍律、連鎖平衡的非近交群體中是不相關(guān)的(Cockerham 1954)嘿悬,理論上應(yīng)該可以通過加性和顯性關(guān)系矩陣的各種組合的乘法來估計(jì)所有這些遺傳效應(yīng),在混合模型方程中使用這些水泉。例如善涨,加性 - 加性上位關(guān)系矩陣將通過兩個附加遺傳關(guān)系矩陣的元素方式乘法獲得。不幸的是草则,在實(shí)踐中钢拧,上位關(guān)系矩陣將是彼此的倍數(shù),這可能導(dǎo)致統(tǒng)計(jì)模型中的參數(shù)的可識別性的頂點(diǎn)(對于關(guān)于可識別性的討論炕横,參見Gelfand和Sahu1999)源内。此外,應(yīng)該注意包括支配因素份殿,因?yàn)榭紤]的譜系可能太小膜钓,不能導(dǎo)致可識別的結(jié)果(Misztal 1997)。非加性遺傳方差分量的估計(jì)是至關(guān)重要的幾個原因卿嘲。首先颂斜,它將產(chǎn)生更準(zhǔn)確的統(tǒng)計(jì)估計(jì),因此可以實(shí)施更準(zhǔn)確的選擇策略(Du和Heschele 2000)拾枣。這在附帶實(shí)驗(yàn)設(shè)計(jì)中特別重要(Henderson 1985b)沃疮。在這種情況下盒让,標(biāo)準(zhǔn)加性模型(假設(shè)殘差與恒定方差不相關(guān))可以產(chǎn)生加性遺傳值的有偏估計(jì),因?yàn)楹唵螝埐罘讲罱Y(jié)構(gòu)是錯誤的(Lynch和Walsh 1998)司蔬。已經(jīng)發(fā)現(xiàn)非加性遺傳效應(yīng)可以對育種值的排名具有相當(dāng)大的影響(Wall等人糯彬,2005)。第二葱她,顯性本身是有意義的撩扒,因?yàn)樗c預(yù)期的近交衰退水平耦合(Cockerham andWeir 1984)。因此吨些,沒有顯性作用不會有近交衰退搓谆,避免近親繁殖在育種設(shè)計(jì)和保護(hù)計(jì)劃中不太重要。
最近豪墅,從理論的角度來看泉手,顯性作用和上位性可以轉(zhuǎn)化為瓶頸和近交的加性遺傳方差(例如,Willis and Orr 1993; Wang et al.1998; Lopez-Fanjul et al.2002; Barton和Turelli 2004)偶器。這些發(fā)現(xiàn)在一定程度上通過對模式生物的經(jīng)驗(yàn)研究得到支持(例如Garc?'a等人1994; Fernandez等人1995; Whitlock和Fowler 1999)斩萌。 Hallander和Waldmann(2007)研究了在對育種群體進(jìn)行截短選擇truncation selection時(shí)非加性遺傳相互作用的重要性。他們發(fā)現(xiàn)非加性方差最初可以在截?cái)噙x擇期間轉(zhuǎn)換為加性遺傳方差(參見Fuerst等人1997)屏轰。然而颊郎,這些問題需要進(jìn)一步調(diào)查與基于系譜的統(tǒng)計(jì)方法。
貝葉斯統(tǒng)計(jì)方法已經(jīng)在遺傳學(xué)中變得非常流行(Gianola和Fernando 1986; Shoemaker等1999; Blasco2001; Walsh2001; Xu2003; Beaumont和Rannala 2004)霎苗,因?yàn)?strong>后驗(yàn)分布以概率形式概括點(diǎn)估計(jì)周圍的不確定性(準(zhǔn)確性)姆吭。馬爾科夫鏈蒙特卡羅(MCMC)方法,用于貝葉斯推理近似后驗(yàn)分布唁盏,受Gibbs采樣算法發(fā)展的推推動(Geman和Geman 1984; Gelfand和Smith 1990)内狸,在1990年代上半年引入定量遺傳學(xué)(Wang等人1993年; Sorensen等人1994年)。吉布斯采樣已被用于推斷許多不同的定量遺傳參數(shù)厘擂,例如昆淡,在加性,永久環(huán)境和母體效應(yīng)的后驗(yàn)估計(jì)刽严,以及缺失數(shù)據(jù)的多變量數(shù)據(jù)集(Sorensen和Gianola 2002)昂灵。從方差分量模型的角度來看,已經(jīng)為有限位點(diǎn)模型(Du和Hoeschele 2000)開發(fā)了說明顯性和上位性的貝葉斯方法港庄,它可以解釋為對多元分量的有限位點(diǎn)近似倔既。多因素成分也存在于一些Bayesian QTL作圖方法中(Yi和Xu 2000; Lee和Van Der Werf 2006)。
具有加性和顯性分量的模型是否優(yōu)于簡單的加性模型鹏氧,可以通過模型選擇來評估渤涌。存在用于替代統(tǒng)計(jì)模型的模型選擇分析的幾種不同的方法。在頻率統(tǒng)計(jì)中把还,似然比測試(RAT)和Akaike的信息標(biāo)準(zhǔn)(AIC)是最常見的实蓬,而Bayes因子茸俭,貝葉斯信息標(biāo)準(zhǔn)(BIC),偏離信息標(biāo)準(zhǔn)(DIC)和后驗(yàn)預(yù)測損失統(tǒng)計(jì)是貝葉斯文獻(xiàn)的工具安皱。最近對LRT和AIC的分析表明调鬓,這些方法可能在混合模型中產(chǎn)生不正確的結(jié)果(Crainiceanu和Ruppert 2004; Vaida和Blanchard 2005)。貝葉斯模型比較方法更一般酌伊,但也需要進(jìn)一步評估腾窝。
在本文中,我們制定了一種快速貝葉斯吉布斯采樣方法居砖,用于估計(jì)在無近親動物(或個體)模型中的加性和顯性遺傳變異虹脯,應(yīng)用于沒有近親的一般設(shè)計(jì)的實(shí)驗(yàn)。我們使用混合Gibbs采樣器奏候,其是快速但慢混合的單位點(diǎn)Gibbs采樣算法(例如循集,Sorensen和Gianola 2002)和緩慢但快速混合的阻塞Gibbs采樣算法(Carc?'a-Corte' s和Sorensen 1996)。我們的方法的新穎性是使用可變變換蔗草,其中新的變換變量的協(xié)方差結(jié)構(gòu)(即咒彤,加性和顯性關(guān)系矩陣的逆)是對角的,這大大加速了兩個吉布斯采樣器的計(jì)算并且改進(jìn)了混合單站點(diǎn)吉布斯取樣器。該方法適用于先前公布的蘇格蘭松(Scots pine)(Waldmann和Ericsson 2006)定量遺傳研究的兩個性狀(高度和樹干直徑)的數(shù)據(jù),以及來自具有高和低顯性方差的大NCII設(shè)計(jì)的模擬數(shù)據(jù)。此外,我們使用后驗(yàn)預(yù)測損失標(biāo)準(zhǔn)來比較具有不同數(shù)量方差分量的模型**(Laud和Ibrahim 1995; Gelfand和Gosh 1998)荞驴。
結(jié)果
在這項(xiàng)研究中,我們開發(fā)了一種有效的策略拐云,通過使用貝葉斯推理和變量變換估計(jì)遺傳參數(shù)包括顯性方差田炭。該方法在對實(shí)數(shù)和模擬數(shù)據(jù)進(jìn)行評估時(shí)表現(xiàn)良好。此外谐区,本研究中的狹義遺傳率低于Waldmann和Ericsson(2006)對相同數(shù)據(jù)的純加性模型所發(fā)現(xiàn)的湖蜕。因此,根據(jù)實(shí)驗(yàn)設(shè)計(jì)和性狀數(shù)據(jù)宋列,有時(shí)重要的是估計(jì)加性和非加性遺傳組分群體昭抒。另外,育種值的排名可能是非最佳的炼杖,遺傳力估計(jì)可能被高估灭返,有時(shí)相當(dāng)大。
非加和遺傳效應(yīng)對育種的影響:
在奶牛中坤邪,Wall et al熙含。 (2005)調(diào)查了近親繁殖,雜種顯性艇纺,重組損失和遷移對生育力(適應(yīng)度)性狀和產(chǎn)奶量的影響怎静。研究的目的之一是檢查非加性效應(yīng)是否改變了育種價(jià)值的估計(jì)和公牛的排名邮弹。他們報(bào)告說,非加性效應(yīng)對生育性狀和奶產(chǎn)量有影響蚓聘,盡管不是非常顯著腌乡。此外,如果包括非加性效應(yīng)夜牡,公牛排名有差異与纽,這導(dǎo)致一些個體的排名發(fā)生相當(dāng)大的變化。在我們的研究中塘装,加性遺傳效應(yīng)的排名在加性和加性加顯性模型之間有顯著的差異渣锦。對于前100名個體,選擇非最佳候選者的風(fēng)險(xiǎn)高達(dá)21%(高度)和13%(直徑)氢哮。這表明在育種計(jì)劃中的個體的排名和選擇中包括非加性效應(yīng)可能是重要的袋毙,只要它們存在。此外冗尤,在模擬研究中(VaronaandMisztal 1999)听盖,顯示與基于純加成模型(在具有特定組合能力的譜系設(shè)計(jì))中的選擇相比,包括顯性組分可以有助于選擇≥10%的遺傳應(yīng)答的增加裂七。選擇反應(yīng)的最高增加發(fā)生在加性遺傳率低皆看,顯性遺傳性高,選擇強(qiáng)度低和全同胞高的比例(Varona和Misztal 1999)背零。來自蘇格蘭松分析的設(shè)計(jì)和結(jié)果與這些發(fā)現(xiàn)非常吻合腰吟,因此我們可以預(yù)期,包含該顯性分量將增加該群體的后代中的選擇反應(yīng)徙瓶,特別是如果育種目標(biāo)是直徑毛雇。
非加性遺傳效應(yīng)的實(shí)證估計(jì):
Crnokrak和Roff(1995)在綜合評論中檢查了顯性方差和選擇之間的關(guān)聯(lián)。他們的研究匯編表明侦镇,顯性差異水平在野生物種的不同性狀類別之間變化灵疮。顯性對于生命史性狀最高,對于生理性狀略低壳繁,對于形態(tài)學(xué)性狀最低(VD / VA = 1.17震捣,VD / VA = 1.06,VD / VA = 0.19)闹炉。此外蒿赢,他們發(fā)現(xiàn)國內(nèi)物種的不同性狀類別之間的顯性差異水平?jīng)]有總體趨勢,但是VD / VA相對較高(在0.79和0.91之間)渣触。在最近的一篇綜述中羡棵,Roff和Emerson(2006)綜合了線交叉實(shí)驗(yàn)的顯性和上位性研究。他們發(fā)現(xiàn)昵观,幾乎所有的關(guān)于生命歷史和形態(tài)特征的研究中都存在顯性相互作用(分別為96.5%和97.4%)晾腔。但是舌稀,生命史特征中顯性與加性效應(yīng)的比率是形態(tài)性狀的兩倍。上位相互作用不如顯性地位常見灼擂,但仍然在79.4和67.1%的生命歷史和形態(tài)特征中發(fā)現(xiàn)壁查。與顯性的情況類似,上位性與加性效應(yīng)的比率在生命歷史上高于形態(tài)性狀剔应。
生活史性狀被定義為與適合度恒定并直接相關(guān)的那些性狀睡腿,例如生殖力,存活力峻贮,存活和發(fā)育時(shí)間席怪。
林木中的非加性參數(shù):
歷史上,對于非加性方差分量的注意在林木育種中受到限制纤控。不幸的是挂捻,許多關(guān)于森林中非加性方差分量的研究都是基于太小的數(shù)據(jù)集,因此我們將討論限制在一些設(shè)計(jì)良好的實(shí)驗(yàn)中船万。 Fries和Ericsson(1998)估計(jì)了蘇格蘭松六種不同性狀的顯性方差刻撒,發(fā)現(xiàn)了高顯性值,特別是樹徑(VD / VA = 2.80)耿导。然而声怔,他們無法估計(jì)樹高的顯性變化。在火炬松中舱呻,Jansson和Li(2004)估計(jì)特異性組合能力與一般組合能力的方差比es2SCA = s2GCAT在0.36的生長體積醋火,而Balocchi等(1993)調(diào)查年齡趨勢的高度和報(bào)告,VD / VA隨時(shí)間變化0.20和4.42之間箱吕。在輻射松中芥驳,Wu和Matheson(2004,2005)估計(jì)s2 SCA = s2 GCA的樹高分別為0.90和0.95.Wu和Matheson(2004)建議應(yīng)采用特殊的交配設(shè)計(jì),以利用非加性方差的育種目的殖氏,另一方面晚树,Jansson和Li(2004)認(rèn)為在育種計(jì)劃中只應(yīng)考慮加性方差。也在道格拉斯冷杉雅采,Yanchuk(1996)使用大數(shù)據(jù)集來估計(jì)非加性方差。他們得出結(jié)論慨亲,與非加性方差相比婚瓜,加性方差的水平平均高三倍,并且與樹高相比刑棵,該直徑具有更高水平的非加性方差巴刻。總之蛉签,與加性方差相比胡陪,顯性水平似乎沒有總體趨勢沥寥,但它往往似乎至少存在一些顯性。
統(tǒng)計(jì)問題:
使用基于家系的模型來估計(jì)顯性方差(通過相互作用因子)可能會得到有偏差的加性和顯性方差估計(jì)柠座,因?yàn)橄底V中的信息不是同時(shí)使用的邑雅。在動物育種中使用基于血統(tǒng)的方法(即動物模型)若干次來估計(jì)顯性方差(例如Hoeschele和??Vanraden 1991; Misztal 1997)。通常妈经,在非隨機(jī)交配(例如淮野,育種群體)的群體中進(jìn)行遺傳評價(jià),其中動物模型考慮了多個世代的選擇吹泡,不同于基于家系的方法(Kennedy等人骤星,1988)。此外爆哑,使用基于家系的模型對一般和特定組合能力的估計(jì)將包括通常被忽略的高階上位效應(yīng)的一部分(Lynch和Walsh 1998)洞难。結(jié)果,可能發(fā)生加性和顯性方差的高估揭朝。
在動物模型中队贱,與觀察的數(shù)量相比,要估計(jì)的隨機(jī)效應(yīng)的數(shù)量通常較大萝勤,導(dǎo)致過參數(shù)化的方程系統(tǒng)可能導(dǎo)致參數(shù)的不可識別性露筒。如果在模型中擬合了幾個遺傳因素,這是特別具有挑戰(zhàn)性的敌卓∩魇剑可以通過向譜系添加額外的沒有記錄的世代來改善可識別性的問題。換句話說趟径,使用復(fù)雜的譜系從加性分量中分離非加法方差分量是更有效的瘪吏,因?yàn)榉羌有缘南嗤陆稻仃囑呄蛴谠趶?fù)雜譜系中具有比在簡單譜系中更多的非零元素(Mao和Xu 2005) 。
信息先驗(yàn)可以用于使參數(shù)在貝葉斯模型中更可識別(Gelfand和Sahu 1999; Sorensen和Gianola 2002)蜗巧。在統(tǒng)計(jì)學(xué)中也眾所周知的是掌眠,重復(fù)和相關(guān)的性狀測量將減輕可識別性的問題。使用更經(jīng)濟(jì)的參數(shù)化也可以幫助幕屹,例如蓝丙,父親育種值表示非親本育種值的父親或減少的動物模型(Quaas和Pollak 1980)⊥希或者渺尘,可以通過操縱動物模型的系數(shù)矩陣來減少方程的數(shù)量,這導(dǎo)致不對稱的系數(shù)矩陣(參見Henderson 1984; Lynch和Walsh 1998)说敏。最后鸥跟,還可以對無窮位點(diǎn)模型使用有限位點(diǎn)近似來估計(jì)非加性參數(shù)(例如,Du和Hoeschele 2000)。然而医咨,一般的缺點(diǎn)是估計(jì)值取決于使用的基因座的數(shù)量枫匾。
我們使用后驗(yàn)預(yù)測損失標(biāo)準(zhǔn)來比較包括不同數(shù)量的隨機(jī)遺傳組分的模型。在頻繁的統(tǒng)計(jì)學(xué)中拟淮,通常使用LRT進(jìn)行遺傳方差分量的假設(shè)檢驗(yàn)干茉,其評估簡化模型是否給出與完整模型相同的數(shù)據(jù)擬合。一般來說惩歉,如果樣本量較大等脂,則該測試對于雙側(cè)假設(shè)表現(xiàn)良好,因?yàn)長RT的分布然后遵循卡方分布撑蚌,漸進(jìn)地上遥。另一方面,當(dāng)數(shù)據(jù)量增加時(shí)争涌,所有假設(shè)最終變得具有統(tǒng)計(jì)意義(Sillanpa¨和Auranen 2004)粉楚,對于方差分量等有界參數(shù),空分布可能難以估計(jì)(Crainiceanu和Ruppert 2004)亮垫。因此模软,在這些情況下,使用卡方分布近似LRT的分布可能會給出不正確的結(jié)果饮潦。另一個常用的統(tǒng)計(jì)量是使用似然性(擬合優(yōu)度)和對應(yīng)于模型中參數(shù)(K)的數(shù)量的懲罰項(xiàng)的AIC燃异。 K通常被計(jì)算為固定效應(yīng)的設(shè)計(jì)矩陣的等級加上方差的數(shù)量。 Vaidaand Blanchard(2005)認(rèn)為继蜡,當(dāng)推理的焦點(diǎn)是混合模型中的隨機(jī)效應(yīng)時(shí)回俐,K需要用一個稱為有效參數(shù)數(shù)量的參數(shù)(其考慮了參數(shù)之間的相關(guān)性) 。有效參數(shù)的估計(jì)不是直接的稀并,在我們的分析中沒有執(zhí)行仅颇。
在貝葉斯分析中,貝葉斯因子已被用于在具有和不具有分子標(biāo)記的動物模型中測試多基因遺傳參數(shù)(Garc?'a-Corte等人碘举,2001)忘瓦。然而,貝葉斯因子僅適用于具有完全適當(dāng)先驗(yàn)的模型引颈,并且對模型的參數(shù)化敏感耕皮。 DIC最近被提出作為一般模型選擇標(biāo)準(zhǔn),并已用于動物模型中的評估(例如蝙场,Rekaya等人2003)明场。 Sorensen和Waagepetersen(2003)提供了關(guān)于動物模型的不同貝葉斯模型比較標(biāo)準(zhǔn)的廣泛討論。在本研究中李丰,在使用DIC的令人失望的初始實(shí)驗(yàn)之后,我們選擇使用后驗(yàn)預(yù)測損失方法逼泣。蘇格蘭松數(shù)據(jù)的模型比較結(jié)果表明趴泌,包括加性和顯性效應(yīng)的模型應(yīng)該優(yōu)于減少的模型舟舒。模擬數(shù)據(jù)的分析也表明Dm工作,但是對方差分量的水平敏感嗜憔,我們建議在小方差的情況下秃励,用不同先驗(yàn)的幾次運(yùn)行估計(jì)這個統(tǒng)計(jì)量。
Damgaard(2007)基于Mrode和Thompson(1989)的觀點(diǎn)使用了一種育種價(jià)值轉(zhuǎn)化吉捶,以獲得適用于單站Gibbs采樣的先驗(yàn)不相關(guān)育種值夺鲜。在我們的方法開發(fā)過程中,我們嘗試了類似的方法對于此處考慮的大型家系呐舔,但由于繁殖值的后驗(yàn)相關(guān)性太高而遇到混合問題(結(jié)果未顯示)币励。為了克服這里的混合問題,我們提出了混合采樣器珊拼。此外食呻,我們不會在我們的轉(zhuǎn)換中將方差分量重新調(diào)整為單位方差,因此我們不需要應(yīng)用反向轉(zhuǎn)換澎现。 Chalh和El Gazzah(2004)提出了另外兩種Gibbs加法和顯性模型的抽樣方法仅胞。第一種方法從僅具有加性(A)分量的動物模型獲得估計(jì),然后計(jì)算作為加性效應(yīng)的直接函數(shù)的顯性效應(yīng)剑辫。第二種方法是基于修改來自動物模型的混合模型方程殘差干旧,只有附加(A)分量。與傳統(tǒng)的加性加顯性單站點(diǎn)吉布斯取樣器相比妹蔽,加速度是相當(dāng)大的椎眯,但是需要進(jìn)一步的比較分析關(guān)于混合性能