Lenarcic, A.B., Svenson, K.L., Churchill, G.A., and Valdar, W. 2012. General Bayesian approach to analyzing diallel crosses of inbred strains. Genetics 190(2): 413–435. doi:10.1534/genetics.111.132563.
摘要
經(jīng)典的diallel采取一組父母,并從所有可能的交配對(duì)產(chǎn)生后代蒜焊。后代中的表型值可以與其各自的親本相關(guān)聯(lián)龄糊。當(dāng)父母是二倍體的,有性別的和近交的時(shí)候,雙列可以表征遺傳背景對(duì)表型的總體影響妻怎,揭示菌株劑量箫锤,雜種優(yōu)勢(shì),親本來(lái)源僚焦,上位性和其性別特異性形式的影響锰提。然而,其分析傳統(tǒng)上錯(cuò)綜復(fù)雜芳悲,無(wú)計(jì)劃的缺失信息立肘,對(duì)不平衡的高度敏感,使得雙列對(duì)許多遺傳學(xué)家無(wú)法接近名扛。盡管如此谅年,不平衡和不完整的diallel經(jīng)常出現(xiàn),盡管是無(wú)意識(shí)地肮韧,作為收集F1數(shù)據(jù)的大規(guī)模實(shí)驗(yàn)的副產(chǎn)品融蹂,例如試驗(yàn)研究或多種繁殖努力旺订,例如Collaborative Cross或擬南芥MAGIC系列。我們提出了一個(gè)通用的貝葉斯模型殿较,用于分析雌雄異株二倍體近交系的雙列數(shù)據(jù)耸峭,將觀察到的變異模式干凈地分解成生物直觀成分,同時(shí)模型和適應(yīng)異常值淋纲,并提供由于不平衡劳闹、缺失數(shù)據(jù)、樣本量小導(dǎo)致的不確定性而自動(dòng)包含不確定性的效應(yīng)的收縮估計(jì)洽瞬。我們進(jìn)一步提出了一個(gè)模型選擇程序本涕,用于衡量是否將這些組件納入預(yù)測(cè)模型的證據(jù)。我們通過(guò)模擬評(píng)估我們的方法伙窃,并將其應(yīng)用于關(guān)于創(chuàng)建者和Collaborative Cross 的F1的不完整雙列數(shù)據(jù)菩颖,強(qiáng)健地表征了48種表型的遺傳結(jié)構(gòu)。
diallel是遺傳學(xué)中最古老的設(shè)計(jì)之一为障,其分析非常復(fù)雜晦闰。前提是簡(jiǎn)單的:給予一組J父母,從所有JxJ互惠雜交產(chǎn)生和表型后代鳍怨,并從這些數(shù)據(jù)估計(jì)遺傳參數(shù)呻右,表征親代基因組和性別如何影響表型變異。使用這種設(shè)計(jì)鞋喇,可以估計(jì)平均父母對(duì)表型的影響以及與其他父母的特定組合的影響声滥。當(dāng)親本是近交系時(shí),也可以估計(jì)親本效應(yīng)侦香。盡管在diallel中包含了大量的信息落塑,但在實(shí)踐中阻礙了它的使用。關(guān)于估計(jì)參數(shù)的解釋的爭(zhēng)議已經(jīng)與關(guān)于分析方法本身的爭(zhēng)議不可避免地混淆在一起罐韩,并且討論文獻(xiàn)中的大部分被沉浸在潛在用戶不熟悉的術(shù)語(yǔ)中憾赁。事實(shí)上,對(duì)于局外人來(lái)說(shuō)伴逸,這個(gè)diallel是作為一個(gè)奧秘的難題出現(xiàn)的缠沈,或許是為了簡(jiǎn)化設(shè)計(jì)而最好的避免。
這個(gè)diallel起源于動(dòng)物和植物育種错蝴,作為從育種的角度來(lái)看,你應(yīng)該通過(guò)它的后代的表型來(lái)判斷一個(gè)人的價(jià)值(克里斯蒂和沙特克1992年及其中的參考文獻(xiàn))颓芭。它最初被Schmidt(1919)定義為所有可能的J2成對(duì)雜交的集合顷锰,并且后來(lái)被Jinks和Hayman(1953)引入主流遺傳學(xué)文獻(xiàn)。在接下來(lái)的十年里亡问,這個(gè)diallel定義迅速擴(kuò)展到包含J之間的任何一組F1官紫。 2位家長(zhǎng)肛宋,引起了一群活躍的定量遺傳學(xué)家的注意,他們繼續(xù)研究設(shè)計(jì)和分析的一系列細(xì)節(jié)束世。最簡(jiǎn)單和最流行的分析是Griffing(1956)酝陈。如果hjk是親本j與親本k的交叉的平均表型或預(yù)測(cè)值,那么親本效應(yīng)可以被建模為
其中m是截距毁涉,gj是父母j的主效應(yīng)沉帮,sjk是j和k的統(tǒng)計(jì)互動(dòng),即父母j和k的特定配對(duì)引起的組合主效應(yīng)的偏差贫堰。繼斯普拉格和塔特姆(1942)提出并在整個(gè)雙語(yǔ)文獻(xiàn)中使用的術(shù)語(yǔ)之后穆壕,gj是父親j的廣義組合能力(GCA),而sjk是父母j和k的特定組合能力(SCA)其屏。 GCA捕獲加性遺傳學(xué)的綜合影響喇勋,而SCA則反映導(dǎo)致偏離加性的總遺傳效應(yīng),如顯性和上位性偎行。
已經(jīng)提出了許多對(duì)Griffing模型的擴(kuò)展川背,以從雙列中提取更微妙的效應(yīng)。 (Hayman蛤袒,1957; Gardner和Eberhart熄云,1966)將其分解為互惠效應(yīng)(Griffing,1956)汗盘,進(jìn)一步將其分解為母體和父本效應(yīng)(Cockerham和Weir皱碘,1977; Zhu和Weir,1996)和與其性相關(guān)的變體(Carbonell等隐孽,1983)癌椿。相反,對(duì)獲得少于J2十字架的GCA的興趣激發(fā)了設(shè)計(jì)的變體菱阵,例如半雙列(Griffing 1956)和部分雙列(Kempthorne and Curnow 1961)等等(參見(jiàn)Christie and Shattuck 1992; Lynch and Walsh 1998)踢俄,它們本身也導(dǎo)致了技術(shù)創(chuàng)新(如Greenberg等,2010)晴及。
關(guān)于從diallel估計(jì)的參數(shù)的確切含義的不一致都办,給他們的解釋提出了一個(gè)理論上的絆腳石。親本可以是自交系虑稼,獨(dú)立的雜交種群(如開(kāi)放授粉的玉米品種)或遠(yuǎn)交的個(gè)體(Eberhart和Gardner琳钉,1966)。他們可能是故意選擇的蛛倦,隨機(jī)抽樣的歌懒,或者是這些的妥協(xié)。試驗(yàn)的目的可以是推斷父母本身溯壶,每個(gè)父母代表的人群及皂,還是所有父母都從中得到的更廣泛的人群甫男。對(duì)這些因素的綜合考慮是通過(guò)1950年至1970年的大部分基礎(chǔ)性diallel進(jìn)行的,并且一直是爭(zhēng)議的來(lái)源(Baker验烧,1978; Wright板驳,1985)。
一個(gè)更實(shí)際的絆腳石來(lái)自估計(jì)來(lái)自不完整碍拆,不平衡或被異常值污染的diallel數(shù)據(jù)的參數(shù)的困難若治。雖然有意識(shí)地建立了一些diallel雜交,但在多親本育種計(jì)劃中倔监,作為中間階段的副產(chǎn)品出現(xiàn)了相當(dāng)數(shù)量的雜交直砂。這樣的偶然撥號(hào)可以包含有價(jià)值的信息,但是它們經(jīng)常雜亂無(wú)章的缺失模式使得它們與經(jīng)過(guò)充分研究的設(shè)計(jì)不完美匹配浩习。對(duì)于許多不完整的diallel静暂,目前還不清楚如何在不丟棄觀測(cè)數(shù)據(jù)的情況下分析數(shù)據(jù),大大減少推斷的范圍或做出其他重大的妥協(xié)谱秽。
即使傳統(tǒng)分析方法適用于設(shè)計(jì)洽蛀,關(guān)于哪些參數(shù)(例如明顯的顯性模型,SCA等)應(yīng)該被包括在模型中的選擇可以改變對(duì)其他參數(shù)的估計(jì)和解釋疟赊。通過(guò)對(duì)個(gè)別術(shù)語(yǔ)的重要性測(cè)試進(jìn)行模型選擇的選擇(在較老的文獻(xiàn)中經(jīng)常提出)提供了一些指導(dǎo)郊供,但不令人滿意,因?yàn)樗膮?shù)是以忽略模型選擇中的不確定性的方式估計(jì)的近哟。我們認(rèn)為任何先驗(yàn)合理的效應(yīng)都應(yīng)該被排除在建模之外驮审,這似乎是人為的,與現(xiàn)代的應(yīng)用統(tǒng)計(jì)推斷方法(例如Gelman and Hill吉执,2007)不同步疯淫。
我們提出了一種通用而有效的雙列雜交分析方法,并將其應(yīng)用于從建立協(xié)作雜交中偶然發(fā)現(xiàn)的不完整八菌株中收集的48種表型的數(shù)據(jù)集(Churchill等人2004; Chesler等人al戳玫。2008; Collaborative Cross Consortium 2012)熙掺。我們的分析方法提供了一個(gè)推理框架,對(duì)于設(shè)計(jì)中的不平衡咕宿,缺少數(shù)據(jù)和異常值是強(qiáng)大的币绩。我們模擬了廣泛的效應(yīng),包括加性府阀,雜種優(yōu)勢(shì)缆镣,上位性,親本起源和性別特異性變異试浙。這個(gè)結(jié)構(gòu)實(shí)現(xiàn)了兩個(gè)重要的目標(biāo)费就。首先是對(duì)模型參數(shù)的熟悉和不斷的解釋。二是通過(guò)分層貝葉斯收縮和模型選擇實(shí)現(xiàn)穩(wěn)定一致的估計(jì)和預(yù)測(cè)川队。