基因組選擇:動物育種中范式的轉變
文章來源:[https://academic.oup.com/af/article/6/1/6/4638797?tdsourcetag=s_pcqq_aiomsg]
閱讀者:劉綿宇
摘要
傳統(tǒng)的標記輔助選擇(MAS)并未使DNA信息在動物育種中的廣泛使用赶掖。主要原因是畜牧生產中感興趣的性狀比預期的要復雜得多:它們由數(shù)千種對表型影響微小的基因決定碧绞。這些影響通常太小而沒有統(tǒng)計顯著(事物得以相互區(qū)別的能力),因此被忽略憎瘸。
基因組選擇(GS)假定所有標記都可能與影響該性狀的基因相關聯(lián)富岳,并專注于估計其作用而不是測試其重要性。三項技術突破導致當前DNA信息在動物育種中得到廣泛使用:基因組選擇技術的發(fā)展拯腮,大量遺傳標記(單核苷酸多態(tài)性窖式;SNP)的發(fā)現(xiàn)以及高通量技術以低成本的方式對動物(幾十萬)的snp進行基因分型。
本文回顧了GS的當前方法动壤,包括它們如何處理基因型大量缺失的實際數(shù)據萝喘。預期了全基因組序列數(shù)據的使用,并描述其優(yōu)缺點琼懊。闡述了GS對奶牛和肉牛阁簸,豬以及家禽育種的當前和未來的影響。文末討論了GS的未來發(fā)展方向哼丈。
預計未來的gs應用可能是:在品種內(wbgs)启妹,通過保持龐大的近交參考種群獲得準確度;或在品種間(abgs)醉旦,通過跨品種參考種群和高密度gs方法(專注于致病基因組區(qū)域)獲得準確度饶米。我們認為,未來的GS應用將越來越多地轉向abGS车胡。
前言
動物育種檬输,即對重要經濟性狀的選擇育種,在傳統(tǒng)是以表型記錄數(shù)據為基礎的匈棘。最佳線性無偏預測(BLUP)將個體表型記錄和系譜信息結合起來估計育種值(EBV)丧慈。自1990年起,分子遺傳學的進展使人們相信主卫,在DNA水平上信息的利用將比僅僅使用表型數(shù)據帶來更多的遺傳改良逃默。這導致了對MAS的研究,包括兩個步驟:(1)檢測和(精確)定位感興趣性狀的基因队秩,即所謂的數(shù)量性狀位點(QTL)(2)將QTL信息包括在BLUP-EBV中笑旺。
QTL定位步驟(1)中大多數(shù)檢測基因的定位研究是有意義的,但是定位研究的重復性較低馍资,即在QTL的位置在不同的研究中可能會發(fā)生改變或消失筒主,其中的一個原因是大多數(shù)QTL的效應很小关噪,當這與測試中的大量標記結合時,存在明顯的“Beavis效應”乌妙,其中明顯標記的估計效應被高估(Beavis使兔,1994)。比如藤韵,如果我們使用0.01的P值測試100個標記的統(tǒng)計顯著性虐沥,則即使所有真正的標記效應都為零,我們也期望得到一個(假)顯著結果泽艘。相反欲险,如果所有標記都具有非常小的影響,則少數(shù)(隨機選取的)標記將達到更高的顯著性水平匹涮,并且大多數(shù)標記將達不到閾值并被判斷為不顯著天试。在全基因組關聯(lián)研究(GWAS)中,測試的數(shù)量等于基因型獨立SNP的數(shù)量然低,通常在家畜中有數(shù)千個喜每,在人類遺傳學中有數(shù)十萬個。由于SNP的數(shù)量如此之多雳攘,多重測試問題變得越來越重要带兜,以至于在人類遺傳學中,P值應小于5×10-8吨灭。此外刚照,人類遺傳學期刊還要求在獨立的數(shù)據集種確認QTL。
這些非常嚴格的測試結果只發(fā)現(xiàn)了最顯著的QTL喧兄。對于一些性狀來說就檢測到了這樣的QTL涩咖,例如影響牛奶中脂肪含量的DGA T1(Grisart等,2001)和影響大西洋鮭魚傳染性胰腺壞死病毒(IPNV)抗性的CDH1(Moen等繁莹,2015)檩互。然而,對于許多的其他性狀來說咨演,沒有發(fā)現(xiàn)可靠的QTL闸昨,并且QTL解釋了不到10%的總體育種目標的變異,即所有重要經濟性狀的組合薄风。甚至對于進行了很多強力QTL定位研究的奶牛來說也是如此饵较,QTL解釋的育種目標的遺傳方差不到10%,意味著家畜之間90%以上的遺傳差異必須通過傳統(tǒng)選擇來處理遭赂。因此循诉,直到2005年MAS在家畜育種中的應用也非常有限。在人類遺傳學中撇他,非常龐大的GW AS研究(例如茄猫,160,000個個體對500,000個SNPs進行基因分型)只解釋了總遺傳變異中(非常)有限的一部分狈蚤,這一結果被稱為缺失遺傳力悖論(Manolio等,2009)划纽,即這些龐大的gwas研究沒有解釋大部分遺傳變異脆侮。
關于遺漏遺傳力問題的許多解釋已經發(fā)表(Manolio等人,2009)勇劣。其中最有可能的解釋似乎是因為非常嚴格的統(tǒng)計檢驗和許多影響性狀的小效應基因兩方面結合的原因靖避,即,盡管有大量的基因型個體比默,但基因效應太小而不能通過嚴格的統(tǒng)計檢驗幻捏。所有這些小基因共同解釋了大多數(shù)性狀的絕大多數(shù)遺傳變異(Yang等,2010)命咐。2001年粘咖,Hayes和Goddard(2001)預測50-100個基因影響乳品性狀,這在當時被認為是一個很高的估計侈百。而基于目前的GWAS和基因組選擇結果,我們認為乳品性狀受2,000-10,000個基因的影響翰铡。因此钝域,被認為影響復雜性狀(如乳品性狀)的基因數(shù)量在過去15年中增加了100倍,即復雜性狀比一二十年前的預期要復雜得多锭魔。太多影響性狀的基因意味著單個基因的影響很小例证,這限制了MAS方法的效率。
三個突破導致目前DNA信息的廣泛應用:1)GS方法學(Meuwissen等迷捧,2001)织咧,2)數(shù)千個SNP標記的鑒定,3)SNP芯片基因分型技術漠秋,使所有這些SNP的基因分型的成本降低笙蒙。在MAS中,使用了少量有意義的標記庆锦,其余的被視為零效應捅位。在GS中,所有這些SNP的影響都是在不進行任何顯著性檢驗的情況下同時進行估計的搂抒。如果有大約10,000個基因影響一個性狀艇搀,那么基因組上到處都是基因,這可能與分布在整個基因組中的數(shù)千個SNP有關求晶。因此焰雕,所有SNP都有效應的假設可能是有價值的,我們應該將我們的重點從顯著性測試轉移到估計所有標記的影響芳杏。(第二代)測序工作使許多家畜物種基因組序列的發(fā)現(xiàn)矩屁,同時揭示了數(shù)千個SNP標記辟宗。在牛中,1,000頭公牛的測序項目已經揭示了3000萬個SNP標記(Daetwyler等档插,2014)慢蜓。SNP芯片基因分型技術主要由Illumina和Affymetrix開發(fā),第一代SNP芯片包含大多數(shù)家畜物種的典型約50,000個SNP郭膛。
在基因組選擇中晨抡,對參考群體進行基因分型并記錄性狀來估計SNP效應,接下來则剃,對候選群體進行基因分型耘柱,并通過將其基因型與估計的效應相結合來估計候選群體的基因組估計育種值(GEBV),我們可以注意到GS方法并不需要系譜信息棍现,而系譜信息在傳統(tǒng)的BLUP-EBV中是必須的调煎,并且選優(yōu)家畜(候選群體)不一定要具有表型信息,在傳統(tǒng)育種中己肮,選優(yōu)育種的家畜要盡可能準確地記錄表型性狀和系譜信息士袄。這種將精準記錄與選優(yōu)育種群體分開的潛力使得完全重設育種方案成為可能,因此GS導致了動物育種的范式轉變谎僻。我們的目的是為非遺傳學家的讀者更詳細地描述GS方法娄柳。此外,我們還將描述當前和預測未來GS對奶牛和肉牛艘绍、豬和家禽養(yǎng)殖的影響赤拒。
基因組選擇方法
在參考群體中同時估算所有SNP效應,使用統(tǒng)計模型對它們的基因型和表型進行分析(假設有50,000個SNP)
yi是動物i的表型诱鞠; μ是總體平均值挎挖; X1i是標記i的動物i的基因型; ei是殘差航夺。通常我們有<50,000只的參考群體蕉朵,如果使用傳統(tǒng)的統(tǒng)計方法,將50,000個SNP效應視為固定效應則無法估算它們的效應阳掐。在GS中墓造,通過將SNP效應看作從已知分布中得出的隨機效應,可以解決此問題锚烦。這可以看作是一種貝葉斯方法觅闽,其中添加了有關SNP效應的先驗信息以使所有效應都可估計。一個常用的先驗假設是SNP效應呈正態(tài)分布涮俄,均值為0蛉拙,且具有恒定的方差(即總遺傳方差除以50,000)畜侦。實際上尔店,此方法使用BLUP來估計SNP的效應介褥,有時稱為SNP-BLUP逾礁。
候選群體j的基因組育種值預測為:
其中1是對SNP1效應的估計;X1j是SNP1的動物j的基因型畸肆。
GBLUP方法
在傳統(tǒng)BLUP中宦芦,EBV使用表型和親緣關系進行估算,這些基于動物的系譜轴脐。在GBLUP中调卑,GEBV使用表型和基因組關系進行估算,這些表型和基因組關系基于全基因組范圍內的密集標記數(shù)據大咱。動物1和2之間的基因組關系被計算為它們的SNP基因型xj1和xj2在所有j的SNP之間的相關性恬涧。因此,GBLUP方法與傳統(tǒng)的BLUP非常相似碴巾,除了譜系關系被基因組關系代替溯捆。 GBLUP方法的一個實際優(yōu)勢是,所有傳統(tǒng)的BLUP方法和軟件仍然可以使用:我們只需要用基因組關系替換譜系即可厦瓢。
兩個全同胞之間的系譜關系是0.5提揍,這意味著兩個全同胞個體預期具有50%等位基因相同。然而煮仇,在現(xiàn)實生活中劳跃,兩個全同胞可能共享60%或40%的等位基因,并且這種與基于系譜的50%的期望的偏差將通過密集標記基因分型來檢測到欺抗。因此,GBLUP比傳統(tǒng)的BLUP更準確强重,因為基因組關系比基于譜系的關系更準確绞呈。前者需要基于足夠大數(shù)量的SNP進行基因組關系估計。對于一個品種中的牲畜和親緣關系间景,50000個SNP分布在整個基因組中似乎就足夠了(Goddard等人佃声,2011)。品種間的親緣關系越小需要的SNP數(shù)量越多倘要。
GBLUP方法的統(tǒng)計模型為:
ui是動物i的育種值圾亏。如果我們將ui定義為如下式子,則GBLUP和SNP-BLUP育種值是等效的封拧。
ui的定義對兩個動物ui和uj之間的協(xié)方差有影響志鹃,其變?yōu)椋?/p>
假設總遺傳方差為1(為簡單起見),每個SNP的方差為Sb 2 = 1/50000泽西。如果我們對基因型Xki進行標準化曹铃,以使其在每個SNP k中均值為0,標準差為1捧杉,則上述公式將計算SNP基因型之間的相關性陕见,即動物i和j之間的基因組關系秘血。 (此處不需要對相關系數(shù)計算中的均值和標準差進行通常的校正,因為對SNP基因型進行了縮放评甜,以使其均值為0而標準差為1灰粮。)以這種方式進行參數(shù)化時,SNP-BLUP和GBLUP模型暗示動物之間具有相同的協(xié)方差忍坷,因此也具有相同的動物遺傳價值記錄回歸系數(shù)粘舟。后者意味著,當仔細調整參數(shù)時承匣,SNP-BLUP和GBLUP產生相同的GEBV蓖乘,即方法被認為是等效的。 GBLUP和SNP-BLUP等效性的更正式推論可以在文獻中找到(Habier等韧骗,2007嘉抒; VanRaden,2008袍暴; Goddard些侍,2009)。
GBLUP和SNP-BLUP的計算要求可能有很大的不同政模。 SNP-BLUP需要估計50,000個SNP效果岗宣,因此需要求解50,000個方程組,而GBLUP需要估計N個GEBV和求解N個方程淋样,其中N是動物的數(shù)量耗式。由于通常基因型動物的數(shù)量少于50,000趁猴,因此(在計算上)首選GBLUP方法刊咳。將來,基因型動物的數(shù)量預計會急劇增加儡司,因此SNP-BLUP方法很可能成為首選方法娱挨。但是,其他非BLUP方法也可能會變得流行起來捕犬,如以下各節(jié)所示跷坝。
基因組選擇的非線性方法
SNP-BLUP(以及隱含的GBLUP)中的先驗信息假定每個SNP的SNP效應均以相同的方差分布。該假設導致對SNP效應的BLUP估計是所有觀察到的表型的線性組合碉碉。從生物學上講柴钻,我們可能希望某些接近基因的SNP起作用,而另一些則沒有效果垢粮。已經開發(fā)出許多方法顿颅,這些方法結合了先驗信息,這些信息假定SNP的分數(shù)π有作用,而分數(shù)(1-π)根本沒有作用粱腻。這些方法使用的模型是:
其中Ij是指示變量庇配,其值為0或1,指示SNP j是否有效绍些。 BayesC假定具有影響的SNP正態(tài)分布具有恒定的方差(Habier等捞慌,2011),因此最接近SNP-BLUP柬批。 BayesB使用先驗效應的SNP的t分布啸澡,這使得某些SNP具有非常大的效應(Meuwissen等,2001)氮帐。 BayesR假設有效SNP的正態(tài)分布是混合的嗅虏,這也允許一些SNP具有非常大的效應,即那些從具有最大方差的分布中提取的SNP(Erbe等人上沐,2012)皮服。這些方法估計的SNP效應不再是表型的線性組合。其他非線性估計方法是BayesA(Meuwissen等参咙,2001)龄广,LASSO,Bayesian Lasso和彈性網(Hastie等蕴侧,2009)择同。 (非線性方法有時被稱為“貝葉斯”方法,因為它們使用SNP效果的先驗分布净宵,但是SNP-BLUP也使用先驗分布敲才,假定為正態(tài)分布。)
非線性方法使用的SNP效應的先驗分布在生物學上比假設所有SNP都具有效應且所有效應都非常小要有意義择葡。在計算機仿真研究中紧武,非線性方法明顯優(yōu)于GBLUP(Meuwissen和Goddard,2010年)刁岸,但在實際數(shù)據中脏里,非線性方法在某些特征上優(yōu)于某些特征她我,但不是全部特征(Erbe等人虹曙,2012年)。這可能由以下解釋:(1) 有許多基因影響著重要的經濟性狀番舆,因此假設所有SNP均具有作用是近似正確的酝碳。 (2) 連鎖不平衡(兩個基因座之間的非隨機關聯(lián))延伸到牲畜種群中較大的基因組距離,從而使許多SNP與一個基因相關聯(lián)恨狈; (3) SNP密度不夠高疏哗,以至于每個QTL可以用一個SNP來解釋,因此需要許多SNP來共同解釋QTL的作用禾怠。所以返奉,當將50k SNP芯片替換為高密度777k SNP芯片并且數(shù)據包含多個品種時贝搁,非線性方法相對于GBLUP的優(yōu)勢更加明顯(Br?ndum等人,2015)芽偏。(1)和(2)的組合雷逆,即有許多基因與連鎖不平衡的程度有關,主要解釋了GBLUP在品種內的良好表現(xiàn)污尉。
序列數(shù)據
基于SNP芯片基因型的基因組選擇取決于QTL與SNP之間的連鎖不平衡(LD)膀哲,即SNP與QTL之間的關聯(lián)。增加SNP的密度會增加任何QTL具有與其完美結合的SNP的可能性被碗。最終密度是用全基因組序列(WGS)數(shù)據代替SNP基因型某宪。在后一種情況下,預期致病突變會出現(xiàn)在序列數(shù)據中锐朴,但是兴喂,GS可以直接作用于致病突變,而不必依賴標記和致病突變之間的LD包颁。然而瞻想,這些突變隱藏在數(shù)百萬個SNP中,沒有任何作用娩嚼。由此預期和模擬研究表明(Meuwissen和Goddard蘑险,2010年),在使用WGS數(shù)據時岳悟,假設許多SNP沒有效應的非線性GS方法的準確度要比GBLUP高得多佃迄。
最近,Br?ndum等人贵少。 (2015年)證明了具有序列數(shù)據的GEBV的準確性小幅增長(2-5%)呵俏。當前的WGS數(shù)據不會大大改善GEBV的準確性的原因可以解釋如下。首先滔灶,當從777k數(shù)據轉換為WGS數(shù)據時普碎,GBLUP方法預期不會產生什么改進,因為用777k數(shù)據準確估計了基因組關系录平,而WGS幾乎不會提高關系的準確性麻车,因此也無法提高GEBV。但是斗这,非線性GS方法試圖識別因果SNP动猬,并有望從WGS數(shù)據中受益。第二表箭,當前的WGS數(shù)據不是很準確赁咙,可能是由于不完善的基因型調用,對SNP歸因的廣泛依賴(請參閱下一節(jié))或結構基因組變異(很難通過短讀序列進行評估)。WGS數(shù)據中的不準確之處可能會抵消更高的SNP密度帶來的好處彼水。第三崔拥,遠距離LD在參考種群動物中可能廣泛存在,導致大的染色體片段或單倍型很常見凤覆。因此握童,將有許多SNP組合來解釋單倍型以及因果變體的作用。每種統(tǒng)計方法都會選擇最適合其先前假設的SNP效果組合叛赚,而它們都可能對單倍型效果給出相同的預測澡绩。但是,如果減小LD的范圍(例如俺附,通過使用不那么緊密相關的參考群體)肥卡,則專注于因果變體的非線性方法可能會比GBLUP(后者同樣使用所有序列變體)的準確性更高。另一個問題是事镣,當今的計算機很難存儲和處理這些海量數(shù)據步鉴,特別是如果要在許多動物身上采集WGS的情況下。盡管有效利用WGS數(shù)據存在當前問題璃哟,但可以預期WGS數(shù)據將成為未來的基因型數(shù)據氛琢,因為如果測序成本繼續(xù)下降,WGS可能會成為最有效的基因分型方法(Gorjanc等人随闪,2015年)阳似。
基因型缺失的歸因
SNP芯片基因分型后,一些基因型將丟失铐伴。這種缺失可以通過稱為基因型插補的過程來解決撮奏。根據動物的已知基因型,可以識別在其他動物中也可以觀察到的相同單倍型当宴。因此畜吊,可以從這些具有相同單倍型的其他動物的基因型中讀取缺失的基因型。用于插補的軟件包括Beagle(Browning and Browning户矢,2007)玲献,F(xiàn)impute(Sargolzaei等人,2014)和Alphaimpute(Hickey等人梯浪,2012)捌年。
插補方法也可以與稀疏但便宜的SNP芯片結合使用。對關鍵祖先進行基因分型驱证,用致密但昂貴的芯片鑒定群體中的單倍型延窜。接下來恋腕,使用稀疏的廉價SNP芯片對大量后代進行基因分型抹锄。稀疏芯片具有足夠的SNP以識別動物攜帶哪種單倍型。由于已經用高密度芯片鑒定出了單倍型,可以推斷缺失的基因型伙单。
采用相同的策略來獲取許多動物的WGS數(shù)據:1,000個公呕窀撸基因組項目收集了不同品種的一組測序公牛,用于鑒定牛單倍型及其序列吻育。接下來念秧,用SNP芯片對許多動物進行基因分型,識別它們攜帶的牛單倍型布疼,并估算其WGS數(shù)據摊趾。另一個選擇是在低覆蓋范圍內對后代進行排序。在這種情況下游两,低覆蓋率序列應足以識別單體型砾层。1,000個公牛基因組計劃證明贱案,對于具有較高次要等位基因頻率的SNP(和其他變體)肛炮,序列基因型的準確估算是可能的。然而宝踪,對于次要等位基因頻率較低的SNP侨糟,估算的準確性較差。Druet等在模擬中證明瘩燥,如果對大量祖先進行了測序秕重,覆蓋率相對較低(四到六倍),則這些稀有SNP的估算基因型的準確性就會提高厉膀。van Binsbergen等悲幅。(2014年)清楚地證明,與直接將50K基因型插值到序列相比站蝠,先將50K基因型插值到800K汰具,然后再進行測序,可以提高插補的準確性菱魔。
非基因型動物
在基因組選擇中留荔,許多(可能大多數(shù))動物沒有基因型,但我們需要在育種價值估算中包括它們的表型信息澜倦。至少聚蝶,傳統(tǒng)選擇將使用此類信息。一種方法是通過多步驟GS:在步驟1中藻治,為基因型動物計算假表型碘勉,其中動物i的假表型包括有關其非基因型家系的信息;在步驟2中桩卵,使用偽記錄和基因型進行基因組預測验靡。第3步倍宾,將傳統(tǒng)的EBV和GEBV合并為一個總EBV(例如VanRaden,2008年)胜嗓。這里可以用公牛子代的平均產奶量作為一個偽記錄的實例高职,公牛是基因型而不是表型,而他的女兒是表型而不是基因型辞州。由于數(shù)據要分多個步驟處理怔锌,該方法并不是最佳選擇。但實際上变过,使用此方法已達到良好的GS精度埃元。
在單步GBLUP(ssGBLUP)中,所有數(shù)據都在單個估算步驟中核算(請參見Legarra等媚狰,2014)亚情。當從傳統(tǒng)的BLUP遷移到GBLUP時,我們用基因組關系替換整個系譜關系矩陣(見上文)哈雏。一個很好的想法是當能用基因組關系替換譜系時替換楞件,不能時則保留譜系關系。然而裳瘪,當基因分型顯示基于系譜的不同家系中的某些動物比預期的關聯(lián)性要高土浸,那么這些家系中的其他未分型動物可能也比預期的關聯(lián)性更高∨砀可以通過從基因型動物開始然后使用系譜來計算涉及這些基因型動物的非基因型后代的關系來獲得正確的關系矩陣黄伊,即沿著譜系向下并考慮該譜系祖先基于標記的關系。同樣的想法也可以用于系譜派殷,即當祖先是非基因型時还最,盡管在這種情況下它不是最佳的想法(Meuwissen等人,2011)毡惜。在奶牛中拓轻,ssGBLUP產生的準確度比多步方法高出0-2%(Legarra等人,2014)经伙,但對于不太受父系支配的其他物種(即扶叉,在這些物種中子代平均數(shù)不能匯總家族信息),ssGBLUP和多步方法之間的精度差異可能更大帕膜。單步方法的一個缺點是:雖然文獻中已經提出了單步非線性估計的一些解決方案枣氧,但是目前它仍不適用于非線性估計(Liu等人,2014垮刹;Legarra和Ducrocq达吞,2012)。
在大多數(shù)研究中荒典,相對于純基因組模型酪劫,由單一步驟而增加的可靠性很型萄肌(Koivula等人,2012年)契耿。單步模型的一個更重要的特征是它可以對年輕基因型公牛進行預選,使得GEBV較為準確(Vitezica等螃征,2011)搪桂。直到最近,必須直接反轉G矩陣的要求限制了ssBLUP可以應用到的數(shù)據集的大小盯滚。先祖踢械,成熟,公牛算法(APY)使用遞歸直接構建G -1矩陣的較大組成部分魄藕,克服了這一限制内列,并將ssBLUP的應用擴展到了數(shù)百萬的基因型動物(Fragomeni等人,2015年)背率,但以G -1的一些近似值為代價话瞧。對于未來,顯然需要一種在序列級數(shù)據上使用非線性統(tǒng)計方法的單步方法寝姿。
畜牧業(yè)中基因組選擇的實施
奶牛的基因組選擇
奶牛的基因組預測準確性在生產性狀上超過0.8交排,在生育力,壽命饵筑,體細胞計數(shù)和其他性狀上超過0.7(例如Wiggans等埃篓,2011;Lund等根资,2011)架专。這些高準確性反映了每個品種的大量參考種群,這些種群已經被組裝以能夠進行基因組預測玄帕,以及部脚,參考種群中的許多個體都是經過后代測試的公牛,其子代表現(xiàn)高度準確的表型裤纹。此外睛低,GEBV通常用于預測參考種群中動物的近親。奶欧基因組預測的一個特點是钱雷,各國之間進行合作以組裝這些大型參考集,并建立了三個財團(歐洲財團吹零,包括荷蘭罩抗,德國,法國灿椅,北歐國家套蒂,西班牙和波蘭钞支;北美財團,包括美國操刀,加拿大烁挟,意大利和英國;以及“世界其他國家”財團骨坑,由許多其他國家組成)撼嗓。
基因組預測的高精度和通過低密度基因分型后進行插補獲得基因組預測的相對較低成本的方法已導致對大量選擇候選者進行基因分型。為了基因組預測欢唾,目前在全球范圍內已對約200萬頭奶牛進行了基因分型且警。僅在美國,就已經對934780只荷斯坦牛礁遣,120439只澤西牛斑芜,19,588瑞士褐牛和4767只Aryshire牛進行了基因分型。其他國家對相似數(shù)量的動物進行了基因分型祟霍,其中僅法國就有360,000種(Boichard杏头,個人交流)。
在奶牛中進行基因組選擇提高了遺傳增益沸呐,已通過許多國家的遺傳趨勢分析得到證明大州。例如,在加拿大從引入基因組選擇以來遺傳獲得率大約增加了一倍垂谢。但一些人認為厦画,基因組選擇增加了每年的近交率(Schenkel,2012)滥朱。因此根暑,在限制近交率的同時,最大限度地提高基因組選擇的遺傳增益將成為未來研究的重要課題徙邻。
有趣的是排嫌,許多國家中大多數(shù)基因型動物現(xiàn)在都是小母牛。雖然對小公牛犢進行基因分型可帶來最大的遺傳收益缰犁,但現(xiàn)在進行基因分型已經足夠便宜淳地,以至于為了選擇保留在牛群中的小母牛而對小牛犢進行基因分型是有利的(Pryce and Hayes 2012 ; Weigel等,2012)帅容。當選擇與公牛配對的公牛時颇象,也可以使用小母牛的基因型,這樣可以最大程度地減少小牛的近親繁殖并徘。
當選定的小母牛進入牛群并具有牛群記錄數(shù)據時遣钳,它們可以在參考種群中用于基因組預測(Wiggans等,2011)麦乞。當目的是增加參考種群的大小以提高基因組預測的準確性時蕴茴,對具有良好表型記錄的成熟母牛進行基因分型是有必要的劝评。有報道說,將10,000和5,000頭母牛添加到用于評估Holstein和Jersey牛的參考集上倦淀,根據性狀的不同蒋畜,其準確性提高了5–8%。與上述某些種群相比撞叽,這一相對較大的增長可能反映了較小的公牛參考集(分別為Holsteins和Jersey的4,000和1,000)姻成。
肉牛的基因組選擇
現(xiàn)在在一些牛肉品種中,基因組選擇已得到大規(guī)模應用能扒。例如佣渴,在美國現(xiàn)在已經對超過52,000只安格斯牛進行了基因分型以進行GEBV評估(Loureco 等辫狼,2015)初斑。但是,一般來說肉牛的基因組預測準確性低于奶牛膨处。例如见秤,Van Eenennaam等在他們的評論中。(2014年)報告的準確度范圍為0.3到0.7真椿。較低的準確性是因為奶牛的參考種群質量較高鹃答。在肉牛中,參考種群一個品種中的個體較少且這些個體尚未經過后代測試突硝。另外测摔,與奶牛相比,肉牛的目標種群和驗證動物與參考種群的聯(lián)系可能不太緊密解恰。
為了補償一個品種中少量的參考動物锋八,使用多品種參考種群是常見的方法。Bolormaa等人發(fā)現(xiàn)护盈,使用種方法準確性略有提高(從0.33到0.38)挟纱,但幅度不及來自相同品種的相同數(shù)量的動物。當Akanno等人使用美國幾個純種的參考種群來預測加拿大的雜種種群腐宋,其準確性較低紊服。如果目標種群不包括在參考種群中,則準確性非常低胸竞。
這些跨品種預測的失望結果使人并不意外欺嗤。De Roos等人。(2009年)發(fā)現(xiàn)除了在短的基因組距離(如卫枝,<10kb)剂府,LD的階段不會在所有品種中持續(xù)存在。因此剃盾,當使用50k SNP面板時腺占,來自其他品種的信息不會提高準確性淤袜。即使使用高密度SNP,來自另一個品種的信息遠沒有來自目標品種的信息有用衰伯,因為不同品種的動物比相同品種的動物共享更小的染色體片段铡羡。當使用BLUP預測育種值時,假定染色體區(qū)段的方差與其長度(或SNP的數(shù)量)成正比意鲸,小區(qū)段的方差較低烦周,估計的準確性不如大區(qū)段。通過使用貝葉斯方法可以稍微改善這種情況怎顾,該方法允許某些SNP(以及某些段)的影響大于其他SNP读慎。使得在預測種可以更好地利用具有QTL的高LD中的SNP,并且該信息可能會在各個品種之間轉換(Bolormaa等槐雾,2013b夭委; Khansefid等,2014)募强。
在參考種群中組合品種的價值在一定程度上取決于多個品種中QTL的分離株灸。Bolormaa等。(2014年)報道了QTL在多個品種的相似位置擎值,這表明QTL確實存在于多個Bos taurus品種中慌烧。但是,Bolormaa等人得出結論鸠儿,QTL很少在B. taurus和B. indi-cus內分離屹蚊,并且存在已知的例外,例如PLAG1和CAST进每。
基因組選擇沒有像奶牛育種那樣廣泛地用于牛肉中汹粤。部分原因是因為精度較低,而且還因為經濟優(yōu)勢不那么好品追⌒ǎ基因組選擇最適合傳統(tǒng)上難以選擇的性狀。它在牛肉中的優(yōu)勢不如奶牛肉瓦,因為這些性狀不需要對子代進行后代測試遭京,這些諸如生長率之類的性狀可以在年輕候選者身上進行測量。但是泞莉,很難選擇肉牛的幾個重要特性哪雕,例如飼料轉化效率和牛肉質量。記錄這些特征很昂貴鲫趁,因此建立大量的訓練種群是昂貴的斯嚎,并且沒有大型公司可以為自己的育種計劃證明這筆費用是合理的。對于這些特征,基于高密度SNP或基因組序列數(shù)據的多品種訓練種群和非線性分析可能是最好的方法堡僻。
盡管存在這些困難糠惫,但在肉牛中已經進行了基因組選擇。例如钉疫,澳大利亞和美國的安格斯EBV使用DNA信息進行計算硼讽。有兩種方法可以完成此操作。一種牲阁,可以將基因型提供給計算EBV的組織固阁,然后由該組織計算預測方程。另一種城菊,諸如Zoetis或GeneSeek之類的商業(yè)組織可以提供DNA測試服務备燃,并使用其自己的預測方程式生成“標記育種值”,然后將其傳輸?shù)竭z傳評估服務中以并入EBV凌唬。兩種方法都在運行并齐。
豬育種中的基因組選擇
在生豬育種中,最重要的選擇步驟是在核心群中選擇優(yōu)良公豬(如果是合作養(yǎng)豬的話法瑟,這可能是在公豬試驗站進行的冀膝。)公豬試驗記錄通常是在選擇精英公豬之前進行的唁奢,因此霎挟,由于世代間隔的減少是有限的,額外收益有限麻掸,但通過引入GS酥夭,世代間隔仍可能減少約25%(Bjarne Nielsen,2015)脊奋。因此熬北,gs在豬育種中的應用主要是針對屠宰品質、母豬不能記錄的性狀和純種動物不能記錄的雜交性能等主要針對性狀
在母豬性狀方面诚隙,試驗公豬的雌性同胞是在核心群中飼養(yǎng)的讶隐,但母豬性狀記錄是在公豬選種后獲得,母豬性狀的GS可以基于測試野豬的阿姨久又。對于母性性狀的選擇巫延,可以達到約50%的公豬選擇準確率(Lillehammer等人,2011年)地消。母豬性狀的選擇與生長速度炉峰、飼料轉化效率等生產性狀的選擇競爭,導致母豬性狀遺傳增益大幅度增加脉执,同時生產性狀的增益略有降低總功績收益率適度提高疼阔,但收益率的方向與育種目標指示的方向更為接近。母本性狀的顯著提高,從而導致更平衡和可持續(xù)的選擇婆廊。
就屠宰性狀而言迅细,在選擇試驗豬之前,試驗豬的同胞可被屠宰并記錄這些性狀淘邻。因此疯攒,gs可以基于非常接近選擇候選者的參考總體,從而可以實現(xiàn)高的選擇精度列荔。此外敬尺,在這里替梨,額外的收益將在一定程度上以犧牲傳統(tǒng)生產性狀的收益為代價逗爹,但遺傳變化的方向將更接近育種目標品嚣,因此可以在未來更長的時間內持續(xù)下去循帐。
豬肉是由雜交豬生產的月帝,但是精英育種核心個體是在有利的環(huán)境(例如核心群)中進行純種繁殖的运敢。在非常好的環(huán)境中進行純種生產與在不太有利的環(huán)境中進行雜交表現(xiàn)之間的關系在0.4到0.7之間變化(Esfandyari等人耻陕,2015)括眠。這意味著袁串,只有40-70%的核心內實現(xiàn)的遺傳改良將在實踐中提高性能概而,例如,如果核心豬由于遺傳改良而生長速度加快100克/天囱修,那么商業(yè)豬每天只增加40-70克赎瑰。通過對雜交豬進行基因分型并記錄其在商業(yè)環(huán)境中的表現(xiàn),gs可用于改善純種核心動物在商業(yè)環(huán)境下的雜交表現(xiàn)破镰。這需要跨品種和雜交的基因組選擇餐曼,這一點尚未得到證實。
因此鲜漩,需要開發(fā)最佳的跨品種/純種基因組選擇方法源譬。目前,養(yǎng)豬公司正致力于在實際條件下孕似,通過這種方法直接提高雜交豬的遺傳性能踩娘。同樣的方法可用于選擇與出口市場相關但未在國內市場記錄的性狀(例如,對某些疾病的抗性)該方法將需要一個基礎設施喉祭,收集(跨國家)實用動物的性能數(shù)據和基因型养渴,轉移到育種價值評估中心,并用于核心選擇臂拓。
家禽基因組選擇
在蛋雞中厚脉,實際上已經進行了一項試驗,以測試基因組選擇是否可以比傳統(tǒng)選擇更快地獲得收益胶惰。在Wolc等傻工。(2015年),將一個蛋雞群體分成兩個亞系,一個提交常規(guī)表型選擇中捆,另一個根據基因組預測進行選擇鸯匹。實驗歷時3年,共進行了4個基因組選擇周期和2個表型選擇周期泄伪。在為期3年的試驗結束時殴蓬,對這兩個亞系的多個與商品蛋生產相關的性能性狀進行了比較。在用于選擇的索引中包含的16個性狀中蟋滴,基因組選擇系的表現(xiàn)優(yōu)于表型選擇系染厅。盡管這兩個計劃旨在實現(xiàn)相同的近交率每年,沃爾克等(2015)發(fā)現(xiàn)從系譜評估的每年實現(xiàn)的近交在基因組選擇系中比在常規(guī)選擇系中高津函。
在肉雞或肉禽中肖粮,gs的情況不如在蛋雞中明顯,因為大多數(shù)性狀都可以在幼年時記錄在兩性身上尔苦。不過涩馆,育種公司正在積極調查GS的使用情況可能的用途是選擇在商業(yè)環(huán)境中提高雜交后代的表現(xiàn),以及用于不能記錄在細胞核中的性狀允坚,如疾病挑戰(zhàn)試驗魂那。
未來發(fā)展方向
DNA檢測的成本在許多情況下阻礙了其使用。如果這種成本繼續(xù)下降稠项,DNA檢測的用途將會擴大涯雅。這將有助于產生更大和最新的參考種群。難以記錄的性狀可能使得單步評估方法成為常態(tài)皿渗。因為它們提供了更準確的EBV斩芭,并且因為更便宜的DNA測試將導致被測試動物比例更高轻腺。
將來可以使用兩種方法來計算基因組EBV乐疆。評估在品種內(在GS內; wbGS內)贬养。在這種情況下挤土,中密度或低密度SNP就足夠了,可以使用G或SNP-BLUP來計算預測方程误算⊙雒溃或者,訓練種群可能包括多個品種儿礼,甚至可能是雜交種(abGS)咖杂。在這種情況下,如果使用密集的SNP并使用非線性方法來計算預測方程蚊夫,則EBV會更加準確诉字。對于wbGS,除了獲得更大的參考人群外,似乎幾乎沒有機會改善預測壤圃。對于abGS陵霉,有許多改進的途徑∥樯基因組序列數(shù)據可比高密度SNP產生的EBV更準確踊挠,因為數(shù)據中包含因果變異,我們不必依賴LD冲杀。關于基因組每個位點突變影響的生物學知識的增加效床,可被用于發(fā)現(xiàn)這些因果變體。
如果wbGS產生足夠準確的EBV(例如> 0.9)权谁,則無需探索abGS扁凛。但是,將來闯传,GS將用于越來越多的性狀谨朝,其中一些將很難大規(guī)模記錄(例如,甲烷排放)甥绿,并且這減少了wbGS的大量內部參考種群的機會字币。因此,從長遠來看共缕,我們相信abGS可以為整個育種目標帶來更準確的EBV洗出,對于隨時間和空間變化的種群來說是更穩(wěn)定的。如果GS的未來僅限于wbGS图谷,則品種和品系中的數(shù)量將減少翩活,因為只有最大的品系才會有足夠大的訓練種群來產生準確的EBV。
基因組選擇提供了兩個機會便贵,迄今尚未充分利用菠镇。首先,GS與生殖技術相結合可以大大縮短世代長度承璃,并結合多次排卵和胚胎移植(MOET)利耍,GS可以用來挑選最佳胚胎來生產下一代動物(而不是隨機胚胎)第二,我們可以創(chuàng)造商業(yè)動物的預測方程盔粹,而不是針對商業(yè)相關性狀進行測量的種畜隘梨。例如,商業(yè)動物通常是雜交的舷嗡,在比純種種畜更嚴酷的環(huán)境下飼養(yǎng)轴猎。此外,我們還可以收集未在種畜水平上測量的性狀信息进萄,如肉質和抗病性(例如捻脖,如果傳染病的爆發(fā)是罕見的事件)烦秩。這意味著由于較少的表型和系譜記錄以及生成參考數(shù)據集的成本增加,在種畜水平上的成本降低隨著基因分型和實際性狀記錄的成本不斷下降(例如郎仆,在自動擠奶系統(tǒng)中使用傳感器)只祠,這一變化也可能是意料之中的為這一變化提供資金的商業(yè)機制尚不明顯。
動物育種中的GS范式轉變似乎最終會導致基因改良產業(yè)的結構變化扰肌,但現(xiàn)在提出這些變化可能是什么還為時過早抛寝,還有一種可能性是,養(yǎng)牛曙旭、羊和豬的企業(yè)數(shù)量將減少盗舰,正如家禽中已經發(fā)生的那樣。