1 研討會回顧:奶牛的單步基因組評估
此文來自綜述: Symposium review: Single-step genomic evaluations in dairy cattle.(M?ntysaari et al., 2020)
背景:
在過去十年中,基因組選擇徹底改變了奶牛育種。例如渤弛,出生于 2018 年的北歐奶牛(丹麥慨代、芬蘭和瑞典)> 90% 是由經(jīng)過基因組測試的年輕公牛配種的士袄。因此掂咒,2018 年出生的紅奶牛母牛的平均公牛年齡僅為 3.1 歲梧却,而 2011 年為 5.7 歲样刷。早些時候,遺傳進(jìn)步的關(guān)鍵驅(qū)動因素是選擇經(jīng)過后代測試的公牛暴构,但現(xiàn)在是年輕公牛的基因組預(yù)選跪呈。這導(dǎo)致傳統(tǒng)遺傳評估對遺傳進(jìn)展的估計有偏差。
問題:
當(dāng)這些被用作多步基因組評估的輸入時取逾,它們也會被扭曲耗绿。保持公正性的唯一長期解決方案是在評估中包含基因組信息。 2010年雖然引入了單步評價模型的手段砾隅,但尚未在大規(guī)模的全國乳品評價中實(shí)施误阻。起初,單步評估受到計算成本的阻礙琉用。這已經(jīng)在很大程度上解決了堕绩,或者通過稀疏表示基于 G (ssGBLUP) 的單步評估模型中所需的基因分型動物的基因組關(guān)系 (G) 和譜系關(guān)系 (A22) 矩陣的逆矩陣,或者通過使用單個-步標(biāo)記模型邑时。 G-1 的方法是 APY-G奴紧,其中“年輕”動物之間的關(guān)系完全取決于它們與“核心”動物的關(guān)系,以及單步評估晶丘,其中 G-1 被基于計算公式取代G的結(jié)構(gòu)(ssGTBLUP)黍氮。
單步標(biāo)記模型
單步標(biāo)記模型包括標(biāo)記效應(yīng),或者直接作為統(tǒng)計模型中的效應(yīng)浅浮,或者間接地在基因分型動物之間產(chǎn)生基因組關(guān)系沫浆。隨著算法的發(fā)展,計算資源在計算機(jī)內(nèi)存的可用性和速度方面都得到了發(fā)展」鲋龋現(xiàn)在積極研究的問題對于兩種單步方法(GBLUP 和標(biāo)記模型)都是相同的专执。隨著基因型數(shù)量的增加,迭代求解的收斂性似乎變得更糟郁油。這些問題在低遺傳性狀和性狀間具有高遺傳相關(guān)性的多性狀模型中更為明顯本股。
問題還與譜系和不同遺傳群體的不平衡有關(guān)。在許多情況下桐腌,可以通過適當(dāng)考慮基因型動物對基因組的貢獻(xiàn)來解決問題拄显。標(biāo)準(zhǔn)求解方法是預(yù)處理共軛梯度迭代,其中通過更好的預(yù)處理矩陣提高了收斂性案站。
另一個需要考慮的困難是候選動物基因組評估的膨脹躬审;基因組模型似乎高估了基因組信息。單步評估中的問題通常比多步評估中的問題小,但更難以通過臨時調(diào)整來緩解承边。
總結(jié):
基因組評估原則是在 10 多年前引入的遭殉,目前,基因組選擇是全球奶牛遺傳改良的主要來源炒刁。因?yàn)檫@種選擇不能歸因于母牛記錄或公牛子代平均值中的選擇恩沽,所以它不會被基于譜系的遺傳評估所捕獲。因此翔始,EBV 開始變得越來越有偏見。目前里伯,2015 年出生的公牛正在獲得他們的第一個后代測試結(jié)果城瞎。這些公牛及其公牛是根據(jù)基因組評估預(yù)先選擇的。為了確保未來評估的公正性疾瓮,唯一的選擇是開始將基因組信息納入國家評估脖镀。這可以使用單步評估方法來完成。
在過去十年中狼电,基因分型也已成為選擇母牛替代者的日常工具蜒灰。許多國家還對母牛進(jìn)行基因分型,目的是增加基因組評估的參考人群肩碟。最終目標(biāo)可能是對所有動物進(jìn)行基因分型强窖。同時,國家遺傳評估必須能夠處理所有非基因型動物以及逐漸增加的基因型動物數(shù)量削祈。在引入單步基因組評估模型時翅溺,人們擔(dān)心應(yīng)用程序會對評估中可以包含多少基因型有上限。使用當(dāng)前的單步技術(shù)髓抑,計算成本與基因分型的動物數(shù)量成線性關(guān)系咙崎;因此,該算法能夠處理任何規(guī)模的奶牛種群吨拍。具有基因組關(guān)系的單步模型可以使用 ssGTBLUP(M?ntysaari 等褪猛,2017)或單步 APY GBLUP(Misztal 等,2014)解決羹饰∫磷蹋或者,可以使用各種基于標(biāo)記效應(yīng)的模型進(jìn)行計算严里。最有前途的標(biāo)記模型方法是混合 ssHM(Fernando 等人新啼,2016 年),如果證明收斂性令人滿意刹碾,那么具有增強(qiáng) SNP 效應(yīng)和 RPG 的模型(Liu 等人燥撞,2014 年)。
當(dāng)基因組模型基于所有標(biāo)記具有相同先驗(yàn)方差的高斯假設(shè)時,基于 G 和基于標(biāo)記的單步模型的差異并不大物舒,特別是如果假設(shè)和擬合剩余多基因效應(yīng)色洞。如果將來可以為不同的 SNP 效應(yīng)賦予不同的權(quán)重,或者在多性狀模型中為不同的性狀擬合不同的 SNP冠胯,那么 ssMEM 模型比依賴于基因組關(guān)系矩陣 G 的方法具有明顯的優(yōu)勢火诸。
單步評估被指責(zé)高估了育種價值的差異。盡管在多步評估中對某些動物的過度預(yù)測很容易糾正荠察,但單步評估被認(rèn)為是在種群中進(jìn)行的唯一評估置蜀。為了育種計劃的成功運(yùn)行,評估應(yīng)公平地對動物進(jìn)行排序悉盆,無論是年輕的還是年老的盯荤,有或沒有基因組信息,有或沒有表型信息焕盟。對于選擇目標(biāo)中的關(guān)鍵特征秋秤,過度預(yù)測或過度分散最為嚴(yán)重。不幸的是脚翘,這些也是最迫切應(yīng)該實(shí)施單步評估的特征灼卢。正在深入研究這種偏差,希望能找到“打折”基因組信息的通用解決方案来农。
2 未知父母分組和metafounders在ssGBLUP應(yīng)用
此文來自綜述:Invited review: Unknown-parent groups and metafounders
in single-step genomic BLUP. (Masuda et al., 2021).
介紹:
單步基因組 BLUP (ssGBLUP) 是一種基因組預(yù)測方法鞋真,它將譜系 (A) 和基因組 (G) 關(guān)系矩陣整合到一個統(tǒng)一的加性關(guān)系矩陣(H矩陣)中,該矩陣的逆被合并到一組混合模型方程 (MME) 中以計算基因組預(yù)測备图。
問題:
奶牛的譜系信息通常不完整灿巧。缺少譜系可能會導(dǎo)致使用 ssGBLUP 獲得的基因組估計育種值 (GEBV) 出現(xiàn)偏差和膨脹。
三個主要問題與 ssGBLUP 中的譜系缺失有關(guān)揽涮,即選擇的有偏預(yù)測抠藕、譜系關(guān)系中的近親繁殖缺失以及 G 和 A 在水平和尺度上的不相容性。
解決方案:
這些問題可以使用適用于未知父組 (UPG) 的適當(dāng)模型來解決蒋困。使用 UPG 背后的理論對于譜系 BLUP 已經(jīng)很好建立盾似,但對于 ssGBLUP 則不然。本研究回顧了譜系 BLUP 中 UPG 模型的發(fā)展雪标、ssGBLUP 中 UPG 模型的特性零院,以及 UPG 對遺傳趨勢和基因組預(yù)測的影響。
還回顧了 UPG 和元創(chuàng)始人 (MF) 模型(一種廣義 UPG 模型)之間的異同村刨。
使用 MME 的變換導(dǎo)出的 UPG 模型 (QP) 具有良好的收斂行為告抄。然而,由于數(shù)據(jù)不足嵌牺,QP 模型可能會產(chǎn)生有偏見的遺傳趨勢打洼,并可能低估 UPG龄糊。 QP 模型可以通過從 MME 中刪除連接 GEBV 和 UPG 效應(yīng)的基因組關(guān)系來改變。與 QP 模型相比募疮,這種改變后的 QP 模型在遺傳趨勢上的偏差較小炫惩,在基因組預(yù)測中的膨脹較小,尤其是在大數(shù)據(jù)集的情況下阿浓。最近他嚷,在模擬純種種群中提出了一種新模型,該模型將 UPG 方程封裝到基因分型動物的譜系關(guān)系中芭毙。
MF 模型是對缺失譜系問題的綜合解決方案筋蓖。如果數(shù)據(jù)集允許估計 MF 的合理關(guān)系矩陣,則該模型可以作為多品種或雜交評估的選擇稿蹲。
缺少譜系會影響遺傳趨勢扭勉,但當(dāng)許多經(jīng)證實(shí)的公牛進(jìn)行基因分型時,其對基因分型動物遺傳價值可預(yù)測性的影響應(yīng)該可以忽略不計苛聘。
SNP 效應(yīng)可以使用來自年長基因型動物的 GEBV 進(jìn)行反向求解,并且這些預(yù)測的 SNP 效應(yīng)可用于計算缺少父母的年輕基因型動物的 GEBV忠聚。