最近參加了EAAP會(huì)議,聽了 Ole F. Christensen報(bào)告了將多組學(xué)數(shù)據(jù)加入到GP中的報(bào)告株灸。
其測(cè)試的結(jié)果是:微生物組(https://doi.org/10.3168/jds.2022-22948)沒有幫助提高GS和GP的準(zhǔn)確性萧福;但是代謝組也沒有提高GS的準(zhǔn)確性拉鹃,但是提高了GP的準(zhǔn)確性。
代謝組整合到GP的文章最近發(fā)表在了GSE上统锤,現(xiàn)在整理出毛俏,讓我們使用其他組學(xué)進(jìn)行測(cè)試和借鑒。
文章名字:代謝組學(xué)-基因組預(yù)測(cè)可以提高大麥麥芽品質(zhì)性狀育種值的預(yù)測(cè)準(zhǔn)確性(https://doi.org/10.1186/s12711-023-00835-w)
值得注意是:此文章的所有數(shù)據(jù)饲窿,包括表型煌寇、基因組和代謝組數(shù)據(jù),都可以在公共可訪問的存儲(chǔ)庫中獲扔庑邸(https://data.mendeley.com/datasets/s3s4ft92wj/1)阀溶。
摘要
- 背景
代謝組學(xué)測(cè)量基因型和表型之間的中間階段,因此可能對(duì)育種有用鸦泳。 - 目標(biāo):
整合基因組和代謝組信息研究麥芽質(zhì)量 (MQ) 性狀的遺傳參數(shù)和預(yù)測(cè)育種值的準(zhǔn)確性银锻。 - 數(shù)據(jù):
總共包括來自三年和兩個(gè)地點(diǎn)的 2430 個(gè)地塊,562 個(gè)啤酒春大麥品系做鹰。在每個(gè)地塊生產(chǎn)的麥芽汁中測(cè)量了五種 MQ 性狀击纬。使用的代謝組學(xué)特征是對(duì)每個(gè)麥芽汁樣品測(cè)量的 24,018 個(gè)核磁共振強(qiáng)度。 -
方法:
統(tǒng)計(jì)分析的方法是基因組最佳線性無偏預(yù)測(cè)(GBLUP)和代謝組學(xué)-基因組最佳線性無偏預(yù)測(cè)(MGBLUP)(由GOBLUP钾麸,Genomic Omics BLUP演變出來)更振。驗(yàn)證法:
(1)使用兩種交叉驗(yàn)證策略比較預(yù)測(cè)育種值的準(zhǔn)確性:留一年(LOYO)和留一線出(LOLO)炕桨,
(2)線性回歸(LR)方法查看兩者情況下驗(yàn)證群體(VP)基因組預(yù)測(cè)準(zhǔn)確性的提高。第一:納入VP的代謝組數(shù)據(jù)后準(zhǔn)確性的提高 肯腕;第二:納入VP的代謝組和表型數(shù)據(jù)后準(zhǔn)確性的提高献宫。
如下圖所示的驗(yàn)證方法:
-
結(jié)果
(1)對(duì)于所有性狀作者發(fā)現(xiàn)代謝組介導(dǎo)的遺傳力很大。
(2) 交叉驗(yàn)證結(jié)果表明实撒,一般來說姊途,當(dāng)表型和代謝組數(shù)據(jù)記錄都在一塊地有時(shí),MGBLUP 和 GBLUP 的預(yù)測(cè)精度相似知态。
LOLO的預(yù)測(cè)結(jié)果
LOYO預(yù)測(cè)結(jié)果
(3) LR 方法的結(jié)果表明捷兰,對(duì)于除一項(xiàng)外的所有性狀,當(dāng)包括 VP 品系的代謝組數(shù)據(jù)時(shí)肴甸,MGBLUP 的準(zhǔn)確性有所增加寂殉,并且當(dāng)還包括表型時(shí),MGBLUP 的準(zhǔn)確性進(jìn)一步增加原在。
LOLO下的LR的準(zhǔn)確率增加指標(biāo):
(4)然而,一般來說彤叉,當(dāng)在 VP 上包括代謝組數(shù)據(jù)和表型時(shí)庶柿,MGBLUP 準(zhǔn)確性的增加與在 VP 系上包括表型時(shí) GBLUP 準(zhǔn)確性的增加相似。
LOYO下的LR的準(zhǔn)確率增加指標(biāo):
(5)因此秽浇,作者們發(fā)現(xiàn)浮庐,當(dāng)代謝組學(xué)數(shù)據(jù)包含在 VP 品系中時(shí),沒有表型記錄的品系的準(zhǔn)確性大大提高柬焕,
- 結(jié)論
MGBLUP 是一種結(jié)合表型审残、基因組和代謝組數(shù)據(jù)來預(yù)測(cè) MQ 性狀育種值的有用方法。
GOBLUP的詳細(xì)介紹
公式:
- 方程(1)描述了表型和組學(xué)表達(dá)水平之間的關(guān)系斑举,其中y是表型向量搅轿,β是包含固定效應(yīng)的向量,矩陣X將固定效應(yīng)與表型聯(lián)系起來富玷,矩陣Z將具有組學(xué)數(shù)據(jù)的個(gè)體與表型聯(lián)系起來璧坟,矩陣 M 包含 m1,…,mk 作為列,向量 α 包含組學(xué)表達(dá)水平對(duì)表型的回歸效應(yīng)赎懦,向量 ar 包含殘余遺傳效應(yīng)雀鹃,即對(duì)表型的遺傳效應(yīng)不是通過觀察到的組學(xué)表達(dá)水平介導(dǎo)的,矩陣 Zr 涉及 遺傳對(duì)表型的影響励两,ε 是殘差向量黎茎。
-
組學(xué)特征 i=1,…,k 的方程 (2) 描述了組學(xué)表達(dá)水平 mi 與個(gè)體遺傳效應(yīng)之間的關(guān)系,其中矩陣 X~ 將固定效應(yīng)與組學(xué)表達(dá)水平相關(guān)聯(lián)(對(duì)于不同的組學(xué)特征假設(shè)固定效應(yīng)中的變量相同)当悔,矩陣Z~ 將個(gè)體與組學(xué)表達(dá)水平聯(lián)系起來傅瞻,對(duì)于第i個(gè)組學(xué)特征迁酸,向量β~i包含固定效應(yīng),向量gi是遺傳效應(yīng)向量俭正,ei是殘差向量奸鬓。 遺傳效應(yīng)是針對(duì)所有感興趣的個(gè)體(即,包括沒有表型和組學(xué)數(shù)據(jù)的個(gè)體)指定的掸读,并且相應(yīng)地定義了發(fā)生矩陣 Zr 和 Z~串远。 我們注意到關(guān)聯(lián)矩陣之間的關(guān)系,Zr=ZZ~儿惫,并且在模型的兩個(gè)部分中固定效應(yīng)中的變量相同的情況下澡罚,則 X=ZX~。 因此肾请,設(shè) G 為包含 g1,…,gk 為列的矩陣留搔,E 為包含 e1,…,ek 為列的矩陣,則 M=X~ B~ + G + E 铛铁,其中 B~ = [β~ 1,…,β~k] 隔显。 注意,這里的矩陣G不是基因組關(guān)系矩陣饵逐。
最終:育種值a= Gα + ar
改為類似混合方程組(更好理解):
第一步括眠,通過估計(jì)組學(xué)效應(yīng)(類似于 SNP-BLUP)或使用組學(xué)相似性(類似于 GBLUP)來估計(jì)組學(xué)對(duì)數(shù)據(jù)的影響:
由“非介導(dǎo)”遺傳效應(yīng)解釋的表型變異部分;這些方程產(chǎn)生 EBV 的"非中介部分 (ar); 和“改進(jìn)的表型預(yù)測(cè)” (u),它們基于性狀觀察y和組學(xué)M倍权,可以被視為“環(huán)境噪聲較少的y ”掷豺,或者作為預(yù)測(cè)性狀,例如 SCS薄声,它是亞臨床乳腺炎的預(yù)測(cè)因子当船。
在第二步中,一旦表型預(yù)測(cè)因子 (u)獲得后默辨,它們?cè)诘诙€(gè) MME 中用作偽特征來提取可遺傳部分德频, am:
X 和Z~ 是組學(xué)記錄和參數(shù)的設(shè)計(jì)矩陣 , h2m是組學(xué)測(cè)量的遺傳力.
最后總EBV:a = am + ar
參考文章(算法詳細(xì)內(nèi)容應(yīng)該查看文獻(xiàn)2和3):
- 代謝組學(xué)-基因組預(yù)測(cè)可以提高大麥麥芽品質(zhì)性狀育種值的預(yù)測(cè)準(zhǔn)確性(https://doi.org/10.1186/s12711-023-00835-w)
- 遺傳評(píng)估,包括中間組學(xué)特征(https://doi.org/10.1093/genetics/iyab130)
- 基因組評(píng)估方法包括中間相關(guān)特征廓奕,例如高通量或組學(xué)表型(https://doi.org/10.3168/jdsc.2022-0276)