Moreira2020 多變量相關(guān)數(shù)據(jù)的分析

Moreira, F.F., Oliveira, H.R., Volenec, J.J., Rainey, K.M., and Brito, L.F. 2020. Integrating High-Throughput Phenotyping and Statistical Genomic Methods to Genetically Improve Longitudinal Traits in Crops. Front. Plant Sci. 11(May): 1–18. doi:10.3389/fpls.2020.00681.【這是我很長時(shí)間關(guān)注的一個(gè)問題】

結(jié)合高通量表型分析和統(tǒng)計(jì)基因組方法對(duì)作物縱向性狀進(jìn)行遺傳改良

遙感技術(shù)在農(nóng)藝學(xué)研究中的迅速發(fā)展咪辱,使作物縱向性狀的動(dòng)態(tài)特性得到充分的描述锤躁,從而促進(jìn)作物效率的遺傳改良。對(duì)于光截獲、生物量積累和應(yīng)激反應(yīng)等性狀最冰,各種高通量表型(HTP)方法生成的數(shù)據(jù)需要足夠的統(tǒng)計(jì)技術(shù)來評(píng)估整個(gè)時(shí)間段的表型記錄。因此,有關(guān)植物功能和基因激活的信息,以及在植物發(fā)育的不同階段和對(duì)環(huán)境刺激的反應(yīng)中基因網(wǎng)絡(luò)的相互作用可以被利用庇勃。在這篇綜述中,我們概述了目前在數(shù)量遺傳學(xué)中應(yīng)用于作物整個(gè)發(fā)育過程中縱向性狀的分析方法槽驶,描述了每種方法的優(yōu)點(diǎn)和缺點(diǎn)责嚷,并指出了未來的研究方向和機(jī)會(huì)。

介紹

植物育種家的下一個(gè)挑戰(zhàn)是通過減少產(chǎn)量差距來提高農(nóng)業(yè)生產(chǎn)效率掂铐,同時(shí)培育出更具抗逆性的品種(Godfray等罕拂,2010揍异;Foley等,2011爆班;Ray等衷掷,2013;Challinor等柿菩,2014棍鳖;Tai等,2014)碗旅。最可行的解決方案是開發(fā)創(chuàng)新方法,以加快經(jīng)濟(jì)重要性狀的遺傳改良镜悉,描述新性狀祟辟,并將其納入育種計(jì)劃(Duvick,2005侣肄;Lange和Federizzi旧困,2009;Fischer和Edmeades稼锅,2010吼具;Nolan和Santos,2012矩距;Rogers等拗盒,2015)。
植物育種學(xué)是20世紀(jì)初建立起來的一門科學(xué)锥债,當(dāng)時(shí)人們對(duì)數(shù)量性狀表型變異的遺傳學(xué)基礎(chǔ)的新見解陡蝇,分別與孟德爾和達(dá)爾文闡明的遺傳機(jī)制和作物雜交的基礎(chǔ)理論相結(jié)合(約翰森,1909哮肚,1911登夫;East,1911允趟;Bradshaw恼策,2017年)。從那時(shí)起潮剪,植物育種家通過選擇許多性狀來提高作物產(chǎn)量涣楷。育種目標(biāo)不斷完善,以應(yīng)對(duì)新的挑戰(zhàn)抗碰,包括適應(yīng)新的生產(chǎn)區(qū)域总棵、應(yīng)對(duì)新出現(xiàn)的病蟲害、各種最終用途改含、先進(jìn)的農(nóng)業(yè)技術(shù)和氣候變化(Toenniessen情龄,2002;Baenziger等,2006骤视;Tester和Langridge鞍爱,2010;Gilliham等专酗,2017)睹逃。例如,1955年大豆育種的重點(diǎn)是提高種子含油量祷肯、冠層覆蓋率和成熟均勻性沉填。十年后,重點(diǎn)轉(zhuǎn)移到減少莢果破碎和倒伏佑笋,然后這些年又發(fā)生了變化翼闹,包括質(zhì)量和附加值性狀(Baenziger等,2006年)蒋纬。在動(dòng)物育種中猎荠,育種目標(biāo)和表型技術(shù)也發(fā)生了類似的變化(Henryon等,2014年蜀备;Miglior等关摇,2017年)。然而碾阁,縱觀歷史输虱,改善感興趣的性狀取決于量化在多個(gè)環(huán)境中復(fù)制的基因型表型的能力(Stoskopf等,1994年)脂凶。因此悼瓮,潛在的有價(jià)值的性狀可能由于昂貴的表型和技術(shù)限制而被忽視。
植物表型一直是遺傳改良的首要任務(wù)艰猬。近端遙感技術(shù)的最新進(jìn)展横堡,再加上新的傳感器和計(jì)算機(jī)科學(xué)應(yīng)用,使得成本效益高的高通量表型(HTP)和新性狀的解剖成為可能(Montes等冠桃,2007命贴;Furbank和Tester,2011食听;Fiorani和Schurr胸蛛,2013;Araus和Cairns樱报,2014葬项;Coppens等,2017)迹蛤。HTP提供時(shí)間序列測(cè)量民珍,跟蹤作物在整個(gè)生命階段的發(fā)育情況以及對(duì)環(huán)境的反應(yīng)襟士。有關(guān)基因功能、基因激活嚷量、基因網(wǎng)絡(luò)在植物發(fā)育不同階段的相互作用以及對(duì)環(huán)境刺激的響應(yīng)等方面的信息現(xiàn)在可以利用(Wu和Lin陋桂,2006;Montes等蝶溶,2007)嗜历。植物育種家越來越有可能將光截獲、生物量積累和對(duì)干旱脅迫的響應(yīng)視為動(dòng)態(tài)特征抖所,而不是靜態(tài)的時(shí)間點(diǎn)(Montes等梨州,2007)。這一分析框架增強(qiáng)了我們對(duì)作物發(fā)育的理解田轧,并彌合了基因型與表型之間關(guān)系的差距(Granier and Vile暴匠,2014;Araus等涯鲁,2018)。
在個(gè)體一生中反復(fù)或連續(xù)表達(dá)的特征可以定義為縱向特征(Yang等有序,2006年抹腿;Oliveira等,2019a)旭寿、無限維特征(Kirkpatrick和Heckman警绩,1989年)或功能值特征(Promislow等,1996年)盅称。對(duì)縱向性狀的研究可以為深入了解環(huán)境脅迫和發(fā)育過程中生理反應(yīng)的遺傳機(jī)制提供重要的見解肩祥。該信息可用于提高多變量環(huán)境下復(fù)雜多基因性狀的預(yù)測(cè)能力,并有助于識(shí)別總體(如大豆產(chǎn)量)或特定時(shí)間的數(shù)量性狀位點(diǎn)(QTL)(Fahlgren等缩膝,2015混狠;Campbell等,2017疾层;Sun等将饺,2017)。這樣的分析可以評(píng)估遺傳和環(huán)境因素的統(tǒng)計(jì)關(guān)聯(lián)痛黎,例如不同發(fā)育階段的分子標(biāo)記與非生物脅迫反應(yīng)之間的關(guān)系(Langridge和Fleury予弧,2011)。在這種情況下湖饱,表型數(shù)據(jù)描述了一個(gè)功能隨著其他變量的變化而不斷變化(Stinchcombe和Kirkpatrick掖蛤,2012;Granier和Vile井厌,2014)蚓庭。這些方法產(chǎn)生大量的數(shù)據(jù)致讥,這就需要先進(jìn)的統(tǒng)計(jì)方法來評(píng)估表型數(shù)據(jù)作為時(shí)間的函數(shù)。在這篇文獻(xiàn)綜述中彪置,我們將概述目前定量遺傳學(xué)和基因組學(xué)中的分析方法拄踪,這些方法可以應(yīng)用于隨著時(shí)間的推移而量化的HTP(圖1)。此外拳魁,我們描述了每種方法的優(yōu)點(diǎn)和缺點(diǎn)惶桐,并探討了未來研究的方向和機(jī)會(huì)。
圖1潘懊∫縱向數(shù)據(jù)分析的工作流程示意圖。不同的遙感工具最常用的高通量表型監(jiān)測(cè)作物生長和發(fā)育授舟。比較概述潛在的基因組分析模型救恨,連同輸出和計(jì)算需求的例子。

表型縱向性狀

當(dāng)前的HTP平臺(tái)释树,也被稱為“表型”工具肠槽,包括各種方法,在受控環(huán)境或現(xiàn)場使用遙感獲得非破壞性表型測(cè)量值(Pauli等奢啥,2016b)秸仙。作物表型分型最常見的傳感器類型包括紅-綠-藍(lán)(RGB;Xavier等桩盲,2017)寂纪、多光譜(Xu等,2019)赌结、高光譜(Bodner等捞蛋,2018)、熒光(Pérez-Bueno等柬姚,2016)拟杉、熱傳感器(Sagan等,2019)量承、三維傳感器(3D捣域;Topp等,2013年)宴合,以及激光成像探測(cè)和測(cè)距(LiDAR)(Sun等焕梅,2018)設(shè)備。一般來說卦洽,這些傳感器依賴于電磁輻射與植物之間的相互作用(反射贞言、吸收或傳輸光子),傳感器將其捕獲為反射輻射(Fiorani等阀蒂,2012该窗;Li等弟蚀,2014)。因此酗失,傳感器將植物解釋為光學(xué)物體义钉,植物的每一個(gè)成分都顯示出一個(gè)特征光譜特征,這是由植被表面的吸收率规肴、反射率和透射率的波長特性引起的(Schowengerdt捶闸,2012;Li等拖刃,2014)删壮。
植物的光譜特征在生命周期中發(fā)生變化,產(chǎn)生基因型-時(shí)間特異型表型兑牡。例如央碟,在衰老過程中,由于葉綠素的損失均函,紅色區(qū)域的反射率增加(Schowengerdt亿虽,2012)。對(duì)于基于野外的表型分析苞也,這些傳感工具通常集成到地面或空中飛行器中(Araus等洛勉,2018年)。大多數(shù)HTP平臺(tái)具有捕獲縱向特征所需的空間和時(shí)間分辨率墩朦。然而坯认,特定實(shí)驗(yàn)的需求和資源應(yīng)驅(qū)動(dòng)平臺(tái)和傳感器的選擇翻擒,因?yàn)檫@些選擇直接影響研究的規(guī)模和類型(Pauli等氓涣,2016b)。一些評(píng)論集中于HTP及其細(xì)微差別陋气,如數(shù)據(jù)收集劳吠、數(shù)據(jù)處理和傳感器類型(Fahlgren等,2015年巩趁;Rahaman等痒玩,2015年;Singh等议慰,2016年蠢古;Tardieu等,2017年别凹;Yang等草讶,2017年;Zhao等炉菲,2019年堕战;Reynolds等坤溃,2020年)。
最近報(bào)道了用HTP捕獲的作物縱向性狀的遺傳控制嘱丢。在溫室里薪介,Neilson等(2015)調(diào)查了高粱對(duì)水分限制條件和不同施肥水平的生長和動(dòng)態(tài)表型反應(yīng)。他們用激光掃描越驻、RGB和近紅外(NIR)相機(jī)定義和測(cè)量了幾個(gè)性狀汁政,包括葉面積、莖生物量伐谈、高度烂完、分蘗數(shù)和葉片綠度。在大麥中诵棵,多個(gè)傳感器在溫室中連續(xù)58天捕捉每日?qǐng)D像抠蚣,測(cè)量可見光光譜、熒光光譜和近紅外光譜履澳,以便剖析干旱反應(yīng)的表型成分(Chen等嘶窄,2014年)。利用從分蘗過程中結(jié)合計(jì)算機(jī)斷層掃描(CT)和RGB成像的成像系統(tǒng)提取的700多個(gè)性狀距贷,對(duì)水稻分蘗生長進(jìn)行了檢測(cè)(Wu等柄冲,2019年)。
由于地下成像的困難忠蝗,基于田間的根系HTP比地上性狀的HTP進(jìn)展較少(Atkinson等现横,2019)。鏟形法是一種用于根表型分析的高通量方法阁最,已用于玉米戒祠、普通豆、豇豆和小麥等作物(Trachsel等速种,2011年姜盈;Burridge等,2016年配阵;York等馏颂,2018年)。它包括從圖像中提取幾個(gè)特征棋傍。然而救拉,它具有破壞性和勞動(dòng)密集性,需要人工挖掘樹根瘫拣,這限制了它隨時(shí)間推移捕捉重復(fù)記錄的能力亿絮。最近,包括電阻層析成像、電磁感應(yīng)和探地雷達(dá)在內(nèi)的地球物理技術(shù)有助于以無損的方式識(shí)別和量化野外根(Shanahan等壹无,2015葱绒;Whalley等,2017斗锭;Liu等地淀,2018a;Atkinson等岖是,2019)帮毁。然而,HTP根系表型分型更常見于受控環(huán)境中豺撑,該環(huán)境允許使用可實(shí)現(xiàn)根成像的替代生長系統(tǒng)烈疚,如rhizotrons、生長袋和透明人工生長介質(zhì)(Atkinson等聪轿,2019年爷肝;Ma等,2019年)陆错。為了模擬玉米的生長動(dòng)態(tài)灯抛,Hund等(2009)每天對(duì)吸墨紙上生長的根系進(jìn)行掃描。托普等(2013)利用蓋倫膠培養(yǎng)基在不同生長日對(duì)水稻根系結(jié)構(gòu)進(jìn)行3D成像表型分析音瓷,以進(jìn)行QTL檢測(cè)分析对嚼。在植物科學(xué)中使用X射線CT和磁共振成像的最新進(jìn)展使人們能夠監(jiān)測(cè)土壤中的根系結(jié)構(gòu)和隨時(shí)間變化的動(dòng)態(tài)生長(Metzner等,2015年绳慎;Pfeifer等纵竖,2015年;van Dusshoten等杏愤,2016年靡砌;Pflugfelder等,2017年声邦;Gao等乏奥,2019年)摆舟。關(guān)于根表型的更多細(xì)節(jié)和附加技術(shù)亥曹,見Atkinson等(2019年)。

縱向性狀建模

植物生長和發(fā)育的特點(diǎn)是有幾種表型變化恨诱,只有通過監(jiān)測(cè)一段時(shí)間內(nèi)的重復(fù)表型才能對(duì)其進(jìn)行研究(Li和Sillanp?a媳瞪,2015)。HTP平臺(tái)允許以高時(shí)間分辨率跟蹤特征照宝,無論是隨時(shí)間連續(xù)還是以離散間隔(Furbank and Tester蛇受,2011)突梦。傳統(tǒng)上呐籽,數(shù)學(xué)函數(shù)用于描述植物生命周期中性狀的時(shí)間軌跡(Paine等踪旷,2012)贩挣。縱向性狀的分析通常采用以下兩種技術(shù)之一(Li和Sillanp?把将,2013):(1)平滑函數(shù)(如樣條曲線轻专;如van Eeuwijk等,2018察蹲;Oliveira等请垛,2019a)或參數(shù)函數(shù)(如生長模型;如Paine等洽议,2012)來擬合隨時(shí)間變化的表型記錄宗收,為所有時(shí)間點(diǎn)提供內(nèi)插值;或(2)通過估計(jì)函數(shù)系數(shù)重新參數(shù)化數(shù)據(jù)亚兄,然后在分析中使用這些系數(shù)來表示隨時(shí)間變化的特征混稽。無論哪種方法,都需要選擇最適合特征軌跡形狀的函數(shù)來精確估計(jì)曲線參數(shù)和結(jié)果审胚。Paine等(2012)詳細(xì)回顧增長模型荚坞,強(qiáng)調(diào)基本功能形式、優(yōu)缺點(diǎn)菲盾。在本節(jié)中颓影,我們將描述已成功用于適應(yīng)作物改良目的的各種性狀的主要功能。
植物生長的許多復(fù)雜性通常使用非線性生長模型來表示懒鉴,這些模型解釋了生長的時(shí)間變化诡挂,捕捉了年齡和大小依賴的生長(Paine等,2012年)临谱。通常璃俗,植物生命周期內(nèi)的生長模式遵循一個(gè)S型曲線(S型),其特征是最初緩慢生長悉默,然后迅速增長城豁,接近指數(shù)增長率,最后在達(dá)到飽和階段時(shí)減慢(Yin等抄课,2003)唱星。S形曲線可以用S形函數(shù)來描述,如logistic跟磨、Gompertz间聊、Richards或β函數(shù)(Gompertz,1815抵拘;Richards哎榴,1959;Yin等,2003尚蝌;Poorter等迎变,2013)。在這種情況下飘言,Gompertz函數(shù)是Richard函數(shù)的一個(gè)特例氏豌;Richard函數(shù)是最古老的生長模型之一,經(jīng)常用于適應(yīng)不同物種的各種生物過程(Tj?rve和Tj?rve热凹,2017)泵喘。Gompertz函數(shù)用于描述玉米粒中的生物量積累(Meade等,2013年)般妙、大麥生物量(Chen等纪铺,2014年)以及小麥(Camargo等,2018年)和高粱(Neilson等碟渺,2015年)中的各種縱向性狀鲜锚。Logistic函數(shù)更常用于漸近形式來描述生物生長過程對(duì)生物量、冠層覆蓋率苫拍、冠層大小芜繁、體積、長度和面積等性狀的時(shí)間依賴性(Thornley等绒极,2005骏令;Paine等,2012)垄提。邏輯函數(shù)可以有一個(gè)榔袋、兩個(gè)、三個(gè)铡俐、四個(gè)或五個(gè)參數(shù)(Tessmer等凰兑,2013年)。單參數(shù)和雙參數(shù)logistic模型過于簡單审丘,往往無法很好地?cái)M合數(shù)據(jù)吏够,但仍在一些研究中使用(例如,Paine等滩报,2012年锅知;Tessmer等,2013年)露泊。三參數(shù)logistic函數(shù)(3PL喉镰;也稱為Verhulst或自催化生長函數(shù))可能是最流行的植物生長分析模型旅择。在高粱水分限制試驗(yàn)中惭笑,3PL模型在各種乙狀體型模型中表現(xiàn)最好,以適合預(yù)測(cè)的葉面積(Neilson等,2015年)沉噩。Sun等(2018年)使用3PL模型擬合了棉花的冠層高度捺宗、預(yù)計(jì)冠層面積和植株體積的生長曲線。在小麥方面川蒙,Baillot等(2018)通過擬合第三方物流模型估計(jì)各種谷物灌漿參數(shù)蚜厉。四參數(shù)logistic(4PL)模型比3PL模型更靈活,因?yàn)樗募s束更少(Pinheiro和Bates畜眨,2000)昼牛。Camargo等(2018)對(duì)小麥整個(gè)生命周期的面積、高度和衰老的平均值進(jìn)行了表型分析康聂,發(fā)現(xiàn)4PL模型最適合縱向數(shù)據(jù)贰健。五參數(shù)版本(5PL)提供了最大的靈活性并適應(yīng)了不對(duì)稱性(Gottschalk和Dunn,2005)恬汁,盡管與較低數(shù)量的參數(shù)相比伶椿,其復(fù)雜性更高。
許多生物學(xué)曲線不能用sigmoid函數(shù)來描述氓侧。冪律(也稱為異速生長)函數(shù)是一種不產(chǎn)生S形曲線的非漸近脊另、非線性增長模型(Marquet等,2005年)约巷。它們通常用于生態(tài)學(xué)中預(yù)測(cè)植物群落的關(guān)系(Chen和Shiyomi偎痛,2019)。它有效地捕捉了生長的時(shí)間變化独郎,因?yàn)樗试S相對(duì)增長率隨著時(shí)間的推移和生物量的增加而減慢(Paine等看彼,2012年)。冪律函數(shù)用于擬合不同氮水平高粱的預(yù)計(jì)葉面積數(shù)據(jù)(Neilson等囚聚,2015)靖榕,以及擬南芥的葉長和花環(huán)面積(An等,2016)顽铸。
線性模型茁计,如正交多項(xiàng)式和樣條函數(shù),也用于擬合縱向性狀(Oliveira等谓松,2019a)星压。多項(xiàng)式在作物生長模型中的應(yīng)用始于20世紀(jì)60年代,作為擬合生長數(shù)據(jù)和提供個(gè)體發(fā)生漂移的清晰圖像的函數(shù)方法(Vernon和Allison鬼譬,1963娜膘;Hughes和Freeman,1967优质;Poorter竣贪,1989)军洼。這些功能的優(yōu)點(diǎn)之一是它們不需要預(yù)先知道表型的縱向形狀。因此演怎,只要選擇多項(xiàng)式的不同階數(shù)匕争,它們就可以用來擬合任何形狀的生物數(shù)據(jù)。盡管多項(xiàng)式函數(shù)在時(shí)間上不是線性的爷耀,但它們的參數(shù)是線性的甘桑,因此,可以利用線性模型可用的推理方法(Yang等歹叮,2006年)跑杭。例如,三次多項(xiàng)式函數(shù)已用于描述水稻(Jones等咆耿,1979艘蹋;Shi等,2015)票灰、小麥(Gebeyehou等女阀,1982)、大麥(Leon和Geisler屑迂,1994)和紅花(Koutroubas和Papakosta浸策,2010)中的谷物生長。這種方法的主要困難之一是選擇合適的多項(xiàng)式次數(shù)來擬合數(shù)據(jù)惹盼,同時(shí)避免虛假的向上或向下趨勢(shì)或過度擬合或低估數(shù)據(jù)(Paine等庸汗,2012年)。
正交多項(xiàng)式在擬合生物曲線方面特別受歡迎手报,因?yàn)樗鼈兊南禂?shù)之間的相關(guān)性要低得多蚯舱,并且提供了協(xié)方差矩陣的估計(jì),而協(xié)方差矩陣在各種數(shù)據(jù)集上往往更為穩(wěn)窖诟颉(Schaeffer枉昏,2004)。Legendre多項(xiàng)式代表簡單的正交多項(xiàng)式揍鸟,并已成功地用于家畜育種計(jì)劃(如Albuquerque and Meyer兄裂,2001;Oliveira等阳藻,2017晰奖,2019b;Brito等腥泥,2017)和植物研究(e.g.匾南,Yang等,2006蛔外;Yang and Xu蛆楞,2007溯乒;Campbell等,2018臊岸;Momen等橙数,2019)中的縱向性狀尊流。
與正交多項(xiàng)式相比帅戒,樣條函數(shù)為縱向特征建模提供了更靈活的選擇(van Eeuwijk等,2018)崖技。樣條曲線是分段多項(xiàng)式函數(shù)逻住,在稱為節(jié)點(diǎn)的特定點(diǎn)連接(de Boor,1980)迎献。對(duì)于縱向數(shù)據(jù)瞎访,這些節(jié)點(diǎn)表示數(shù)據(jù)收集間隔內(nèi)的時(shí)間點(diǎn)(Li和Sillanp?a,2015)吁恍。樣條曲線更大的靈活性是由于每個(gè)線段的獨(dú)立性扒秸,它們可以具有相同或不同的多項(xiàng)式次數(shù),以適應(yīng)軌跡的突然變化(Meyer冀瓦,2005b)伴奥。樣條函數(shù)的一種特殊類型是基樣條或B樣條(de Boor,1980)翼闽,廣泛應(yīng)用于動(dòng)物育種(Meyer拾徙,2005b;Oliveira等感局,2019a)尼啡。樣條曲線的另一個(gè)版本是P樣條曲線,它將B樣條曲線與相鄰B樣條曲線系數(shù)的不同懲罰相結(jié)合询微,從而得到更平滑的曲線(Eilers和Marx崖瞭,1996;Meyer撑毛,2005b)读恃。
樣條函數(shù)最近被用來模擬作物的縱向性狀。例如代态,在一個(gè)二倍體馬鈴薯定位群體中寺惫,在生長季節(jié)的幾個(gè)點(diǎn)上對(duì)hallm衰老進(jìn)行了評(píng)估,并使用P樣條擬合(Hurtado等蹦疑,2012年)西雀。Montesinos-López等(2017)在產(chǎn)量預(yù)測(cè)模型中使用B樣條函數(shù)擬合小麥冠層高光譜波段。B樣條曲線還模擬了有限水環(huán)境中水稻的時(shí)生莖生物量(Momin等歉摧,2019年)艇肴。

統(tǒng)計(jì)遺傳模型

植物育種主要是從大量候選品種中篩選出新的遺傳優(yōu)勢(shì)品種腔呜。在開發(fā)最佳線性無偏預(yù)測(cè)(BLUP;Henderson再悼,1974)之前核畴,使用表型值的簡單算術(shù)平均值或最佳線性無偏估計(jì)(BLUE,將基因型視為固定效應(yīng))進(jìn)行選擇冲九。BLUPs基于混合線性模型谤草,目前是植物和牲畜物種遺傳評(píng)估最常用的方法(Piepho等,2008莺奸;Mrode丑孩,2014)。在混合模型框架下灭贷,基因型被隨機(jī)擬合温学,基因型效應(yīng)用BLUP估計(jì)。BLUP方法的主要優(yōu)點(diǎn)是提高了遺傳效應(yīng)的預(yù)測(cè)精度甚疟。這是因?yàn)槠骄档氖湛s取決于可用信息量(從個(gè)人和/或其親屬處獲得)仗岖,這將調(diào)整極端高和低的表現(xiàn),使之接近總體平均值览妖,也包括了來自系譜或基因組信息的相關(guān)基因型之間的遺傳相關(guān)性(Piepho等轧拄,2008)。后者不是模型的要求黄痪,因此BLUP最簡單的情況不使用關(guān)系矩陣紧帕,基因型被認(rèn)為是獨(dú)立的隨機(jī)變量(Yan和Rajcan,2003桅打;Cullis等是嗜,2006)。Piepho等(2008)介紹了植物育種中BLUP分析的幾個(gè)例子挺尾。
雖然很少使用鹅搪,系譜數(shù)據(jù)是一個(gè)簡單和廉價(jià)的信息來源,植物育種家利用個(gè)人之間的關(guān)系遭铺,以更準(zhǔn)確地估計(jì)育種價(jià)值丽柿。基于系譜的BLUP已成功應(yīng)用于各種作物(Bromley等魂挂,2000年甫题;Rutkoski等,2016年涂召;Basnet等坠非,2019年;Moreira等果正,2019年)炎码,并促進(jìn)了基因進(jìn)步率的重大進(jìn)步盟迟。
基因組信息的包含為基因型間的遺傳相關(guān)性提供了更準(zhǔn)確的估計(jì),尤其是關(guān)于孟德爾抽樣效應(yīng)(Habier等潦闲,2007)攒菠。基因組信息追蹤等位基因遺傳歉闰,捕捉個(gè)體間共享的基因組小片段辖众,即使它們?cè)谙底V上顯然不相關(guān)(Velazco等,2019年)新娜。植物育種家廣泛采用基于基因組的BLUPs(GBLUP)進(jìn)行基因組選擇(Auinger等赵辕,2016既绩;Crossa等概龄,2017;Schrag等饲握,2019)私杜。盡管基因組信息很有前途,但在實(shí)踐中救欧,由于基因分型成本衰粹、物流或兩者兼而有之,高密度基因分型并不總是適用于育種計(jì)劃中的所有基因型(Habier等笆怠,2009年)铝耻。另一種方法是根據(jù)系譜和基因組關(guān)系構(gòu)建一個(gè)聯(lián)合關(guān)系矩陣來預(yù)測(cè)基因型和非基因型材料的blup,稱為單步GBLUP(ssGBLUP蹬刷;Misztal等瓢捉,2009;Aguilar等办成,2010泡态;Christensen和Lund,2010)迂卢。這種方法整合了兩種關(guān)系矩陣某弦,將它們?cè)谶z傳相關(guān)性上的不同但又互補(bǔ)的信息聯(lián)系起來,為基因型間的遺傳相似性提供更可靠和準(zhǔn)確的估計(jì)而克“凶常基于ssGBLUP方法的基因組育種值通常用于動(dòng)物育種(Aguilar等,2010员萍;Legarra等腾降,2014;Meuwissen等充活,2015蜂莉;Guarini等蜡娶,2019a,b映穗;Oliveira等窖张,2019c),并且它們?cè)谥参镉N中的應(yīng)用也開始流行(Ashraf等蚁滋,2016宿接;Cappa等,2019辕录;Velazco等睦霎,2019)。在高粱中走诞,Velazco等(2019)證明該方法提高了復(fù)雜性狀的預(yù)測(cè)能力副女,尤其是對(duì)于遺傳力估計(jì)值較低、在發(fā)育階段后期測(cè)量的性狀蚣旱,或是難以或昂貴的性狀碑幅。
對(duì)于縱向性狀,我們可以將每個(gè)時(shí)間點(diǎn)的BLUPs分別計(jì)算為具有獨(dú)特表型的個(gè)體性狀塞绿;然而沟涨,這些方法并不直接調(diào)查和比較隨時(shí)間的變化趨勢(shì)(Littell等,1998)异吻。這使得當(dāng)BLUPs因遺傳力估計(jì)值的差異而出現(xiàn)不同收縮時(shí)裹赴,很難考慮大量的時(shí)間點(diǎn)并抑制數(shù)據(jù)比較【骼耍縱向性狀曲線和模式擬合的主要目標(biāo)是考慮多個(gè)時(shí)間點(diǎn)(如生長)發(fā)育過程中的可變性棋返。已開發(fā)出分析方法,以更好地利用BLUP上下文笋妥、簡單方差分析或兩者兼而有之(Littell懊昨,1990;Meyer和Kirkpatrick春宣,2005酵颁;Mrode,2014)月帝。我們將在這篇綜述中討論主要的方法躏惋。

重復(fù)性模型

隨著時(shí)間的推移記錄的單個(gè)測(cè)量值可以被視為相同特性的重復(fù)記錄。這就是所謂的重復(fù)性模型嚷辅。該方法隱含兩個(gè)關(guān)鍵假設(shè):(1)同一基因型(或個(gè)體)內(nèi)不同測(cè)量值的方差總是相等的簿姨,而不考慮記錄之間的時(shí)間間隔;(2)所有測(cè)量值之間的遺傳相關(guān)性都等于1,即:扁位。准潭,不同時(shí)間點(diǎn)的測(cè)量結(jié)果都受到相同基因的影響(Falconer和Mackay,1996域仇;Meyer和Hill刑然,1997;Littell等暇务,1998)泼掠。在這種情況下,簡單的重復(fù)性模型是標(biāo)準(zhǔn)的方法垦细。
最簡單的方法之一是在時(shí)間設(shè)計(jì)中使用分裂圖進(jìn)行重復(fù)測(cè)量方差分析(ANOVA)择镇,該方法將基因型作為一個(gè)整體的繪圖單元,將特定時(shí)間的基因型作為一個(gè)子圖單元(Rowell和Walters括改,1976腻豌;Littell,1990)叹谁。值得一提的是饲梭,由于時(shí)間是實(shí)驗(yàn)中的一個(gè)不能隨機(jī)化的因素乘盖,這不是一個(gè)真正的分裂圖設(shè)計(jì)焰檩。此外,該方法假設(shè)數(shù)據(jù)在所有重復(fù)測(cè)量中具有相等的方差(同構(gòu)性)订框,并且所有測(cè)量對(duì)具有相同的相關(guān)性(即復(fù)合對(duì)稱性)析苫,這對(duì)于大多數(shù)作物數(shù)據(jù)集來說是不現(xiàn)實(shí)的假設(shè)。然而穿扳,Huynh和Feldt(1970)表明衩侥,假設(shè)相關(guān)的任何兩個(gè)治療測(cè)量值之間的差異方差相等,足以進(jìn)行分裂圖方差分析矛物。在這種情況下茫死,如果數(shù)據(jù)違反Huynh和Feldt條件,子圖單元及其相互作用的F統(tǒng)計(jì)量將膨脹履羞。因此峦萎,這種方法容易出現(xiàn)較高的I型錯(cuò)誤率,從而得出結(jié)論:當(dāng)影響不顯著時(shí)忆首,其影響具有統(tǒng)計(jì)學(xué)意義(Scheiner和Gurevitch爱榔,2001;Fernandez糙及,2019)详幽。
在混合模型的背景下,指定模型中的隨機(jī)和固定效應(yīng)將取決于研究目標(biāo)、數(shù)據(jù)結(jié)構(gòu)和可以作出的假設(shè)唇聘。通常版姑,時(shí)間被認(rèn)為是一個(gè)固定的影響,因?yàn)樗皇请S機(jī)的實(shí)驗(yàn)迟郎。簡單的重復(fù)性模型已用于計(jì)算HTP衍生的縱向性狀的BLUPs和BLUEs漠酿,用于基因組預(yù)測(cè),如小麥(Rutkoski等谎亩,2016炒嘲;Sun等,2017)匈庭。

多性狀模型

通常夫凸,HTP平臺(tái)用于生成不同“年齡”或發(fā)育階段的植物表型,測(cè)量/分析日期之間的表型平均值和方差隨時(shí)間而變化阱持。因此夭拌,假設(shè)縱向性狀的遺傳控制將隨著時(shí)間的推移而不同,將縱向記錄/表型描述為不同的性狀衷咽。在這種情況下鸽扁,分析縱向特征的常見方法是多特征分析,將每個(gè)時(shí)間點(diǎn)視為不同的因變量(Sun等镶骗,2017年)桶现。
多元方差分析(MANOVA)是前面提到的方差分析(ANOVA)的一個(gè)擴(kuò)展,它避免了重復(fù)測(cè)量方差分析中出現(xiàn)的協(xié)方差結(jié)構(gòu)問題鼎姊。然而骡和,它仍然要求被比較的組之間的協(xié)方差相等,并且隨著時(shí)間的推移平衡數(shù)據(jù)相寇。此外慰于,MANOVA假設(shè)多元正態(tài)分布。有人提出了替代方法來克服這些限制(Krishnamoorthy and Lu唤衫,2010婆赠;Krishnamoorthy and Yu,2012佳励;Konietschke等休里,2015),但MANOVA在實(shí)踐中的應(yīng)用仍然有限植兰。
在BLUP背景下份帐,多性狀混合模型首先由Henderson和Quaas(1976)實(shí)現(xiàn),利用性狀間的遺傳和殘差協(xié)方差分析兩個(gè)或多個(gè)相關(guān)性狀(Speidel楣导,2011)废境。使用這種方法,可以直接建模多個(gè)因變量的協(xié)方差結(jié)構(gòu),并有效地處理缺失數(shù)據(jù)(Mrode噩凹,2014)巴元。與單一性狀重復(fù)性模型相比,使用多性狀模型(MTM)的主要優(yōu)勢(shì)在于驮宴,由于遺傳協(xié)方差和殘差協(xié)方差之間的數(shù)據(jù)有更好的聯(lián)系逮刨,因此每個(gè)性狀的評(píng)價(jià)精度都有所提高(Colleau等,1999堵泽;Mrode修己,2014)。這種數(shù)據(jù)結(jié)構(gòu)與高度遺傳性狀和一個(gè)或多個(gè)性狀缺失記錄的基因型相結(jié)合迎罗,有利于預(yù)測(cè)遺傳力較低的性狀(Mrode睬愤,2014)。在小麥中纹安,MTM用于預(yù)測(cè)冠層溫度和歸一化差異植被指數(shù)的BLUP(NDVI尤辱;Sun等,2017)厢岂,以及綠色NDVI的藍(lán)色(Juliana等光督,2018)。
多性狀混合模型存在一些缺點(diǎn)塔粒。例如结借,高維縱向數(shù)據(jù)(例如,長時(shí)間內(nèi)多次記錄的特征)可能導(dǎo)致具有高計(jì)算要求的過參數(shù)化模型(Speidel窗怒,2011)映跟。連續(xù)測(cè)量之間也有可能存在高度相關(guān)性,這會(huì)降低顯著性檢驗(yàn)的效力(Foster等扬虚,2006年)。有一些方法可以降低MTM的維數(shù)球恤,我們將在下面討論這些方法辜昵。值得注意的是,在應(yīng)用這些方法時(shí)咽斧,適當(dāng)?shù)哪P腿詰?yīng)足以描述數(shù)據(jù)堪置,解釋平均值和協(xié)方差隨時(shí)間的變化,并估計(jì)必要的遺傳參數(shù)(Mrode张惹,2014)舀锨。
表型記錄的典型轉(zhuǎn)換是通過特征值分解消除性狀間自相關(guān)的一種常用方法(Meyer和Hill,1997)宛逗。一組高度相關(guān)的度量將提供接近于零的特征值坎匿。在典型轉(zhuǎn)化表型的框架下,將原始觀測(cè)值轉(zhuǎn)化為一組新的響應(yīng)變量,并選擇特征值最高的變量組成新的性狀組合替蔬。MTODE與2014年后的新結(jié)果進(jìn)行了擬合告私。Grosu等(2013)強(qiáng)調(diào),只有在所有性狀的所有個(gè)體都被記錄下來的情況下承桥,才能使用典型轉(zhuǎn)化驻粟,并且每個(gè)性狀的模型需要是相同的,只考慮兩個(gè)隨機(jī)效應(yīng):殘差效應(yīng)和遺傳效應(yīng)凶异。另一種適合MTM的策略被稱為“彎曲”(Thompson和Meyer蜀撑,1986;Meyer剩彬,2019)屯掖。它并不要求對(duì)所有個(gè)體的所有特征進(jìn)行測(cè)量。這個(gè)過程通過一個(gè)彎曲因子來壓縮性狀間的協(xié)方差襟衰,從而產(chǎn)生一個(gè)正定的協(xié)方差矩陣贴铜,從而迫使性狀之間的自相關(guān)性降低。
主成分分析(PCA)和因子分析(FA)方法往往更適合于對(duì)大量性狀進(jìn)行降維瀑晒。FA確定了與變量之間相關(guān)性相關(guān)的共同因素绍坝,稱為潛在變量(Mrode,2014)苔悦。另一方面轩褐,PCA方法旨在創(chuàng)建獨(dú)立變量(主成分),以解釋數(shù)據(jù)集中的最大變化量(Mrode玖详,2014)把介。此后,主成分或潛在變量成為MTM中新的因變量蟋座。這兩種方法都用于降低動(dòng)物(Macciotta等拗踢,2017;Durón-Benítez等向臀,2018巢墅;Vargas等,2018)和植物(Kwak等券膀,2016君纫;Yano等怒坯,2019)的縱向特征分析維度竟稳。
根據(jù)定義褒链,縱向特征是沿著時(shí)間軌跡的究珊,整個(gè)數(shù)據(jù)集可以用描述軌跡曲線形狀的參數(shù)來表示(例如椅亚,生長曲線)蒙袍。這些參數(shù)可以成為MTM中新的因變量或綜合協(xié)方差結(jié)構(gòu)(Speidel澡罚,2011幻件;Oliveira等,2019a)好乐;然而匾竿,迄今為止我們討論過的縱向數(shù)據(jù)分析方法都沒有考慮到遺傳和環(huán)境方差可能隨時(shí)間而變化(Meyer,1998蔚万,2005a岭妖;奧利維拉等,2019a年a)反璃。此外昵慌,這些方法僅限于測(cè)量性狀的時(shí)間點(diǎn)。隨機(jī)回歸模型(RRMs)提供了一種克服這些局限性的方法(Schaeffer淮蜈,2004)斋攀。

隨機(jī)回歸模型

縱向性狀的一個(gè)共同特征是重復(fù)測(cè)量之間的協(xié)方差依賴于它們之間的時(shí)間間隔。換言之梧田,在較近的時(shí)間收集的測(cè)量值將比相距較遠(yuǎn)的測(cè)量值具有更高的相關(guān)性淳蔼。Kirkpatrick等(1990)提出了使用協(xié)方差函數(shù)分析縱向數(shù)據(jù)的概念,通過將特征的協(xié)方差結(jié)構(gòu)描述為時(shí)間函數(shù)裁眯。本質(zhì)上鹉梨,這種方法將一組正交函數(shù)擬合到隨時(shí)間變化的記錄的給定協(xié)方差矩陣中(Meyer和Hill,1997)穿稳。
一階自回歸分析(AR-1)是一種很有吸引力的建模隨時(shí)間變化的表型協(xié)方差結(jié)構(gòu)的方法(Apiolaza and Garrick存皂,2001;Yang等逢艘,2006旦袋;Vanhatalo等,2019)它改。它假設(shè)同質(zhì)的方差和相關(guān)性隨著測(cè)量被更大的時(shí)間間隔分開而呈指數(shù)下降疤孕。因此,在時(shí)間上較近的兩個(gè)測(cè)量值將比相距較遠(yuǎn)的測(cè)量值具有更高的相關(guān)性(Wade等搔课,1993胰柑;Littell等,2000爬泥;Piepho等,2004)崩瓤。AR-1結(jié)構(gòu)僅適用于在等間隔時(shí)間點(diǎn)進(jìn)行的測(cè)量(Wang和Goonewardene袍啡,2004)。盡管這在農(nóng)業(yè)研究中却桶,特別是在田間試驗(yàn)中難以滿足這一要求境输,但如前一節(jié)所述蔗牡,對(duì)縱向性狀進(jìn)行建模將使數(shù)據(jù)在時(shí)間上均勻分布,從而驗(yàn)證AR-1方法嗅剖。另一種方法是使用空間冪協(xié)方差結(jié)構(gòu)辩越,允許時(shí)間點(diǎn)之間的間隔不相等(Wang和Goonewardene,2004)信粮。
請(qǐng)注意黔攒,到目前為止,我們假設(shè)隨時(shí)間的變化是同質(zhì)的强缘。也有協(xié)方差結(jié)構(gòu)來處理異質(zhì)方差督惰,例如一階前相關(guān)結(jié)構(gòu)(Wolfinger,1996)旅掂。因此赏胚,Legendre正交多項(xiàng)式和樣條曲線是更具吸引力的協(xié)方差函數(shù),因?yàn)樗鼈冊(cè)诨貧w參數(shù)之間產(chǎn)生相對(duì)較小的相關(guān)性商虐,并且可以靈活地根據(jù)軌跡曲線的形狀進(jìn)行調(diào)整(Schaeffer觉阅,2004;Meyer秘车,2005a典勇,b;Bohmanova等鲫尊,2008痴柔;Pereira等,2013疫向;Brito等咳蔚,2018)。在植物中搔驼,各種性狀的不同協(xié)方差結(jié)構(gòu)已經(jīng)過評(píng)估(Apiolaza等谈火,2011年;Sun等舌涨,2017年糯耍;Campbell等,2019年)囊嘉。
Meyer和Hill(1997)證明協(xié)方差函數(shù)與RRMs等價(jià)温技。Schaeffer(2016)報(bào)告說,協(xié)方差函數(shù)有助于預(yù)測(cè)隨時(shí)間變化的變化扭粱,而RRM是估計(jì)協(xié)方差函數(shù)和確定軌跡中個(gè)體差異的一種方法舵鳞。RRMs提供了一個(gè)穩(wěn)健的框架,用于在每個(gè)時(shí)間點(diǎn)使用協(xié)方差或在每個(gè)時(shí)間點(diǎn)之間的協(xié)方差來建模特征軌跡琢蛤,而不需要假設(shè)恒定方差或相關(guān)性蜓堕。RRMs為研究性狀下發(fā)育行為的時(shí)間遺傳變異提供了見解(oliveria等抛虏,2019a)。盡管計(jì)算成本增加套才,但與其他方法相比迂猴,RRMs可產(chǎn)生更精確的育種值(Sun等,2017年背伴;Oliveira等沸毁,2019a)。
RRM最初被引入動(dòng)物育種中挂据,以克服MTM中的過參數(shù)化模型以清,自那時(shí)起,它們被廣泛使用(Jamrozik和Schaeffer崎逃,1997掷倔;Schaeffer,2004个绍;van Pelt等勒葱,2015;Englishby等巴柿,2016凛虽;Oliveira等,2019a)广恢】總之,RRMs將描述性狀軌跡的函數(shù)參數(shù)設(shè)置為模型中的固定和隨機(jī)效應(yīng)钉迷,因此比MTM的參數(shù)更少(Schaeffer至非,2016;Oliveira等糠聪,2019a)荒椭。因此,在RRMs中舰蟆,對(duì)于縱向性狀趣惠,隨機(jī)參數(shù)并不直接對(duì)應(yīng)于個(gè)體的遺傳值。相反身害,它們對(duì)應(yīng)于代表每個(gè)基因型縱向性狀時(shí)間軌跡的回歸系數(shù)集的遺傳值(Turra等味悄,2012年)∷欤可以從回歸系數(shù)的遺傳(co)方差矩陣和與所用函數(shù)相關(guān)的所有時(shí)間點(diǎn)的獨(dú)立協(xié)變量矩陣分析得到區(qū)間內(nèi)所有時(shí)間點(diǎn)的遺傳參數(shù)和育種值估計(jì)值(Oliveira等傍菇,2019a)。當(dāng)在所有模型中使用相同的固定效應(yīng)時(shí)界赔,應(yīng)使用實(shí)際數(shù)據(jù)檢查不同的協(xié)方差結(jié)構(gòu)丢习,并根據(jù)統(tǒng)計(jì)方法選擇最適合模型的結(jié)構(gòu),如Akaike信息準(zhǔn)則(AIC淮悼、Wang和Goonewardene咐低,2004)或貝葉斯信息準(zhǔn)則(BIC、Neath和Cavanaugh袜腥,2012)见擦。最后,利用所選擇的協(xié)方差結(jié)構(gòu)估計(jì)感興趣的效果羹令。一般情況下鲤屡,RRM可描述為如下(Oliveira等,2019a):
\mathrm{y}_{\mathrm{g}\mathrm{i}\mathrm{j}}=\sum_{\mathrm{q}=1}^{\mathrm{Q}}\mathrm福侈_{\mathrm{q}\mathrm{g}}\mathrm{z}_{\mathrm{q}\mathrm{g}}+\sum_{\mathrm{r}=1}^{\mathrm{R}}\mathrm{a}_{\mathrm{r}\mathrm{i}}\mathrm{z}_{\mathrm{r}\mathrm{i}}+\sum_{\mathrm{s}=1}^{\mathrm{s}}\mathrm{p}_{\mathrm{s}\mathrm{i}}\mathrm{z}_{\mathrm{s}\mathrm{i}}+\mathrm{e}_{\mathrm{g}\mathrm{i}\mathrm{j}}
\mathrm{y}_{\mathrm{g}\mathrm{i}\mathrm{j}}為基因型i的第j次重復(fù)記錄(如種植后不同天數(shù)的冠層覆蓋率)酒来;\mathrm_{\mathrm{q}\mathrm{g}}為第q組的固定回歸系數(shù)肪凛;\mathrm{a}_{\mathrm{r}\mathrm{i}}為第i個(gè)基因型加性遺傳效應(yīng)的第r個(gè)隨機(jī)回歸系數(shù)堰汉;\mathrm{p}_{\mathrm{s}\mathrm{i}}是第i個(gè)基因型的永久環(huán)境效應(yīng)的隨機(jī)回歸系數(shù); \mathrm{e}_{\mathrm{g}\mathrm{i}\mathrm{j}}是殘余效應(yīng)伟墙;\mathrm{z}_{\mathrm{q}\mathrm{g}}翘鸭, \mathrm{z}_{\mathrm{r}\mathrm{i}}\mathrm{z}_{\mathrm{s}\mathrm{i}} 是與描述時(shí)間(例如,種植后的天數(shù))的函數(shù)相關(guān)的協(xié)變量戳葵,假設(shè)相同的函數(shù)(例如就乓,勒讓德多項(xiàng)式)具有不同的階數(shù)QRS(例如拱烁,線性生蚁、二次、立方)(Oliveira等邻梆,2019a)守伸。
隨機(jī)回歸模型已被證明是在眾多家畜育種計(jì)劃中對(duì)縱向性狀進(jìn)行遺傳評(píng)估的最有效的選擇(如Oliveira等,2019a所述)浦妄,但在植物育種中應(yīng)用RRMs的例子并不多尼摹,尤其是在結(jié)合基因組信息時(shí)。Sun等(2017)利用RRMs連續(xù)捕捉了小麥生長階段HTP性狀的變化剂娄〈览裕坎貝爾等(2018)使用RRMs預(yù)測(cè)水稻多樣性小組中的芽生長軌跡,并證明與單時(shí)間點(diǎn)模型相比阅懦,預(yù)測(cè)精度有所提高和二。基于相同的水稻數(shù)據(jù)集耳胎,Campbell等(2019)利用RRMs識(shí)別具有時(shí)間特異性效應(yīng)的QTL惯吕。多性狀RRM也是可行的惕它,并已在動(dòng)物育種計(jì)劃的幾個(gè)環(huán)境中實(shí)施(Nobre等,2003年废登;Muir等淹魄,2007年;Oliveira等堡距,2019b甲锡,c)。
縱向性狀基因組選擇的實(shí)現(xiàn)
Meuwissen等(2001)引入了基因組選擇(GS)的概念羽戒,其基礎(chǔ)是密集全基因組基因分型的標(biāo)記將與影響感興趣的數(shù)量性狀的qtl連鎖不平衡缤沦。因此,它們可以用于選擇易稠,而不需要識(shí)別QTL或功能多態(tài)性缸废。人們對(duì)GS的理解不斷加深,因?yàn)槿藗冎莱藰?biāo)記和QTL之間的連鎖不平衡所捕獲的信號(hào)外缩多,標(biāo)記還會(huì)攜帶關(guān)系信息(Habier等呆奕,2007;Meuwissen衬吆,2009)梁钾。
在GS中,基因組和表型數(shù)據(jù)被組合在一個(gè)訓(xùn)練群體中逊抡,從而能夠開發(fā)預(yù)測(cè)方程姆泻,該預(yù)測(cè)方程可用于測(cè)試(或目標(biāo))群體中的選擇候選人,該群體由基因型但非表型的個(gè)體組成(Crossa等冒嫡,2017年)拇勃。因此,GS可以在早期(沒有測(cè)量)更精確地選擇個(gè)體孝凌。這通過減少品種發(fā)育所需的時(shí)間和每個(gè)周期的成本來提高遺傳增益率方咆。HTP能夠生成高質(zhì)量的定量數(shù)據(jù),并在生長季節(jié)有效地描述大量的訓(xùn)練種群蟀架。GS和HTP的結(jié)合有可能提高精度和效率瓣赂,同時(shí)降低成本和最小化勞動(dòng)力(Araus等,2018年)片拍。
在GS的縱向框架下煌集,時(shí)間育種值的預(yù)測(cè)可以在生長季節(jié)的特定時(shí)期進(jìn)行有針對(duì)性的選擇,或者選擇具有理想性狀軌跡的個(gè)體捌省。此外苫纤,縱向性狀可作為次要性狀,以改善產(chǎn)量等經(jīng)濟(jì)終點(diǎn)性狀的基因組選擇(Sun等,2017)卷拘『胺希坎貝爾等(2018)使用具有二階勒讓德多項(xiàng)式的RRMs對(duì)水稻多樣性面板中的莖生長軌跡進(jìn)行系譜和基因組預(yù)測(cè)。他們證明了與單時(shí)間點(diǎn)模型相比恭金,使用RRM的預(yù)測(cè)精度有所提高操禀。此外,作者還報(bào)道了基因組RRMs在使用早期測(cè)量的子集來預(yù)測(cè)未來表型方面是有用的横腿。水稻的另一項(xiàng)研究使用RRMs,利用Legendre多項(xiàng)式和B樣條基函數(shù)預(yù)測(cè)受控和水分限制條件下的預(yù)計(jì)枝梢面積(Momen等斤寂,2019年)耿焊。在擬合這兩個(gè)函數(shù)之前,他們調(diào)整了原始的表型測(cè)量遍搞,以獲得用于下游遺傳分析的藍(lán)色罗侯。總體而言溪猿,與基線多性狀模型相比钩杰,RRMs具有更高的預(yù)測(cè)精度。此外诊县,B樣條曲線的表現(xiàn)略好于勒讓德多項(xiàng)式(Momin等讲弄,2019年)。
目前依痊,植物育種GS中使用的統(tǒng)計(jì)模型通常是單性狀(單變量)避除,沒有利用不同時(shí)間點(diǎn)收集的性狀之間的遺傳協(xié)方差或表型記錄(Jia等,2012)胸嘁。然而瓶摆,通過考慮性狀間的相關(guān)性,GS的MTM表現(xiàn)優(yōu)于單性狀模型性宏,從而提高了預(yù)測(cè)精度群井、統(tǒng)計(jì)能力、參數(shù)估計(jì)精度毫胜,并減少了性狀選擇偏差(Jia等书斜,2012年;Guo G.等指蚁,2014年菩佑;Montesinos-López等,2016年凝化、2019年)稍坯。這些優(yōu)勢(shì)在產(chǎn)量等低遺傳力性狀與高遺傳性狀遺傳相關(guān)的性狀上表現(xiàn)得更為明顯(郭G等,2014;Jiang等瞧哟,2015)混巧。最近,CIMMYT(2019)小麥育種計(jì)劃1中的研究表明勤揩,通過合并來自用UAV測(cè)量的所謂次級(jí)性狀的HTP縱向數(shù)據(jù)咧党,GS的準(zhǔn)確性大大提高(Rutkoski等,2016陨亡;Montesinos-López等傍衡,2017;Sun等负蠕,2017蛙埂,2019),隨著HTP和基因分型變得更容易獲得遮糖,一種實(shí)施起來相對(duì)便宜的方法(例如绣的,通過測(cè)序進(jìn)行目標(biāo)基因分型;Pembleton等欲账,2016年)屡江。此外,次級(jí)性狀也有助于預(yù)測(cè)早期生長階段的主要性狀赛不,因?yàn)樗鼈兺ǔ惩嘉?梢栽谥饕誀睿ㄈ绻任锂a(chǎn)量)之前表現(xiàn)出來(Sun等,2017年)俄删。因此宏怔,縱向性狀可以作為次要性狀來提高GS的準(zhǔn)確性,有助于更好地理解應(yīng)激反應(yīng)和發(fā)育的生物學(xué)機(jī)制畴椰。如前一節(jié)所述臊诊,從縱向性狀中提取遺傳信息有多種方法,所采用的方法將決定它們?cè)贕S中的應(yīng)用斜脂。
Rutkoski等(2016)將HTP冠層溫度(CT)抓艳、綠色歸一化差異植被指數(shù)(GNDVI)和紅色歸一化差異植被指數(shù)(RNDVI)作為小麥產(chǎn)量GS中的次要性狀。首先帚戳,他們使用可重復(fù)性模型估計(jì)縱向性狀的BLUEs玷或,并將其用于MTM和產(chǎn)量,用于系譜和基因組預(yù)測(cè)片任。他們發(fā)現(xiàn)偏友,與單性狀模型相比,利用系譜和基因組信息建立的多性狀模型提高了谷物產(chǎn)量的準(zhǔn)確性对供。在另一項(xiàng)研究中位他,CT和NDVI還提高了預(yù)測(cè)小麥產(chǎn)量的能力(Sun等氛濒,2017)。然而鹅髓,除了重復(fù)性模型之外舞竿,作者還使用MTM和RRMs計(jì)算次要性狀的BLUPs,以比較它們的效率窿冯。在包含次要性狀時(shí)骗奖,預(yù)測(cè)能力平均提高70%,RRM和MTM的預(yù)測(cè)能力優(yōu)于重復(fù)性模型醒串。同樣在小麥中执桌,Juliana等(2018)利用不同日期測(cè)得的產(chǎn)量藍(lán)和GNDVI進(jìn)行系譜和基因組多性狀預(yù)測(cè)模型。他們發(fā)現(xiàn)厦凤,包括GNDVI提高了預(yù)測(cè)精度鼻吮。Sun等(2019)使用帶三次平滑樣條的RRM預(yù)測(cè)小麥CT和GNDVI的BLUP。在第二步中较鼓,他們使用BLUPs作為次要性狀和籽粒產(chǎn)量作為GS的因變量。利用次級(jí)性狀對(duì)產(chǎn)量的預(yù)測(cè)精度平均提高146%违柏,前期測(cè)定的次要性狀對(duì)提高預(yù)測(cè)精度最為有利博烂。Montesinos-López等(2017)和Crain等(2018)在小麥方面也取得了類似的結(jié)果。Howard和Jarquin(2019)利用SoyNAM數(shù)據(jù)集(Song等漱竖,2017禽篱;Diers等,2018)對(duì)林冠覆蓋率和產(chǎn)量之間的遺傳協(xié)方差進(jìn)行了建模馍惹,并證明躺率,基于不同的交叉驗(yàn)證方案,當(dāng)模型中同時(shí)包含冠層和標(biāo)記信息時(shí)万矾,預(yù)測(cè)能力最高悼吱。另外兩篇論文報(bào)告了相同數(shù)據(jù)集的類似改進(jìn)(Xavier等,2017年良狈;Jarquin等后添,2018年)。
鑒于HTP能夠同時(shí)收集多個(gè)時(shí)間性狀薪丁,多性狀RRMs(MTRRMs)可以成為多個(gè)縱向性狀聯(lián)合基因組預(yù)測(cè)的有力工具(oliveria等遇西,2016)。此外严嗜,MTRRMs可以結(jié)合不同的功能來描述同一模型中的不同性狀粱檀,并估計(jì)不同性狀間隨時(shí)間的遺傳相關(guān)性(oliveria等,2016)漫玄。在動(dòng)物中茄蚯,MTRRM是山羊(Oliveira等,2016)、牛(Oliveira等第队,2019c)和水牛(Borquis等哮塞,2013)的產(chǎn)奶量和乳成分的聯(lián)合遺傳預(yù)測(cè)的一種可行替代方法。最近凳谦,與單一性狀RRMs相比忆畅,在20天內(nèi)每天記錄的預(yù)測(cè)枝面積和水分使用的mtrrm顯示出更好的預(yù)測(cè)能力(Baba等,2020年)尸执。
在動(dòng)物育種和多階段植物育種分析中家凯,通常使用去灰遺傳值作為基因組預(yù)測(cè)的偽表型。Oliveira等(2018)比較了縱向性狀的不同退化方法如失。然而绊诲,這種多步驟方法可能會(huì)導(dǎo)致較低的精確度、偏差和信息丟失(Legarra等褪贵,2009年掂之;Kang等,2017年)脆丁∈澜ⅲ考慮到ssGBLUP和RRMs在遺傳評(píng)價(jià)中的優(yōu)勢(shì),整合這兩種方法是增強(qiáng)縱向性狀基因組預(yù)測(cè)的有效策略(Kang等槽卫,2017)跟压。Koivula等(2015)報(bào)告說,與傳統(tǒng)的基于系譜的RRM相比歼培,使用ssGBLUP RRM預(yù)測(cè)北歐紅奶牛產(chǎn)奶性能的準(zhǔn)確性更高震蒋,偏差更小。Kang等與2017年的其他情景相比躲庄,GBRRP模型的精確度最高(包括2017年)查剖。總之读跷,基于RRMs的ssGBLUP的使用可以提高奶牛試驗(yàn)日性狀基因組預(yù)測(cè)的可靠性(Koivula等梗搅,2015;Kang等效览,2018无切;Oliveira等,2019c)丐枉,并且可能在作物中哆键。

檢測(cè)與縱向性狀相關(guān)的QTL和因果變異

基因組學(xué)研究的主要目標(biāo)之一是通過識(shí)別遺傳變異,利用基因型預(yù)測(cè)表型變異瘦锹。有機(jī)體的發(fā)展是基因和環(huán)境因素相互作用的結(jié)果(Wu和Lin籍嘹,2006)闪盔。與單時(shí)間點(diǎn)測(cè)量不同,研究縱向性狀作為時(shí)間的函數(shù)可以全面評(píng)估作物的生長和發(fā)育(例如辱士,年齡代謝率泪掀;Ma等,2002年)颂碘。然而异赫,在植物中,對(duì)于縱向性狀的QTL分析或全基因組關(guān)聯(lián)研究(GWAS)的檢測(cè)仍然是在每個(gè)時(shí)間點(diǎn)獨(dú)立進(jìn)行的头岔。例如塔拳,Würschum等(2014)分別在離散時(shí)間點(diǎn)使用連鎖作圖來識(shí)別與小黑麥株高相關(guān)的時(shí)間特異性QTL。在棉花中峡竣,在幾天的研究中靠抑,分別使用冠層相關(guān)性狀來繪制加性QTL效應(yīng)及其與環(huán)境的相互作用(Pauli等,2016a)适掰。在大豆中颂碧,GWAS用于識(shí)別種植后14-56天內(nèi)每個(gè)單獨(dú)冠層覆蓋測(cè)量的QTL(Xavier等,2017年)类浪。Zhang等(2017)分別在16個(gè)時(shí)間點(diǎn)對(duì)玉米的幾個(gè)生長相關(guān)性狀進(jìn)行了QTL定位稚伍。同樣在玉米中,對(duì)單個(gè)時(shí)間點(diǎn)的分析發(fā)現(xiàn)戚宦,在不同的生長階段,控制株高的同時(shí)存在不同的QTL(Wang等锈嫩,2019年)受楼。利用時(shí)間點(diǎn)生長相關(guān)特征,Knoch等(2020)在油菜中發(fā)現(xiàn)了時(shí)間QTL的證據(jù)呼寸。這些靜態(tài)檢測(cè)雖然有用艳汽,但提供了遺傳控制的簡化視圖,忽略了性狀形成的時(shí)間變化和發(fā)育特征(Wu和Lin对雪,2006)河狐。此外,在動(dòng)物中瑟捣,已經(jīng)證明縱向性狀的表型或加性多基因效應(yīng)在整個(gè)表型表達(dá)中都不是恒定不變的(Szyda等馋艺,2014;Brito等迈套,2018捐祠;Oliveira等,2019a)桑李。
作為另一種選擇踱蛀,Ma等(2002)提出了一種動(dòng)態(tài)模型窿给,稱為功能定位,以定位與縱向性狀整個(gè)發(fā)育過程相關(guān)的qtl率拒。如前所述崩泡,縱向性狀可以用曲線表示,由給定時(shí)間內(nèi)線性或非線性函數(shù)的幾個(gè)參數(shù)描述猬膨。功能定位背后的想法是基因型間曲線參數(shù)的差異可能暗示了基因控制表型軌跡的時(shí)間模式(Ma等角撞,2002)。因此寥掐,功能定位可以檢測(cè)QTL表達(dá)的時(shí)間和持續(xù)時(shí)間(Wu等靴寂,2004)。Li和Sillanp?(2015)提出了幾種功能映射建模策略召耘,并對(duì)其進(jìn)行了審查百炬。其中一種方法(兩階段法)包括使用線性和非線性模型對(duì)整個(gè)表型軌跡進(jìn)行建模,并將這些參數(shù)用作QTL檢測(cè)的潛在性狀表型(Li和Sillanp?污它,2015)剖踊。通常,研究人員對(duì)單個(gè)時(shí)間點(diǎn)進(jìn)行分析衫贬,然后采用這種兩階段方法來推導(dǎo)曲線參數(shù)德澈。Busemeyer等(2013)使用logistic函數(shù)擬合647個(gè)雙單倍體小黑麥品系的大型作圖群體不同發(fā)育階段的高通量衍生生物量。除了個(gè)別日的GWAS外固惯,他們利用logistic曲線的參數(shù)進(jìn)行了多性狀功能GWAS梆造,以揭示生物量調(diào)節(jié)的時(shí)間遺傳模式。類似的方法用于評(píng)估玉米系的圖像生物量(Muraya等葬毫,2017)镇辉;春大麥的數(shù)字生物量積累(Neumann等,2017)贴捡;小麥的面積忽肛、高度和衰老(Camargo等,2018)烂斋∫俟洌坎貝爾等(2017)計(jì)算了360份水稻品種在移栽后19至41天的預(yù)計(jì)芽面積。他們使用冪函數(shù)模擬縱向表型(Paine等汛骂,2012年)罕模,并將參數(shù)用作多性狀GWA中的偽表型。為了揭示馬鈴薯衰老的時(shí)間動(dòng)態(tài)香缺,Hurtado等手销。(2012)采用P樣條曲線作為平滑曲線,并使用曲線參數(shù)識(shí)別QTL图张。
Kwak等(2014)提出了兩種基于簡單回歸的QTL定位方法锋拖,分別對(duì)每個(gè)時(shí)間點(diǎn)進(jìn)行分析诈悍,然后結(jié)合跨時(shí)間點(diǎn)的測(cè)試統(tǒng)計(jì)數(shù)據(jù)確定總體顯著性。后來兽埃,Kwak等(2016)提出了一種改進(jìn)的方法侥钳,將觀察到的縱向特征替換為平滑近似,然后通過PCA進(jìn)行維數(shù)縮減柄错。利用主成分對(duì)數(shù)據(jù)進(jìn)行多性狀QTL分析舷夺。Muraya等(2017)實(shí)施了Kwak等建議的方法(2016年)。他們使用B樣條曲線平滑表型售貌,然后用PCA進(jìn)行變量縮減给猾,并按照Kwak等的方法進(jìn)行了多QTL分析。(2014)揭示玉米生長動(dòng)態(tài)的潛在遺傳變異颂跨。模型C4禾本科狗尾草的時(shí)間高度QTL也通過這種方法得到了揭示(Feldman等敢伸,2017)。長期以來恒削,動(dòng)物育種家一直使用PCA進(jìn)行縱向性狀分析池颈,以合成復(fù)雜的模式并減少計(jì)算量大的多性狀QTL檢測(cè)(Macciotta等,2006年钓丰、2015年躯砰、2017年;Zhang等携丁,2018年)琢歇。
RRMs提供了一個(gè)更好的選擇來適應(yīng)縱向特征,并已廣泛應(yīng)用于動(dòng)物的遺傳評(píng)估(Ning等梦鉴,2017矿微;oliverira等,2019a)尚揣。隨機(jī)回歸方法揭示了SNP隨時(shí)間的影響,因?yàn)樗軌蜃R(shí)別持久的和特定時(shí)間的瞬時(shí)qtl掖举。此外快骗,與其他方法相比,RRMs提高了檢測(cè)qtl的統(tǒng)計(jì)能力塔次,因?yàn)樗鼈兝昧艘徽自伎v向表型(Ning等方篮,2017),并且可以在發(fā)育曲線的特定區(qū)域捕獲具有顯著影響的qtl励负,盡管這些qtl的影響總體上可能很小藕溅。RRMs還可用于檢測(cè)基因與環(huán)境相互作用中的QTL(Lillehammer等,2007继榆;Carvalheiro等巾表,2019)汁掠。
Das等(2011)基于RRMs提出了一種稱為功能性GWAS(fGWAS)的方法,該方法將GWAS和描述生物過程的數(shù)學(xué)模型相結(jié)合集币】稼澹總之,fGWAS估計(jì)每個(gè)基因型和時(shí)間點(diǎn)的不同SNP效應(yīng)的平均值鞠苟,然后進(jìn)行假設(shè)檢驗(yàn)乞榨,以確定SNP在時(shí)間過程中是否具有任何加性或顯性效應(yīng)。這種方法的主要缺點(diǎn)是只進(jìn)行單軌跡分析当娱。后來吃既,Ning等(2017)提出了對(duì)fGWAS的修正,通過分別估計(jì)時(shí)間依賴的群體平均數(shù)和SNP效應(yīng)跨细,而不是直接擬合它們鹦倚。他們還通過將snp作為協(xié)變量(fGWAS-C)或因子(fGWAS-F)來擴(kuò)展模型,以捕捉復(fù)雜性狀的時(shí)變多基因效應(yīng)扼鞋。然而申鱼,與其他模型相比,由于混合模型方程的高維性云头,他們的方法計(jì)算效率低下捐友。隨后,寧等溃槐。(2018)提出了一種快速縱向GWAS方法匣砖,使用特征分解將協(xié)方差矩陣轉(zhuǎn)換為對(duì)角矩陣。這樣昏滴,每個(gè)SNP測(cè)試都可以用加權(quán)最小二乘模型來求解模型猴鲫。
據(jù)我們所知,坎貝爾等(2019年)是第一個(gè)在主要連作作物中使用RRM GWA的公司谣殊。他們使用勒讓德正交多項(xiàng)式從RRMs獲得的基因組育種值來評(píng)估早期營養(yǎng)生長期間水稻莖生長的遺傳結(jié)構(gòu)拂共。他們發(fā)現(xiàn),與單時(shí)間點(diǎn)分析相比姻几,瞬時(shí)效應(yīng)和持續(xù)效應(yīng)都與地上部生長有關(guān)宜狐,與RRM的關(guān)系更大。

挑戰(zhàn)和未來發(fā)展

為了利用表型和分子技術(shù)的進(jìn)步蛇捌,需要在開發(fā)育種人員能夠操縱系統(tǒng)以理解基因型和表型之間關(guān)系的方法方面取得更大的進(jìn)展抚恒。由于環(huán)境系統(tǒng)和/或隨著時(shí)間的推移,潛在的生物變化可以用縱向數(shù)據(jù)捕捉络拌。主要的挑戰(zhàn)是以一種有意義的方式綜合不同層次的信息俭驮,以了解發(fā)育壓力的下游影響和對(duì)育種的影響(Harfouche等,2019年)春贸。

非加性效應(yīng)與GxE

非加性遺傳效應(yīng)對(duì)復(fù)雜性狀的總遺傳變異有顯著貢獻(xiàn)混萝。包含優(yōu)勢(shì)效應(yīng)的預(yù)測(cè)模型代表了育種計(jì)劃的重要組成部分遗遵,重點(diǎn)關(guān)注雜交種群、雜交生產(chǎn)和無性繁殖物種(de Almeida Filho等譬圣,2019)瓮恭。還有大量證據(jù)表明上位性在各種作物復(fù)雜性狀的遺傳結(jié)構(gòu)中的重要性(Guo T.et al.,2014厘熟;Monir and Zhu屯蹦,2018)。將非加性效應(yīng)整合到統(tǒng)計(jì)模型中可以提高預(yù)測(cè)精度并比簡單的加性模型檢測(cè)到更多的QTL绳姨,尤其是當(dāng)非加性方差占遺傳方差的很大比例時(shí)(Bouvet等登澜,2016;Bonnafous等飘庄,2018脑蠕;Liu等,2018b跪削,2019谴仙;Monir and Zhu,2018碾盐;Varona et al晃跺。,2018年)。然而,這些研究僅限于單時(shí)間點(diǎn)性狀孵坚。對(duì)于縱向性狀而言,建立完整的遺傳模型(包括加性效應(yīng)和非加性效應(yīng))可能具有挑戰(zhàn)性烹玉,需要密集的標(biāo)記面板來估計(jì)時(shí)間相關(guān)(co)方差,以及對(duì)遺傳方差成分進(jìn)行劃分阐滩。然而二打,縱向性狀的完整遺傳模型可能會(huì)影響未來育種策略的設(shè)計(jì)和實(shí)施。
縱向性狀的時(shí)間動(dòng)態(tài)導(dǎo)致了隨時(shí)間而改變表型的相互作用掂榔。這可能是因?yàn)榛?基因和基因-環(huán)境相互作用(GxE)是時(shí)間或年齡依賴的址儒,需要進(jìn)行適當(dāng)?shù)慕#‵an等,2012)衅疙。在這種情況下,環(huán)境描述符應(yīng)該作為性狀表型進(jìn)行多次測(cè)量鸳慈。由此得到的模型是一個(gè)具有多種交互作用的多特征饱溢、多環(huán)境模型,在這種模型中走芋,由于被估計(jì)參數(shù)的數(shù)量增加绩郎,可能會(huì)出現(xiàn)計(jì)算問題潘鲫。研究表明,RRMs可以同時(shí)解釋動(dòng)物育種中縱向性狀的加性遺傳效應(yīng)和一定程度的GxE肋杖,它允許對(duì)時(shí)間相關(guān)性狀和環(huán)境相關(guān)協(xié)變量的整個(gè)軌跡上的遺傳(co)方差分量和育種值進(jìn)行估計(jì)(Brügemann等溉仑,2011年;桑塔納等状植,2016年浊竟;博盧利等,2019年)津畸。因此振定,在植物育種中,該模型可以為特定環(huán)境下決定性能的機(jī)制提供相當(dāng)多的生物學(xué)見解肉拓,使其成為今后研究的一個(gè)有價(jià)值的方法后频。

互補(bǔ)的“經(jīng)濟(jì)學(xué)”技術(shù)

“組學(xué)”技術(shù)的迅速發(fā)展使得為許多作物物種生成大規(guī)模的“組學(xué)”數(shù)據(jù)集,為研究和改進(jìn)復(fù)雜性狀提供了新的機(jī)會(huì)暖途。在這篇綜述中描述的不同方法提供了有價(jià)值的工具來結(jié)合表型和基因組學(xué)數(shù)據(jù)來揭示縱向性狀的潛在遺傳基礎(chǔ)卑惜。然而,當(dāng)前的一個(gè)挑戰(zhàn)是整合額外的“組學(xué)”技術(shù)(例如轉(zhuǎn)錄組學(xué)驻售、元基因組學(xué)露久、蛋白質(zhì)組學(xué)、代謝組學(xué)芋浮、表觀基因組學(xué))抱环,以提供一個(gè)整體的多組學(xué)方法來研究重要農(nóng)藝性狀的生物學(xué)機(jī)制及其對(duì)環(huán)境脅迫的響應(yīng)。
最近纸巷,結(jié)合“-omics”信息的方法已在一些作物中用于研究單點(diǎn)性狀的表型網(wǎng)絡(luò)镇草,例如,精確定位候選基因和/或位點(diǎn)并預(yù)測(cè)表型變異(Acharjee等瘤旨,2016梯啤;Li等,2016存哲;Das等因宇,2017;Sheng等祟偷,2017察滑;Pandey等,2018修肠;Jiang等贺辰,2019)。迄今為止,有關(guān)作物縱向性狀的詳細(xì)的“組學(xué)”數(shù)據(jù)集的薈萃分析還很有限饲化。Baker等(2019)描述了甘藍(lán)型油菜株高發(fā)育動(dòng)態(tài)的基因組結(jié)構(gòu)莽鸭、轉(zhuǎn)錄組表達(dá)網(wǎng)絡(luò)和生長曲線表型變異之間的機(jī)械聯(lián)系。多組學(xué)方法的結(jié)合似乎也有希望闡明模式植物和作物的衰老過程(Gro?kinsky等吃靠,2018)硫眨。當(dāng)聯(lián)合建模縱向“-omics”數(shù)據(jù)(一種或多種類型的“omics”數(shù)據(jù)隨時(shí)間變化)時(shí)巢块,統(tǒng)計(jì)分析變得更具挑戰(zhàn)性礁阁。一些關(guān)鍵點(diǎn)可以在Sperisen等中找到。(2015年)夕冲〉總的來說,需要調(diào)整方法學(xué)和實(shí)驗(yàn)設(shè)計(jì)歹鱼,以探索與生物過程的全球進(jìn)化有關(guān)的過程泣栈,例如生長和發(fā)育。盡管存在所有這些挑戰(zhàn)弥姻,但綜合方法可以提高分析能力南片,找到真正的因果變異、調(diào)控網(wǎng)絡(luò)和路徑庭敦。反過來疼进,這些可以被納入GS和育種計(jì)劃,以加速遺傳增益(Suravajhala等秧廉,2016年)伞广。

深度學(xué)習(xí)

深度學(xué)習(xí)(DL)是一種功能強(qiáng)大且高度靈活的機(jī)器學(xué)習(xí)算法類,其基于非線性分層學(xué)習(xí)器中包含多個(gè)層次的表示學(xué)習(xí)方法(Lecun等疼电,2015)嚼锄。本質(zhì)上,DL是人工神經(jīng)網(wǎng)絡(luò)(ANN)的高級(jí)版本蔽豺,具有多個(gè)隱藏層区丑,旨在模擬人腦功能(Patterson和Gibson,2017)修陡。
深度學(xué)習(xí)已經(jīng)證明了其在生物科學(xué)不同領(lǐng)域的應(yīng)用沧侥,例如疾病診斷(Gao等,2018)魄鸦、多組學(xué)數(shù)據(jù)整合(Chaudhary等宴杀,2018)、預(yù)測(cè)DNA和RNA結(jié)合特異性(Trabelsi等拾因,2019年)以及最近在植物育種基因組預(yù)測(cè)(Ma等旺罢,2018年斯棒;Montesinos-López A.等,2018年主经;Montesinos-López O.A.等,2018年庭惜;Montesinos-López等罩驻,2019年)。鄒等(2019)和Pérez Enciso和Zingaretti(2019)提供了基因組學(xué)中DL的引物护赊。人們對(duì)植物育種惠遏,特別是預(yù)測(cè)的DL方法越來越感興趣,這可能是因?yàn)樗哂袕?qiáng)大的學(xué)習(xí)能力骏啰,能夠?qū)W習(xí)隱藏在大數(shù)據(jù)中的預(yù)測(cè)因子和響應(yīng)之間的復(fù)雜非線性關(guān)系节吮,與其他方法相比,通常具有更高的精確度(montecinos-López A.等判耕,2018年透绩;Pérez Enciso和Zingaretti,2019年壁熄;Zou等帚豪,2019年)。需要指出的是草丧,盡管DL可以處理復(fù)雜的場景并達(dá)到最先進(jìn)的精確度狸臣,但它需要領(lǐng)域知識(shí)和大規(guī)模數(shù)據(jù)集,而對(duì)底層生物學(xué)的解釋比標(biāo)準(zhǔn)統(tǒng)計(jì)模型更具挑戰(zhàn)性(Zou等昌执,2019)烛亦。
在DL類中,遞歸神經(jīng)網(wǎng)絡(luò)(RNN)是為序列或時(shí)間序列數(shù)據(jù)而設(shè)計(jì)的(Lecun等懂拾,2015)煤禽,可能是對(duì)縱向特征建模的最合適的結(jié)構(gòu)。RNN可以被認(rèn)為是一種存儲(chǔ)狀態(tài)委粉,它保留了網(wǎng)絡(luò)所看到的先前數(shù)據(jù)的信息呜师,并根據(jù)新的信息更新其預(yù)測(cè)。因此贾节,除了預(yù)測(cè)外汁汗,RNN還具有捕獲長期時(shí)間依賴性的能力(Che等,2018)栗涂。最近知牌,RNN在時(shí)間序列或序列數(shù)據(jù)的許多應(yīng)用中取得了驚人的成果,特別是在人文科學(xué)領(lǐng)域(Azizi等斤程,2018角寸;Che等菩混,2018;Lee等扁藕,2019沮峡;Sung等,2019亿柑;Zhong等邢疙,2019)。盡管RNNs具有許多優(yōu)點(diǎn)望薄,但據(jù)我們所知疟游,RNNs還沒有用于植物育種中的基因組預(yù)測(cè)或縱向性狀QTL定位。在此背景下痕支,多性狀分析的多功能DL模型(Montesinos-López O.A.等颁虐,2018年)、多環(huán)境分析(Montesinos-López O.A.等卧须,2018年)和混合表型(二進(jìn)制另绩、有序和連續(xù);Montesinos-López等故慈,2019)的同步預(yù)測(cè)已經(jīng)成功實(shí)施板熊。這種情況不僅令人鼓舞,而且可能導(dǎo)致將來將DL和RNNs整合到作物縱向性狀分析中察绷。DL是一種強(qiáng)有力的方法干签,它有可能改變植物育種的許多領(lǐng)域,因?yàn)樗袧摿μ幚肀揪C述中強(qiáng)調(diào)的所有復(fù)雜問題拆撼。不用說容劳,還需要進(jìn)一步的創(chuàng)新和技術(shù)評(píng)估,使DL能夠充分處理種植育種數(shù)據(jù)的獨(dú)特特性闸度。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末竭贩,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子莺禁,更是在濱河造成了極大的恐慌留量,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,277評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件哟冬,死亡現(xiàn)場離奇詭異楼熄,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)浩峡,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門可岂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人翰灾,你說我怎么就攤上這事缕粹≈擅” “怎么了?”我有些...
    開封第一講書人閱讀 163,624評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵平斩,是天一觀的道長亚享。 經(jīng)常有香客問我,道長绘面,這世上最難降的妖魔是什么虹蒋? 我笑而不...
    開封第一講書人閱讀 58,356評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮飒货,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘峭竣。我一直安慰自己塘辅,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評(píng)論 6 392
  • 文/花漫 我一把揭開白布皆撩。 她就那樣靜靜地躺著扣墩,像睡著了一般。 火紅的嫁衣襯著肌膚如雪扛吞。 梳的紋絲不亂的頭發(fā)上呻惕,一...
    開封第一講書人閱讀 51,292評(píng)論 1 301
  • 那天,我揣著相機(jī)與錄音滥比,去河邊找鬼亚脆。 笑死,一個(gè)胖子當(dāng)著我的面吹牛盲泛,可吹牛的內(nèi)容都是我干的濒持。 我是一名探鬼主播,決...
    沈念sama閱讀 40,135評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼寺滚,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼柑营!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起村视,我...
    開封第一講書人閱讀 38,992評(píng)論 0 275
  • 序言:老撾萬榮一對(duì)情侶失蹤官套,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后蚁孔,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體奶赔,經(jīng)...
    沈念sama閱讀 45,429評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評(píng)論 3 334
  • 正文 我和宋清朗相戀三年勒虾,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了纺阔。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,785評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡修然,死狀恐怖笛钝,靈堂內(nèi)的尸體忽然破棺而出质况,到底是詐尸還是另有隱情,我是刑警寧澤玻靡,帶...
    沈念sama閱讀 35,492評(píng)論 5 345
  • 正文 年R本政府宣布结榄,位于F島的核電站,受9級(jí)特大地震影響囤捻,放射性物質(zhì)發(fā)生泄漏臼朗。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評(píng)論 3 328
  • 文/蒙蒙 一蝎土、第九天 我趴在偏房一處隱蔽的房頂上張望视哑。 院中可真熱鬧,春花似錦誊涯、人聲如沸挡毅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽跪呈。三九已至,卻和暖如春取逾,著一層夾襖步出監(jiān)牢的瞬間耗绿,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評(píng)論 1 269
  • 我被黑心中介騙來泰國打工砾隅, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留误阻,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,891評(píng)論 2 370
  • 正文 我出身青樓晴埂,卻偏偏與公主長得像堕绩,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子邑时,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評(píng)論 2 354