- Zas R. Iterative kriging for removing spatial autocorrelation in analysis of forest genetic trials. Tree Genet. Genomes. 2006;2:177–85.
在未充分阻斷的田間基因試驗(yàn)中空間相關(guān)數(shù)據(jù)的常規(guī)分析可能會(huì)產(chǎn)生嚴(yán)重影響育種決定的錯(cuò)誤結(jié)果旁涤。森林基因試驗(yàn)通常非常大且非常不均勻洞拨,因此微環(huán)境異質(zhì)性的調(diào)整變得不可或缺赠尾。本研究探討使用地統(tǒng)計(jì)學(xué)來(lái)解釋四個(gè)松屬松果Ait的空間自相關(guān)您觉。后代試驗(yàn)建立在丘陵和不規(guī)則的地形竹宋,隨機(jī)完全塊設(shè)計(jì)和大塊救斑。使用基于半變異函數(shù)和克里金法的迭代方法調(diào)整在8歲時(shí)評(píng)估的5種不同性狀的數(shù)據(jù)泵琳,并且與常規(guī)分析相比評(píng)價(jià)對(duì)方差分量心褐,遺傳力和家庭效應(yīng)的估計(jì)的影響舔涎。幾乎所有研究的性狀顯示非隨機(jī)空間結(jié)構(gòu)。因此逗爹,在對(duì)空間自相關(guān)進(jìn)行調(diào)整之后亡嫌,在常規(guī)分析中非常高的塊和族x塊方差分量幾乎消失嚎于。相互作用方差的減少通過(guò)家族方差分量恢復(fù),導(dǎo)致更高的遺傳力估計(jì)挟冠。空間自相關(guān)的消除也影響家庭效應(yīng)的估計(jì)于购,導(dǎo)致在空間調(diào)整后家庭等級(jí)的重要變化。由于家庭效應(yīng)估計(jì)的更高的準(zhǔn)確性知染,家族之間的比較也大大改善肋僧。生長(zhǎng)性狀的分析改善較大,其顯示出最強(qiáng)的空間異質(zhì)性控淡,但對(duì)于其它性狀如直線性或螺旋數(shù)也是明顯的嫌吠。本文演示如何空間自相關(guān)可以大幅度影響森林遺傳試驗(yàn)與大塊的分析。本文提出的迭代克里金程序是解決這種空間異質(zhì)性的有前途的工具掺炭。
介紹
森林遺傳試驗(yàn)(FGT)通常是非常大的辫诅,因?yàn)檫z傳條目的數(shù)量很大并且個(gè)體植物需要大的空間。此外涧狮,F(xiàn)GT通常建立在丘陵和不規(guī)則地形上泥栖,導(dǎo)致復(fù)制塊內(nèi)的空間異質(zhì)性,這可能限制測(cè)試的效率勋篓。事實(shí)上吧享,空間梯度和斑塊性已經(jīng)顯示為FGT中的規(guī)范(Costa-Silva等人2001; Dutkowski等人2002; Fu等人1999; Hamann等人2002; Magnussen 1990),甚至在表觀上(Joyce等人譬嚣,2002年)钢颂。當(dāng)存在空間異質(zhì)性時(shí),近鄰相比遠(yuǎn)離近鄰更相似拜银,即殊鞭,數(shù)據(jù)是自相關(guān)的,并且違反了在標(biāo)準(zhǔn)參數(shù)統(tǒng)計(jì)中的數(shù)據(jù)獨(dú)立性的要求(Legendre 1993)尼桶。盡管已經(jīng)表明遺傳試驗(yàn)中空間相關(guān)觀察的常規(guī)分析可能是災(zāi)難性的(Magnussen 1993a)操灿,但是在數(shù)據(jù)分析中并入空間相關(guān)性正在慢慢地出現(xiàn)。具有小塊的幾個(gè)復(fù)雜的不完全塊(IB)設(shè)計(jì)可以成功地解釋這種空間異質(zhì)性的大部分(Fu等人1998)泵督。這些實(shí)驗(yàn)設(shè)計(jì)中的一些趾盐,如alpha設(shè)計(jì)(Whitaker等人,1999)小腊,在最近的森林遺傳試驗(yàn)中已經(jīng)變得流行救鲤,但是隨機(jī)化完全區(qū)塊設(shè)計(jì)(RCB)仍然在使用,并且是幾十年前建立的FGT中的典型設(shè)計(jì)(Loo-Dinkins 1992; Magnussen 1993b)秩冈。由于FGT的評(píng)估必須延遲本缠,以實(shí)現(xiàn)對(duì)成熟性能的可靠預(yù)測(cè),仍然有許多森林測(cè)試需要RCB和大塊入问,仍然需要評(píng)估丹锹。然而稀颁,IB設(shè)計(jì)的使用可能無(wú)法解釋短距離上的完全空間異質(zhì)性(Magnussen 1990),并且塊邊界和位置變化的實(shí)際模式之間的失配將會(huì)發(fā)生楣黍,而不管采用何種設(shè)計(jì)匾灶,因?yàn)榄h(huán)境變化傾向于連續(xù)和平滑(Dutilleul 1993; Dutkowski等人2002; Ettema和Wardle 2002)。植物間競(jìng)爭(zhēng)可能是老年森林試驗(yàn)的另一個(gè)特殊性锡凝,影響鄰居之間的相關(guān)性(Magnussen 1994)。為了最小化不同遺傳項(xiàng)之間的競(jìng)爭(zhēng)垢啼,F(xiàn)GT通常與多樹(shù)連續(xù)地塊建立(Magnussen 1993b)窜锯。在多樹(shù)連續(xù)圖中,基本環(huán)境協(xié)方差與給定圖中的遺傳協(xié)方差混淆芭析,導(dǎo)致偏倚的遺傳參數(shù)估計(jì)和大塊進(jìn)入塊間相互作用方差锚扎,這可能大大降低現(xiàn)場(chǎng)測(cè)試的精度(Loo -Dinkins 1992)。除了IB設(shè)計(jì)馁启,??已經(jīng)提出了幾種分析方法來(lái)解釋環(huán)境變化并且提高現(xiàn)場(chǎng)遺傳試驗(yàn)的分析的效率驾孔。空間分析惯疙,如趨勢(shì)分析翠勉,鄰居分析或最近鄰分析,已顯示加強(qiáng)農(nóng)業(yè)田間試驗(yàn)的分析霉颠,并在農(nóng)藝學(xué)中變得相當(dāng)普遍(例如对碌,Gilmour等人1997; Grondona等人1996年;喬et al.2000,2004)蒿偎。雖然沒(méi)有如此常用朽们,空間分析方法在森林試驗(yàn)中也給出了成功的結(jié)果(Anekonda和Libby 1996; Costa-Silva等人2001; Dutkowski等人2002; Hamann等人2002; Joyce等人2002; Magnussen 1993a,1994)诉位。
在不同的方法中骑脱,地統(tǒng)計(jì)學(xué)已被證明是一種優(yōu)秀的工具來(lái)模擬土壤性質(zhì)的空間變化(Gallardo 2003; Gallardo和Covelo 2005;López和Arrúe1995年),并且還去除了遺傳試驗(yàn)中的微環(huán)境異質(zhì)性(Hamann et al.2002)苍糠。加利西亞(NW西班牙)是一個(gè)多山和異質(zhì)區(qū)域與酸性和不育森林土壤叁丧。該地區(qū)森林種植的生產(chǎn)力高度依賴(lài)于土壤性質(zhì)(Merino等人2003;Sánchez-Rodríguez等人2002; Zas和Serrada 2003),其已知具有小規(guī)脑啦t?臻g異質(zhì)性(Gallardo 2003; Gallardo和Covelo 2005)歹袁。在四個(gè)RCB松屬pinaster Ait。在加利西亞的后代測(cè)試寝优,這種空間異質(zhì)性反映了總方差的大比例解釋塊之間的差異和一個(gè)大的家庭由塊相互作用(Zas et al条舔。2004a)》Ψ空間自相關(guān)在這些試驗(yàn)中似乎是非常重要的孟抗,所選擇的材料顯示出極端和不協(xié)調(diào)的環(huán)境敏感性迁杨,應(yīng)該進(jìn)一步研究。本研究的目的是1)分析這些后代試驗(yàn)中不同變量的空間結(jié)構(gòu)凄硼,以及2)評(píng)估空間異質(zhì)性對(duì)RCB試驗(yàn)常規(guī)統(tǒng)計(jì)分析效率的影響铅协。空間變異使用半變異函數(shù)和克里金法建模摊沉。提出了基于這些技術(shù)的迭代方法以從數(shù)據(jù)中去除空間異質(zhì)性狐史。
空間分析
因?yàn)椴皇撬械臉?shù)苗都按照規(guī)則網(wǎng)格種植,所以使用在?1:1000尺度的正交航空照片估計(jì)每棵樹(shù)的近似x-y坐標(biāo)说墨。容易地鑒定種植系骏全,并且從照片中獲得每條線的開(kāi)始和結(jié)束的坐標(biāo)。通過(guò)用n-1個(gè)等長(zhǎng)段中的種植線劃分來(lái)確定每條線內(nèi)的樹(shù)的坐標(biāo)尼斧,其中n是給定線中的樹(shù)的數(shù)目姜贡。減去家族效應(yīng)后每個(gè)變量的殘差用于探索數(shù)據(jù)的空間結(jié)構(gòu)。進(jìn)行單向方差分析棺棵,家族效應(yīng)被認(rèn)為是隨機(jī)的楼咳,并且使用SAS系統(tǒng)中的MIXED程序(SAS Institute 1999)獲得家族效應(yīng)的最佳線性無(wú)偏預(yù)測(cè)器(BLUP)。
使用半變異函數(shù)對(duì)所得到的殘差的空間結(jié)構(gòu)進(jìn)行建模烛恤,其將樹(shù)中的半方差作為它們之間的距離的函數(shù)進(jìn)行繪圖(Cressie 1993)母怜。半方差γ(h)計(jì)算為
其中n是由距離h(稱(chēng)為滯后距離)分離的相鄰樹(shù)的對(duì)數(shù),z(si)是位于si處的樹(shù)的測(cè)量的特征值缚柏,z(si + h)是位于距離h糙申。對(duì)于隨機(jī)分布的數(shù)據(jù),當(dāng)h增加時(shí)船惨,將獲得半變化的很小變化柜裸,并且半變異函數(shù)將基本上是平的。如果存在空間依賴(lài)性粱锐,半變異性在短距離上將很小疙挺,將在中間距離處增加,并且將在大距離處達(dá)到漸近線(圖1)怜浅。實(shí)驗(yàn)半變異函數(shù)使用SAS中的VARIOGRAM程序(Sas Institute铐然,1999)構(gòu)建。使用SAS中的NLIN程序恶座,將指數(shù)理論半變異函數(shù)擬合到實(shí)驗(yàn)半變異函數(shù)中(SAS Institute1999)搀暑。該理論半變異函數(shù)用于使用克里金法將殘差的變化劃分為空間自相關(guān)變化和隨機(jī)誤差】缌眨克里金基于由理論半變異函數(shù)定義的空間結(jié)構(gòu)來(lái)計(jì)算空間網(wǎng)格上的值的最佳線性無(wú)偏預(yù)測(cè)的平滑表面自点。在每個(gè)點(diǎn),克里金估計(jì)的值將被解釋為由于空間位置引起的性狀的量脉让。因此桂敛,每個(gè)樹(shù)配置的克里金值用于校正每個(gè)變量相對(duì)于它們的空間變化的原始值功炮。使用KRIG2D SAS程序(SAS Institute 1999)進(jìn)行克里金分析。
討論
本文提出的結(jié)果表明強(qiáng)烈的空間自相關(guān)术唬,可能?chē)?yán)重影響數(shù)據(jù)的遺傳分析薪伏。如前所述,RCB設(shè)計(jì)的塊結(jié)構(gòu)可能不足以說(shuō)明這種空間異質(zhì)性粗仓,并且常規(guī)統(tǒng)計(jì)分析可能導(dǎo)致錯(cuò)誤方差和家族效應(yīng)估計(jì)(Costa-Silva等人2001; Dutkowski等人2002 ; Hamann等人2002; Joyce等人2002; Magnussen 1993a)嫁怀。當(dāng)塊大且存在空間依賴(lài)性時(shí),需要一些空間分析技術(shù)借浊。本文中使用的迭代克里金程序有效地消除了空間變異塘淑,塊和逐塊相互作用方差消失或最終消失。其他空間分析程序巴碗,如最近鄰(NN)調(diào)整朴爬,已被用于解釋空間異質(zhì)性即寒,但已經(jīng)注意到幾個(gè)關(guān)注點(diǎn)橡淆。在NN-協(xié)方差調(diào)整中使用的鄰居數(shù)目(Joyce等人2002)和權(quán)重(Magnussen 1993a)對(duì)分析具有重要影響,并且通常是任意定義的母赵∫菥簦克里金法使用對(duì)應(yīng)于實(shí)際空間依賴(lài)性的比率(范圍)內(nèi)的完整信息來(lái)執(zhí)行空間結(jié)構(gòu)的無(wú)偏估計(jì),并且使用基于點(diǎn)之間的距離和理論半變異函數(shù)(例如凹嘲, Cressie 1993)师倔。克里金法然后可以被認(rèn)為是NN方法的外推,其中在調(diào)整中使用的鄰居的數(shù)量和權(quán)重從數(shù)據(jù)的實(shí)際空間結(jié)構(gòu)最佳地導(dǎo)出周蹭。因此趋艘,克里金估計(jì)是特別由于樹(shù)位置引起的性狀量的更可靠的指示。如本文所觀察到的凶朗,Hamann et al瓷胧。 (2002),分析三個(gè)紅der木基因試驗(yàn)發(fā)現(xiàn)棚愤,單個(gè)克里金步驟搓萧,去除塊效應(yīng),減少了族間的相互作用宛畦,增加了家庭和原產(chǎn)地方差分量瘸洛,遺傳力相應(yīng)增加。然而次和,家庭或出生手段的排序沒(méi)有改變反肋,在本研究中的P pinaster測(cè)試√な空間異質(zhì)性的強(qiáng)度越低囚玫,由較低的co / cn比率和相對(duì)較低的塊方差表示喧锦,可以解釋這些差異。 Costa-Silva et al抓督。 (2001)燃少,包括統(tǒng)計(jì)分析中的空間相關(guān)殘差,還發(fā)現(xiàn)在幾個(gè)FGT中的遺傳方差的增加和與標(biāo)準(zhǔn)分析相關(guān)的遺傳條目的排名的相對(duì)大的變化铃在。 Joyce等人報(bào)道了使用NN方法的類(lèi)似結(jié)果阵具。 (2002)在黑云杉后代試驗(yàn)中,以及Anekonda和Libby(1996)在紅木的克隆試驗(yàn)中定铜。然而阳液,Magnussen(1993a)使用模擬數(shù)據(jù),發(fā)現(xiàn)空間自相關(guān)人為地增加了多單位地塊設(shè)計(jì)中的遺傳方差和遺傳率揣炕。在這些情況下帘皿,空間自相關(guān)可能使絕對(duì)家庭方差膨脹,因?yàn)閱蝹€(gè)圖中的樹(shù)將更相似畸陡,但是這應(yīng)當(dāng)通過(guò)逐個(gè)塊相互作用方差的增加來(lái)清楚地補(bǔ)償(由塊內(nèi)空間異質(zhì)性)鹰溜,導(dǎo)致遺傳力估計(jì)的向下偏差。 Magnussen(1993a)模擬數(shù)據(jù)中的小尺度斑塊結(jié)構(gòu)可能在更大程度上影響家族差異丁恭,而不是逐個(gè)家庭的相互作用變量曹动,這將解釋為什么他沒(méi)有發(fā)現(xiàn)向下偏差遺傳性估計(jì)。在本研究中牲览,家族方差的絕對(duì)值在空間分析后沒(méi)有持續(xù)變化墓陈,但其相對(duì)值有一致的增加(圖5),因此第献,在遺傳力估計(jì)中(表2) 贡必。家族平均值的預(yù)減法可以偏倚遺傳參數(shù)的估計(jì),因?yàn)榄h(huán)境協(xié)方差可以與家庭成員之間的協(xié)方差混淆庸毫,如果一個(gè)家庭發(fā)生在每個(gè)塊中的優(yōu)于平均值的微遺漏中的情況(Joyce等人仔拟。2002; Loo- Dinkins 1992)。然而岔绸,這可能不會(huì)發(fā)生在所有十個(gè)塊的P. pinaster后代試驗(yàn)理逊。這種偏差已被認(rèn)為是在遺傳場(chǎng)數(shù)據(jù)分析中NN調(diào)整的主要約束,但是通過(guò)本文提出的迭代過(guò)程來(lái)克服盒揉。在所有塊中的優(yōu)于平均微陣列中出現(xiàn)的家族將在家族發(fā)生的位置周?chē)目死锝鸸烙?jì)中最初產(chǎn)生向下偏差晋被。然而,家族效應(yīng)的以下估計(jì)將更低刚盈,并且這種偏差將趨向于在進(jìn)一步迭代中消失羡洛。事實(shí)上,在迭代過(guò)程之后殘差的小尺度空間變化對(duì)于內(nèi)行和橫行方向沒(méi)有差異,如相似的各向異性半變量所示(數(shù)據(jù)未示出)欲侮≌赶校考慮到方差分量的變化,家族BLUP的準(zhǔn)確性和在第一步之后保持的家族等級(jí)威蕉,需要迭代過(guò)程是明顯的刁俭。還可以考慮其他收斂標(biāo)準(zhǔn),如去除的共振的變化或BLUP的精度變化韧涨,以完成迭代過(guò)程牍戚。然而,家族等級(jí)的穩(wěn)定性似乎是最嚴(yán)格的標(biāo)準(zhǔn)虑粥,并且在家族等級(jí)穩(wěn)定后如孝,去除的協(xié)方差的變化或BLUP的準(zhǔn)確性不顯著。類(lèi)似地娩贷,Magnussen(1993a)也發(fā)現(xiàn)NN調(diào)整過(guò)程的迭代被證明比非迭代調(diào)整更有效第晰。其他作者在兩個(gè)步驟中對(duì)空間變化進(jìn)行建模:首先,通過(guò)線性回歸來(lái)識(shí)別行和列中的一般梯度彬祖,然后針對(duì)小規(guī)淖率荩空間變化探索去趨勢(shì)殘差(Fu等人1999; Joyce等人2002 )。盡管這樣的兩步分析在空間變異的表征中可能是有利的(Fu等人1999)涧至,在RCB場(chǎng)基因試驗(yàn)的分析中更重要的方面是塊內(nèi)空間異質(zhì)性腹躁,即小規(guī)纳0空間變化南蓬。在一般梯度的情況下,塊設(shè)計(jì)的效率更高哑了。然后應(yīng)將半變異函數(shù)構(gòu)建到與塊大小相似的距離赘方。 Fu et al。 (1999)發(fā)現(xiàn)弱左,球面協(xié)方差模型很好地適合于剪影殘差的高度在50個(gè)66道格拉斯杉木后代試驗(yàn)窄陡,并表明其他方向,而不是行和列的大規(guī)模梯度可能解釋缺乏適合其余網(wǎng)站拆火。如果將原始?xì)埐睿ㄎ慈コ┯糜诎胱儺惡瘮?shù)擬合(如在這種情況下)跳夭,這些大規(guī)模空間變化可以通過(guò)其他理論函數(shù)來(lái)解釋?zhuān)缰饾u到達(dá)漸近線的指數(shù)函數(shù)们镜。然而币叹,應(yīng)該嘗試幾種空間模型,并決定哪種模型是最適合的情況模狭。 SAS提供了幾種空間協(xié)方差模型(球形颈抚,指數(shù),高斯嚼鹉,線性贩汉,功率驱富,嵌套模型等)(SAS研究所,1999)匹舞。另一個(gè)問(wèn)題是褐鸥,當(dāng)試驗(yàn)分成幾個(gè)不同的區(qū)域時(shí),我們應(yīng)該如何進(jìn)行;這是圖2中的情況赐稽。在繪圖邊界附近克里金法的可靠性較小晶疼,因?yàn)橛糜诳死锝鸸烙?jì)的鄰居較少,導(dǎo)致克里格估計(jì)的標(biāo)準(zhǔn)誤差較高又憨。因此翠霍,克里金法將在分割位置或具有不規(guī)則形狀的位置(邊界附近的樹(shù)的比例較高)中表現(xiàn)較差。在幾個(gè)離散區(qū)域的情況下蠢莺,可以為每個(gè)區(qū)域構(gòu)建單獨(dú)的半變異函數(shù)寒匙。在具有本文的離散區(qū)域(位點(diǎn)B和C)的P. pinaster位點(diǎn)中,迭代克里金法似乎是魯棒的躏将,并且使用單獨(dú)的半變異函數(shù)或整個(gè)位點(diǎn)的唯一半變異函數(shù)锄弱,結(jié)果幾乎相同(數(shù)據(jù)未示出)。然而祸憋,在未來(lái)的FGT中應(yīng)當(dāng)避免分割位點(diǎn)或具有不規(guī)則形狀的位點(diǎn)以?xún)?yōu)化空間分析技術(shù)的有效性会宪。生長(zhǎng)性狀最受空間異質(zhì)性影響,但較少受土壤性質(zhì)變化影響的其他性狀蚯窥,如直線度和螺旋數(shù)掸鹅,并不完全沒(méi)有這種現(xiàn)象。除了可能存在的土壤空間依賴(lài)性(del-Ríoet al拦赠。2004)巍沙,主觀評(píng)估的性狀可能受到評(píng)估者(Sierra de Grado et al。1999)的相對(duì)性引起的自相關(guān)性的影響荷鼠, 句携,通過(guò)提出的空間分析程序有效地去除。如Hamann等人(2002)對(duì)于物候特征允乐,當(dāng)存在低空間自相關(guān)時(shí)矮嫉,方差分量和家庭效應(yīng)估計(jì)的減少的變化表明即使在這些情況下應(yīng)用所提出的過(guò)程也幾乎沒(méi)有什么危害。本文結(jié)果表明空間異質(zhì)性如何可以大大影響FGT的遺傳分析與大塊在丘陵和不規(guī)則的地形牍疏。如已經(jīng)指出的(Costa-Silva等人2001; Dutkowski等人2002; Hamann等人2002; Magnussen 1993b蠢笋,1994),在存在空間自相關(guān)的情況下留下未調(diào)整的數(shù)據(jù)是明顯不可接受的麸澜。在不去除空間效應(yīng)的情況下挺尿,當(dāng)規(guī)劃高級(jí)育種策略和錯(cuò)誤估計(jì)遺傳增益時(shí),錯(cuò)誤方差估計(jì)可能導(dǎo)致不幸的決定。家庭選擇也可以受到強(qiáng)烈影響编矾,因?yàn)樵诳臻g調(diào)整后在家庭等級(jí)中觀察到嚴(yán)重的變化熟史。子代試驗(yàn)中用于進(jìn)一步育種的個(gè)體選擇也將被錯(cuò)誤,并且潛在的遺傳收益將丟失窄俏。提出的迭代克里金程序是解決空間異質(zhì)性的有前途的工具蹂匹。雖然這種方法是相當(dāng)艱巨的應(yīng)用,需要很長(zhǎng)時(shí)間來(lái)完成分析凹蜈,計(jì)算機(jī)資源的限制不再是障礙限寞,正如幾年前所討論的(Joyce等人2002; Magnussen 1993a),所有的完整可以使用常見(jiàn)的SAS-STAT軟件包(SAS Institute 1999)進(jìn)行空間分析仰坦。仍然有許多RCB試驗(yàn)與大塊履植,在這種空間調(diào)整是至關(guān)重要的。應(yīng)當(dāng)定期檢查半變異函數(shù)悄晃,以檢驗(yàn)?zāi)P偷臍埐钍欠袷强臻g自相關(guān)的玫霎,在這種情況下,強(qiáng)烈建議使用迭代克里金法去除這種空間異質(zhì)性妈橄。