Lambert2004 空間回歸模型

Lambert DM, Lowenberg-Deboer J, Bongiovanni R (2004) A comparison of four spatial regression models for yield monitor data: A case study from Argentina. Precis Agric 5:579–600. doi: 10.1007/s11119-004-6344-3

數(shù)據(jù)分析和具體地點的建議之間的差距被認為是廣泛采用精密農(nóng)業(yè)技術的主要制約因素之一罩阵。這種差異部分是由于可用于理解作物GIS層的分析技術落后于數(shù)據(jù)收集和存儲技術的發(fā)展的事實颓遏。產(chǎn)量監(jiān)測需纳,傳感器和其他空間密集的農(nóng)藝數(shù)據(jù)通常是自相關的,并且鄰近觀測之間的這種依賴違反了經(jīng)典統(tǒng)計分析的假設。因此屹堰,估計的可靠性可能受到損害。空間回歸分析是更充分地利用空間密集數(shù)據(jù)中包含的信息的一種方式哀蘑。空間回歸技術還可以調(diào)整由空間自相關引起的偏差和無效率葵第。本文的目的是比較四個空間回歸方法绘迁,在可變率技術的經(jīng)濟分析中明確納入空間相關性:(1)從空間計量經(jīng)濟學文獻中采用的回歸方法; (2)多項式趨勢回歸法; (3)經(jīng)典最近鄰分析;和(4)地統(tǒng)計方法。分析中使用的數(shù)據(jù)來自1999年阿根廷科爾多瓦省的可變速率氮試驗卒密。空間回歸方法提供了比普通最小二乘法更強的對氮的玉米產(chǎn)量響應的空間異質(zhì)性的統(tǒng)計學證據(jù)缀台。空間計量經(jīng)濟學分析可以在相對較小的數(shù)據(jù)集上實施哮奇,這些數(shù)據(jù)集沒有足夠的觀測值來估計地統(tǒng)計學所需的半變異函數(shù)膛腐。最近鄰和多項式趨勢分析可以使用GIS軟件中可用的普通最小二乘法來實現(xiàn)。這項研究的主要結果是鼎俘,從這個可變速率氮試驗的邊際分析得出的結論是相似的每個空間回歸模型哲身,雖然每個模型中的空間過程的假設是完全不同的。


介紹
精確農(nóng)業(yè)(PA)已經(jīng)捕獲了生產(chǎn)者和農(nóng)業(yè)企業(yè)的想象力而芥,但采用相對較慢律罢。對于2001年的收獲,約34%的美國玉米地區(qū)是用裝備有產(chǎn)量監(jiān)測器的聯(lián)合收割機收獲的(Daberkow等人棍丐,2002),但是這些組合物中只有約三分之一配備有GPS接收器沧踏,制作收益率圖歌逢。在2000年,大約11%的玉米翘狱,6%的大豆和4%的棉花地區(qū)使用可變施肥量施肥秘案。根據(jù)作物,可變播種和農(nóng)藥施用量占地區(qū)面積的1%-3%。 Bullock等人(2002)確定了缺乏特定作物的作物反應信息阱高,作為采用空間作物管理實踐的限制因素赚导。大多數(shù)可變速率輸入應用程序仍然基于全場(WF)作物響應信息。 Bullock等人認為如果生產(chǎn)者可以更容易地收集和分析特定土壤赤惊,微氣候和管理區(qū)的作物反應吼旧,則PA可能更有利可圖,使用該技術改善環(huán)境績效和食品安全的社會目標可以更多輕松實現(xiàn)未舟。

文獻中報道的大部分作物反應信息已經(jīng)用普通最小二乘法(OLS)和類似的統(tǒng)計工具分析圈暗。但基于OLS估計的產(chǎn)量響應函數(shù)的可靠性可以通過空間自相關數(shù)據(jù)進行比較(Kessler et al。裕膀,1998)员串。用于農(nóng)藝和農(nóng)場實驗的古典統(tǒng)計假設觀察是獨立的。但是昼扛,在PA數(shù)據(jù)的情況下寸齐,這種獨立性的假設是站不住腳的。例如抄谐,任何產(chǎn)量監(jiān)測觀測與其相鄰觀測值明顯相關访忿。因此,田間異質(zhì)性可能是不成比例的斯稳,推斷作物對變化肥率的反應可能會產(chǎn)生誤導海铆。

農(nóng)場試驗研究表明,比較可變速率氮(VRN)與常規(guī)均勻施肥率的實驗分析(Bongiovanni和Lowenberg-DeBoer挣惰,2002; Hurley et al卧斟。,2004.憎茂,Lambert et al珍语。 柱徙,2002)可能導致不準確的結論合蔽,即哪種輸入管理策略最適合具有不同的,可識別的管理區(qū)的領域具篇。在這些研究中拳氢,當考慮空間自相關時募逞,開發(fā)了可變速率技術(VRT)獲利性的更可靠的估計。開發(fā)方法以確定精確農(nóng)業(yè)是否有利可行是一個關鍵步驟是開發(fā)一致和可靠的估計程序馋评,考慮到PA數(shù)據(jù)的空間自相關性質(zhì)放接。從經(jīng)濟角度看,更好的估計轉(zhuǎn)化為更準確的評估特定于站點的管理盈利能力留特【榔ⅲ空間依賴是一種特殊情況玛瘸,其中每個位置的因變量或誤差項與其他位置的因變量或誤差項的觀測值相關(Anselin,1992)苟蹈。在多種背景下(例如糊渊,地理學,農(nóng)學慧脱,區(qū)域經(jīng)濟學和地質(zhì)學)已經(jīng)開發(fā)了模型空間相關性的回歸方法渺绒。本文的主要目的是比較對VRN的收益率,其中利率是基于使用不同空間回歸技術估計的對氮的現(xiàn)場特定玉米產(chǎn)量響應磷瘤。使用四個空間回歸模型和普通最小二乘法(OLS)估計玉米產(chǎn)量反應異質(zhì)性芒篷。

比較的空間回歸技術是:(i)限制最大似然(REML)地統(tǒng)計方法(Cressie,1993; Schabenberger和Pierce采缚,2002); (ii)使用多邊形作為離散觀察單位(或空間自回歸针炉,SAR)的空間回歸方法(Anselin,1988); (iii)多項式趨勢(PTR)方法(Tamura等人扳抽,1988);和(iv)由Papadakis(1937)首先建議的經(jīng)典最近鄰(NN)方法篡帕。每種方法不同地建模空間自相關贸呢×眨空間數(shù)據(jù)的估計技術之間的差異圍繞著假設觀測之間的關系是否被最好地描述為離散或連續(xù)關系(關于這種區(qū)別的細節(jié),見Anselin楞陷,1988)怔鳖。 SAR和NN方法假定空間相關性是特定點或多邊形之間的離散關系。地質(zhì)統(tǒng)計和PTR方法反映了它們在方法中的起源固蛾,用于映射和插值结执,假定空間結構在空間上是連續(xù)的。

在1999 - 2000年作物季節(jié)數(shù)據(jù)分析中提出的經(jīng)驗結果和部分預算是使用替代空間回歸方法時響應估計值有所不同的一個例子艾凯。然而献幔,本案例研究的主要焦點是比較不同模型的空間相關性的替代回歸方法,以及導出特定位點結果的方法趾诗。方法結果旨在作為將各種方法應用于相同數(shù)據(jù)時所發(fā)生的情況的示例蜡感。結果是確定方法之間的關鍵差異的一個步驟。


理論

  • 近鄰法和空間回歸法(NN)
    農(nóng)業(yè)中的經(jīng)典實驗設計是隨機完全區(qū)塊(RCB)恃泪。 RCB設計本質(zhì)上是控制實驗誤差的策略郑兴。由Fisher在20世紀20年代開發(fā),RCB被譽為農(nóng)業(yè)試驗中非均勻?qū)嶒瀱挝坏男U虮茫貏e是關于展示不同土壤類型或排水特性的異質(zhì)景觀杈笔。 Papadakis(1937)通過引入最近鄰法(NN)來回應費舍爾的阻塞方法。在該方法中糕非,從處理塊中的處理j中的子塊i的單個子塊(y ij)的實驗結果從母塊的總體處理平均值(y ij)中減去蒙具。子塊和整個塊值之間的差是yij的實驗誤差。在經(jīng)典NN分析中朽肥,鄰居被垂直地布置:每個觀察具有四個鄰居禁筏。因此,y ij的誤差是其四個相鄰的共享相同邊界的誤差項的平均值衡招。
    Stroup等人(1994)也將NN方法與標準阻斷方法進行比較篱昔。使用網(wǎng)格實驗設計,Vollmann et al始腾。 (2000)使用經(jīng)典的NN方法來識別大豆實驗區(qū)之間的空間模式州刽。他們發(fā)現(xiàn)大豆產(chǎn)量,種子蛋白質(zhì)數(shù)量和種子大小受地塊之間的空間異質(zhì)性的影響浪箭。 Helms等人使用的迭代NN方法(1999)比較塊處理和混合誤差手段比較大豆品種的性能穗椅。使用方差分析(ANOVA),他們發(fā)現(xiàn)在減少由塊內(nèi)空間異質(zhì)性引起的誤差方面奶栖,經(jīng)典阻塞和NN技術之間沒有什么差別匹表。 NN和經(jīng)典實驗設計之間的繪圖方差估計的精度(純誤差)是相似的。 Brownie et al宣鄙。 (1993)描述了NN模型:

其中Y是產(chǎn)量袍镀,l是總平均產(chǎn)量,sij是處理效果冻晤,zij是垂直于yij的最近鄰殘差的集合苇羡,h是產(chǎn)量yij和其zij近鄰的殘差之間的協(xié)方差的斜率系數(shù)。殘差誤差表示為rij = yij鼻弧? ^ Yk设江,其中^ Yk是處理k的總平均值。 yij的NN殘差的平均值被確定為zij = jri;j≥1+ ji1 + j1j + j + 1; j = 4温数。 NN模型的結構如(1)中所示绣硝,是通常用于測試農(nóng)場試驗的治療差異的熟悉的ANOVA模型的結構。方程(1)可以通過將zij插入到解釋變量的nxk矩陣中而被推廣到熟悉的回歸模型中撑刺。這種重新說明是重要的鹉胖,因為本研究的主要興趣是估計位點特異性產(chǎn)量反應氮(N)。 NN模型變?yōu)閥 = Xb + hz + e够傍,其中協(xié)方差參數(shù)h是殘差的鄰域的平均參數(shù)甫菠。等式(1)用OLS估計。

  • 多項式趨勢回歸和空間回歸(PTR)
    Tamura et al冕屯。 (1988)提出了另一種替代方法寂诱,通過在熟悉的ANOVA模型中插入多項式趨勢變量(Tij)來模擬空間依賴性。這種方法與城市和區(qū)域地理學中引起注意的空間擴展回歸方法有些相關(Anselin安聘,1988)痰洒。趨勢面被引入到模型中以捕獲觀察之間的空間關系瓢棒。這種方法假定省略空間依賴性與經(jīng)濟計量文獻中省略的變量問題類似。通過在ANOVA模型中包括趨勢變量來處理省略的變量問題丘喻。像Papadakis提出的NN方法一樣脯宿,Tamura等人的PTR模型被開發(fā)以解決未通過常規(guī)阻塞技術處理的空間結構化誤差過程。利用回歸模型對多項式響應面的同時估計將由空間相關性引起的系統(tǒng)誤差分量與eij的非系統(tǒng)部分分離開(Kirk等人泉粉,1980)连霉。參數(shù)估計只針對剩余的隨機分量eij。實際上嗡靡,假設由多項式表達式指定的趨勢面具有正確的規(guī)格跺撼,則將觀察i與j相關的坐標系添加到以多項式表示的熟悉的回歸模型y = Xb + e中消除了省略的變量問題。所討論的省略的變量將是解釋誤差殘差中的空間結構的變量讨彼。 PTR模型指定為
    其中Y為產(chǎn)量歉井,l為總均值,sk為處理效應点骑,T為多項式趨勢酣难,e為獨立同分布(i.i.d)隨機誤差分量。二次趨勢項估計為
    其中ui是觀測值yij的笛卡爾(x黑滴,y)坐標的斜率系數(shù)憨募。 (x,y)坐標表示為行/列對袁辈。與NN方法類似菜谣,PTR方法被開發(fā)用于控制空間依賴性的治療效果的ANOVA。在本研究中晚缩,目的是確定在空間變化的地形上玉米對氮的邊際響應的差異尾膊。為了實現(xiàn)這個目標,PTR模型重寫為荞彼,然后用熟悉的回歸估計
    方程y = xb + e冈敛,包括(x,y)坐標鸣皂,它們的平方和它們在X中的相互作用抓谴。使用OLS估計模型。

  • 空間回歸地質(zhì)統(tǒng)計方法(REML)
    許多農(nóng)學家使用地球統(tǒng)計工具來模擬作物和土壤空間關系寞缝。也許這是因為土壤科學與地質(zhì)學之間的學科聯(lián)系癌压。最初,地統(tǒng)計學被開發(fā)用于通過觀測之間的插值產(chǎn)生地圖荆陆。為了便于繪制滩届,地統(tǒng)計學假定空間變異性是由半變異函數(shù)模型化的距離的連續(xù)函數(shù)。在地統(tǒng)計框架中被啼,在給定點的變量(例如帜消,作物GIS中的層)之間的關系的推理測試已經(jīng)發(fā)展相對最近棠枉。 Cressie(1993)介紹了REML地質(zhì)統(tǒng)計方法。 Little et al券犁。 (1996)和Schabenberger和Pierce(2002)闡述了這種方法术健,這需要估計經(jīng)驗半變異函數(shù)汹碱,然后在回歸模型中使用半變異函數(shù)參數(shù)估計作為先驗粘衬,以表征觀察之間的空間相關性。 Cressie(1993)和Schabenberger和Pierce(2002)概述的REML地質(zhì)統(tǒng)計方法已用于分析小麥雜交試驗(Stroup等咳促,1994)稚新,北卡羅來納州嬰兒猝死綜合征(SIDS)的模式分析(Cressie, 1993)和土壤中的重金屬(Schabenberger和Pierce跪腹,2002)褂删。 Lambert et al。 (2002)使用REML地質(zhì)統(tǒng)計方法來分析產(chǎn)量監(jiān)測數(shù)據(jù)冲茸。 Hurley et al屯阀。 (2004)采用了類似的方法結合地質(zhì)統(tǒng)計學和回歸技術來分析美國明尼蘇達州的VRN玉米試驗。他們估計土壤測試轴术,地形圖和玉米遙感信息的利潤率难衰,使用半變異函數(shù)進行模型空間誤差過程。 Lark和Wheeler(2003)使用該模型的變體來估計歐洲的大麥產(chǎn)量響應逗栽。半變異函數(shù)是REML-地質(zhì)統(tǒng)計回歸模型的主干盖袭。
    半變異函數(shù)參數(shù)(范圍,nugget和sill)被估計彼宠,然后用作先驗模型回歸協(xié)方差矩陣鳄虱。回歸模型與熟悉的模型y = Xb + e估計凭峡,但空間協(xié)方差(R)通過R = Var(e)建模拙已,其中Var(e)
    2 + rs2F,F(xiàn)是N·N矩陣摧冀,其第i倍踪,j個元素由距離衰減函數(shù)表征,并且rn2和rs2是核函數(shù)和半變異函數(shù)估計按价,I是單位矩陣(Little等人惭适, 1996)。 REML參數(shù)估計是針對空間自相關調(diào)整的估計廣義最小二乘(EGLS)估計楼镐。如果空間相關性存在于OLS殘差中癞志,則基于OLS和REML模型的對數(shù)似然性的-2倍的差異的似然比(LR)測試(v2(2)變量)的零假設被拒絕et al。框产,1996)凄杯。在本研究中错洁,OLS殘差的魯棒半變異函數(shù)(Cressie,1993)使用SAS中的VARIOGRAM程序(2000)進行估計戒突。在Cressie(1993)之后屯碴,使用加權非線性最小二乘法(WNLS)來估計OLS殘差的半變異函數(shù)。使用SAS(2000)中的MIXED過程估計REML回歸膊存。

  • 離散空間回歸法(SAR)
    離散空間回歸方法假定空間依賴是離散觀察或多邊形之間的關系导而。空間結構可以在因變量(例如隔崎,產(chǎn)量)或回歸殘差中找到今艺。空間結構被建模爵卒,假設因變量或殘差是相鄰觀測值的加權平均值的函數(shù)虚缎。這種方法已廣泛用于流行病學,地理學和區(qū)域經(jīng)濟學钓株。在農(nóng)業(yè)中实牡,數(shù)據(jù)的結構是類似的,但多邊形通常是土壤類型或管理區(qū)域轴合,而不是州创坞,縣,地區(qū)或社區(qū)值桩。這種方法使用多邊形數(shù)據(jù)摆霉,實現(xiàn)空間結構的同時最大似然估計和GIS層之間的關系。構造空間權重矩陣以識別數(shù)據(jù)集中的鄰居奔坟。矩陣被設計為將諸如重力携栋,熵或衰變的過程并入回歸模型中(Anselin,1988)咳秉。以規(guī)則矩形網(wǎng)格排列的數(shù)據(jù)使用三個標準來定義:“bishop”婉支,“rook”或“queen”。這些類描述了多邊形之間的鄰接級別或共同邊界澜建。根據(jù)Bongiovanni和Lowenberg-DeBoer(2000)向挖,本研究中的SAR回歸使用“皇后”標準:單個網(wǎng)格單元具有與一個或多個其他單元共同的邊界和角。在空間術語中炕舵,鄰接性被定義為將一個細胞與另一個細胞分開的距離的函數(shù)何之。屬于同一鄰域的塊共享相同的權重,覆蓋整個網(wǎng)格的鄰域的復合定義空間權重矩陣咽筋。該矩陣(W)是N·N溶推,具有元素wij的正定矩陣,以及沿著對角線的零。在使用空間權重矩陣來估計回歸模型中的空間效應之前蒜危,它們是行標準化的虱痕。這有助于比較鄰域的空間特性。行中的每個元素都由行和除辐赞。 Anselin(1988)確定了兩個一般模式部翘,空間依賴可能表現(xiàn)在回歸分析:空間滯后和空間誤差。如果忽略空間誤差過程响委,OLS估計是低效的新思,但仍然是無偏的。如果忽略空間滯后過程晃酒,那么OLS估計是不一致和有偏差的表牢。當與相關聯(lián)的空間矩陣相關地估計回歸模型時,確定這些效應的存在贝次。確定空間自相關的存在的第一步驟需要估計與相關聯(lián)的空間矩陣組合的標準OLS模型y = Xb + e。通過將空間權重矩陣W結合到回歸模型中彰导,為滯后(誤差)分類確定因變量yi(ei)與相鄰yj(ej)之間的關系蛔翅。對于滯后過程,模型回歸模型變?yōu)閥 = qWy + Xb + e;其中q為相鄰yj的自回歸移動平均參數(shù)位谋∩轿觯空間誤差模型被指定為y = xb + e,其中e = kWe + u掏父,其中u表示良好行為笋轨,非異方差,不相關的誤差赊淑。 bi是對空間自相關校正的EGLS估計爵政。拉格朗日乘數(shù)測試(LM,作為v2(1)變量分布)可以用于檢測OLS殘差中空間相關性的存在陶缺。 LMerror測試的替代方案是殘差遵循空間模式钾挟,而LMlag測試的替代方案是解釋性和/或因變量的個體觀察與給定鄰域中相同變量的其他值的平均值相關的觀察。拒絕LMlag測試的null意味著我們面臨一個省略的變量問題; OLS估計是有偏差和不一致的饱岸。如果我們拒絕LMerror測試的null掺出,我們面臨一個效率問題; OLS估計沒有偏差,但它們是低效的

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末苫费,一起剝皮案震驚了整個濱河市汤锨,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌百框,老刑警劉巖闲礼,帶你破解...
    沈念sama閱讀 222,104評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡位仁,警方通過查閱死者的電腦和手機柑贞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來聂抢,“玉大人钧嘶,你說我怎么就攤上這事×帐瑁” “怎么了有决?”我有些...
    開封第一講書人閱讀 168,697評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長空盼。 經(jīng)常有香客問我书幕,道長,這世上最難降的妖魔是什么揽趾? 我笑而不...
    開封第一講書人閱讀 59,836評論 1 298
  • 正文 為了忘掉前任台汇,我火速辦了婚禮,結果婚禮上篱瞎,老公的妹妹穿的比我還像新娘苟呐。我一直安慰自己,他們只是感情好俐筋,可當我...
    茶點故事閱讀 68,851評論 6 397
  • 文/花漫 我一把揭開白布牵素。 她就那樣靜靜地躺著,像睡著了一般澄者。 火紅的嫁衣襯著肌膚如雪笆呆。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,441評論 1 310
  • 那天粱挡,我揣著相機與錄音赠幕,去河邊找鬼。 笑死抱怔,一個胖子當著我的面吹牛劣坊,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播屈留,決...
    沈念sama閱讀 40,992評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼局冰,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了灌危?” 一聲冷哼從身側(cè)響起康二,我...
    開封第一講書人閱讀 39,899評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎勇蝙,沒想到半個月后沫勿,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,457評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,529評論 3 341
  • 正文 我和宋清朗相戀三年产雹,在試婚紗的時候發(fā)現(xiàn)自己被綠了诫惭。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,664評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡蔓挖,死狀恐怖夕土,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情瘟判,我是刑警寧澤怨绣,帶...
    沈念sama閱讀 36,346評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站拷获,受9級特大地震影響篮撑,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜匆瓜,卻給世界環(huán)境...
    茶點故事閱讀 42,025評論 3 334
  • 文/蒙蒙 一赢笨、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧陕壹,春花似錦质欲、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,511評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽怎憋。三九已至又碌,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間绊袋,已是汗流浹背毕匀。 一陣腳步聲響...
    開封第一講書人閱讀 33,611評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留癌别,地道東北人皂岔。 一個月前我還...
    沈念sama閱讀 49,081評論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像展姐,于是被迫代替她去往敵國和親躁垛。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,675評論 2 359

推薦閱讀更多精彩內(nèi)容