起了個(gè)大早做這張導(dǎo)圖疯趟,不知道會(huì)不會(huì)嚇到大家拘哨。有一周沒(méi)有更新我們的《數(shù)量生態(tài)學(xué)筆記》了,因?yàn)檫@一章還是蠻有難度的信峻,書中就是說(shuō)這一章我們來(lái)講典范排序倦青,然后就直接講RDA了№镂瑁看RDA一會(huì)排序一會(huì)回歸产镐,書中的每一個(gè)漢字都認(rèn)識(shí),放在一起的一個(gè)句子就不懂了踢步。這基本上就是我的一個(gè)狀態(tài)癣亚,所以就沒(méi)更新。
本來(lái)以為只要多查些資料就好了获印,多看嘛述雾,總會(huì)理解的。看張金屯老師的《數(shù)量生態(tài)學(xué)》有知道典范排序(約束排序)是在非約束排序分析的每一步與環(huán)境因子進(jìn)行回歸玻孟,再將回歸系數(shù)結(jié)合到下一步的排序值得計(jì)算之中唆缴。其中與環(huán)境因子的結(jié)合方式如下:
式中,為第
個(gè)樣方的排序值黍翎;
為截距面徽;
為第
個(gè)環(huán)境因子的回歸系數(shù)(
為環(huán)境因子的數(shù)目)可用多元線性回歸求得;
為第
個(gè)環(huán)境因子的觀測(cè)值匣掸。
可以看出趟紊,典范排序不再是被動(dòng)加入解釋變量,而是從排序開(kāi)始直接加入解釋變量進(jìn)行計(jì)算旺聚。與非約束排序不同的是织阳,典范排序只是提出和展示與解釋變量有關(guān)的數(shù)據(jù)結(jié)構(gòu),并可以通過(guò)統(tǒng)計(jì)檢驗(yàn)方法檢驗(yàn)解釋變量與響應(yīng)變量之間關(guān)系的顯著性砰粹。
不管怎么說(shuō)我們講典范排序就離不開(kāi)多元回歸模型唧躲,因?yàn)?/p>
回歸 + 非約束排序 = 典范排序
線性多元回歸模型
所以我找來(lái)同樣是賴?yán)蠋煼g的《基于 CANOCO 的生態(tài)學(xué)數(shù)據(jù)的多元統(tǒng)計(jì)分析 》第五章5約束排序與置換檢驗(yàn)(Constrained Ordination and
Permutation tests),在這里和大家分享一下其中的部分內(nèi)容碱璃。
首先弄痹,我們必須回顧一下傳統(tǒng)的線性回歸模型,因?yàn)檫@對(duì)于我們理解“直接梯度分析”(約束排序)相當(dāng)重要嵌器。圖5-1展示的是最簡(jiǎn)單的線性回歸模型肛真,線性模型可以模擬響應(yīng)變量依賴自變量
的程度。圖5-1中不僅有擬合回歸線爽航,也展示了模擬值和實(shí)測(cè)值之間的差別蚓让。模擬值
(回歸線上的值)與實(shí)測(cè)值
之間的差值叫做回歸殘差(regression residual),用e表示。所有的統(tǒng)計(jì)模型(statistical models,包括回歸模型)有個(gè)重要的特征是它們都有兩個(gè)主要的部分構(gòu)成:系統(tǒng)組成部分(systematic component)表示響應(yīng)變量中能被一個(gè)或更多的解釋變量(模型)解釋的部分讥珍,這部分用帶參數(shù)的函數(shù)表示历极。另外一部分就是隨機(jī)部分(stochastic
component),表示不能被目前解釋變量(模型)所能解釋的部分衷佃。隨機(jī)部分通常用概率和分布特性來(lái)定義趟卸。
我們通常通過(guò)響應(yīng)變量有多少能夠被系統(tǒng)組成部分解釋來(lái)評(píng)估擬合模型的好壞。也經(jīng)常將能被解釋和未被解釋的部分進(jìn)行比較氏义。目的在于锄列,盡力去構(gòu)建一個(gè)最簡(jiǎn)約的回歸模型來(lái)解釋最多的變化量,讓所有的自變量對(duì)于響應(yīng)變量的解釋都有顯著貢獻(xiàn)惯悠。我們可以通過(guò)逐步迭代(回歸)(stepwise selection)的方式來(lái)選擇解釋變量(環(huán)境變量)的子集合邻邮,在排序術(shù)語(yǔ)中往往叫預(yù)選(forward selection)。預(yù)選變量的過(guò)程是無(wú)響應(yīng)變量的零和假設(shè)開(kāi)始吮螺,零和假設(shè)是響應(yīng)變量中沒(méi)有可以被解釋變量預(yù)測(cè),而僅僅由隨機(jī)變量解釋饶囚。當(dāng)我們選擇一個(gè)解釋變量(環(huán)境變量)進(jìn)入分析帕翻,可以導(dǎo)致回歸模型能解釋一部分響應(yīng)變量÷芊纾可以根據(jù)所加入的變量所能解釋部分的大小來(lái)確定是否選擇的該環(huán)境變量嘀掸。另外,需要用隨意置換(randomly swap)環(huán)境
因子的值來(lái)檢驗(yàn)這種解釋量是偶然的规惰,還是真的為環(huán)境變量所解釋? 如果被檢驗(yàn)的變量所能解釋的部分被證明是非隨機(jī)的(統(tǒng)計(jì)顯著), 我們就可以接受這個(gè)變量睬塌。可以重復(fù)這個(gè)過(guò)程歇万,再進(jìn)一步從剩下的變量中選擇另外更好的變量揩晴,直到選擇具有足夠的變量為止。
約束排序模型 (Constrained ordination model)
非約束的排序(PCA 和CA)被定義為尋找潛在的梯度代表最優(yōu)的解釋變量(預(yù)測(cè)器)來(lái)擬合物種的回歸模型贪磺。
約束排序跟非約束的排序有一個(gè)很大的區(qū)別硫兰,非約束排序是虛擬的(潛在的)梯度、而約束排序的梯度是明確給出的寒锚。這些梯度(排序軸)是參與排序的環(huán)境變量的線性組合劫映。因此我們通過(guò)合成變量(排序軸)盡力解釋物種的多度變化,這些合成變量是實(shí)測(cè)環(huán)境變量的線性組合刹前。
因此泳赋,約束排序方法(RDA和CCA)類似于多元多重回歸。但在多元多重回歸中喇喉,如果有個(gè)響應(yīng)變量祖今,
個(gè)環(huán)境因子,我們必須估計(jì)出
個(gè)的參數(shù)(回歸系數(shù))(每個(gè)方程需要
個(gè)參數(shù)拣技,
個(gè)方程自然是需要
個(gè)的參數(shù))千诬。然而,在約束排序里面膏斤,不必這么麻煩大渤,環(huán)境因子對(duì)于響應(yīng)變量的影響被集中在幾個(gè)合成的梯度(排序軸),也叫典范軸(canonical axes)掸绞。典范軸的數(shù)量是跟獨(dú)立解釋變量的數(shù)量一樣多,但是我們經(jīng)常使用前面幾軸耕捞。如果環(huán)境因子和物種的數(shù)量很少的時(shí)候衔掸,是不必做約束排序的,做普通回歸即可俺抽,
和
比較多的時(shí)候敞映,約束排序的優(yōu)勢(shì)才能展示出來(lái)。
如果有協(xié)變量(covariables)磷斧,我們經(jīng)常使用偏分析(partial analyses)振愿。有協(xié)變量情況捷犹,表示我們要將這些協(xié)變量的所能解釋的部分先剔除出去。協(xié)變量在方差分析中也有相同的用法冕末,通常是把量化的協(xié)變量作為一種因子處理萍歉。而在傳統(tǒng)的回歸中,協(xié)變量的概念是不常用的档桃,協(xié)變量與真變量沒(méi)有什么不同枪孩,叫法不同而已。
別怕藻肄,這些概念都會(huì)在我們的典范排序的筆記中給到大家的蔑舞。不管怎么排序,就記住一條就好:在排序空間內(nèi)嘹屯,離得越近的關(guān)系越近攻询。
參考:
Ordination Methods - an overview
Canonical ordination
基于 CANOCO 的生態(tài)學(xué)數(shù)據(jù)的多元統(tǒng)計(jì)分析|第五章
Multiple Linear Regression - MLR
Multiple Linear Regression