1. 起源——checkerboard distribution
在一項關(guān)于新幾內(nèi)亞島(New Guinea)及其周邊島嶼的鳥類群落的研究中铆铆,Diamond聲稱找到了鳥類物種分布的構(gòu)建原則,說到“某些物種從未共存過潮梯,不管是二者共存客税,還是與其他物種一起共存”。例如蹈胡,麥金萊杜鵑鴿(Macropygia mackinlayi)和斑尾杜鵑鴿(Macropygia nigrirostris)渊季,盡管二者生態(tài)習(xí)性相似,分布區(qū)也存在重疊罚渐,但是二者卻從未在俾斯麥群島上某個島嶼上共存過却汉。Diamond將這種分布模式稱為“棋盤分布(checkerboard distribution)”,意指二者像checkerboard上的黑白格一樣荷并,雖交錯分布合砂,卻毫無關(guān)聯(lián)。Diamond認(rèn)為源织,兩種杜鵑鴿對有限資源的競爭是導(dǎo)致這種分布模式的原因之一翩伪。
然而,其他生態(tài)學(xué)家認(rèn)為僅僅從空間分布模式上推斷二者存在競爭排斥很草率谈息。Connor和Simberloff認(rèn)為幻工,要證明競爭導(dǎo)致了棋盤分布,首先要證偽一個零假設(shè)(null hypothesis)黎茎,即棋盤分布是由于鳥類隨機定居造成的。如何建立一個零假設(shè)模型当悔?他們策略是傅瞻,在某種限制下,將物種隨機放置在俾斯麥群島的一個小島盲憎,然后計算任意小島上從未共存鳥類物種對的數(shù)量嗅骄。如果這樣的物種對數(shù)量的期望值與俾斯麥群島實際觀測到的物種對數(shù)據(jù)不存在統(tǒng)計差異,那么就不能拒絕零假設(shè)饼疙,即不能否定隨機定居的作用溺森,而將棋盤分布?xì)w因于競爭排斥。Connor和Simberloff的挑戰(zhàn)招來了Diamond及其同事的極力反駁窑眯;同樣屏积,Simberloff及其同事也針鋒相對。這場持續(xù)的爭辯一直到今天也沒有停止磅甩。而伴隨著這場爭論炊林, Simberloff提出的策略在生物科學(xué)中非常廣泛地應(yīng)用開來。
2. 構(gòu)建零模型——certain constraints
在Connor和Simberloff的設(shè)計中卷要,物種被隨機置放于各個小島中渣聚。這即是形成了一個個隨機矩陣独榴,如下圖所示。那么奕枝,對于有m個物種棺榔,n個小島的觀測數(shù)據(jù)來講,即存在2mn個隨機矩陣隘道。但是症歇,但是,在實際應(yīng)用中薄声,物種隨機擱置形成的矩陣要服從一定限制当船。Connor和Simberloff提出了以下三種限制:
- 對于某個小島,物種數(shù)等于該小島的實際觀測物種數(shù)
- 對于某個物種默辨。其在所有小島的出現(xiàn)次數(shù)等于實際觀測的出現(xiàn)次數(shù)
-
物種只隨機放置于該物種實際出現(xiàn)的島嶼中
前二者很好理解德频,對應(yīng)列聯(lián)表中的列和、行和缩幸。第三個限制就比較復(fù)雜壹置,一些物種的分布區(qū)較廣,而另一些物種可能僅分布在特定的島嶼表谊。因此第三個是更為嚴(yán)格的限制钞护。Tello文章中給出的零模型構(gòu)建函數(shù)“assemblages.from.pool.randA”,專門設(shè)置了“fix.local.abund=TRUE”和“fix.rSAD=TRUE”兩個參數(shù)爆办,這兩個參數(shù)即是上面所述隨機矩陣的限制條件难咕。Tello在代碼中,詳細(xì)注釋了這兩個參數(shù)的含義:
- fix.local.abund - TRUE/FALSE argument that determines whether the abundances in local assemblages (row sums) will be constrained to be the same as in the empirical data.
- fix.rSAD - TRUE/FALSE argument that determines whether the regional species abundance distribution (SAD; column sums) will be constrained to be the same as in the empirical data. If FALSE, individuals are randomly re-assigned to species before they are re-distributed among local assemblages. The default is TRUE.
3.模擬數(shù)據(jù)與實測數(shù)據(jù)比較——statistical testing
通過零模型產(chǎn)生模擬數(shù)據(jù)與俾斯麥群島的實測數(shù)據(jù)進(jìn)行統(tǒng)計檢驗距辆,來決定是否拒絕零假設(shè)余佃。通過若干次迭代,我們能夠得到俾斯麥群島中每個小島的非共存物種對的數(shù)量分布(即null distribution)跨算,它描述了非共存物種對數(shù)目期望值的可能性爆土。據(jù)此,我們可以計算該分布的均值和標(biāo)準(zhǔn)差诸蚕,進(jìn)而與實際觀測數(shù)據(jù)進(jìn)行比較步势。如果二者之間不存在顯著差異,那么就認(rèn)為棋盤分布的存在與隨機定居是一致的背犯;反之坏瘩,則認(rèn)為我們不能否認(rèn)競爭排斥的作用。
4. 爭論——critical evaluation
4.1 技術(shù)爭論:Diamond反駁之稀釋效應(yīng)
Diamond和Gilpin認(rèn)為漠魏,種間競爭僅發(fā)生在功能團內(nèi)部(guild)桑腮,即對資源需求存在重疊的物種才存在競爭。而Connor和Simberloff的隨機化策略包含了整個鳥類蛉幸,這樣功能團內(nèi)部的競爭作用被一系列生態(tài)習(xí)性差異較大的物種所形成的不相關(guān)數(shù)據(jù)所稀釋破讨。這是Connor和Simberloff所構(gòu)建模型存在的問題丛晦,而并不是零假設(shè)模型應(yīng)用的問題。因此提陶,Connor在其最新的研究中接受這個批判烫沙,并改正了模型。
4.2 技術(shù)爭論:Diamond反駁之零假設(shè)模型隱含的競爭效應(yīng)
在Connor和Simberloff所構(gòu)建的零假設(shè)模型中隙笆,物種的隨機擱置存在上述的三種限制锌蓄。Diamond和Gilpin認(rèn)為,限制2和限制3本身就受到競爭的影響撑柔,那么屈從于這種限制的零假設(shè)模型也就實際上包含了某些競爭因素瘸爽,這使得零假設(shè)模型不再“null”。只要零假設(shè)模型存在這些限制铅忿,那么這個問題就一直存在剪决。
4.3 Null models替代“對照”?
零假設(shè)檢驗(null hypothesis testing)并非生態(tài)學(xué)專屬檀训,而來自于統(tǒng)計學(xué)(請參閱《女士品茶》)柑潦。目前的統(tǒng)計檢驗都包含null hypothesis和alternative hypothesis(Neyman假設(shè)檢驗)。然而峻凫,傳統(tǒng)統(tǒng)計檢驗并不需要null models渗鬼;而Connor和Simberloff所建立的零假設(shè)模型中,null models是必須的(如下圖)荧琼。那么第一個問題來了譬胎,為什么零假設(shè)模型需要多次迭代的null models。在傳統(tǒng)假設(shè)檢驗中命锄,研究人員搜集處理組和對照的數(shù)據(jù)堰乔,通過假設(shè)檢驗來確定二者是否存在差異。但是累舷,在很多生態(tài)學(xué)案例中,二者之間的對立關(guān)系通常是缺失的夹孔。例如被盈,在描述上面提及的鳥類共存的棋盤分布中,我們感興趣的是競爭是否能導(dǎo)致這種分布搭伤。在實際世界中只怎,我們不可能找到一個群島作為對照,即物種的分布是完全不存在競爭的怜俐。Connor和Simberloff所提的null models目的是為了建立一個隨機的模擬分布身堡,這其中競爭作用被完全排除。因此拍鲤,零假設(shè)模型中null model是“對照”的替代贴谎,這樣empirical data和simulated data就可以進(jìn)行假設(shè)檢驗汞扎。
4.4 完全互斥和窮舉性原則
統(tǒng)計假設(shè)檢驗中零假設(shè)和備擇假設(shè)必須是完全互斥的(mutually exclusive)、窮舉的(collectively exhaustive)擅这。例如澈魄,高血壓藥物的降壓效果中研究中,即是探討高血壓藥物與血壓高低的因果關(guān)系仲翎。那么這個問題的零假設(shè)可以是二者存在因果關(guān)系痹扇,而備擇假設(shè)是二者沒有因果關(guān)系。盡管血壓降低也能夠由其他因素造成(心情溯香、運動等)鲫构,但是考慮到我們關(guān)注高血壓藥物的作用,因此這些額外因子的作用并不是這個問題容許假設(shè)玫坛,也就并沒有破壞窮舉性的原則结笨。
現(xiàn)在回到Connor和 Simberloff零假設(shè)模型,那么棋盤分布問題的零假設(shè)和備擇假設(shè):
- H0棋盤分布是隨機定居造成的結(jié)果
- H1棋盤分布是由于競爭作用造成的
這里的null models目的在于產(chǎn)生一個將特定機制排除在外的模擬系統(tǒng)昂秃,即滿足完全互斥的原則禀梳。因此,H0不應(yīng)包含任何競爭因素肠骆,并要包含除競爭外的其他因素算途。然而,上面4.2提及的問題恰恰破壞了這個原則蚀腿。并且null models也并不能包含除競爭以外的所有其他因素嘴瓤。對零假設(shè)模型的null models解釋,Gotelli和Graves這樣說到:“A null model is a pattern-generating model that is based on randomization of ecological data or random sampling from a known or imagined distribution. The null model is designed with respect to some ecological or evolutionary process of interest. Certain elements of the data are held constant, and others are allowed to vary stochastically to create new assemblage patterns. The randomization is designed to produce a pattern that would be expected in the absence of a particular ecological mechanism.” 同時莉钙,Sloep也強調(diào)廓脆,H0和H1并不是合適的零假設(shè)和備擇假設(shè),因為H0并不滿足的完全互斥原則磁玉。
Zhang認(rèn)為二者在同一時間不能同為真停忿,所以滿足完全互斥;但是二者不滿足窮舉性原則蚊伞。Zhang認(rèn)為席赂,決定物種共存的答案絕不止競爭一個,諸如擴散能力时迫、環(huán)境偏好颅停、對捕食者和病菌的響應(yīng)等等都會影響物種共存。因此掠拳,H0和H1并不能窮舉導(dǎo)致物種共存的所有容許假設(shè)(如下圖所示)癞揉,這造成了拒絕任意一個假設(shè),都不能夠完全支持另一個假設(shè)。具體地喊熟,拒絕棋盤分布的隨機性成因柏肪,并不能使我們得出競爭導(dǎo)致棋盤分布的結(jié)論。因此逊移,由于面對的目標(biāo)不一致预吆,傳統(tǒng)的統(tǒng)計假設(shè)檢驗與零假設(shè)模型在窮舉性原則上存在差異。傳統(tǒng)假設(shè)檢驗旨在確定一個關(guān)系胳泉,即關(guān)系存在與否拐叉,這滿足了窮舉性。而零假設(shè)模型則更多傾向于即是生態(tài)模式扇商、生態(tài)現(xiàn)象凤瘦,而對于模式和現(xiàn)象的解釋可以有很多種,這會違背窮舉性原則案铺。
對于零假設(shè)和備擇假設(shè)不匹配的問題蔬芥,我們可以轉(zhuǎn)換思路。以棋盤分布為例控汉,我們可以對備擇假設(shè)H1進(jìn)行修正為“零假設(shè)H0的邏輯否定”笔诵,即棋盤分布不是由于隨機定居造成的。這樣修正之后的H1與H0就滿足了窮舉性原則姑子。值得注意的是乎婿,這樣修正之后,問題的重點就變了——“棋盤分布是否由于隨機定居造成”街佑。在技術(shù)層面谢翎,修正后的備擇假設(shè)和零假設(shè)滿足了統(tǒng)計假設(shè)的原則。但是沐旨,同時也忽視了其他因子效應(yīng)森逮。零假設(shè)模型對其他變量因子并沒有進(jìn)行有效控制。此外磁携,數(shù)據(jù)集的大小也存在差異褒侧。經(jīng)過多次迭代,null models形成了較大的數(shù)據(jù)集谊迄,而實測數(shù)據(jù)僅僅一個闷供。這種數(shù)據(jù)集之間的差異會不會對最終的假設(shè)檢驗結(jié)果產(chǎn)生影響?這也是未知問題鳞上。
4.5 爭論的蔓延
上述問題在物種分布模式這個群落生態(tài)學(xué)問題上依然延續(xù)開來这吻。物種分布模式的傳統(tǒng)解釋是生態(tài)位分化吊档,即每個物種有一系列不同的性狀篙议,適應(yīng)特定的環(huán)境,并占據(jù)特定的生態(tài)位。不同的物種能夠共存是因為它們的生態(tài)位存在差異并且利用資源的方式不同鬼贱。這是Chase等人關(guān)于生態(tài)位分化影響物種分布格局的核心思想移怯。而Hubbell的中性理論提出與之相反的生物多樣性格局解釋。Hubbell認(rèn)為個體之間不存在差異这难,具有生態(tài)等價性舟误,它們有相同的出生、死亡姻乓、遷入和遷出幾率嵌溢。Hubbell將中性假設(shè)作為一個與生態(tài)位理論相對應(yīng)的零假設(shè)。
Reference:
本文譯自
The use and limitations of null?model?based hypothesis testing
https://link.springer.com/article/10.1007/s10539-020-09748-0
5. 零假設(shè)模型之beta deviation
# 所需函數(shù)如下蹋岩,具體代碼自行下載(文末參考文獻(xiàn))
assemblages.from.pool.randA <- function(compo, rand.N=999, fix.local.abund=TRUE, fix.rSAD=TRUE, save.output=FALSE, save.format="matrices", path.to.save, show.progress=FALSE)
beta.ses <-function(compo, null.matrices)
# 以vegan數(shù)據(jù)集 varespec為例
> data(varespec)
> varespec1 <- as.data.frame(lapply(varespec,as.integer)) %>% as.data.frame(.)
> rownames(varespec1) <- rownames(varespec)
> compo <- varespec1
> rand.res <- assemblages.from.pool.randA(compo= compo, fix.local.abund=TRUE, fix.rSAD=TRUE,rand.N= 999, save.output=FALSE)
> # 計算beta dev
> null.com <- rand.res$rand.datasets
> null.mat <- null.com
> b_dev <- beta.ses(compo, null.mat)
> # boxplot圖
> data("varechem")
> b_dev1 <- b_dev %>% mutate(ph=varechem$pH)
> ggplot(b_dev1, aes(ph, V1))+
+ geom_boxplot(aes(group = ph), size = 1,outlier.shape = 19)+
+ geom_smooth(method =lm, formula= y~poly(x,2), se = F)+
+ theme_bw()+
+ geom_hline(yintercept = 0)
Refs:
https://www.nature.com/articles/s41467-020-19228-4
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0121458
https://onlinelibrary.wiley.com/doi/10.1111/ele.12787