Optimizely通過(guò)mSPRT理論的擴(kuò)展预烙,提供了時(shí)時(shí)有效的P值與置信區(qū)間斥黑,解決了ab實(shí)驗(yàn)中的偷看問(wèn)題衷快。
1. 定義
單樣本:
已知稽亏,棺牧。
雙樣本:
X螃成、Y獨(dú)立同分布呕臂。
判決條件:
破托,為結(jié)束時(shí)間(樣本量),允許為歧蒋,代表拒絕原假設(shè)土砂。
2. 始終有效推斷
為了解決偷看,需要始終有效谜洽。
2.1 始終有效的P
任意時(shí)間T萝映,滿足:
2.2 始終有效的貫序檢測(cè)
依靠樣本數(shù)據(jù)決策樣本量。
判決條件:
- 不會(huì)影響水平
2.3 置信區(qū)間
對(duì)來(lái)說(shuō)阐虚,如果始終有效序臂,就是始終有效的水平置信區(qū)間。
3. 構(gòu)造始終有效的P
Optimizely通過(guò)混合貫序檢驗(yàn)(mSPRT)構(gòu)造始終有效的P值实束。
3.1 混合貫序檢驗(yàn)(mSPRT)
H為上的混合分布奥秆,概率密度函數(shù)為h。計(jì)算H的似然比除以的似然比:
mSPRT判斷流程:
選擇咸灿,則拒絕原假設(shè)條件為构订,此時(shí)。
詳細(xì)原理參照文末避矢。
3.2 mSPRT的P值與置信區(qū)間
如果數(shù)據(jù)自正態(tài)分布悼瘾,且混合分布,則
3.3 mSPRT擴(kuò)展到A/B
定義审胸,并對(duì)其做mSPRT檢測(cè)亥宿,則:
對(duì)于0/1型數(shù)據(jù),近似于正態(tài)分布歹嘹,箩绍,則:
3.4 實(shí)現(xiàn)細(xì)節(jié)
對(duì)于一些連續(xù)性指標(biāo),比如“付費(fèi)”(嚴(yán)重右斜)使用正態(tài)分布是不合適的尺上,需要其它更適應(yīng)這種偏斜的分布材蛛。
由于為了保證單調(diào)性圆到,可能導(dǎo)致后期跑出置信區(qū)間,此時(shí)Optimizely會(huì)重置顯著性卑吭。這樣的做法只會(huì)讓p值更大芽淡、置信區(qū)間更寬,不會(huì)增加假陽(yáng)性錯(cuò)誤豆赏,但是可能增大假陰性錯(cuò)誤挣菲。
4.回歸測(cè)試
假陽(yáng)性錯(cuò)誤已知被控制了,但是假陰性怎么樣掷邦?Optimizely進(jìn)行了一些優(yōu)化和測(cè)試白胀。
4.1 優(yōu)化
實(shí)驗(yàn)者不會(huì)永遠(yuǎn)等待,因此有最大等待樣本量M抚岗。
經(jīng)過(guò)Optimizely驗(yàn)證或杠,帶M截?cái)嗟膍SPRT比一般的假設(shè)檢驗(yàn)平均花費(fèi)更少的樣本量。
4.2 混合分布的選擇
之前選擇了混合分布為宣蔚。對(duì)于混合分布如何選擇向抢,沒(méi)有現(xiàn)存的理論指導(dǎo)。
Optimizely選擇的先驗(yàn)為胚委,并且通過(guò)數(shù)據(jù)仿真得到挟鸠。
5.多重比較問(wèn)題
Optimizely通過(guò)Benjamini-Hochberg方法對(duì)多重比較進(jìn)行校正。
附: Statistical Methods Related to the Law of The Iterated Logarithm
若對(duì)隨機(jī)變量亩冬,有聯(lián)合概率密度函數(shù)艘希,為任意其他概率密度函數(shù),且鉴未,則:
對(duì)任意枢冤,存在這樣的n的概率小于鸠姨,即
以下僅簡(jiǎn)述x為正態(tài)分布下铜秆、混合函數(shù)為標(biāo)準(zhǔn)正態(tài)分布的場(chǎng)景
如果,則:
的聯(lián)合概率密度函數(shù)為:
,
定義,如果將替換為:
若
與維納過(guò)程的聯(lián)系
表示標(biāo)準(zhǔn)維納過(guò)程讶迁,连茧,下面另個(gè)數(shù)列對(duì)任意具有相同的聯(lián)合分布。
檢驗(yàn)與置信區(qū)間
巍糯,如果啸驯,則
如果,因此可以得到序列祟峦,使得對(duì)的覆蓋率超過(guò)0.95罚斗。
power分析
單邊檢驗(yàn):,則
假陰性錯(cuò)誤概率:
此時(shí)power為1宅楞。
下邊界:當(dāng)時(shí)针姿,
。根據(jù)一些其它研究:
上邊界:當(dāng)時(shí)距淫,