A/B實(shí)驗(yàn)設(shè)計(jì)——樣本量選擇

本文介紹樣本量對實(shí)驗(yàn)效果的影響,以及如何正確選擇樣本量。僅作為實(shí)驗(yàn)設(shè)計(jì)者可跳過最后數(shù)學(xué)推導(dǎo)過程,直接使用工具運(yùn)算情臭。

樣本量的影響

假設(shè)一個(gè)這樣的實(shí)驗(yàn),按鈕顏色對用戶點(diǎn)擊率的影響:


假設(shè)A樣式點(diǎn)擊率30%赌蔑,B樣式點(diǎn)擊率為40%俯在。考慮以下兩種情況:

  1. 當(dāng)每個(gè)頁面有10次訪問時(shí)娃惯,直觀感受上并不能證明B比A的點(diǎn)擊率高跷乐。實(shí)際約65%的可能性差異是隨機(jī)產(chǎn)生的。
  2. 當(dāng)每個(gè)頁面有1000次訪問時(shí)趾浅,差異不像是隨機(jī)產(chǎn)生了愕提。實(shí)際只有約0.0002%可能性差異是隨機(jī)產(chǎn)生的。

通過上面例子發(fā)現(xiàn)皿哨,相同的差異程度下浅侨,樣本數(shù)量越多,我們越有把握兩者并不相同往史。這也是符合生活經(jīng)驗(yàn)的仗颈。

樣本量選擇原則

我們已經(jīng)知道了樣本數(shù)越多佛舱,證據(jù)會越可信椎例,那么樣本數(shù)該怎么選擇呢?

實(shí)驗(yàn)角度请祖,樣本量越多越好

樣本數(shù)量變多订歪,實(shí)驗(yàn)則有了更多的“證據(jù)”,實(shí)驗(yàn)的“可靠性”也就越強(qiáng)肆捕。

業(yè)務(wù)角度刷晋,樣本量越少越好

樣本量應(yīng)該越少越好,因?yàn)椋?/p>

  1. 試錯(cuò)成本大慎陵。假設(shè)我們拿50%用的戶來跑實(shí)驗(yàn)眼虱,但不幸的是,1周后結(jié)果表明實(shí)驗(yàn)組的總收入下降了20%席纽。算下來捏悬,你的實(shí)驗(yàn)在一周內(nèi)給整個(gè)公司帶來了10%的損失。這個(gè)試錯(cuò)成本未免高了一些...
  2. 其它風(fēng)險(xiǎn)增加润梯。移動(dòng)端例子过牙,假設(shè)B方案崩潰率增長甥厦,1%流量我們可以從容處理,50%流量會對業(yè)務(wù)造成嚴(yán)重影響寇钉,甚至事故定責(zé)刀疙。
  3. 流量有限。流量總數(shù)是確定的扫倡,同類型的實(shí)驗(yàn)不能重疊谦秧,實(shí)驗(yàn)流量更小,就可以同時(shí)運(yùn)行更多的實(shí)驗(yàn)撵溃。

樣本量如何選擇

通過樣本量計(jì)算工具可以直接得到油够,有很多的在線工具,例如對轉(zhuǎn)化率可使用Evan's Awesome A/B Tools

參數(shù)解釋

  1. Baseline conversion rate:填入實(shí)驗(yàn)前估測到的轉(zhuǎn)化率征懈,可以通過舊數(shù)據(jù)統(tǒng)計(jì)作為估算石咬。
  2. Minimum Detectable Effect:填入希望觀測到的最小效果。填入實(shí)驗(yàn)的預(yù)期卖哎。
  3. Statistical power:1 - 假陰性概率鬼悠。實(shí)驗(yàn)效果真實(shí)有效時(shí),能被正確發(fā)現(xiàn)的概率亏娜。
  4. Significance level:假陽性概率焕窝。實(shí)驗(yàn)實(shí)際沒有效果時(shí),被錯(cuò)誤發(fā)現(xiàn)的概率维贺。

總結(jié)

樣本量選擇一般過程:打開樣量計(jì)算器它掂,填入α, power, MDE,填入已知參數(shù)(轉(zhuǎn)化率溯泣、均值虐秋、方差等),得到結(jié)果垃沦。


附錄:樣本量計(jì)算原理

需要讀者有一定數(shù)理統(tǒng)計(jì)知識客给,跳過不影響實(shí)驗(yàn)設(shè)計(jì)。從單尾假設(shè)檢驗(yàn)出發(fā)進(jìn)行推導(dǎo)肢簿,然后擴(kuò)展到雙尾假設(shè)檢驗(yàn)靶剑。
(簡書bug導(dǎo)致\bar{x}顯示為x^2,請注意)

單尾假設(shè)檢驗(yàn)


定義θ = μ2 - μ1池充,圖中對應(yīng)假設(shè)可轉(zhuǎn)換為:
原假設(shè):θ = 0桩引,此時(shí)對應(yīng)紅色曲線
備擇假設(shè):θ > 0,此時(shí)對應(yīng)綠色曲線

μ1:方案A的期望值收夸,不可改變坑匠。
μ2:方案B的期望值,不可改變咱圆。
\bar x:方案A的均值笛辟,會隨機(jī)波動(dòng)功氨。
\bar y:方案B的均值,會隨機(jī)波動(dòng)手幢。
\alpha = \mathbb{P}(\frac{ \bar y - \bar x}{SD( \bar y - \bar x))} > C | \mu1 = \mu2 ) 捷凄,紅色曲線下,紅色面積占比围来。
\beta= \mathbb{P}(\frac{ \bar y - \bar x }{SD( \bar y - \bar x))} <= C | \mu1 > \mu2 ) 跺涤。
power = \mathbb{P}(\frac{ \bar y - \bar x }{SD( \bar y - \bar x))} > C | \mu1 > \mu2 ) ,綠色曲線下监透,綠色面積占比桶错。
MDE:根據(jù)期望效果取的值,會參與樣本量計(jì)算
μ2 - μ1 >= mde時(shí)胀蛮,power大于等于預(yù)設(shè)值院刁,實(shí)驗(yàn)容易顯著。
μ2 - μ1 < mde時(shí)粪狼,power小于預(yù)設(shè)退腥,實(shí)驗(yàn)不容易顯著。

\frac{ \bar y - \bar x}{SD( \bar y - \bar x))} > C中再榄,C為預(yù)設(shè)常量狡刘,\bar x\bar y通過實(shí)驗(yàn)獲取無法控制困鸥,唯一可以改變的是SD( \bar y - \bar x))嗅蔬,樣本量增大 -> SD( \bar y - \bar x))減少 -> 實(shí)驗(yàn)顯著概率升高。

計(jì)算過程:
{SD( \bar y - \bar x)} = MDE / [ \phi^{-1} (\alpha) + \phi^{-1} (power )] ,

x疾就、y樣本量同為n澜术,標(biāo)準(zhǔn)差同為\sigma時(shí),
{SD( \bar y - \bar x)} = \sqrt{2\sigma ^{2}/ n},

易得n = 2\sigma ^{2} [ \phi^{-1} (1- \alpha) + \phi^{-1} (power )]^{2}/MDE^{2}

雙尾假設(shè)檢驗(yàn)

定義θ = μ2 - μ1虐译,雙尾情況下對應(yīng)假設(shè):
原假設(shè):θ = 0瘪板;
備擇假設(shè):θ ≠ 0 吴趴,等價(jià)于 θ > 0 or θ < 0漆诽。

雙尾假設(shè)檢驗(yàn)一般是對稱的,在此情況下有:

  1. \alpha = \mathbb{P}(\frac{ \bar y - \bar x}{SD( \bar y - \bar x))} > C1 | \mu1 = \mu2 ) + \mathbb{P}(\frac{ \bar y - \bar x}{SD( \bar y - \bar x))} < C2 | \mu1 = \mu2 )
  2. \mathbb{P}(\frac{ \bar y - \bar x}{SD( \bar y - \bar x))} > C1 | \mu1 = \mu2 ) = \mathbb{P}(\frac{ \bar y - \bar x}{SD( \bar y - \bar x))} < C2 | \mu1 = \mu2 )

正態(tài)分布的概率密度函數(shù)特點(diǎn)為左右對稱(鐘形曲線)锣枝,由此可知:
C1 > 0, C2 < 0, |C1| = |C2|

可以理解為一個(gè)α水平的雙尾假設(shè)檢驗(yàn)厢拭,等于兩個(gè)α/2水平的單尾假設(shè)檢驗(yàn)。
將α/2帶入單尾計(jì)算公式撇叁,得到雙尾檢驗(yàn)需要的樣本量為:
n = 2\sigma ^{2} [ \phi^{-1} (1 - \alpha/2) + \phi^{-1} (power )]^{2}/MDE^{2}

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末供鸠,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子陨闹,更是在濱河造成了極大的恐慌楞捂,老刑警劉巖薄坏,帶你破解...
    沈念sama閱讀 212,816評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異寨闹,居然都是意外死亡胶坠,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,729評論 3 385
  • 文/潘曉璐 我一進(jìn)店門繁堡,熙熙樓的掌柜王于貴愁眉苦臉地迎上來沈善,“玉大人,你說我怎么就攤上這事椭蹄∥拍担” “怎么了?”我有些...
    開封第一講書人閱讀 158,300評論 0 348
  • 文/不壞的土叔 我叫張陵绳矩,是天一觀的道長罩润。 經(jīng)常有香客問我,道長翼馆,這世上最難降的妖魔是什么哨啃? 我笑而不...
    開封第一講書人閱讀 56,780評論 1 285
  • 正文 為了忘掉前任,我火速辦了婚禮写妥,結(jié)果婚禮上拳球,老公的妹妹穿的比我還像新娘。我一直安慰自己珍特,他們只是感情好祝峻,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,890評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著扎筒,像睡著了一般莱找。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上嗜桌,一...
    開封第一講書人閱讀 50,084評論 1 291
  • 那天奥溺,我揣著相機(jī)與錄音,去河邊找鬼骨宠。 笑死浮定,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的层亿。 我是一名探鬼主播桦卒,決...
    沈念sama閱讀 39,151評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼匿又!你這毒婦竟也來了方灾?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,912評論 0 268
  • 序言:老撾萬榮一對情侶失蹤碌更,失蹤者是張志新(化名)和其女友劉穎裕偿,沒想到半個(gè)月后洞慎,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,355評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡嘿棘,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,666評論 2 327
  • 正文 我和宋清朗相戀三年拢蛋,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蔫巩。...
    茶點(diǎn)故事閱讀 38,809評論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡谆棱,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出圆仔,到底是詐尸還是另有隱情垃瞧,我是刑警寧澤,帶...
    沈念sama閱讀 34,504評論 4 334
  • 正文 年R本政府宣布坪郭,位于F島的核電站个从,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏歪沃。R本人自食惡果不足惜嗦锐,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,150評論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望沪曙。 院中可真熱鬧奕污,春花似錦、人聲如沸液走。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽缘眶。三九已至嘱根,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間巷懈,已是汗流浹背该抒。 一陣腳步聲響...
    開封第一講書人閱讀 32,121評論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留顶燕,地道東北人凑保。 一個(gè)月前我還...
    沈念sama閱讀 46,628評論 2 362
  • 正文 我出身青樓,卻偏偏與公主長得像割岛,于是被迫代替她去往敵國和親愉适。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,724評論 2 351