年薪XX萬門檻最低的方式-AB測試

面試官A:你知道AB測試怎么做嗎纹腌?

面試官B:你有AB測試的經(jīng)驗嗎?

面試官C:AB測試的統(tǒng)計學原理可以簡單說一下嗎滞磺?

... ...

現(xiàn)在升薯,互聯(lián)網(wǎng)場景下,越來越多的公司or面試官開始考察AB-Test相關的知識

似乎是懂了AB測試击困,年薪就達到XX萬(請自行腦補)

那么涎劈,為了大家都能年薪XX萬广凸,我們今天來聊下

AB-Test那些事兒

AB-Test的起源

AB測試的概念來源于醫(yī)學的雙盲實驗盲镶。

用戶被隨機分組成兩組九杂,在不知情的情況下,拿到了測試用藥和安慰劑谷饿。經(jīng)過一段時間的實驗后听怕,比較這兩組病人的表象是否具有顯著的差異,從而決定測試用藥是否有效檐涝。

同樣,互聯(lián)網(wǎng)公司們在采取AB測試時也用了同樣的概念

將web或者app界面或者流程,拆分為多個版本页畦,在同一時間段里,分別讓同質(zhì)化的用戶使用裙戏。之后收集相關的業(yè)務數(shù)據(jù),最后評估出最好的版本形病,從而達到效果最大化扔傅。

從本質(zhì)上來說伊履,AB-Test是對某唯一變化的有效性進行測試的實驗

#請忽略我的強行過渡

很多同學說力穗,知道了AB-test的起源巫员,對我們實際工作并沒有啥幫助

那么,接下來袖瞻,讓我們說說AB-Test的具體步驟把

AB-Test的步驟

開局先上圖:

根據(jù)上圖,我們把AB-Test拆分為實驗前 + 實驗中 + 實驗后來大致講解下實驗的流程及步驟

實驗前:

1、設定項目目標:即本次AB測試的主體是什么斋配,一個頁面優(yōu)化爬范,一個app功能搭儒,一個文案修改?

2步咪、本次測試的用戶群體:是面對整體用戶仇矾,還是部分用戶?是需要分版本生效垫卤,還是全部生效旺遮?

3鸣剪、預計會達到的目標:比如點擊率,如預期10%上漲至15%用狱,需要有個心理預期

4祟滴、計算樣本量:根據(jù)預計效果,以及顯著性水平歌溉,計算出所需樣本量

5垄懂、計算流量分配比例:當計算出樣本量后,我們需要根據(jù)當前流量,制定分流計劃,是分群還是分層监透,或者同時進行

6、規(guī)劃整理以上內(nèi)容漫谷,進行AB測試前的文檔落盤,方便實驗后進行效果觀測和實驗結果評估

實驗中:

1蹂析、實驗上線:根據(jù)事前設定的 測試功能舔示,分流比例,投放人群進行線上AB測試

2电抚、空白組確認:空白組惕稻,是否真的空白組,一定需要確認

3喻频、AB生效確認:檢驗線上AB是否生效缩宜,以及AB測試是否按照計劃比例分流

4、如果為了驗證分流是否有效甥温,及實驗效果的顯著性檢驗锻煌,我們在AB時,可以進行AA實驗

實驗后:

1姻蚓、實驗有效性檢測:判斷實驗是否達到最小樣本量宋梧,從而能夠以較大概率避免兩個統(tǒng)計錯誤的發(fā)生(棄真錯誤 &? 取偽錯誤)。一般情況下狰挡,通過AA實驗的顯著性差異檢驗捂龄,就能判斷實驗結果有效

2释涛、實驗效果比較:即通過對比AB實驗下,實驗組及基準組的區(qū)別倦沧,是否有顯著差異唇撬,是否達到預期,從而判斷后續(xù)迭代策略

以上展融,就差不多是AB-Test的整體步驟

當然窖认,在實驗的過程中,也會碰到很多坑

我們也提前幫大家“預警“一下都有哪些坑

AB-Test的一些坑

1告希、用戶屬性一定要一致

如果上線一個實驗扑浸,我們對年輕群體上線,年老群體不上線燕偶,實驗后拿著效果來對比喝噪,即使數(shù)據(jù)顯著性檢驗通過,那么指么,實驗也是不可信的酝惧。因為AB測試的基礎條件之一,就是實驗用戶的同質(zhì)化涧尿。即實驗用戶群系奉,和非實驗用戶群的 地域檬贰、性別姑廉、年齡等自然屬性因素分布基本一致。

2翁涤、一定要在同一時間維度下做實驗

舉例:如果某一個招聘app桥言,年前3月份對用戶群A做了一個實驗,年中7月份對用戶群B做了同一個實驗葵礼,結果7月份的效果明顯較差号阿,但是可能本身是由于周期性因素導致的。所以我們在實驗時鸳粉,一定要排除掉季節(jié)等因素扔涧。

3、AB測試一定要從小流量逐漸放大

如果上線一個功能届谈,直接流量開到50%去做測試枯夜,那么如果數(shù)據(jù)效果不好,或者功能意外出現(xiàn)bug艰山,對線上用戶將會造成極大的影響湖雹。所以,建議一開始從最小樣本量開始實驗曙搬,然后再逐漸擴大用戶群體及實驗樣本量摔吏。

4鸽嫂、如果最小樣本量不足該怎么辦

如果我們計算出來,樣本量需要很大征讲,我們分配的比例已經(jīng)很大据某,仍舊存在樣本量不足的情況,那么我們只能通過拉長時間周期诗箍,通過累計樣本量來進行比較

5哗脖、是否需要上線第一天就開始看效果?

由于AB-Test扳还,會影響到不同的用戶群體才避,所以,我們在做AB測試時氨距,盡量設定一個測試生效期桑逝,這個周期一般是用戶的一個活躍間隔期。如招聘用戶活躍間隔是7天俏让,那么生效期為7天楞遏,如果是一個機酒app,用戶活躍間隔是30天首昔,那生效期為30天

6寡喝、用戶是否生效?

用戶如果被分組后,未觸發(fā)實驗勒奇,我們需要排除這類用戶预鬓。因為這類用戶本身就不是AB該統(tǒng)計進入的用戶(這種情況較少,如果有赊颠,那在做實驗時打上生效標簽即可)

7格二、用戶不能同時處于多個組

如果用戶同時屬于多個組,那么竣蹦,一個是會對用戶造成誤導(如每次使用顶猜,效果都不一樣),一個是會對數(shù)據(jù)造成影響痘括,我們不能確認及校驗實驗的效果及準確性

8长窄、如果多個實驗同時進行,一定要對用戶分層+分組

比如纲菌,在推薦算法修改的一個實驗中挠日,我們還上線了一個UI優(yōu)化的實驗,那么我們需要將用戶劃分為4個組:A驰后、老算法+老UI肆资,B、老算法+新UI灶芝,C郑原、新算法+老UI唉韭,D、新算法+新UI犯犁,因為只有這樣属愤,我們才能同時進行的兩個實驗的參與改動的元素,做數(shù)據(jù)上的評估

9酸役、特殊情況(實際情況)

樣本量計算這步住诸,可能在部分公司不會使用,更多的是偏向經(jīng)驗值涣澡;

假設檢驗這一步贱呐,部分公司可能也不會使用;

大部分公司入桂,都會有自己的AB平臺奄薇,產(chǎn)運更偏向于平臺上直接測試,最后在一段時間后查看指標差異抗愁。

對于這兩種情況馁蒂,我們需要計算不同流量分布下的指標波動數(shù)據(jù),把相關自然波動下的閾值作為波動參考蜘腌,這樣能夠大概率保證AB實驗的嚴謹及可信度

以上沫屡,就是本期內(nèi)容,希望對你有幫助

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末撮珠,一起剝皮案震驚了整個濱河市沮脖,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌劫瞳,老刑警劉巖倘潜,帶你破解...
    沈念sama閱讀 221,406評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件绷柒,死亡現(xiàn)場離奇詭異志于,居然都是意外死亡,警方通過查閱死者的電腦和手機废睦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,395評論 3 398
  • 文/潘曉璐 我一進店門伺绽,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人嗜湃,你說我怎么就攤上這事奈应。” “怎么了购披?”我有些...
    開封第一講書人閱讀 167,815評論 0 360
  • 文/不壞的土叔 我叫張陵杖挣,是天一觀的道長。 經(jīng)常有香客問我刚陡,道長惩妇,這世上最難降的妖魔是什么株汉? 我笑而不...
    開封第一講書人閱讀 59,537評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮歌殃,結果婚禮上乔妈,老公的妹妹穿的比我還像新娘。我一直安慰自己氓皱,他們只是感情好路召,可當我...
    茶點故事閱讀 68,536評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著波材,像睡著了一般股淡。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上廷区,一...
    開封第一講書人閱讀 52,184評論 1 308
  • 那天揣非,我揣著相機與錄音,去河邊找鬼躲因。 笑死早敬,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的大脉。 我是一名探鬼主播搞监,決...
    沈念sama閱讀 40,776評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼镰矿!你這毒婦竟也來了琐驴?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,668評論 0 276
  • 序言:老撾萬榮一對情侶失蹤秤标,失蹤者是張志新(化名)和其女友劉穎绝淡,沒想到半個月后苍姜,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體牢酵,經(jīng)...
    沈念sama閱讀 46,212評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,299評論 3 340
  • 正文 我和宋清朗相戀三年衙猪,在試婚紗的時候發(fā)現(xiàn)自己被綠了馍乙。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,438評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡垫释,死狀恐怖丝格,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情棵譬,我是刑警寧澤显蝌,帶...
    沈念sama閱讀 36,128評論 5 349
  • 正文 年R本政府宣布,位于F島的核電站订咸,受9級特大地震影響曼尊,放射性物質(zhì)發(fā)生泄漏扭屁。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,807評論 3 333
  • 文/蒙蒙 一涩禀、第九天 我趴在偏房一處隱蔽的房頂上張望料滥。 院中可真熱鬧,春花似錦艾船、人聲如沸葵腹。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,279評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽践宴。三九已至,卻和暖如春爷怀,著一層夾襖步出監(jiān)牢的瞬間阻肩,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,395評論 1 272
  • 我被黑心中介騙來泰國打工运授, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留烤惊,地道東北人。 一個月前我還...
    沈念sama閱讀 48,827評論 3 376
  • 正文 我出身青樓吁朦,卻偏偏與公主長得像柒室,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子逗宜,可洞房花燭夜當晚...
    茶點故事閱讀 45,446評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 【假設檢驗分6步】——《統(tǒng)計學(第6版)賈俊平》 一雄右、原假設h0和備擇假設h11、原假設h0和備擇假設h12纺讲、確定...
    dataTONG閱讀 5,591評論 0 16
  • 增長團隊有三寶:埋點擂仍、漏斗、AB測熬甚。工作中一直想實踐逢渔,沒有合適的機會,過段時間又忘了则涯。在此整理一下复局,雖然比不上做過...
    夢游的貓頭鷹閱讀 2,599評論 0 5
  • 久違的晴天,家長會粟判。 家長大會開好到教室時,離放學已經(jīng)沒多少時間了峦剔。班主任說已經(jīng)安排了三個家長分享經(jīng)驗档礁。 放學鈴聲...
    飄雪兒5閱讀 7,524評論 16 22
  • 今天感恩節(jié)哎,感謝一直在我身邊的親朋好友吝沫。感恩相遇呻澜!感恩不離不棄递礼。 中午開了第一次的黨會,身份的轉(zhuǎn)變要...
    迷月閃星情閱讀 10,567評論 0 11
  • 可愛進取羹幸,孤獨成精脊髓。努力飛翔,天堂翱翔栅受。戰(zhàn)爭美好将硝,孤獨進取。膽大飛翔屏镊,成就輝煌依疼。努力進取,遙望而芥,和諧家園律罢。可愛游走...
    趙原野閱讀 2,735評論 1 1