AB測試-整理匯總

http://www.reibang.com/p/c6df75dbb2fa
http://www.evanmiller.org/ab-testing/

【目的】AB測試,還有AA測試
【樣本選擇】分桶怎么分的却特,每組是否滿足正態(tài)分布
根據(jù) cookie (比如 cookie 會話ID的最后一位數(shù)字)決定分桶就是一個不錯的方法戈轿。

【AB測試意義】A/B測試其實是一種“先驗”的實驗體系,屬于預(yù)測型結(jié)論道伟,與“后驗”的歸納性結(jié)論差別巨大。A/B測試的目的在于通過科學(xué)的實驗設(shè)計使碾、采樣樣本代表性蜜徽、流量分割與小流量測試等方式來獲得具有代表性的實驗結(jié)論,并確信該結(jié)論在推廣到全部流量可信票摇。
【實現(xiàn)手段】
相似性采樣:在A/B測試的實驗中拘鞋,需要保證小流量的實驗具備代表性,也就是說1%的流量做出來的實驗結(jié)果矢门,可以推廣到100%的用戶盆色,為了保證這一點灰蛙,需要保證1%的流量的樣本特征與100%流量的樣本特征具備相似性。(說個最簡單的邏輯:假定把所有小米手機用戶均勻的分到這100組中隔躲,那第一組的所有小米手機用戶的特征與第2組-第100組的所有小米手機用戶具備相似性)

代表性誤差:代表性誤差摩梧,又稱抽樣誤差。主要是指在用樣本數(shù)據(jù)向總體進行推斷時所產(chǎn)生的隨機誤差宣旱。從理論上講仅父,這種誤差是不可避免的,但是它是可以計算并且加以控制的浑吟。(繼續(xù)小米笙纤。。盡管把小米用戶均勻的分成了100組组力,但是不能完全保證每個組里的小米用戶的數(shù)量省容、性別、地域等特征完全一樣燎字,這就帶來了實驗誤差風(fēng)險)

聚類:物理或抽象對象的集合分成由類似的對象組成的多個類的過程被稱為聚類腥椒,也就是在分配小米用戶的過程中,需要按照實驗?zāi)康牡牟煌烟卣飨嗨菩愿叩挠脩粽J(rèn)為是一類用戶候衍,比如定義100次點擊為高頻點擊寞酿,可能在某些情況下也會認(rèn)為99次點擊的用戶跟100次點擊的用戶是一類用戶。

置信度與置信區(qū)間

在統(tǒng)計學(xué)中脱柱,一個概率樣本的置信區(qū)間(Confidence interval)是對這個樣本的某個總體參數(shù)的區(qū)間估計伐弹。置信區(qū)間展現(xiàn)的是這個參數(shù)的真實值有一定概率落在測量結(jié)果的周圍的程度。置信區(qū)間給出的是被測量參數(shù)的測量值的可信程度榨为,即前面所要求的“一定概率”惨好。這個概率被稱為置信水平。

置信度:簡單來將表示可信程度随闺,一般來說95%的置信度就很好了日川,一些及其嚴(yán)苛的A/B測試實驗才會到99%的置信度。差別在于矩乐,越高的置信度得出結(jié)論的實驗時間越長龄句、流量要求越高

置信區(qū)間:從前面的概念中也講了,1%的流量盡管具備了代表性散罕,但是跟100%的流量還是有差異的嘛分歇,所以實驗結(jié)果的評判要有一定的前提的,置信度就是這個前提欧漱,置信區(qū)間表示在這個置信度的前提下职抡,實驗結(jié)果很可能會落在一個區(qū)間內(nèi),比如下圖误甚,95%的置信度的前提下缚甩,置信區(qū)間為[-2.3%, +17.4%],可以解讀為這個A/B測試的實驗既有可能使“點擊次數(shù)”降低2.3%谱净,又有可能提升17.4%。說明這個實驗結(jié)果還不穩(wěn)定擅威,可能是試驗時間短或者是流量不夠壕探。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市郊丛,隨后出現(xiàn)的幾起案子李请,更是在濱河造成了極大的恐慌,老刑警劉巖宾袜,帶你破解...
    沈念sama閱讀 218,451評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件捻艳,死亡現(xiàn)場離奇詭異驾窟,居然都是意外死亡庆猫,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,172評論 3 394
  • 文/潘曉璐 我一進店門绅络,熙熙樓的掌柜王于貴愁眉苦臉地迎上來月培,“玉大人,你說我怎么就攤上這事恩急∩夹螅” “怎么了?”我有些...
    開封第一講書人閱讀 164,782評論 0 354
  • 文/不壞的土叔 我叫張陵衷恭,是天一觀的道長此叠。 經(jīng)常有香客問我,道長随珠,這世上最難降的妖魔是什么灭袁? 我笑而不...
    開封第一講書人閱讀 58,709評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮窗看,結(jié)果婚禮上茸歧,老公的妹妹穿的比我還像新娘。我一直安慰自己显沈,他們只是感情好软瞎,可當(dāng)我...
    茶點故事閱讀 67,733評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著拉讯,像睡著了一般涤浇。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上魔慷,一...
    開封第一講書人閱讀 51,578評論 1 305
  • 那天芙代,我揣著相機與錄音,去河邊找鬼盖彭。 笑死纹烹,一個胖子當(dāng)著我的面吹牛页滚,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播铺呵,決...
    沈念sama閱讀 40,320評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼裹驰,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了片挂?” 一聲冷哼從身側(cè)響起幻林,我...
    開封第一講書人閱讀 39,241評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎音念,沒想到半個月后沪饺,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,686評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡闷愤,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,878評論 3 336
  • 正文 我和宋清朗相戀三年整葡,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片讥脐。...
    茶點故事閱讀 39,992評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡遭居,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出旬渠,到底是詐尸還是另有隱情俱萍,我是刑警寧澤,帶...
    沈念sama閱讀 35,715評論 5 346
  • 正文 年R本政府宣布告丢,位于F島的核電站枪蘑,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏岖免。R本人自食惡果不足惜岳颇,卻給世界環(huán)境...
    茶點故事閱讀 41,336評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望觅捆。 院中可真熱鬧赦役,春花似錦、人聲如沸栅炒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,912評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽赢赊。三九已至乙漓,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間释移,已是汗流浹背叭披。 一陣腳步聲響...
    開封第一講書人閱讀 33,040評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留玩讳,地道東北人涩蜘。 一個月前我還...
    沈念sama閱讀 48,173評論 3 370
  • 正文 我出身青樓嚼贡,卻偏偏與公主長得像,于是被迫代替她去往敵國和親同诫。 傳聞我的和親對象是個殘疾皇子粤策,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,947評論 2 355

推薦閱讀更多精彩內(nèi)容

  • -- 原創(chuàng),未經(jīng)授權(quán)误窖,禁止轉(zhuǎn)載 2017.11.15 -- 對于推薦系統(tǒng)叮盘,本文總結(jié)內(nèi)容,如下圖所示: 文章很長霹俺,你...
    rui_liu閱讀 42,938評論 14 256
  • Github上的一個python小程序 地址在此:Github·proxmark3proxmark3 原版的程序一...
    echo_ec20閱讀 2,206評論 0 0
  • 今年雙11丙唧,各線上商家愈魏,如火如荼,轟轟烈烈high翻天的時候艇棕,線下實體店蝌戒,袖手旁觀串塑,冷冷的看著沼琉,心中五味雜陳。...
    楊畫畫閱讀 116評論 0 1
  • 張岱(明代)朗讀 崇禎五年十二月桩匪,余住西湖打瘪。大雪三日,湖中人鳥聲俱絕傻昙。 是日更定矣闺骚,余拏一小舟,擁毳衣爐火妆档,獨往湖...
    永言光閱讀 303評論 0 0
  • 關(guān)注我微信的朋友可能還記得,1月16日我對外公布了要和朋友做云集微店的宣傳须板,至今已有12天碰镜。 在此期間,總共宣傳4...
    曉慧慧曉閱讀 280評論 1 0