2021-03-12

AB Test

AB test完整流程

1.建立實(shí)驗(yàn)?zāi)繕?biāo)
2.提出實(shí)驗(yàn)假設(shè)
3.實(shí)驗(yàn)方案設(shè)計(jì)
4.開(kāi)發(fā)需求文檔
5.開(kāi)始實(shí)驗(yàn)
6.采集分析評(píng)估數(shù)據(jù)
7.發(fā)布產(chǎn)品

實(shí)驗(yàn)設(shè)計(jì)流程

確定監(jiān)測(cè)指標(biāo)（核心指標(biāo)（本次實(shí)驗(yàn)需要提升的指標(biāo)））
確定實(shí)驗(yàn)受眾（所選擇的用戶群體）
確定樣本量
根據(jù)預(yù)估的功能體校數(shù)值和顯著性水平得出
確定實(shí)驗(yàn)時(shí)長(zhǎng)
時(shí)長(zhǎng)一般不超過(guò)兩周

開(kāi)發(fā)需求文檔

實(shí)驗(yàn)?zāi)康?/li>
實(shí)驗(yàn)假設(shè)
實(shí)驗(yàn)方案
流量配置

3.進(jìn)行假設(shè)檢驗(yàn)并判斷實(shí)驗(yàn)結(jié)果

假設(shè)檢驗(yàn)(假設(shè)檢驗(yàn)前進(jìn)行數(shù)據(jù)清洗）
原假設(shè)H0與備擇假設(shè)H1
雙側(cè)檢驗(yàn)還是單側(cè)檢驗(yàn)
根據(jù)樣本量（N>30?）確定是T檢驗(yàn)還是Z檢驗(yàn)
計(jì)算統(tǒng)計(jì)量T值或Z值從而得出P值
p值:實(shí)驗(yàn)組與對(duì)照組之間的差異是否顯著
p值<0.05院促，實(shí)驗(yàn)帶來(lái)的差異是顯著的

-注意點(diǎn)

-實(shí)驗(yàn)組與對(duì)照組的用戶分布要一致
-2個(gè)實(shí)驗(yàn)改動(dòng)的變量相互獨(dú)立
-排除實(shí)驗(yàn)結(jié)果由偶然因素引發(fā)的（兩類錯(cuò)誤）

python實(shí)現(xiàn)

import numpy as np
import pandas as pd
ba_sales_data=pd.read_csv("E:/miki/coupang/ba_sales_data.csv")
ba_sales_data
ba_sales_data.info()
ba_sales_data.describe()

#刪除重復(fù)值
df_noDup=ba_sales_data.drop_duplicates()
df_noDup
df_noDup.describe()

#sale_price<0的值需要去除
df_noDup_del=df_noDup[df_noDup['sale_price']>0]
df_noDup_del

#將age字段中為999的替換為空
df_noDup_del['age']=df_noDup_del['age'].replace(999,np.nan)

df_noDup_del.info()

#將清洗好的數(shù)據(jù)存入excel中
writer = pd.ExcelWriter('E:/miki/coupang/df_noDup_del.xlsx')
data.to_excel(writer, 'df_noDup_del', float_format='%.5f')
writer.save()
writer.close()

#匯總每個(gè)用戶的總消費(fèi)金額
#計(jì)算實(shí)驗(yàn)組和對(duì)照組的平均消費(fèi)金額
import pymysql
#打開(kāi)數(shù)據(jù)庫(kù)連接
cursor=conn.cursor()
conn = pymysql.connect(host='localhost',user = "root",passwd = "root",db = "miki")
sql="select user_id,test_option,sum(sale_price) as sp from (select distinct * from df_noDup_del) a group by user_id,test_option order by test_option"
cursor.execute(sql,args=None)
name_list=[]
myresult = cursor.fetchall()
result=list(myresult)

#將sql數(shù)據(jù)結(jié)果轉(zhuǎn)換為dateframe
from pandas.core.frame import DataFrame
data=DataFrame(result)
data.rename(columns={0:'uid',1:'type',2:'sale_price'},inplace=True)
data

#計(jì)算檢驗(yàn)統(tǒng)計(jì)量
from scipy import stats
sales0_mean=data[data.type=='0'].sale_price.mean()
sales0_std=data[data.type=='0'].sale_price.std(ddof = 1)
sales1_mean=data[data.type=='1'].sale_price.mean()
sales1_std = data[data.type=='1'].sale_price.std(ddof = 1)
z = (sales0_mean - sales1_mean) / np.sqrt(sales0_std ** 2 / len(data[data.type=='0'].sale_price) + sales1_std ** 2 /len(data[data.type=='1'].sale_price))
p = 2*stats.norm.sf(abs(z))
s = np.sqrt(((len(data[data.type=='0'].sale_price) - 1)* sales0_std**2 + (len(data[data.type=='1'].sale_price) - 1)* sales1_std**2 ) / (len(data[data.type=='0'].sale_price) + len(data[data.type=='1'].sale_price) - 2))
# 效應(yīng)量Cohen's d
d = abs((sales0_mean - sales1_mean)) / s
sales0_mean,sales1_mean,z,p,d

#計(jì)算樣本量
from statsmodels.stats.power import NormalIndPower
import math
effect_size=d
ztest=NormalIndPower()
num=ztest.solve_power(
    effect_size=effect_size,    
    alpha=0.05,
    power=0.8,
    ratio=1,
    alternative='two-sided'
)
print(num)
      ```

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市斧抱，隨后出現(xiàn)的幾起案子常拓，更是在濱河造成了極大的恐慌，老刑警劉巖辉浦，帶你破解...
沈念sama閱讀 219,366評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件弄抬，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡宪郊，警方通過(guò)查閱死者的電腦和手機(jī)掂恕，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,521評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)弛槐，“玉大人懊亡，你說(shuō)我怎么就攤上這事『醮” “怎么了店枣？”我有些...
開(kāi)封第一講書(shū)人閱讀 165,689評(píng)論 0贊 356
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我鸯两，道長(zhǎng)坏瞄，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,925評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任甩卓，我火速辦了婚禮鸠匀，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘逾柿。我一直安慰自己缀棍，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,942評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布机错。她就那樣靜靜地躺著爬范，像睡著了一般。火紅的嫁衣襯著肌膚如雪弱匪。梳的紋絲不亂的頭發(fā)上青瀑，一...
開(kāi)封第一講書(shū)人閱讀 51,727評(píng)論 1贊 305
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音萧诫，去河邊找鬼斥难。笑死，一個(gè)胖子當(dāng)著我的面吹牛帘饶，可吹牛的內(nèi)容都是我干的哑诊。我是一名探鬼主播，決...
沈念sama閱讀 40,447評(píng)論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼及刻，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼镀裤！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起缴饭，我...
開(kāi)封第一講書(shū)人閱讀 39,349評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤暑劝，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后颗搂，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體担猛，經(jīng)...
沈念sama閱讀 45,820評(píng)論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,990評(píng)論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年峭火，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了毁习。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片智嚷。...
茶點(diǎn)故事閱讀 40,127評(píng)論 1贊 351
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡卖丸，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出盏道，到底是詐尸還是另有隱情稍浆，我是刑警寧澤，帶...
沈念sama閱讀 35,812評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站衅枫，受9級(jí)特大地震影響嫁艇，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜弦撩，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,471評(píng)論 3贊 331
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一步咪、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧益楼，春花似錦猾漫、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,017評(píng)論 0贊 22
一樁弒父案悯周，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至陪竿，卻和暖如春禽翼，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背族跛。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,142評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工闰挡，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人礁哄。一個(gè)月前我還...
沈念sama閱讀 48,388評(píng)論 3贊 373
代替公主和親
正文我出身青樓解总，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親姐仅。傳聞我的和親對(duì)象是個(gè)殘疾皇子花枫，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,066評(píng)論 2贊 355