問題一:(考點(diǎn):活動(dòng)運(yùn)營數(shù)據(jù)分析)
表1——訂單表orders腻脏,大概字段有(user_id‘用戶編號’, order_pay‘訂單金額’ , order_time‘下單時(shí)間’)永品。
表2——活動(dòng)報(bào)名表act_apply击纬,大概字段有(act_id‘活動(dòng)編號’, user_id‘報(bào)名用戶’,act_time‘報(bào)名時(shí)間’)
要求:
1.統(tǒng)計(jì)每個(gè)活動(dòng)對應(yīng)所有用戶在報(bào)名后產(chǎn)生的總訂單金額,總訂單數(shù)炕桨。(每個(gè)用戶限報(bào)一個(gè)活動(dòng),題干默認(rèn)用戶報(bào)名后產(chǎn)生的訂單均為參加活動(dòng)的訂單)肯腕。
2.統(tǒng)計(jì)每個(gè)活動(dòng)從開始后到當(dāng)天(考試日)平均每天產(chǎn)生的訂單數(shù)实撒,活動(dòng)開始時(shí)間定義為最早有用戶報(bào)名的時(shí)間。(涉及到時(shí)間的數(shù)據(jù)類型均為:datetime)吭净。
答案
解析:
使用左連接,如果orders有懸浮元組囚巴,即提交了訂單彤叉,但是沒有參加任一個(gè)活動(dòng),那么因?yàn)?code>order_time>=atc_time會把懸浮元組剔除秽浇。保證最后結(jié)果的正確性柬焕。
2.
解析:窗口函數(shù)
之所以使用
group by (act_id,act_start)
而不是使用group by(act_id)
是因?yàn)橹挥羞@樣act_start
才能出現(xiàn)在select中
問題二:(考點(diǎn):用戶行為路徑分析)
表1——用戶行為表tracking_log斑举,大概字段有(user_id‘用戶編號’,opr_id‘操作編號’,log_time‘操作時(shí)間’)
要求:
1.計(jì)算每天的訪客數(shù)和他們的平均操作次數(shù)。
2.統(tǒng)計(jì)每天符合以下條件的用戶數(shù):A操作之后是B操作璧坟,AB操作必須相鄰。
答案
問題三:(考點(diǎn):用戶新增留存分析)
表1——用戶登陸表user_log,大概字段有(user_id‘用戶編號’会钝,log_time‘登陸時(shí)間’)
要求:
1.每天新增用戶數(shù)工三,以及他們第2天俭正、30天的回訪比例