分析目的
實現(xiàn)淘寶展示廣告精準(zhǔn)投放,提高廣告投放效果澎羞。
數(shù)據(jù)來源
https://tianchi.aliyun.com/dataset/dataDetail?dataId=56
數(shù)據(jù)說明
原始樣本骨架raw_sample
從淘寶網(wǎng)站中隨機抽樣了114萬用戶8天內(nèi)的廣告展示/點擊日志(2600萬條記錄)吁恍,構(gòu)成原始的樣本骨架颇象。
字段說明如下:
(1) user_id:脫敏過的用戶ID;
(2) adgroup_id:脫敏過的廣告單元ID敛纲;
(3) time_stamp:時間戳掠兄;
(4) pid:資源位像云;
(5) noclk:為1代表沒有點擊;為0代表點擊蚂夕;
(6) clk:為0代表沒有點擊迅诬;為1代表點擊;
廣告基本信息表ad_feature
本數(shù)據(jù)集涵蓋了raw_sample中全部廣告的基本信息婿牍。字段說明如下:
(1) adgroup_id:脫敏過的廣告ID侈贷;
(2) cate_id:脫敏過的商品類目ID;
(3) campaign_id:脫敏過的廣告計劃ID等脂;
(4) customer_id:脫敏過的廣告主ID俏蛮;
(5) brand:脫敏過的品牌ID;
(6) price: 寶貝的價格
用戶基本信息表user_profile
本數(shù)據(jù)集涵蓋了raw_sample中全部用戶的基本信息上遥。字段說明如下:
(1) userid:脫敏過的用戶ID搏屑;
(2) cms_segid:微群ID;
(3) cms_group_id:cms_group_id露该;
(4) final_gender_code:性別 1:男,2:女睬棚;
(5) age_level:年齡層次;
(6) pvalue_level:消費檔次解幼,1:低檔抑党,2:中檔,3:高檔撵摆;
(7) shopping_level:購物深度底靠,1:淺層用戶,2:中度用戶,3:深度用戶
(8) occupation:是否大學(xué)生 ,1:是,0:否
(9) new_user_class_level:城市層級
用戶的行為日志behavior_log
本數(shù)據(jù)集涵蓋了raw_sample中全部用戶22天內(nèi)的購物行為(共七億條記錄)特铝。字段說明如下:
(1) user:脫敏過的用戶ID暑中;
(2) time_stamp:時間戳;
(3) btag:行為類型, 包括以下四種:
ipv:瀏覽
cart:加入購物車
fav:喜歡
buy:購買
(4) cate:脫敏過的商品類目鲫剿;
(5) brand: 脫敏過的品牌詞鳄逾;
(本數(shù)據(jù)集數(shù)據(jù)量極大,本次分析只截取部分數(shù)據(jù)(4百萬條記錄)來分析)