一、什么是用戶畫像
1.應(yīng)用場景
1.1精細(xì)化運營
?為不同用戶群體進(jìn)行運營贮匕,通過較少的成本得到較高的運營收入井佑,可提升ROI(Return on investment)。
· 領(lǐng)導(dǎo)(直觀掌握數(shù)據(jù)):活躍用戶數(shù)憎夷、新增設(shè)備數(shù)、注冊用戶數(shù)昧旨、客單價拾给、GMV、各平臺收入分布兔沃。
· 采購人員(各商品的售賣情況):時間/季節(jié)蒋得、商品品類/名稱、購買人數(shù)乒疏、購買次數(shù)额衙、購買金額(銷售趨勢)。
·?市場人員(了解用戶的渠道來源缰雇,從而針對性的調(diào)整投放策略):下載渠道入偷、活躍用戶、訪問次數(shù)械哟、訪問時間疏之、次日留存、注冊轉(zhuǎn)化用戶(率)暇咆、支付成功用戶(率)锋爪、支付金額。
·?產(chǎn)品人員(了解用戶行為路徑爸业,迭代產(chǎn)品):功能模塊使用量(活動banner其骄、首頁...)、時間扯旷、新用戶留存率(目標(biāo)用戶數(shù)拯爽、當(dāng)日、第1日钧忽、第2日毯炮、第3日....)
·?營銷人員(分不同群體進(jìn)行營銷/push):近7日活躍用戶逼肯、新增用戶、近30日活躍購買5次以上的用戶)
1.2推薦系統(tǒng)
基于已有連結(jié)預(yù)測新的連結(jié)( 瀏覽頁面桃煎、購物車頁面篮幢、訂單頁面推薦),用戶數(shù)字化表示为迈。
2.概念
2.1示例
· 張三用戶畫像:1001(UserID)三椿,年齡20,常住地北京葫辐,消費能力高搜锰,購買偏好美妝
對每一條數(shù)據(jù)標(biāo)簽數(shù)字化:
年齡:20-25歲301、26-30歲302另患、31-35歲303...
性別:男101纽乱、女102...
常住地:北京401蛾绎、上海402...
商品偏好:美妝201昆箕、書籍202、數(shù)碼203...
· 張三用戶畫像:1001租冠,301鹏倘,401,201
2.2定義
· 用戶畫像就是用戶標(biāo)注顽爹,通過標(biāo)簽的形式描述用戶纤泵;
· 個人特征:自然屬性(年齡、身高镜粤、體重)捏题、社會屬性(職業(yè)、社交特征)肉渴、財富狀況(高/低收入人群公荧、是否有固定資產(chǎn))、家庭情況(是否已婚同规、是否有孩子)循狰、購物習(xí)慣(網(wǎng)購、下線購物券勺、線下看網(wǎng)上買)绪钥、位置特征(常住地、彻亓叮活動的商圈)程腹。
二、用戶畫像的計算框架選型
目標(biāo):理解用戶畫像項目的幾種實現(xiàn)方式
步驟:1.計算方式? ?2.存儲方式
2.1離線數(shù)倉
直接在mySQL上查詢的缺點:(mySQL是為業(yè)務(wù)數(shù)據(jù)庫準(zhǔn)備的)
(1) 查詢時會影響線上業(yè)務(wù)運行儒拂;
(2)查詢語句過于繁瑣寸潦,并且多個分析之間有共性缀去,中間層沒有保存;
(3)用于業(yè)務(wù)數(shù)據(jù)庫的模型一般都特別細(xì)分甸祭,分析不方便缕碎。
解決問題(2):維度建模(分層)
(1)ODS貼源層:做數(shù)據(jù)存儲,當(dāng)出現(xiàn)問題時不再二次抽瘸鼗А咏雌;
(2)DW數(shù)倉層:維度建模,簡化查詢校焦;
(3)DM集市層赊抖,為每個部門提供小型數(shù)倉;
(4)ADS應(yīng)用層寨典,對應(yīng)數(shù)據(jù)應(yīng)用的需求氛雪,例如便于報表訪問等。
解決問題(3):將多個表進(jìn)行合并拉寬
解決問題(1):數(shù)據(jù)抽取