一默刚、需求目的
①、商城已上線2周年逃魄,已有10萬+在售物品荤西。數(shù)據(jù)倉庫中積累著大量的業(yè)務(wù)數(shù)據(jù)、日志數(shù)據(jù)及埋點(diǎn)數(shù)據(jù)伍俘。如何充分挖掘沉淀在數(shù)據(jù)倉庫中的數(shù)據(jù)的價(jià)值邪锌,有效的支持用戶畫像的建設(shè),成為當(dāng)前的重要工作癌瘾。
②觅丰、在保證用戶規(guī)模不斷增長的目標(biāo)下,運(yùn)營方考慮建立用戶流失預(yù)警機(jī)制妨退,及時(shí)識(shí)別將要流失的用戶群體妇萄,及時(shí)采取運(yùn)營策略換回用戶。
二咬荷、產(chǎn)品結(jié)構(gòu)
三冠句、用戶畫像系統(tǒng)搭建流程
目前團(tuán)隊(duì)已經(jīng)搭建了比較成熟的數(shù)據(jù)倉庫。也就是說已經(jīng)有結(jié)構(gòu)化的幸乒、清晰的用戶屬性懦底、用戶行為相關(guān)數(shù)據(jù)。在此基礎(chǔ)上罕扎,搭建用戶畫像系統(tǒng)聚唐,需要:
四丐重、數(shù)據(jù)建模
對(duì)人、貨拱层、場進(jìn)行分析弥臼,對(duì)用戶個(gè)體的性質(zhì)和特征做出概括,形成相應(yīng)的用戶屬性標(biāo)簽根灯、用戶行為標(biāo)簽后径缅。才可以開始建模。建模需要分別從定性烙肺、定量纳猪,兩個(gè)方面入手:
定性:在從已有數(shù)據(jù)中心,選擇特征桃笙。假設(shè)這些特征與你要預(yù)測的值有一個(gè)關(guān)系氏堤。這個(gè)關(guān)系就是一個(gè)原始的模型。
定量:確定模型中涉及到的所有未知系數(shù)
模型計(jì)算完成后搏明,需要計(jì)算模型的置信度鼠锈。此時(shí)根據(jù)測試數(shù)據(jù)(可以是團(tuán)隊(duì)內(nèi)部測試、灰度測試等方式)星著,來判斷模型計(jì)算的結(jié)果购笆,與預(yù)期是否相符。如果相符虚循,就可以用這個(gè)模型來預(yù)測用戶喜歡什么同欠。如果與預(yù)期不相符,那么久需要重復(fù)上述過程
【舉例】
比如商城系統(tǒng)中横缔,有以下數(shù)據(jù)項(xiàng)
用戶忠誠度指標(biāo)(L)铺遂,與用戶活躍度、購物車商品數(shù)茎刚、收藏?cái)?shù)襟锐、下單數(shù)、在線時(shí)長的用戶行為指標(biāo)有一定的關(guān)系膛锭。將這5項(xiàng)數(shù)據(jù)指標(biāo)的熵權(quán)值捌斧,定義為用戶忠誠度指標(biāo),可以用以下公式表示:
其中a表示上表中A2-A6的歸一化值泉沾,歸一化計(jì)算公式如下
w表示權(quán)重。權(quán)重系數(shù)計(jì)算公式如下
其中妇押,e為行為數(shù)據(jù)信息熵跷究,計(jì)算公式如下
最終計(jì)算所有的用戶的指標(biāo)L后。例如可以取前25%為高忠誠用戶敲霍,25-50%為普通忠誠用戶俊马,剩余為低忠誠用戶丁存。取值范圍可以根據(jù)業(yè)務(wù)實(shí)際情況調(diào)整。
另外柴我,由于權(quán)重系數(shù)解寝,有可能隨時(shí)間的增加而衰減。所以如果需要艘儒,還需要定義衰減因子r聋伦。加入衰減因子后,標(biāo)簽權(quán)重=衰減因子*行為權(quán)重
五界睁、梳理用戶畫像維度
設(shè)計(jì)用戶畫像維度時(shí)觉增,建議使用MECE(Mutually Exclusive Collectively Exhaustive)準(zhǔn)則。也就是對(duì)于一個(gè)重大的議題翻斟,能夠做到不重疊逾礁、不遺漏的分類,而且能夠借此有效把握問題的核心访惜,并成為有效解決問題的方法嘹履。
比如初步搭建用戶畫像維度,可以參考下圖
上圖為商城系統(tǒng)债热,初步的用戶畫像維度砾嫉。圖中的數(shù)據(jù),按照獲取的方式阳柔,可以分為:統(tǒng)計(jì)類標(biāo)簽焰枢、規(guī)則類標(biāo)簽、挖掘類標(biāo)簽舌剂。
統(tǒng)計(jì)類標(biāo)簽:這類標(biāo)簽是最為基礎(chǔ)也最為常見的標(biāo)簽類型济锄,例如對(duì)于某個(gè)用戶來說,他的性別霍转、年齡荐绝、城市、星座避消、近7日活躍時(shí)長低滩、近7日活躍天數(shù)、近7日活躍次數(shù)等字段可以從用戶注冊數(shù)據(jù)岩喷、用戶訪問恕沫、消費(fèi)類數(shù)據(jù)中統(tǒng)計(jì)得出。該類標(biāo)簽構(gòu)成了用戶畫像的基礎(chǔ)纱意;
規(guī)則類標(biāo)簽:該類標(biāo)簽基于用戶行為及確定的規(guī)則產(chǎn)生婶溯。例如對(duì)平臺(tái)上“消費(fèi)活躍”用戶這一口徑的定義為近30天交易次數(shù)>=2。在實(shí)際開發(fā)畫像的過程中,由于運(yùn)營人員對(duì)業(yè)務(wù)更為熟悉迄委、而數(shù)據(jù)人員對(duì)數(shù)據(jù)的結(jié)構(gòu)褐筛、分布、特征更為熟悉叙身,因此規(guī)則類標(biāo)簽的規(guī)則確定由運(yùn)營人員和數(shù)據(jù)人員共同協(xié)商確定渔扎;
挖掘類標(biāo)簽:該類標(biāo)簽通過數(shù)據(jù)挖掘產(chǎn)生,應(yīng)用在對(duì)用戶的某些屬性或某些行為進(jìn)行預(yù)測判斷信轿。例如根據(jù)一個(gè)用戶的行為習(xí)慣判斷該用戶是男性還是女性晃痴,根據(jù)一個(gè)用戶的消費(fèi)習(xí)慣判斷其對(duì)某商品的偏好程度。該類標(biāo)簽需要通過算法挖掘產(chǎn)生虏两。
六愧旦、形成初步用戶畫像
基于用戶畫像數(shù)據(jù),可以使運(yùn)營人員定罢、營銷人員笤虫,有更好的用戶認(rèn)識(shí),帶來更佳的用戶服務(wù)質(zhì)量祖凫,實(shí)現(xiàn)精準(zhǔn)運(yùn)營琼蚯、精準(zhǔn)營銷。
設(shè)計(jì)用戶畫像的可視化展現(xiàn)時(shí)惠况,可以使用以下工具:
其中tableau遭庶、powerbi等自助式數(shù)據(jù)分析工具,可以讓沒有編程經(jīng)驗(yàn)的業(yè)務(wù)人員稠屠、運(yùn)營人員等進(jìn)行自我數(shù)據(jù)分析峦睡,不需要依賴IT人員
七、評(píng)估用戶畫像效果
在初步形成了用戶畫像后权埠,并不能直接交給運(yùn)營榨了、業(yè)務(wù)人員實(shí)際使用。還需要評(píng)估用戶畫像的準(zhǔn)確性攘蔽。評(píng)估方式主要分為3種:邏輯驗(yàn)證龙屉、A/B test、用戶回訪满俗。
邏輯驗(yàn)證:也叫做交叉驗(yàn)證转捕。在完整的用戶畫像標(biāo)簽體系中,一些標(biāo)簽往往會(huì)存在一些相關(guān)性唆垃。比如用戶的累計(jì)在線時(shí)長越長五芝,訂單量通常會(huì)越高。比如購買3C產(chǎn)品的用戶群中辕万,男性用戶數(shù)通常大于女性用戶數(shù)与柑。另外谤辜,如果公司購買了第三方機(jī)構(gòu)的數(shù)據(jù),也可用于交叉驗(yàn)證
A/B test:也叫做灰度測試价捧。以上述的忠誠度為例。保證對(duì)照組涡戳、實(shí)驗(yàn)組的流量相同结蟋。對(duì)實(shí)驗(yàn)組的用戶,進(jìn)行提升忠誠度的運(yùn)營策略(促銷活動(dòng)渔彰、積分獎(jiǎng)勵(lì)等)嵌屎。如果實(shí)驗(yàn)組的用戶,忠誠度相比對(duì)照組用戶恍涂,有一定提升宝惰,則可以認(rèn)為用戶畫像比較精確。
用戶回訪:最樸實(shí)的評(píng)估方法再沧。比如用戶畫像系統(tǒng)尼夺,定義了10萬用戶為低忠誠度用戶。此時(shí)從中隨機(jī)抽取1000人炒瘸,交給客服淤堵,進(jìn)行回訪。根據(jù)回訪結(jié)果顷扩,判斷用戶畫像結(jié)果是否準(zhǔn)確拐邪。甚至可以對(duì)回訪結(jié)果進(jìn)行文本挖掘,形成詞云隘截,查看消極詞的占比扎阶。
八、總結(jié)
當(dāng)公司業(yè)務(wù)規(guī)模婶芭,用戶體量上升到一定量級(jí)东臀。業(yè)務(wù)、運(yùn)營團(tuán)隊(duì)雕擂,往往會(huì)提出對(duì)用戶精準(zhǔn)運(yùn)營的想法啡邑。此時(shí)就需要用戶畫像系統(tǒng),在支持業(yè)務(wù)運(yùn)營的同時(shí)井赌,也可以幫助產(chǎn)品經(jīng)理更好的了解用戶谤逼。
0-1搭建用戶畫像系統(tǒng)。需要在已有比較成熟的數(shù)據(jù)倉庫的前提下 進(jìn)行:
1仇穗、數(shù)據(jù)建模:根據(jù)業(yè)務(wù)模式流部,設(shè)計(jì)相應(yīng)的數(shù)據(jù)模型
2、梳理用戶畫像維度:不重疊纹坐、不遺漏的梳理用戶標(biāo)簽體系
3枝冀、形成初步用戶畫像:可以使用tableau、powerBI、echarts等多種工具果漾,生成可視化的用戶畫像
4球切、評(píng)估用戶畫像效果;通過邏輯驗(yàn)證绒障、A/B測試吨凑、用戶回訪等方式,驗(yàn)證用戶畫像系統(tǒng)中的標(biāo)簽是否準(zhǔn)確
5户辱、根據(jù)評(píng)估效果鸵钝,持續(xù)優(yōu)化用戶標(biāo)簽系統(tǒng)