什么是用戶畫像绣张?
簡而言之箍土,用戶畫像是根據(jù)用戶社會屬性肉拓、生活習(xí)慣和消費(fèi)行為等信息而抽象出的一個標(biāo)簽化的用戶模型鸭丛。構(gòu)建用戶畫像的核心工作即是給用戶貼“標(biāo)簽”竞穷,而標(biāo)簽是通過對用戶信息分析而來的高度精煉的特征標(biāo)識。
舉例來說鳞溉,如果你經(jīng)常購買一些玩偶玩具瘾带,那么電商網(wǎng)站即可根據(jù)玩具購買的情況替你打上標(biāo)簽“有孩子”,甚至還可以判斷出你孩子大概的年齡熟菲,貼上“有 5-10 歲的孩子”這樣更為具體的標(biāo)簽看政,而這些所有給你貼的標(biāo)簽統(tǒng)在一次,就成了你的用戶畫像抄罕,因此允蚣,也可以說用戶畫像就是判斷一個人是什么樣的人。
除去“標(biāo)簽化”呆贿,用戶畫像還具有的特點(diǎn)是“低交叉率”嚷兔,當(dāng)兩組畫像除了權(quán)重較小的標(biāo)簽外其余標(biāo)簽幾乎一致,那就可以將二者合并做入,弱化低權(quán)重標(biāo)簽的差異冒晰。
用戶畫像的作用
羅振宇在《時間的朋友》跨年演講上舉了這樣一個例子:當(dāng)一個壞商家掌握了你的購買數(shù)據(jù),他就可以根據(jù)你平常購買商品的偏好來決定是給你發(fā)正品還是假貨以提高利潤母蛛。且不說是否存在這情況翩剪,但這也說明了利用用戶畫像可以做到“精準(zhǔn)銷售”,當(dāng)然了彩郊,這是極其錯誤的用法前弯。
其作用大體不離以下幾個方面:
- 精準(zhǔn)營銷,分析產(chǎn)品潛在用戶秫逝,針對特定群體利用短信郵件等方式進(jìn)行營銷恕出;
- 用戶統(tǒng)計,比如中國大學(xué)購買書籍人數(shù) TOP10违帆,全國分城市奶爸指數(shù)浙巫;
- 數(shù)據(jù)挖掘男应,構(gòu)建智能推薦系統(tǒng)侵续,利用關(guān)聯(lián)規(guī)則計算弓乙,喜歡紅酒的人通常喜歡什么運(yùn)動品牌足淆,利用聚類算法分析,喜歡紅酒的人年齡段分布情況丧裁;
- 進(jìn)行效果評估护桦,完善產(chǎn)品運(yùn)營,提升服務(wù)質(zhì)量煎娇,其實(shí)這也就相當(dāng)于市場調(diào)研二庵、用戶調(diào)研,迅速下定位服務(wù)群體缓呛,提供高水平的服務(wù)催享;
- 對服務(wù)或產(chǎn)品進(jìn)行私人定制,即個性化的服務(wù)某類群體甚至每一位用戶(個人認(rèn)為這是目前的發(fā)展趨勢哟绊,未來的消費(fèi)主流)因妙。比如,某公司想推出一款面向 5-10 歲兒童的玩具匿情,通過用戶畫像進(jìn)行分析兰迫,發(fā)現(xiàn)形象=“喜羊羊”、價格區(qū)間=“中等”的偏好比重最大炬称,那么就給新產(chǎn)品提供類非常客觀有效的決策依據(jù)涡拘。
- 業(yè)務(wù)經(jīng)營分析以及競爭分析玲躯,影響企業(yè)發(fā)展戰(zhàn)略
構(gòu)建流程
數(shù)據(jù)收集
數(shù)據(jù)收集大致分為網(wǎng)絡(luò)行為數(shù)據(jù)、服務(wù)內(nèi)行為數(shù)據(jù)鳄乏、用戶內(nèi)容偏好數(shù)據(jù)跷车、用戶交易數(shù)據(jù)這四類。
- 網(wǎng)絡(luò)行為數(shù)據(jù):活躍人數(shù)橱野、頁面瀏覽量朽缴、訪問時長、激活率水援、外部觸點(diǎn)密强、社交數(shù)據(jù)等
- 服務(wù)內(nèi)行為數(shù)據(jù):瀏覽路徑、頁面停留時間蜗元、訪問深度或渤、唯一頁面瀏覽次數(shù)等
- 用戶內(nèi)容便好數(shù)據(jù):瀏覽/收藏內(nèi)容、評論內(nèi)容奕扣、互動內(nèi)容薪鹦、生活形態(tài)偏好、品牌偏好等
- 用戶交易數(shù)據(jù)(交易類服務(wù)):貢獻(xiàn)率、客單價池磁、連帶率奔害、回頭率、流失率等
當(dāng)然地熄,收集到的數(shù)據(jù)不會是 100% 準(zhǔn)確的华临,都具有不確定性,這就需要在后面的階段中建模來再判斷离斩,比如某用戶在性別一欄填的男银舱,但通過其行為偏好可判斷其性別為“女”的概率為 80%。
還得一提的是跛梗,儲存用戶行為數(shù)據(jù)時最好同時儲存下發(fā)生該行為的場景寻馏,以便更好地進(jìn)行數(shù)據(jù)分析。
行為建模
該階段是對上階段收集到數(shù)據(jù)的處理核偿,進(jìn)行行為建模诚欠,以抽象出用戶的標(biāo)簽,這個階段注重的應(yīng)是大概率事件漾岳,通過數(shù)學(xué)算法模型盡可能地排除用戶的偶然行為轰绵。
這時也要用到機(jī)器學(xué)習(xí),對用戶的行為尼荆、偏好進(jìn)行猜測左腔,好比一個 y=kx+b 的算法,X 代表已知信息捅儒,Y 是用戶偏好液样,通過不斷的精確 k 和 b 來精確 Y。
在這個階段巧还,需要用到很多模型來給用戶貼標(biāo)簽鞭莽。
- 用戶汽車模型
根據(jù)用戶對“汽車”話題的關(guān)注或購買相關(guān)產(chǎn)品的情況來判斷用戶是否有車、是否準(zhǔn)備買車 - 用戶忠誠度模型
通過判斷+聚類算法判斷用戶的忠誠度 - 身高體型模型
根據(jù)用戶購買服裝鞋帽等用品判斷 - 文藝青年模型
根據(jù)用戶發(fā)言麸祷、評論等行為判斷用戶是否為文藝青年 - 用戶價值模型
判斷用戶對于網(wǎng)站的價值澎怒,對于提高用戶留存率非常有用(電商網(wǎng)站一般使用 RFM 實(shí)現(xiàn))
還有消費(fèi)能力、違約概率阶牍、流失概率等等諸多模型喷面。
用戶畫像基本成型
該階段可以說是二階段的一個深入,要把用戶的基本屬性(年齡荸恕、性別乖酬、地域)、購買能力融求、行為特征咬像、興趣愛好、心理特征、社交網(wǎng)絡(luò)大致地標(biāo)簽化县昂。
為什么說是基本成型肮柜?因?yàn)橛脩舢嬒裼肋h(yuǎn)也無法 100% 地描述一個人,只能做到不斷地去逼近一個人倒彰,因此审洞,用戶畫像既應(yīng)根據(jù)變化的基礎(chǔ)數(shù)據(jù)不斷修正,又要根據(jù)已知數(shù)據(jù)來抽象出新的標(biāo)簽使用戶畫像越來越立體待讳。
關(guān)于“標(biāo)簽化”芒澜,一般采用多級標(biāo)簽、多級分類创淡,比如第一級標(biāo)簽是基本信息(姓名痴晦、性別),第二級是消費(fèi)習(xí)慣琳彩、用戶行為誊酌;第一級分類有人口屬性,人口屬性又有基本信息露乏、地理位置等二級分類碧浊,地理位置又分工作地址和家庭地址的三級分類。
數(shù)據(jù)可視化分析
這是把用戶畫像真正利用起來的一步瘟仿,在此步驟中一般是針對群體的分析箱锐,比如可以根據(jù)用戶價值來細(xì)分出核心用戶、評估某一群體的潛在價值空間劳较,以作出針對性的運(yùn)營瑞躺。
如圖:
后記
這里只寫了用戶畫像的構(gòu)建流程和一些原理,下次有時間我會寫篇關(guān)于大數(shù)據(jù)平臺的實(shí)踐文章兴想,并說一下一些行為模型的算法原理,有興趣的朋友可以關(guān)注下赡勘。
參考閱讀:
[1]永洪BI:手把手教您搞定用戶畫像
[2]易觀智庫:大數(shù)據(jù)下的用戶分析(PPT)
[3]楊步濤:基于用戶畫像的大數(shù)據(jù)挖掘?qū)嵺`
[4]慕課網(wǎng):電商大數(shù)據(jù)應(yīng)用之用戶畫像
[5]知乎:Alex Chu 關(guān)于用戶畫像的回答