基于大數(shù)據(jù)的用戶畫像構(gòu)建(理論篇)

什么是用戶畫像绣张?

簡而言之箍土,用戶畫像是根據(jù)用戶社會屬性肉拓、生活習(xí)慣和消費(fèi)行為等信息而抽象出的一個標(biāo)簽化的用戶模型鸭丛。構(gòu)建用戶畫像的核心工作即是給用戶貼“標(biāo)簽”竞穷,而標(biāo)簽是通過對用戶信息分析而來的高度精煉的特征標(biāo)識。

舉例來說鳞溉,如果你經(jīng)常購買一些玩偶玩具瘾带,那么電商網(wǎng)站即可根據(jù)玩具購買的情況替你打上標(biāo)簽“有孩子”,甚至還可以判斷出你孩子大概的年齡熟菲,貼上“有 5-10 歲的孩子”這樣更為具體的標(biāo)簽看政,而這些所有給你貼的標(biāo)簽統(tǒng)在一次,就成了你的用戶畫像抄罕,因此允蚣,也可以說用戶畫像就是判斷一個人是什么樣的人。

除去“標(biāo)簽化”呆贿,用戶畫像還具有的特點(diǎn)是“低交叉率”嚷兔,當(dāng)兩組畫像除了權(quán)重較小的標(biāo)簽外其余標(biāo)簽幾乎一致,那就可以將二者合并做入,弱化低權(quán)重標(biāo)簽的差異冒晰。

用戶畫像的作用

羅振宇在《時間的朋友》跨年演講上舉了這樣一個例子:當(dāng)一個壞商家掌握了你的購買數(shù)據(jù),他就可以根據(jù)你平常購買商品的偏好來決定是給你發(fā)正品還是假貨以提高利潤母蛛。且不說是否存在這情況翩剪,但這也說明了利用用戶畫像可以做到“精準(zhǔn)銷售”,當(dāng)然了彩郊,這是極其錯誤的用法前弯。

其作用大體不離以下幾個方面:

  1. 精準(zhǔn)營銷,分析產(chǎn)品潛在用戶秫逝,針對特定群體利用短信郵件等方式進(jìn)行營銷恕出;
  2. 用戶統(tǒng)計,比如中國大學(xué)購買書籍人數(shù) TOP10违帆,全國分城市奶爸指數(shù)浙巫;
  3. 數(shù)據(jù)挖掘男应,構(gòu)建智能推薦系統(tǒng)侵续,利用關(guān)聯(lián)規(guī)則計算弓乙,喜歡紅酒的人通常喜歡什么運(yùn)動品牌足淆,利用聚類算法分析,喜歡紅酒的人年齡段分布情況丧裁;
  4. 進(jìn)行效果評估护桦,完善產(chǎn)品運(yùn)營,提升服務(wù)質(zhì)量煎娇,其實(shí)這也就相當(dāng)于市場調(diào)研二庵、用戶調(diào)研,迅速下定位服務(wù)群體缓呛,提供高水平的服務(wù)催享;
  5. 對服務(wù)或產(chǎn)品進(jìn)行私人定制,即個性化的服務(wù)某類群體甚至每一位用戶(個人認(rèn)為這是目前的發(fā)展趨勢哟绊,未來的消費(fèi)主流)因妙。比如,某公司想推出一款面向 5-10 歲兒童的玩具匿情,通過用戶畫像進(jìn)行分析兰迫,發(fā)現(xiàn)形象=“喜羊羊”、價格區(qū)間=“中等”的偏好比重最大炬称,那么就給新產(chǎn)品提供類非常客觀有效的決策依據(jù)涡拘。
  6. 業(yè)務(wù)經(jīng)營分析以及競爭分析玲躯,影響企業(yè)發(fā)展戰(zhàn)略

構(gòu)建流程

Paste_Image.png

數(shù)據(jù)收集

數(shù)據(jù)收集大致分為網(wǎng)絡(luò)行為數(shù)據(jù)、服務(wù)內(nèi)行為數(shù)據(jù)鳄乏、用戶內(nèi)容偏好數(shù)據(jù)跷车、用戶交易數(shù)據(jù)這四類。

  • 網(wǎng)絡(luò)行為數(shù)據(jù):活躍人數(shù)橱野、頁面瀏覽量朽缴、訪問時長、激活率水援、外部觸點(diǎn)密强、社交數(shù)據(jù)等
  • 服務(wù)內(nèi)行為數(shù)據(jù):瀏覽路徑、頁面停留時間蜗元、訪問深度或渤、唯一頁面瀏覽次數(shù)等
  • 用戶內(nèi)容便好數(shù)據(jù):瀏覽/收藏內(nèi)容、評論內(nèi)容奕扣、互動內(nèi)容薪鹦、生活形態(tài)偏好、品牌偏好等
  • 用戶交易數(shù)據(jù)(交易類服務(wù)):貢獻(xiàn)率、客單價池磁、連帶率奔害、回頭率、流失率等
    當(dāng)然地熄,收集到的數(shù)據(jù)不會是 100% 準(zhǔn)確的华临,都具有不確定性,這就需要在后面的階段中建模來再判斷离斩,比如某用戶在性別一欄填的男银舱,但通過其行為偏好可判斷其性別為“女”的概率為 80%。

還得一提的是跛梗,儲存用戶行為數(shù)據(jù)時最好同時儲存下發(fā)生該行為的場景寻馏,以便更好地進(jìn)行數(shù)據(jù)分析。

行為建模

該階段是對上階段收集到數(shù)據(jù)的處理核偿,進(jìn)行行為建模诚欠,以抽象出用戶的標(biāo)簽,這個階段注重的應(yīng)是大概率事件漾岳,通過數(shù)學(xué)算法模型盡可能地排除用戶的偶然行為轰绵。

這時也要用到機(jī)器學(xué)習(xí),對用戶的行為尼荆、偏好進(jìn)行猜測左腔,好比一個 y=kx+b 的算法,X 代表已知信息捅儒,Y 是用戶偏好液样,通過不斷的精確 k 和 b 來精確 Y。

在這個階段巧还,需要用到很多模型來給用戶貼標(biāo)簽鞭莽。

  • 用戶汽車模型
    根據(jù)用戶對“汽車”話題的關(guān)注或購買相關(guān)產(chǎn)品的情況來判斷用戶是否有車、是否準(zhǔn)備買車
  • 用戶忠誠度模型
    通過判斷+聚類算法判斷用戶的忠誠度
  • 身高體型模型
    根據(jù)用戶購買服裝鞋帽等用品判斷
  • 文藝青年模型
    根據(jù)用戶發(fā)言麸祷、評論等行為判斷用戶是否為文藝青年
  • 用戶價值模型
    判斷用戶對于網(wǎng)站的價值澎怒,對于提高用戶留存率非常有用(電商網(wǎng)站一般使用 RFM 實(shí)現(xiàn))
    還有消費(fèi)能力、違約概率阶牍、流失概率等等諸多模型喷面。

用戶畫像基本成型

該階段可以說是二階段的一個深入,要把用戶的基本屬性(年齡荸恕、性別乖酬、地域)、購買能力融求、行為特征咬像、興趣愛好、心理特征、社交網(wǎng)絡(luò)大致地標(biāo)簽化县昂。

為什么說是基本成型肮柜?因?yàn)橛脩舢嬒裼肋h(yuǎn)也無法 100% 地描述一個人,只能做到不斷地去逼近一個人倒彰,因此审洞,用戶畫像既應(yīng)根據(jù)變化的基礎(chǔ)數(shù)據(jù)不斷修正,又要根據(jù)已知數(shù)據(jù)來抽象出新的標(biāo)簽使用戶畫像越來越立體待讳。

關(guān)于“標(biāo)簽化”芒澜,一般采用多級標(biāo)簽、多級分類创淡,比如第一級標(biāo)簽是基本信息(姓名痴晦、性別),第二級是消費(fèi)習(xí)慣琳彩、用戶行為誊酌;第一級分類有人口屬性,人口屬性又有基本信息露乏、地理位置等二級分類碧浊,地理位置又分工作地址和家庭地址的三級分類。

數(shù)據(jù)可視化分析

這是把用戶畫像真正利用起來的一步瘟仿,在此步驟中一般是針對群體的分析箱锐,比如可以根據(jù)用戶價值來細(xì)分出核心用戶、評估某一群體的潛在價值空間劳较,以作出針對性的運(yùn)營瑞躺。
如圖:


Paste_Image.png

后記

這里只寫了用戶畫像的構(gòu)建流程和一些原理,下次有時間我會寫篇關(guān)于大數(shù)據(jù)平臺的實(shí)踐文章兴想,并說一下一些行為模型的算法原理,有興趣的朋友可以關(guān)注下赡勘。

參考閱讀:
[1]永洪BI:手把手教您搞定用戶畫像
[2]易觀智庫:大數(shù)據(jù)下的用戶分析(PPT)
[3]楊步濤:基于用戶畫像的大數(shù)據(jù)挖掘?qū)嵺`
[4]慕課網(wǎng):電商大數(shù)據(jù)應(yīng)用之用戶畫像
[5]知乎:Alex Chu 關(guān)于用戶畫像的回答

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末嫂便,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子闸与,更是在濱河造成了極大的恐慌毙替,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,378評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件践樱,死亡現(xiàn)場離奇詭異厂画,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)拷邢,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評論 2 382
  • 文/潘曉璐 我一進(jìn)店門袱院,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事忽洛∧寤荩” “怎么了?”我有些...
    開封第一講書人閱讀 152,702評論 0 342
  • 文/不壞的土叔 我叫張陵欲虚,是天一觀的道長集灌。 經(jīng)常有香客問我,道長复哆,這世上最難降的妖魔是什么欣喧? 我笑而不...
    開封第一講書人閱讀 55,259評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮梯找,結(jié)果婚禮上唆阿,老公的妹妹穿的比我還像新娘。我一直安慰自己初肉,他們只是感情好酷鸦,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,263評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著牙咏,像睡著了一般臼隔。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上妄壶,一...
    開封第一講書人閱讀 49,036評論 1 285
  • 那天摔握,我揣著相機(jī)與錄音,去河邊找鬼丁寄。 笑死氨淌,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的伊磺。 我是一名探鬼主播盛正,決...
    沈念sama閱讀 38,349評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼屑埋!你這毒婦竟也來了豪筝?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,979評論 0 259
  • 序言:老撾萬榮一對情侶失蹤摘能,失蹤者是張志新(化名)和其女友劉穎续崖,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體团搞,經(jīng)...
    沈念sama閱讀 43,469評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡严望,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,938評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了逻恐。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片像吻。...
    茶點(diǎn)故事閱讀 38,059評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡峻黍,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出萧豆,到底是詐尸還是另有隱情奸披,我是刑警寧澤,帶...
    沈念sama閱讀 33,703評論 4 323
  • 正文 年R本政府宣布涮雷,位于F島的核電站阵面,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏洪鸭。R本人自食惡果不足惜样刷,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,257評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望览爵。 院中可真熱鬧置鼻,春花似錦、人聲如沸蜓竹。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,262評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽俱济。三九已至嘶是,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蛛碌,已是汗流浹背聂喇。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蔚携,地道東北人希太。 一個月前我還...
    沈念sama閱讀 45,501評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像酝蜒,于是被迫代替她去往敵國和親誊辉。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,792評論 2 345

推薦閱讀更多精彩內(nèi)容