用戶畫像是一個挺新穎的詞织鲸,最初它是大數(shù)據(jù)行業(yè)言必及之的時髦概念。現(xiàn)在我們運營談及用戶畫像溪胶,它也是和精準營銷搂擦、精細化運營直接鉤掛的。這篇文章主要講產(chǎn)品和運營角度的用戶畫像哗脖。希望看完后瀑踢,解決你一切關于用戶畫像的疑問。
什么是用戶畫像
用戶畫像一點也不神秘才避,它是根據(jù)用戶在互聯(lián)網(wǎng)留下的種種數(shù)據(jù)橱夭,主動或被動地收集,最后加工成一系列的標簽桑逝。比如猜用戶是男是女棘劣,哪里人,工資多少楞遏,有沒有談戀愛茬暇,喜歡什么,準備剁手購物嗎寡喝?
我們常把用戶標簽和用戶畫像對等糙俗。但凡用戶畫像的文章,類似上文圖片都會出現(xiàn)预鬓,有用爛的趨勢臼节。標簽化是最直觀的解釋,但它不等于用戶畫像珊皿。
用戶畫像的正式名稱是User Profile,大家往往把它和User Persona混淆巨税,后者更恰當?shù)拿质怯脩艚巧āJ钱a(chǎn)品設計和用戶調研的一種方式方法。當我們討論產(chǎn)品草添、需求驶兜、場景、用戶體驗的時候,往往需要將焦點聚集在某類人群上抄淑,用戶角色便是一種抽象的方法屠凶,是目標用戶的集合。
用戶角色不指代具體的誰肆资〈@ⅲ「她是一位25歲的白領,211大學畢業(yè)郑原,現(xiàn)在從事于互聯(lián)網(wǎng)行業(yè)的設計工作唉韭,居住在北京。單身犯犁,平時喜愛搖滾樂」属愤,這段話語,常用來描述產(chǎn)品的典型用戶酸役。
本文談的User Profile住诸,更多是運營和數(shù)據(jù)息息相關的平臺級應用,本質是對任何一個用戶都能用標簽和數(shù)據(jù)描述涣澡。
用戶畫像的應用
它在企業(yè)邁大邁強的過程中有舉足輕重的作用贱呐。以下是主要的應用:
精準營銷:這是運營最熟悉的玩法,從粗放式到精細化暑塑,將用戶群體切割成更細的粒度吼句,輔以短信、推送事格、郵件惕艳、活動等手段,驅以關懷驹愚、挽回远搪、激勵等策略。
數(shù)據(jù)應用:用戶畫像是很多數(shù)據(jù)產(chǎn)品的基礎逢捺,諸如耳熟能詳?shù)耐扑]系統(tǒng)廣告系統(tǒng)谁鳍。操作過各大廣告投放系統(tǒng)的同學想必都清楚,廣告投放基于一系列人口統(tǒng)計相關的標簽劫瞳,性別倘潜、年齡、學歷志于、興趣偏好涮因、手機等等。
用戶分析:雖然和Persona不一樣伺绽,用戶畫像也是了解用戶的必要補充养泡。產(chǎn)品早期嗜湃,PM們通過用戶調研和訪談的形式了解用戶。在產(chǎn)品用戶量擴大后澜掩,調研的效用降低购披,這時候會輔以用戶畫像配合研究。新增的用戶有什么特征肩榕,核心用戶的屬性是否變化等等刚陡。
數(shù)據(jù)分析:這個就不用多提了,用戶畫像可以理解為業(yè)務層面的數(shù)據(jù)倉庫点把,各類標簽是多維分析的天然要素橘荠。數(shù)據(jù)查詢平臺會和這些數(shù)據(jù)打通。
對大部分產(chǎn)品郎逃,用戶畫像用不到推薦系統(tǒng)哥童,個性化推薦也提高不了幾個利潤,畢竟它需要大量的用戶和數(shù)據(jù)作支撐褒翰。所以這些產(chǎn)品贮懈,更適合以用戶畫像為基礎去驅動業(yè)務。
提了那么多好處优训,但是據(jù)我了解朵你,不少公司,花了一大筆錢招了不少人建設用戶畫像系統(tǒng)揣非,結果用不起來抡医。或者做了一份用戶畫像的報告早敬,性別用戶地理位置用戶消費金額忌傻,看上去挺高大上的,看完也就看完了搞监。
歸根結底水孩,難以用好。
很多用戶畫像初衷是好的琐驴,但是淪為了形式主義俘种。
舉身邊的例子,朋友在公司建立用戶畫像劃分了百來個維度绝淡。用戶消費宙刘、屬性、行為無所不包牢酵。本來這不錯啊荐类,但是上線后運營看著這個干瞪眼。
問題包含但不限于茁帽,用戶有那么多維度玉罐,怎么合理地選擇標簽澳厢?我想定義用戶的層級炬丸,VIP用戶應該累積消費金額超過多少共虑?是在什么時間窗口內待秃?為什么選擇這幾個標準株依?后續(xù)應該怎么維護和監(jiān)控憎兽?業(yè)務發(fā)生變化了這個標簽要不要改插龄?
設立好標簽乒躺,怎么驗證用戶畫像的有效性琅束?我怎么知道這套系統(tǒng)成功了呢扭屁?效果不佳怎么辦?它有沒有更多的應用場景涩禀?
策略的執(zhí)行也是一個糾結的問題料滥。從崗位的執(zhí)行看,運營背負著KPI艾船。當月底KPI完不成時葵腹,你覺得他們更喜歡選擇全量運營,還是精細化呢?
我想不少公司都存在這樣類似情況:使用過用戶畫像一段時間后屿岂,發(fā)現(xiàn)也就那么一回事践宴,也就漸漸不再使用。
這是用戶畫像在業(yè)務層面遇到老大難的問題爷怀。雖然企業(yè)自稱建立用戶畫像阻肩,應用還是挺粗糙的。
怎樣深入理解用戶畫像
畫虎不全反類汪运授,想要用好它烤惊,首先得深入理解用戶畫像。
現(xiàn)在運營按用戶生命周期設立了幾個標簽徒坡,比如新用戶撕氧、活躍用戶、流失用戶喇完,這些標簽當然夠細分伦泥。但它真的是一個好標簽么?不是锦溪。
因為這些都是滯后性的不脯。按流失用戶的一般定義,往往是用戶很長一段時間沒有回應和行動刻诊,但是都幾個月沒有響應了防楷,哪怕知道是流失用戶也于事無補。它有價值则涯,但太滯后复局。
聰明的運營會設立一個新的標簽冲簿,最近一次活躍距今天數(shù),用戶有六個月沒有活躍亿昏,那么天數(shù)就是180天峦剔。這個比單純的流失用戶標簽好,能憑此劃分不同的距今天數(shù)角钩,設立30天吝沫,90天,180天的時間節(jié)點递礼。
距今天數(shù)也不是最好的惨险。用戶有差異,同樣兩個用戶A和B脊髓,哪怕不活躍天數(shù)相同辫愉,我也不能認為它們的流失可能性相等。該問題在低頻場景更凸顯供炼,旅游APP一屋,半年沒有活躍也是正常的,此時距今天數(shù)力有未逮袋哼。
回過頭看流失用戶冀墨,我們定義它,不是為了設立一個高大上的系統(tǒng)涛贯。任何企業(yè)诽嘉,肯定一開始就希望流失用戶越少越好,其次才是如何挽回弟翘。這種業(yè)務前提下虫腋,預防性的減少流失用戶比已經(jīng)流失的標簽更重要。
所以稀余,最好的標簽的標簽是用戶流失概率:
流失概率>距今消費天數(shù)>流失標簽
不要想當然的歸納一個齊全完備的體系悦冀,卻忽略了畫像的核心價值。用戶畫像首先得是商業(yè)目的下的用戶標簽集合睛琳。
猜用戶是男是女盒蟆,哪里人,工資多少师骗,有沒有談戀愛历等,喜歡什么,準備剁手購物嗎辟癌?探討這些是沒有意義的寒屯。是男是女如何影響消費決策,工資多少影響消費能力黍少,有沒有談戀愛會否帶來新的營銷場景寡夹,剁手購物怎么精準推薦处面,這些才是用戶畫像背后的邏輯。
不是我有了用戶畫像要出,便能驅動和提高業(yè)務鸳君。而是為了驅動和提高業(yè)務,才需要用戶畫像患蹂。這是很容易犯的錯誤。
用戶畫像的標簽一般通過兩種形式獲得砸紊,基于已有數(shù)據(jù)或者一定規(guī)則加工传于,流失標簽和距今天數(shù)皆是。另外一種是基于已有的數(shù)據(jù)計算概率模型醉顽,會用到機器學習和數(shù)據(jù)挖掘沼溜。
概率是介于0~1之間的數(shù)值。拿性別舉例游添,除非能直接獲取用戶的身份證信息系草,用戶很少會填寫性別,填寫的性別也不一定準確唆涝,網(wǎng)游中性別為女的扣腳大漢一抓一大把呢找都。
這里就要增加一層推斷用戶真實性別的算法。中國人的性別和名字是強相關廊酣,建國建軍能耻,翠花翠蘭,很容易判斷亡驰。算法中常用貝葉斯晓猛,通過已有的姓名性別庫預測新加入的用戶性別。
特殊情況下凡辱,不少姓名是中性戒职,男女不辯。像曉晶透乾,可男可女洪燥。更特殊的情況,看上去是男性的名字续徽,也有可能是女性蚓曼,我的初中老師就叫建軍,然而是個和藹可親的小姐姐钦扭。
特殊情況意味著特殊的概率纫版,所以不能用非此即彼的二分法。所謂概率客情,它更習慣告訴你其弊,通過模型推斷癞己,建軍有95%的可能是男性姓名,表示為0.95梭伐;曉晶有55%的可能是男性痹雅,表示為0.55。
雖然為了方便糊识,模型會設立閾值绩社,將50%以上的概率默認為男性,以下默認為女性赂苗。但業(yè)務部門的同學要清楚愉耙,用戶標簽的本質往往是0~1之間的概率。
概率型的標簽很難驗證拌滋。某位用戶被標上學生標簽朴沿,要么真的哄他上傳學籍證明,否則很難知道他是不是真的學生败砂。這種黑箱情況下赌渣,針對學生用戶進行營銷活動,效果好與不好昌犹,都受標簽準確率的影響坚芜。廣告、推薦祭隔、精準營銷都會遇到這個問題货岭。
概率肯定有多有少。90%流失概率的用戶疾渴,和30%流失概率的用戶千贯,雖然是模型建立出的預測值,非真實搞坝,我們還是會認為前者更有離開的可能性搔谴,憑此設立運營策略。
這帶來一個新的問題桩撮,如何選擇概率的閾值敦第?
我們想要挽回流失用戶,選擇80%以上概率的人群店量,還是60%呢芜果?答案已經(jīng)說過了,要考慮業(yè)務融师,挽回流失用戶是手段不是目的右钾,實際目的是通過挽回流失用戶提高利潤,那么閾值的選擇迎刃而解。計算不同閾值下舀射,挽回用戶的收入和成本窘茁,選擇最優(yōu)解。
推而廣之脆烟,推薦系統(tǒng)也好山林,廣告系統(tǒng)也罷,它們有更復雜的維度邢羔、標簽驼抹、特征,本質也是找出用戶最近想不想買車拜鹤,用戶最近想不想旅游砂蔽。把最合適的信息在最恰當時機推給用戶,獲取最大的利益署惯。
我列舉的案例,是簡化過的镣隶。像姓名极谊,在電商和消費行業(yè),除了生理上的性別安岂,還會建立消費模型上的性別標簽轻猖,有些人雖然是男性,但購物行為是女性域那,這是要區(qū)分的咙边。
看到這里別怕,想要建好用戶畫像次员,說簡單不簡單败许,說難也不難。
如何建立正確的用戶畫像
用戶畫像首先是基于業(yè)務模型的淑蔚。業(yè)務部門連業(yè)務模型都沒有想好市殷,數(shù)據(jù)部門只能巧婦難為無米之炊。數(shù)據(jù)部門也別關門造車刹衫,這和做產(chǎn)品一樣醋寝,連用戶需求都沒有理解透徹,匆匆忙忙上線一個APP带迟,結果無人問津音羞。
理解消費者的決策,考慮業(yè)務場景仓犬,考慮業(yè)務形態(tài)嗅绰,考慮業(yè)務部門的需求…這些概念說得很虛,但是一個好的用戶畫像離不開它們。本文沒有說數(shù)據(jù)办陷、模型和算法貌夕,是我認為,它們比技術層面更重要民镜。
我們從一個故事開始設立用戶畫像吧啡专。
老王是一家互聯(lián)網(wǎng)創(chuàng)業(yè)公司的核心人員,產(chǎn)品主營綠色健康沙拉制圈,老王和綠色比較搭嘛们童。這家公司推出了APP專賣各式各樣的沙拉,現(xiàn)在需要建立用戶畫像指導運營鲸鹦。
公司現(xiàn)階段在業(yè)務層面慧库,更關注營銷和銷售:如何將沙拉賣得更好。下圖是老王簡單梳理的運營流程馋嗜。
老王將顧客按是否購買過沙拉齐板,劃分成潛在用戶和新客。潛在用戶是注冊過APP但還沒有下單葛菇,新客是只購買過一次沙拉的用戶甘磨,除此以外還有老客,即消費了兩次及以上的人群眯停。
為了便于大家理解济舆,我用JSON格式表示一個簡易的用戶畫像。
為什么獨立出新客標簽莺债?因為老王的沙拉針對未消費用戶會有新人紅包引導消費滋觉,萬事開頭難。這也帶來新客一次后不再消費的問題齐邦,所以需要潛在椎侠、新客、老客的劃分侄旬。
作為一個有追求的運營人員肺蔚,劃分老客也是不夠,這里繼續(xù)用戶分層儡羔。
傳統(tǒng)的分層用RFM三個維度衡量宣羊,沙拉的客單價比較固定,F(xiàn)和M取一個就夠用了汰蜘。老王現(xiàn)在計算不同消費檔次的用戶留存度差異仇冯,譬如某時間段內消費達XX元的用戶,在未來時間段是否依舊消費。
沙拉這類餐飲是高頻消費族操,XX應該選擇一個較窄的時間窗口苛坚,統(tǒng)計365天內的消費意義不大比被。還有一點需要注意的是,沙拉不同季節(jié)的銷量是有差異的泼舱,冬天沙拉肯定賣的不如夏天等缀,要綜合考慮消費分布。
這里姑且定義娇昙,30天內消費200元以上為VIP用戶尺迂。老王的生意如果特別好,也可以繼續(xù)劃分超級VIP冒掌。這種標簽往往配合業(yè)務噪裕,譬如VIP有贈送飲料,優(yōu)先配送的權益股毫。非VIP人群膳音,也需要激勵往VIP發(fā)展。
畫像的人口統(tǒng)計屬性铃诬,老王靠用戶填寫訂單上的收貨人姓名搞定祭陷。籍貫年齡這幾個,對沙拉生意沒有特別大的幫助趣席,難道為四川籍用戶提高麻辣沙拉颗胡?
用戶地址,可以通過收貨地設立規(guī)則判斷吩坝,比如某個地址出現(xiàn)X次,可以將其認為常用地地址哑蔫。再依據(jù)送貨地在寫字樓還是學校钉寝,推算用戶是白領還是學生。
老王針對不同屬性的人群闸迷,采取了特殊的運營策略嵌纲。像學生群體,因為7,8月份是暑假腥沽,所以老王提前預估到校園地區(qū)的銷售額下降逮走。當9月開學季,又能對返校學生進行召回今阳。
白領相關的群體师溅,更關注消費體驗,對價格敏感是次要的盾舌。如果平臺女用戶的消費占比高墓臭,老王就主打減肥功能的沙拉,并且以包月套餐的形式提高銷量妖谴。
以一家沙拉店來看窿锉,老王的用戶畫像已經(jīng)不錯了,但他還是焦頭爛額,因為用戶流失率開始上升嗡载。用戶流失有各種各樣的原因:對手老李沙拉的競爭窑多、沙拉的口味、用戶覺得性價比不高洼滚、老王不夠帥等埂息。
流失是一個老大難的預測問題。老王對流失用戶的定義是30天沒有消費判沟。想要準確預測耿芹,這里得嘗試用機器學習建模,技術方面先這里略過挪哄。所謂建模吧秕,最好要找到用戶開始不消費的時間點之前的關鍵因素,可是是行為迹炼,可以是屬性砸彬。
用戶歷史窗口內消費金額少,有可能流失斯入;用戶歷史窗口內消費頻次低砂碉,有可能流失;用戶歷史窗口內打開APP次數(shù)少刻两,有可能流失增蹭;用戶給過差評,有可能流失磅摹;用戶等餐時間長滋迈,有可能流失;用戶的性別差異户誓,有可能流失饼灿;餐飲的季度因素,有可能流失…
老王依據(jù)業(yè)務帝美,挑選了可能影響業(yè)務的特征碍彭,提交給數(shù)據(jù)組嘗試預測流失。需要注意的是悼潭,這些用戶行為不能反應真實的情況庇忌。大家不妨想一下,流失用戶的行為舰褪,是不是一個動態(tài)的變化過程漆枚?
我曾經(jīng)消費過很多次,但是突然吃膩了抵知,于是減少消費次數(shù)墙基,再之后不怎么消費软族,最終流失。單位時間段內的消費忠誠度是梯度下降的残制,為了更好的描述變化過程立砸,將時間窗口細分成多個等距段。前30~20天初茶、前20~10天颗祝、前10天內,這種切分比前30天內可以更好地表達下降趨勢恼布,也更好的預測流失螺戳。
從老王的思路看,所謂流失折汞,可以通過用戶行為的細節(jié)預判倔幼。機器學習的建模雖然依賴統(tǒng)計手段,也離不開業(yè)務洞察爽待。這里再次證明损同,用戶畫像建立在業(yè)務模型上。
流失概率解決了老王的心頭之患鸟款,通過提前發(fā)現(xiàn)降低流失用戶膏燃。挽回流失推行一段時間后,老王發(fā)現(xiàn)雖然流失用戶減少了何什,但是成本提高了组哩,因為挽回用戶也是要花錢的呀。虧本可不行处渣,老王心頭又生一計禁炒,他只挽回有價值的,那種拿了紅包才消費的用戶老王他不要了霍比!老王要的是真愛粉。于是他配合消費檔次區(qū)別對待暴备,雖然流失用戶的數(shù)量沒有控制好悠瞬,但是利潤提高了。
上述的用戶畫像涯捻,沒有一個標簽脫離于業(yè)務之外浅妆。基于業(yè)務場景障癌,我們還能想象很多用戶畫像的玩法凌外。沙拉有不同的口味,蔬果雞肉海鮮涛浙。用戶的口味偏好康辑,可以用矩陣分解摄欲、模糊聚類或者多分類的問題計算,也以0~1之間的數(shù)字表示喜好程度疮薇,相似的胸墙,還有價格偏好,即價格敏感度按咒。
再深入想一下業(yè)務場景迟隅,如果某個辦公地點,每天都有五六筆的訂單励七,分屬不同的客戶不同的時間段智袭,外賣小哥得送個五六次,對人力成本是多大的浪費呀掠抬。運營可以在后臺分析相關的數(shù)據(jù)吼野,以團購或拼單的形式,促成訂單合并剿另,或許銷售額的利潤會下降箫锤,但是外賣的人力成本也節(jié)約了。這也是用畫像作為數(shù)據(jù)分析的依據(jù)雨女。
老王的運營故事說完了谚攒,現(xiàn)在對用戶畫像的建立有一套想法了吧。
用戶畫像的架構
不同業(yè)務的畫像標簽體系并不一致氛堕,這需要數(shù)據(jù)和運營目的性的提煉馏臭。
用戶畫像一般按業(yè)務屬性劃分多個類別模塊。除了常見的人口統(tǒng)計讼稚,社會屬性外括儒。還有用戶消費畫像,用戶行為畫像锐想,用戶興趣畫像等帮寻。具體的畫像得看產(chǎn)品形態(tài),像金融領域赠摇,還會有風險畫像固逗,包括征信、違約藕帜、洗錢烫罩、還款能力、保險黑名單等洽故。電商領域會有商品的類目偏好贝攒、品類偏好、品牌偏好时甚,不一而足隘弊。
上圖是隨手畫的的例子哈踱,畫一個架構不難,難得是了解每個標簽背后的業(yè)務邏輯和落地方式长捧,至于算法嚣鄙,又能單獨扯很多文章了。
從數(shù)據(jù)流向和加工看串结,用戶畫像包含上下級遞進關系哑子。
以上文的流失系數(shù)舉例,它通過建模肌割,其依賴于用戶早期的歷史行為卧蜓。而用戶早期的歷史行為,即10天內的消費金額把敞、消費次數(shù)弥奸、登錄次數(shù)等,本身也是一個標簽奋早,它們是通過原始的明細數(shù)據(jù)獲得盛霎。
上圖列舉了標簽加工和計算的過程,很好理解耽装。最上層的策略標簽愤炸,是針對業(yè)務的落地,運營人員通過多個標簽的組合形成一個用戶群組掉奄,方便執(zhí)行规个。
公司越大,用戶畫像越復雜姓建。某家主打內容分發(fā)的公司進入了全新的視頻領域诞仓,現(xiàn)在有兩款APP,那么用戶畫像的結構也需要改變速兔。既有內容相關的標簽墅拭,也有視頻相關的標簽,兩者是并行且關聯(lián)的涣狗。
比如A用戶在內容標簽下是重度使用谍婉,而在視頻標簽下是輕度。比如B用戶很久沒打開內容APP有流失風險屑柔,但在視頻APP的使用時長上看很忠誠。如此種種珍剑,看的是靈活應用掸宛。當然,姓名性別這類人口統(tǒng)計標簽招拙,是通用的唧瘾。
用戶畫像作為平臺級的應用措译,很多運營策略及工具,都是在其基礎上構建的饰序。
基于營銷和消費相關的標簽领虹,新客、老客求豫、用戶的流失和忠誠塌衰、用戶的消費水平和頻率等,都是構成CRM(客戶關系管理)的基礎蝠嘉,可能大家更習慣叫它用戶/會員管理運營平臺最疆。
它的作用在于,將數(shù)據(jù)化的標簽蚤告,轉換成產(chǎn)品運營策略努酸。不同的標簽對應不同的用戶群體,也對應不同的營銷手段杜恰。CRM的結構中會包含各類觸達用戶的常用渠道比如短信获诈、郵件、推送等心褐。也包含CMS(內容管理系統(tǒng))舔涎,執(zhí)行人員通過其快速配置活動頁、活動通道檬寂、優(yōu)惠券等终抽,靠營銷活動拉動數(shù)據(jù)。
老王的沙拉業(yè)務要是做大桶至,那么運營平臺就會以圖中的結構搭建昼伴。老王在CRM中組合標簽,新客老客流失客的數(shù)據(jù)借助BI監(jiān)控镣屹,然后通過CMS系統(tǒng)配置紅包啊優(yōu)惠券啊等等圃郊,再通過短或Push觸達。
好的用戶畫像系統(tǒng)女蜈,既是數(shù)據(jù)生態(tài)體系持舆,也是業(yè)務和運營的生態(tài)體系,它是一門復雜的交叉領域伪窖。因為篇幅有限逸寓,算法,數(shù)據(jù)產(chǎn)品沒有更多的涉及覆山,以后有機會再講吧竹伸。
萬千用法,存乎一心簇宽。
秦路勋篓,人人都是產(chǎn)品經(jīng)理專欄作家吧享。