用戶畫像介紹
早期的用戶畫像是通過對用戶多方面信息的調(diào)研和了解,將多種信息分類聚合胁镐,產(chǎn)出幾個有典型特征和氣質(zhì)的虛擬用戶偎血。用戶畫像用于輔助產(chǎn)品設計,評價需求是否有價值希停,別讓產(chǎn)品偏離核心用戶的需求烁巫;市場營銷方面署隘,可以用于方案制定宠能,推廣渠道選擇,同時對運營人員也有一定的指導意義磁餐。此種的用戶畫像粒度比較粗违崇,用虛擬的用戶畫像代表真實的用戶。用戶畫像會用如下的文檔描述诊霹。
隨著互聯(lián)網(wǎng)的不斷發(fā)展羞延,積累的用戶信息人柿、行為記錄越來越豐富挟憔,同時大數(shù)據(jù)處理和分析技術也已成熟耳标,可以計算出每一個用戶的特征总寒。特征使用從人口基本屬性踩身、社會屬性、生活習慣篙程、消費行為等信息抽象出來的一個個具體的標簽表示藏畅,標簽是某一用戶特征的符號化表示。為每個用戶計算用戶畫像巩步,這樣更加貼近真實的世界旁赊,每個人都是獨一無二,不能隨隨便便被其他人代表椅野,用戶畫像精準到人终畅。用戶畫像用標簽集合來表示,例如:
吳某竟闪,男离福,32歲,河南人瘫怜,北京工作术徊,銀行業(yè),投資顧問鲸湃,年收入50萬赠涮,已婚,兩套房暗挑,有孩子笋除,喜歡社交,不愛運動炸裆,喝白酒垃它,消費力強等。
基礎信息可以通過用戶的注冊信息獲得烹看,但像是否有孩子国拇、喜歡社交、喝白酒惯殊、消費能力等級等酱吝,用戶不會告訴我們,需要建立數(shù)據(jù)模型才能計算出來土思。當然务热,用戶標簽的體系是需要根據(jù)業(yè)務領域去設計的,比如銀行和電商用戶標簽體系就會不同己儒。
基于大數(shù)據(jù)用戶畫像的用途
1崎岂、應用最廣泛當屬個性化推薦,電商網(wǎng)站為準媽媽推薦嬰兒用品闪湾,為攝影愛好者推薦鏡頭冲甘。個性化推薦中,計算出用戶標簽是其中一環(huán),需要有協(xié)同過濾等推薦算法實現(xiàn)物品的推薦江醇。
2省艳、精準廣告可以根據(jù)年齡、區(qū)域嫁审、人群跋炕、天氣、游戲愛好律适、內(nèi)容偏好辐烂、購物行為、搜索行為等定向選擇進行投放捂贿,例如騰訊的廣點通纠修,支持用戶在微信、QQ精準投放厂僧。
3扣草、精細運營,例如向目標用戶發(fā)送促銷活動短信颜屠,避免全量投放完成的浪費辰妙。可以針對某次活動的拉新用戶進行分析甫窟,評估活動效果密浑,看是否和預期相符。
4粗井、輔佐產(chǎn)品設計尔破,把用戶進行分群,依據(jù)不同用戶群特性就行產(chǎn)品設計和測試驗證浇衬。
其它應用場景
1懒构、查看某次市場推廣的用戶畫像,事后分析是否和預期一致耘擂,判斷推廣渠道和產(chǎn)品目標用戶群的匹配度胆剧。
2、查看不同地域的用戶畫像梳星,不容內(nèi)容頻道的用戶畫像赞赖。
3滚朵、個性化Push冤灾,例如新聞客戶端根據(jù)用戶的閱讀習慣進行個性化的新聞推薦。
步驟
更進一步辕近,以時尚雜志全媒體為業(yè)務原型韵吨,把抽象的文字描述實例化,從戰(zhàn)略目的分析移宅、如何建立用戶畫像體系归粉、怎么對標簽進行分類分層級三個不同角度來說說用戶畫像建立的過程椿疗。梳理標簽體系是實現(xiàn)用戶畫像過程中最基礎、也是最核心的工作糠悼,后續(xù)的建模届榄、數(shù)據(jù)倉庫搭建都會依賴于標簽體系。
可以獲取到的數(shù)據(jù)分兩類倔喂,一類是業(yè)務系統(tǒng)數(shù)據(jù)铝条,一類是用戶訪問網(wǎng)站、APP產(chǎn)生的行為數(shù)據(jù)席噩。
不同的企業(yè)做用戶畫像有不同的戰(zhàn)略目的班缰,廣告公司做用戶畫像是為精準廣告服務,電商做用戶畫像是為用戶購買更多商品悼枢,內(nèi)容平臺做用戶畫像是推薦用戶更感興趣的內(nèi)容提升流量再變現(xiàn)埠忘。
戰(zhàn)略理清楚后,首先要畫出描述用戶畫像的框架馒索,建立用戶畫像體系框架的目的是進一步明確用戶畫像的用途莹妒、把標簽限定在合理的范圍內(nèi)。具體要結(jié)合戰(zhàn)略目標绰上、數(shù)據(jù)情況动羽、應用場景來規(guī)劃標簽系統(tǒng),選取和戰(zhàn)略目標一致的標簽維度渔期,把標簽按照應用場景進行分門別類运吓。同時注意聚焦和收斂,不要把沒用標簽裝進來疯趟,以降低系統(tǒng)的復雜性拘哨,避免無用信息干擾分析過程。
用戶畫像體系和標簽分類從兩個不同角度來梳理標簽信峻,用戶畫像體系偏戰(zhàn)略和應用倦青,標簽分類偏管理和技術實現(xiàn)側(cè)。
把標簽分成不同的層級和類別:
一是方便管理數(shù)千個標簽盹舞,讓散亂的標簽體系化产镐;
二是維度并不孤立,標簽之間互有關聯(lián)踢步;
三可以為標簽建模提供標簽子集癣亚,例如計算美妝總體偏好度,主要使用美妝分類的標簽集合获印。
梳理某類別的子分類時述雾,盡可能的遵循MECE原則(相互獨立、完全窮盡),尤其是一些有關用戶分類的玻孟,要能覆蓋所有用戶唆缴,但又不交叉。比如:用戶活躍度的劃分為核心用戶黍翎、活躍用戶面徽、新用戶、老用戶匣掸、流失用戶斗忌,用戶消費能力分為超強、強旺聚、中织阳、弱,這樣按照給定的規(guī)則每個用戶都有分到不同的組里砰粹。
標簽還可以按照處理過程唧躲、標簽獲取的方式進行劃分,分為事實標簽碱璃、模型標簽弄痹、預測標簽。不同類別的處理方式不一樣嵌器。
事實標簽:直接從原始數(shù)據(jù)中提取肛真,例如性別、年齡爽航、住址蚓让、上網(wǎng)時段等等
模型標簽:需要建立模型進行計算,例如美妝總體偏好度
預測標簽:通過預測算法挖掘讥珍,例如試用了某產(chǎn)品后是否想買正品
但是有些事實標簽历极,如果用戶沒有填寫的話,就需要建立模型來預測衷佃。例如數(shù)據(jù)庫中的年齡字段為空趟卸,建立依據(jù)用戶行為來建立特征工程,然后做預測氏义。
未完待續(xù)锄列。
作者:百川,微信公眾號:修煉大數(shù)據(jù)(studybigdata)