? ? ? 用戶畫像是一種目標用戶的人物原型,它不僅可以快速了解用戶的基本信息并快速歸類亭珍,并且可以進一步精準地分析用戶行為習慣和態(tài)度偏好。用戶畫像雖然是用戶的虛擬代表枝哄,但必須基于的是真實用戶和真實數(shù)據(jù)肄梨。
1、明確研究目的
我們嘗試去做一個用戶畫像挠锥,往往是基于以下情景:
確定目標用戶众羡,將用戶根據(jù)不同特征劃分不同類型,確定目標用戶的比例和特征蓖租;
統(tǒng)計用戶數(shù)據(jù)粱侣,獲得用戶的操作行為、情感偏好以及人口學等信息蓖宦;
根據(jù)目標用戶確定產(chǎn)品發(fā)展相關優(yōu)先級齐婴,在設計和運營中將焦點聚焦于目標用戶的使用動機與行為操作;
方便設計與運營稠茂,據(jù)用戶畫像提供的具體的人物形象進行產(chǎn)品設計和運營活動柠偶,也比僅有模糊的、虛構的睬关、或是有個人偏好的用戶形象更為方便和可靠诱担;
根據(jù)不同類型用戶構建智能推薦系統(tǒng),比如個性化推薦电爹,精準運營等等蔫仙。
從用戶畫像的使用情境也可以看出,用戶畫像適用于各個產(chǎn)品周期:從潛在用戶挖掘到新用戶引流丐箩,再到老用戶的培養(yǎng)與流失用戶的回流摇邦,用戶畫像都有用武之地。
2屎勘、明確研究方法
采用定性的方法(如涎嚼,深度訪談、焦點小組)或定量的方法(如挑秉,定量問卷法梯、行為日志數(shù)據(jù))都能夠完成用戶畫像的構建,不同的方法各有優(yōu)缺點:
但是,不論是選擇定性還是定量的方法立哑,都首先需要對用戶類型有一個基本“量”的了解夜惭,否則在選用樣本時就會產(chǎn)生偏差。那么如何通過定量的方法(聚類)構建用戶畫像呢铛绰?
3诈茧、確定目標維度和數(shù)據(jù)
選擇那些指標?
用戶指標的選擇捂掰,可以是封閉性的敢会,也可以是開放性的。在封閉的指標中这嚣,用戶群的類型是固定的鸥昏,所有用戶類型構成了全部的用戶整體,比如輕度用戶姐帚、重度用戶吏垮;男性用戶,女性用戶罐旗。但是這種劃分方式維度可能過于單一膳汪,無法體現(xiàn)用戶群的復雜性,并且不利于指標體系的補充改進和迭代九秀,因此在研究中我們更傾向于采用開放性的分類方式遗嗽,可以根據(jù)不同應用場景變更或者拓展指標。
開放式的指標體系包括用戶人口屬性鼓蜒、行為操作屬性媳谁、態(tài)度偏好屬性、用戶價值屬性等友酱,用戶的行為和態(tài)度是不斷變化的晴音。
其中,注意一點缔杉,封閉式指標中的人口屬性指標是相對穩(wěn)定的靜態(tài)數(shù)據(jù)锤躁。通常,從我們的經(jīng)驗和掌握到的用戶信息或详,我們對用戶的年齡結構系羞、性別比例都已經(jīng)明確,如果在聚類中人口屬性指標對聚類干擾較大(共線性較強)霸琴,或在模型中作為因子影響過高椒振,可以在聚類時重點關注用戶的行為操作和態(tài)度偏好等指標,聚類成功之后再比較每一種用戶類型的人口學背景信息等梧乘。
如何獲得和篩選數(shù)據(jù)澎迎?
在確定指標后庐杨,我們需要確定指標的來源。有些數(shù)據(jù)是后臺行為日志可以記錄到的夹供,有些是需要用問卷調查的灵份。一般而言,行為層面的指標可以用后臺日志哮洽,更加準確填渠。而態(tài)度層面的則要用問卷來獲取。兩種數(shù)據(jù)渠道各有優(yōu)缺點:
理論上鸟辅,所有的數(shù)據(jù)都可以通過問卷獲得氛什。但是,為了最優(yōu)化研究效果匪凉,我們采取了問卷+行為日志結合的方式枪眉。在發(fā)問卷的同時,抓取了用戶的設備號和ID洒缀,以匹配后臺數(shù)據(jù)瑰谜。
在保證問卷效度的前提下欺冀,問卷設計還需要注意結合用戶特征树绩,以提高填答率以及數(shù)據(jù)準確率。比如隐轩,針對二次元用戶饺饭,在用戶群年齡結構偏小的前提下問卷不能太長,不能出現(xiàn)深奧的專業(yè)術語职车;同時問卷的語句表達以及頁面風格也要相應調整瘫俊,使其沒有距離感。同時悴灵,注意篩除多次填答和注冊的馬甲賬號問卷扛芽。此外還要注意新用戶的占比,需要評估填答問卷中新注冊用戶的比例是否與投放期新用戶正常增量一致积瞒。用戶畫像是否需要包含新用戶取決于項目目的川尖,也可以和產(chǎn)品方討論后決定。
4茫孔、嘗試與評估用戶聚類
把用戶分成幾種類型叮喳?
聚類分析是探索性的研究,他根據(jù)指標或者變量之間的距離判斷親疏關系缰贝,將相似性的聚為一類馍悟,因此會出現(xiàn)多個可能的解,并不會給出一個最優(yōu)的解剩晴,最終選擇哪一種方案是取決于研究者的分析判斷锣咒。
把用戶分的類型越少,顆粒度就越粗,每種類型之間的特征就不會很分明宠哄;用戶類型越多壹将,顆粒度也就越細,但復雜的類型劃分也會給產(chǎn)品定位和運營推廣帶來負擔毛嫉。因此诽俯,細化顆粒度不僅需要定量的聚類來調整,還需要結合產(chǎn)品經(jīng)驗來驗證承粤。同時暴区,因為采用的是開放性的指標體系,我們不可能像區(qū)分“男性用戶辛臊、女性用戶”那樣清楚地知道用戶類型的數(shù)量仙粱,因此,在用數(shù)據(jù)進行用戶畫像時彻舰,最關鍵的一步就是確定把用戶分成幾種類型伐割。
我們將數(shù)據(jù)導入spss嘗試進行聚類分析。如果變量數(shù)據(jù)形式不統(tǒng)一(選擇的指標有定序刃唤、有定類)隔心,則需要首先對數(shù)據(jù)進行標準化;其次尚胞,兩個強相關的變量和其他變量一起進行聚類會加大因子的權重硬霍,使聚類效果不理想,所以我們還要使用因子分析對選擇的指標提取公共因子笼裳,對因子共線性判斷唯卖,因子分析是選擇合適變量進行聚類的前提,如果因子之間共線性強躬柬,則提取公因子進行聚類拜轨,若共線性不強,則直接聚類允青。
如何選擇合適的聚類方法橄碾?
在確定因子之后需要選擇合適的聚類方法。不同方法適用的情況不同昧廷,常用的是K均值聚類以及層次聚類堪嫂。
K均值聚類也稱快速聚類,內存少木柬,復雜程度低皆串,快速高效,適用大數(shù)據(jù)量眉枕。但是需要提前明確分類數(shù)目恶复,并對均值進行定義怜森。只能對樣本聚類,不能對變量聚類谤牡,樣本的變量需是連續(xù)性變量副硅。
層次聚類可以對變量聚類,也可以對樣本聚類翅萤,可以是連續(xù)變量也可以是分類變量恐疲。能提供多種計算距離的方法,但是計算復雜度高套么,適用小數(shù)據(jù)量培己,我們需要結合項目的具體情況,包括項目周期胚泌、數(shù)據(jù)形式省咨、數(shù)據(jù)量、聚類特征等等來確定聚類方法玷室。
最后通過嘗試不同的聚類數(shù)零蓉、距離算法和分類方法,我們可以根據(jù)以下幾點來確定分類的數(shù)量:
1穷缤、依據(jù)產(chǎn)品經(jīng)驗敌蜂,不同產(chǎn)品的典型用戶不同
2、根據(jù)已有的用戶研究以及相關研究結論
3绅项、根據(jù)具體的分類效果確定
4紊册、根據(jù)層次聚類“步數(shù)——距離”拐點
聚類效果好壞的評估可以從聚類中心之間的距離比肄、組件與組內的方差以及群組數(shù)量之間的比例是否符合產(chǎn)品特征快耿、比例是否協(xié)調以及劃分的類型對產(chǎn)品是否有意義等方面去評估。
5芳绩、把數(shù)據(jù)還原成用戶
在已經(jīng)得知了分類結果并且分析得出了每一類用戶在各項指標上的特征之后掀亥,構建用戶畫像的工作也就好比在一副骨架上填充血肉。一方面妥色,我們可以直接利用獲取的數(shù)據(jù)搪花,找到具有顯著特征的信息,賦予到用戶身上嘹害。比如第一類用戶60%使用iOS系統(tǒng)撮竿,而其他三類均不超過20%,我們就可以將第一類用戶抽象為一個平時使用iPhone 的人笔呀。除了問卷數(shù)據(jù)之外幢踏,想要使人物形象更加鮮明,可以對問卷本文題進行分析许师,或者根據(jù)產(chǎn)品經(jīng)驗房蝉、用戶反饋或已有研究進行畫像僚匆,這樣可以使用戶形象更加有血有肉。
但是搭幻,把數(shù)據(jù)還原成用戶本身用戶也需要遵循幾個原則咧擂,畫像(Persona)意味著一個令人信服的用戶角色要滿足七個條件:
通過定量化的調研可以快速對用戶建立一個精準的認識,對不同數(shù)量檀蹋、不同特征的用戶進行比較統(tǒng)計分析松申,在后期產(chǎn)品迭代改進的過程中可以將用戶進行優(yōu)先級排序,著重關注核心的俯逾、規(guī)模大的用戶攻臀。但是,依靠數(shù)據(jù)這種偏定量的方式建立的用戶畫像依然是粗線條的纱昧,難以描述典型用戶的生活情景刨啸、使用場景,難以挖掘用戶情感傾向和行為操作背后的原因和深層次動機识脆。因此设联,如果有足夠精力和時間,后續(xù)可以對每類用戶進行深入的訪談灼捂,將定量和定性的方法結合起來离例,建立的用戶畫像會更為精準和生動。
編者按:本文來源微信公眾號“用鹽有點咸”