定量+定性的用戶畫像方法與流程

? ? ? 用戶畫像是一種目標用戶的人物原型，它不僅可以快速了解用戶的基本信息并快速歸類亭珍，并且可以進一步精準地分析用戶行為習慣和態(tài)度偏好。用戶畫像雖然是用戶的虛擬代表枝哄，但必須基于的是真實用戶和真實數(shù)據(jù)肄梨。

1、明確研究目的

我們嘗試去做一個用戶畫像挠锥，往往是基于以下情景：

確定目標用戶众羡，將用戶根據(jù)不同特征劃分不同類型，確定目標用戶的比例和特征蓖租；

統(tǒng)計用戶數(shù)據(jù)粱侣，獲得用戶的操作行為、情感偏好以及人口學等信息蓖宦；

根據(jù)目標用戶確定產(chǎn)品發(fā)展相關優(yōu)先級齐婴，在設計和運營中將焦點聚焦于目標用戶的使用動機與行為操作；

方便設計與運營稠茂，據(jù)用戶畫像提供的具體的人物形象進行產(chǎn)品設計和運營活動柠偶，也比僅有模糊的、虛構的睬关、或是有個人偏好的用戶形象更為方便和可靠诱担；

根據(jù)不同類型用戶構建智能推薦系統(tǒng)，比如個性化推薦电爹，精準運營等等蔫仙。

從用戶畫像的使用情境也可以看出，用戶畫像適用于各個產(chǎn)品周期：從潛在用戶挖掘到新用戶引流丐箩，再到老用戶的培養(yǎng)與流失用戶的回流摇邦，用戶畫像都有用武之地。

2屎勘、明確研究方法

采用定性的方法（如涎嚼，深度訪談、焦點小組）或定量的方法（如挑秉，定量問卷法梯、行為日志數(shù)據(jù)）都能夠完成用戶畫像的構建，不同的方法各有優(yōu)缺點：

但是，不論是選擇定性還是定量的方法立哑，都首先需要對用戶類型有一個基本“量”的了解夜惭，否則在選用樣本時就會產(chǎn)生偏差。那么如何通過定量的方法（聚類）構建用戶畫像呢铛绰？

3诈茧、確定目標維度和數(shù)據(jù)

選擇那些指標？

用戶指標的選擇捂掰，可以是封閉性的敢会，也可以是開放性的。在封閉的指標中这嚣，用戶群的類型是固定的鸥昏，所有用戶類型構成了全部的用戶整體，比如輕度用戶姐帚、重度用戶吏垮；男性用戶，女性用戶罐旗。但是這種劃分方式維度可能過于單一膳汪，無法體現(xiàn)用戶群的復雜性，并且不利于指標體系的補充改進和迭代九秀，因此在研究中我們更傾向于采用開放性的分類方式遗嗽，可以根據(jù)不同應用場景變更或者拓展指標。

開放式的指標體系包括用戶人口屬性鼓蜒、行為操作屬性媳谁、態(tài)度偏好屬性、用戶價值屬性等友酱，用戶的行為和態(tài)度是不斷變化的晴音。

其中，注意一點缔杉，封閉式指標中的人口屬性指標是相對穩(wěn)定的靜態(tài)數(shù)據(jù)锤躁。通常，從我們的經(jīng)驗和掌握到的用戶信息或详，我們對用戶的年齡結構系羞、性別比例都已經(jīng)明確，如果在聚類中人口屬性指標對聚類干擾較大（共線性較強）霸琴，或在模型中作為因子影響過高椒振，可以在聚類時重點關注用戶的行為操作和態(tài)度偏好等指標，聚類成功之后再比較每一種用戶類型的人口學背景信息等梧乘。

如何獲得和篩選數(shù)據(jù)澎迎？

在確定指標后庐杨，我們需要確定指標的來源。有些數(shù)據(jù)是后臺行為日志可以記錄到的夹供，有些是需要用問卷調查的灵份。一般而言，行為層面的指標可以用后臺日志哮洽，更加準確填渠。而態(tài)度層面的則要用問卷來獲取。兩種數(shù)據(jù)渠道各有優(yōu)缺點：

理論上鸟辅，所有的數(shù)據(jù)都可以通過問卷獲得氛什。但是，為了最優(yōu)化研究效果匪凉，我們采取了問卷+行為日志結合的方式枪眉。在發(fā)問卷的同時，抓取了用戶的設備號和ID洒缀，以匹配后臺數(shù)據(jù)瑰谜。

在保證問卷效度的前提下欺冀，問卷設計還需要注意結合用戶特征树绩，以提高填答率以及數(shù)據(jù)準確率。比如隐轩，針對二次元用戶饺饭，在用戶群年齡結構偏小的前提下問卷不能太長，不能出現(xiàn)深奧的專業(yè)術語职车；同時問卷的語句表達以及頁面風格也要相應調整瘫俊，使其沒有距離感。同時悴灵，注意篩除多次填答和注冊的馬甲賬號問卷扛芽。此外還要注意新用戶的占比，需要評估填答問卷中新注冊用戶的比例是否與投放期新用戶正常增量一致积瞒。用戶畫像是否需要包含新用戶取決于項目目的川尖，也可以和產(chǎn)品方討論后決定。

4茫孔、嘗試與評估用戶聚類

把用戶分成幾種類型叮喳？

聚類分析是探索性的研究，他根據(jù)指標或者變量之間的距離判斷親疏關系缰贝，將相似性的聚為一類馍悟，因此會出現(xiàn)多個可能的解，并不會給出一個最優(yōu)的解剩晴，最終選擇哪一種方案是取決于研究者的分析判斷锣咒。

把用戶分的類型越少，顆粒度就越粗，每種類型之間的特征就不會很分明宠哄；用戶類型越多壹将，顆粒度也就越細，但復雜的類型劃分也會給產(chǎn)品定位和運營推廣帶來負擔毛嫉。因此诽俯，細化顆粒度不僅需要定量的聚類來調整，還需要結合產(chǎn)品經(jīng)驗來驗證承粤。同時暴区，因為采用的是開放性的指標體系，我們不可能像區(qū)分“男性用戶辛臊、女性用戶”那樣清楚地知道用戶類型的數(shù)量仙粱，因此，在用數(shù)據(jù)進行用戶畫像時彻舰，最關鍵的一步就是確定把用戶分成幾種類型伐割。

我們將數(shù)據(jù)導入spss嘗試進行聚類分析。如果變量數(shù)據(jù)形式不統(tǒng)一（選擇的指標有定序刃唤、有定類）隔心，則需要首先對數(shù)據(jù)進行標準化；其次尚胞，兩個強相關的變量和其他變量一起進行聚類會加大因子的權重硬霍，使聚類效果不理想，所以我們還要使用因子分析對選擇的指標提取公共因子笼裳，對因子共線性判斷唯卖，因子分析是選擇合適變量進行聚類的前提，如果因子之間共線性強躬柬，則提取公因子進行聚類拜轨，若共線性不強，則直接聚類允青。

如何選擇合適的聚類方法橄碾？

在確定因子之后需要選擇合適的聚類方法。不同方法適用的情況不同昧廷，常用的是K均值聚類以及層次聚類堪嫂。

K均值聚類也稱快速聚類，內存少木柬，復雜程度低皆串，快速高效，適用大數(shù)據(jù)量眉枕。但是需要提前明確分類數(shù)目恶复，并對均值進行定義怜森。只能對樣本聚類，不能對變量聚類谤牡，樣本的變量需是連續(xù)性變量副硅。

層次聚類可以對變量聚類，也可以對樣本聚類翅萤，可以是連續(xù)變量也可以是分類變量恐疲。能提供多種計算距離的方法，但是計算復雜度高套么，適用小數(shù)據(jù)量培己，我們需要結合項目的具體情況，包括項目周期胚泌、數(shù)據(jù)形式省咨、數(shù)據(jù)量、聚類特征等等來確定聚類方法玷室。

最后通過嘗試不同的聚類數(shù)零蓉、距離算法和分類方法，我們可以根據(jù)以下幾點來確定分類的數(shù)量：

1穷缤、依據(jù)產(chǎn)品經(jīng)驗敌蜂，不同產(chǎn)品的典型用戶不同

2、根據(jù)已有的用戶研究以及相關研究結論

3绅项、根據(jù)具體的分類效果確定

4紊册、根據(jù)層次聚類“步數(shù)——距離”拐點

聚類效果好壞的評估可以從聚類中心之間的距離比肄、組件與組內的方差以及群組數(shù)量之間的比例是否符合產(chǎn)品特征快耿、比例是否協(xié)調以及劃分的類型對產(chǎn)品是否有意義等方面去評估。

5芳绩、把數(shù)據(jù)還原成用戶

在已經(jīng)得知了分類結果并且分析得出了每一類用戶在各項指標上的特征之后掀亥，構建用戶畫像的工作也就好比在一副骨架上填充血肉。一方面妥色，我們可以直接利用獲取的數(shù)據(jù)搪花，找到具有顯著特征的信息，賦予到用戶身上嘹害。比如第一類用戶60%使用iOS系統(tǒng)撮竿，而其他三類均不超過20%，我們就可以將第一類用戶抽象為一個平時使用iPhone 的人笔呀。除了問卷數(shù)據(jù)之外幢踏，想要使人物形象更加鮮明，可以對問卷本文題進行分析许师，或者根據(jù)產(chǎn)品經(jīng)驗房蝉、用戶反饋或已有研究進行畫像僚匆，這樣可以使用戶形象更加有血有肉。

但是搭幻，把數(shù)據(jù)還原成用戶本身用戶也需要遵循幾個原則咧擂，畫像（Persona）意味著一個令人信服的用戶角色要滿足七個條件：

通過定量化的調研可以快速對用戶建立一個精準的認識，對不同數(shù)量檀蹋、不同特征的用戶進行比較統(tǒng)計分析松申，在后期產(chǎn)品迭代改進的過程中可以將用戶進行優(yōu)先級排序，著重關注核心的俯逾、規(guī)模大的用戶攻臀。但是，依靠數(shù)據(jù)這種偏定量的方式建立的用戶畫像依然是粗線條的纱昧，難以描述典型用戶的生活情景刨啸、使用場景，難以挖掘用戶情感傾向和行為操作背后的原因和深層次動機识脆。因此设联，如果有足夠精力和時間，后續(xù)可以對每類用戶進行深入的訪談灼捂，將定量和定性的方法結合起來离例，建立的用戶畫像會更為精準和生動。

編者按：本文來源微信公眾號“用鹽有點咸”

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末悉稠，一起剝皮案震驚了整個濱河市宫蛆，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌的猛，老刑警劉巖耀盗，帶你破解...
沈念sama閱讀 216,324評論 6贊 498
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異卦尊，居然都是意外死亡叛拷，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,356評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門岂却，熙熙樓的掌柜王于貴愁眉苦臉地迎上來忿薇，“玉大人，你說我怎么就攤上這事躏哩∈鸷疲” “怎么了？”我有些...
開封第一講書人閱讀 162,328評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵扫尺，是天一觀的道長筋栋。經(jīng)常有香客問我，道長器联，這世上最難降的妖魔是什么二汛？我笑而不...
開封第一講書人閱讀 58,147評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任婿崭，我火速辦了婚禮，結果婚禮上肴颊，老公的妹妹穿的比我還像新娘氓栈。我一直安慰自己，他們只是感情好婿着，可當我...
茶點故事閱讀 67,160評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布授瘦。她就那樣靜靜地躺著，像睡著了一般竟宋。火紅的嫁衣襯著肌膚如雪提完。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,115評論 1贊 296
城市分裂傳說
那天丘侠，我揣著相機與錄音徒欣，去河邊找鬼。笑死蜗字，一個胖子當著我的面吹牛打肝，可吹牛的內容都是我干的。我是一名探鬼主播挪捕，決...
沈念sama閱讀 40,025評論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼粗梭，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了级零？” 一聲冷哼從身側響起断医，我...
開封第一講書人閱讀 38,867評論 0贊 274
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎奏纪，沒想到半個月后鉴嗤，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,307評論 1贊 310
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡亥贸，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,528評論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年躬窜，在試婚紗的時候發(fā)現(xiàn)自己被綠了浇垦。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片炕置。...
茶點故事閱讀 39,688評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖男韧，靈堂內的尸體忽然破棺而出朴摊，到底是詐尸還是另有隱情，我是刑警寧澤此虑，帶...
沈念sama閱讀 35,409評論 5贊 343
?日本核電站爆炸內幕
正文年R本政府宣布甚纲，位于F島的核電站，受9級特大地震影響朦前，放射性物質發(fā)生泄漏介杆。R本人自食惡果不足惜鹃操，卻給世界環(huán)境...
茶點故事閱讀 41,001評論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望春哨。院中可真熱鬧荆隘，春花似錦、人聲如沸赴背。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,657評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽凰荚。三九已至燃观，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間便瑟，已是汗流浹背缆毁。一陣腳步聲響...
開封第一講書人閱讀 32,811評論 1贊 268
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留到涂，地道東北人积锅。一個月前我還...
沈念sama閱讀 47,685評論 2贊 368
代替公主和親
正文我出身青樓，卻偏偏與公主長得像养盗，于是被迫代替她去往敵國和親缚陷。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 44,573評論 2贊 353

定量+定性的用戶畫像方法與流程

如何選擇合適的聚類方法橄碾？

推薦閱讀更多精彩內容