22####[Qunar]用戶畫像構建策略及應用實踐

【用戶畫像】Qunar用戶畫像構建策略及應用實踐-搜狐 http://mt.sohu.com/20161125/n474154155.shtml

Paste_Image.png
Paste_Image.png

畫像標簽一般根據公司的業(yè)務體系來設計眶拉,存儲有HDFS茅诱,HBASE,ES
標簽的更新頻率:每日更新昼蛀,每周棕兼、每月更新

Paste_Image.png
Paste_Image.png

用戶畫像的構建原則
  我們做用戶畫像的目的有兩個:
必須從業(yè)務場景出發(fā)陡舅,解決實際的業(yè)務問題,之所以進行用戶畫像要么是獲取新用戶伴挚,或者是提升用戶體驗靶衍,或者是挽回流失用戶等有明確的業(yè)務目標 。

根據用戶畫像的信息做產品設計茎芋,必須要清楚知道用戶長什么樣子颅眶,有什么行為特征和屬性,這樣才能為用戶設計產品或開展營銷活動田弥。

一般常見的錯誤想法是畫像維度的數據越多越好涛酗,畫像數據越豐富越好,費了很大的力氣進行畫像后皱蹦,卻發(fā)現只剩下了用戶畫像煤杀,和業(yè)務相差甚遠,沒有辦法直接支持業(yè)務運營沪哺,投入精力巨大但是回報微小沈自,可以說得不償失。鑒于此辜妓,我們的畫像的維度和設計原則都是緊緊跟著業(yè)務需求去推動枯途。
  


  用戶畫像數據倉庫建立
  1
  數據源的集成

  目前Qunar用戶畫像數據倉庫中的數據源來自業(yè)務數據庫的數據和用戶行為日志數據,目前數據倉庫中基本涵蓋了機票籍滴、酒店酪夷、火車票以及保險等業(yè)務系統(tǒng)的數據,可以從全方位的了解去哪兒的一個用戶的畫像孽惰。
  2
  我們有哪些數據晚岭?—數據維度

  3
  我們有哪些數據?—數據倉庫
  目前我們畫像數據倉庫的構建都是基于Qunar基礎數據倉庫進行構建勋功,并按照維度進行劃分坦报。

  目前數據倉庫中包括的信息如下:
畫像數據倉庫表20個

畫像數據倉庫

國內库说、國際 2年+數據

標簽數據

每日增量:

- 基本數據
  - 業(yè)務數據
  - 搜索
  - Booking
  4
  用戶的唯一標志設計
  用戶唯一標識是整個用戶畫像的核心,它把從用戶開始使用app到下單到售后整個所有的用戶行為軌跡進行關聯(lián)片择,可以更好的去跟蹤和描繪一個用戶的特征潜的。


  5
  ETL過程設計:調度系統(tǒng)
依賴數據平臺調度系統(tǒng)

定時觸發(fā)和Job依賴觸發(fā)兩種模式


  6
  ETL過程設計:任務執(zhí)行
ETL的過程主要是將數據源的清洗到數據倉庫表的過程(每天更新增量)

Summary表的處理邏輯(每天更新全量)

標簽庫的處理(每周更新,2年全量)


  7
  用戶主題分析及數據挖掘
  有了豐富的畫像數據后字管,產品和運營人員可以根據用戶主題進行數據分析和數據挖掘相關的工作啰挪。用戶主題Cube的定義如下:
Measure:

– 訂單數量
  – 訂單金額
  – 搜索次數
  – Booking次數
Dimension:

–下單時間
  –出發(fā)時間
  –航司信息
  –艙位信息
  –航班(出發(fā)地、目的地)
  –基本信息(年齡嘲叔、性別等自然屬性)


  

  用戶畫像標簽構建策略
  1
  用戶標簽特征屬性
  用戶的特征屬性可以是事實的亡呵,也可以是抽象的;可以是自然屬性借跪,比如性別政己,年齡酌壕,星座等掏愁,可以是社會屬性,比如職業(yè)卵牍,社交果港,出生地等;還可以是財富狀況糊昙,比如是否高收入人群辛掠,是否有豪車豪宅等固定資產,對于機票用戶來講位置特征也是比較重要的屬性释牺,比常駐地萝衩,常出差地,老家等没咙。這些屬性都可以清楚的描繪一個用戶的畫像特征猩谊。

畫像標簽一般根據公司的業(yè)務體系來設計,存儲有HDFS祭刚,HBASE牌捷,ES

標簽的更新頻率:每日更新,每周涡驮、每月更新

標簽的生命周期:有的數據隨時間衰減迭代

2
  用戶標簽分類及特征項
  提到用戶畫像就不得不提到一個詞“標簽”暗甥。標簽是表達人的基本屬性、行為傾向捉捅、興趣偏好等某一個維度的數據標識撤防,它是一種相關性很強的關鍵字,可以簡潔的描述和分類人群棒口。標簽的定義來源于業(yè)務目標寄月,基于不同的行業(yè)焰情,不同的應用場景,同樣的標簽名稱可能代表了不同的含義剥懒,也決定了不同的模型設計和數據處理方式内舟。我們給機票用戶畫像打標簽分類為兩大類,基礎類標簽和個性化標簽初橘,這些標簽可以有重復验游,但是都是通過不同的角度去定義和刻畫一個用戶,來滿足不同的業(yè)務營銷需求保檐。


  3
  用戶標簽庫構建流程

  

  用戶畫像技術架構
  1
  技術架構

  2
  實施方法論

  

  用戶畫像應用實踐
  1
  用戶群體特征分析
設計目標:

– 根據條件可選項耕蝉,輸出篩選用戶群體
  – 圖形展示用戶群體屬性特征
應用場景:

– 如果篩選的用戶群組滿足業(yè)務的要求,將篩選條件形成參數
  – 根據參數提供接口查詢



  2
  客戶行為預測
  客戶行為預測建立步驟:
建模數據準備

客戶流失節(jié)點判斷

模型應用變量確定

模型構建

模型應用

模型驗證


  可以對用戶流失做及時預測指導建議用戶維系運營夜只。
  3
  數據和業(yè)務在一起
  用戶畫像與業(yè)務產品互相依賴垒在,相輔相成:
用戶畫像標簽庫豐富優(yōu)化

快速提供數據服務

數據分析+機器學習+模型訓練


  

  總結
  用戶畫像作為大數據的根基,它完美的描述了一個用戶的信息全貌扔亥,為進一步精準场躯、快速的分析用戶行為、消費等重要信息旅挤,用戶畫像倉庫同時也提供了足夠的數據基礎踢关。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市粘茄,隨后出現的幾起案子签舞,更是在濱河造成了極大的恐慌,老刑警劉巖柒瓣,帶你破解...
    沈念sama閱讀 211,348評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件儒搭,死亡現場離奇詭異,居然都是意外死亡芙贫,警方通過查閱死者的電腦和手機搂鲫,發(fā)現死者居然都...
    沈念sama閱讀 90,122評論 2 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來屹培,“玉大人默穴,你說我怎么就攤上這事⊥市悖” “怎么了蓄诽?”我有些...
    開封第一講書人閱讀 156,936評論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長媒吗。 經常有香客問我仑氛,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,427評論 1 283
  • 正文 為了忘掉前任锯岖,我火速辦了婚禮介袜,結果婚禮上,老公的妹妹穿的比我還像新娘出吹。我一直安慰自己遇伞,他們只是感情好,可當我...
    茶點故事閱讀 65,467評論 6 385
  • 文/花漫 我一把揭開白布捶牢。 她就那樣靜靜地躺著鸠珠,像睡著了一般。 火紅的嫁衣襯著肌膚如雪秋麸。 梳的紋絲不亂的頭發(fā)上渐排,一...
    開封第一講書人閱讀 49,785評論 1 290
  • 那天,我揣著相機與錄音灸蟆,去河邊找鬼驯耻。 笑死,一個胖子當著我的面吹牛炒考,可吹牛的內容都是我干的可缚。 我是一名探鬼主播,決...
    沈念sama閱讀 38,931評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼票腰,長吁一口氣:“原來是場噩夢啊……” “哼城看!你這毒婦竟也來了女气?” 一聲冷哼從身側響起杏慰,我...
    開封第一講書人閱讀 37,696評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎炼鞠,沒想到半個月后缘滥,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 44,141評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡谒主,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,483評論 2 327
  • 正文 我和宋清朗相戀三年朝扼,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片霎肯。...
    茶點故事閱讀 38,625評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡擎颖,死狀恐怖,靈堂內的尸體忽然破棺而出观游,到底是詐尸還是另有隱情搂捧,我是刑警寧澤,帶...
    沈念sama閱讀 34,291評論 4 329
  • 正文 年R本政府宣布懂缕,位于F島的核電站允跑,受9級特大地震影響,放射性物質發(fā)生泄漏。R本人自食惡果不足惜聋丝,卻給世界環(huán)境...
    茶點故事閱讀 39,892評論 3 312
  • 文/蒙蒙 一索烹、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧弱睦,春花似錦百姓、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至焦读,卻和暖如春子库,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背矗晃。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工仑嗅, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人张症。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓仓技,卻偏偏與公主長得像,于是被迫代替她去往敵國和親俗他。 傳聞我的和親對象是個殘疾皇子脖捻,可洞房花燭夜當晚...
    茶點故事閱讀 43,492評論 2 348

推薦閱讀更多精彩內容