數(shù)據(jù)、運(yùn)營相關(guān)案例問答題(一)【潘偻茫客網(wǎng):數(shù)據(jù)分析試題廣場】

試題來源:攀茫客網(wǎng)

回答僅代表個人看法,歡迎交流評論留言涣狗,有不正確的地方請多指教~~


1谍婉、某APP 7月份DAU比同年5月份上漲了10%,作為數(shù)據(jù)分析師屑柔,你會從哪些方面分析DAU增長的原因屡萤? 請列舉至少兩種以上拆分思路。

step1:確定數(shù)據(jù)是否存在異常:基于歷史數(shù)據(jù)掸宛,利用移動平均等預(yù)測方法死陆,預(yù)測7月DAU數(shù)值,與2-3倍標(biāo)準(zhǔn)差做對比唧瘾,判斷實(shí)際數(shù)值是否處于正常范圍措译。(也就是判斷DAU上漲10%這是一個趨勢,還是一個問題饰序,是長期因素導(dǎo)致的领虹,還是短期內(nèi)社會事件等因素導(dǎo)致的。)

step2:拆分?jǐn)?shù)據(jù)維度:人群拆分求豫、渠道拆分塌衰、地理拆分、內(nèi)外部拆分(拆分的核心是找出哪些影響因素導(dǎo)致了數(shù)值的異常蝠嘉,從各個維度判斷是整體因素還是某類因素)最疆。

① 人群拆分:新老用戶維度、性別維度蚤告、年齡維度努酸、職業(yè)維度等等。

② 渠道拆分:從新用戶的的引入渠道杜恰、APP的跳轉(zhuǎn)入/跳轉(zhuǎn)出渠道获诈、分享渠道、付費(fèi)渠道等心褐。

③ 地理拆分:從地區(qū)舔涎、城市、線級等粒度逗爹,拆分?jǐn)?shù)據(jù)亡嫌,分析DAU增長點(diǎn)是發(fā)生在某類城市、還是整體市場的變化。如果是在某個或某類城市的變化昼伴,則進(jìn)一步分析其DAU增長原因。同時對比其滲透率與DAU變化較小的城市滲透率镣屹,判斷這類城市的變化對整體DAU變化的影響程度圃郊。

④ 內(nèi)外部拆分:內(nèi)部主要指產(chǎn)品本身的改動點(diǎn)是否獲得用戶認(rèn)可,包括產(chǎn)品模塊的改動女蜈、產(chǎn)品運(yùn)營策略的改動持舆,可通過A/B Test、用戶調(diào)研等方式進(jìn)行檢驗(yàn)伪窖。 ?外部可以從市場趨勢逸寓、市場競爭、外部輿論覆山、社會事件竹伸、節(jié)假日、PEST模型等因素考慮簇宽,可利用輿論熱度勋篓、關(guān)鍵詞搜索量、ADX等指標(biāo)衡量趨勢類因素魏割,也可從分隔市場角度解釋市場競爭因素(在固定容量的市場環(huán)境中譬嚣,一些產(chǎn)品的倒下或爆紅,將導(dǎo)致用戶量的集中和分散)钞它。

step3/4/5/6/7/8/9:具體維度考察技術(shù)拜银、產(chǎn)品、運(yùn)營遭垛,進(jìn)一步細(xì)化DAU增長原因尼桶,分析問題,預(yù)測8月趨勢變化耻卡,并為后續(xù)運(yùn)營策略提優(yōu)化建議疯汁。




2、你發(fā)現(xiàn)你負(fù)責(zé)的產(chǎn)品有用戶在褥羊毛卵酪,你如何通過數(shù)據(jù)分析方法揪出這群羊毛黨幌蚊,將漏洞補(bǔ)上?

step1:定義薅羊毛行為:包括羊毛指什么溃卡,薅羊毛的手段溢豆、薅羊毛的性質(zhì),大體可分為兩類:

① 利用活動規(guī)則而行使的正常撿漏行為:通俗來說就是在活動期間瘸羡,利用活動規(guī)則漩仙,使用消費(fèi)券、優(yōu)惠券、免費(fèi)券等队他,導(dǎo)致支付金額較少卷仑,低變現(xiàn)轉(zhuǎn)化的行為。

例如1:瑞辛咖啡的邀請新人得免費(fèi)咖啡券麸折,羊毛黨邀請不喝咖啡的長輩锡凝,免費(fèi)得2張咖啡券。

例如2:陰陽師分享得藍(lán)票垢啼,羊毛黨分享在朋友圈僅自己可見窜锯,或分享給文件傳輸助手等。

② 利用漏洞芭析,運(yùn)動專業(yè)技術(shù)批量性操作的作弊手段锚扎、或針對平臺Bug 而行使的惡性撿漏行為。

例如1:ofo單車眾騎活動中馁启,利用虛擬GPS作弊領(lǐng)取紅包的行為.

例如2:拼多多后臺Bug領(lǐng)取百元紅包的行為等驾孔。

(也可以從薅羊毛的方法上對羊毛黨進(jìn)行分類:刷單刷票類、任務(wù)類进统、黃牛類助币、黑客類、漏斗研究類)

step2:定義清楚薅羊毛的行為類別后螟碎,確定具體的羊毛量眉菱,即金額、補(bǔ)貼等可量化的指標(biāo)(部分活動的發(fā)起不僅是為了拉新掉分,也為了促活俭缓,因此一定范圍內(nèi)的羊毛是正常的,所以需要明確具體的羊毛量酥郭,防止將過多正常用戶被納入羊毛黨)华坦。

step3:利用sql或python,從數(shù)據(jù)庫中定位相應(yīng)用戶賬號不从。

step4:分析用戶行為數(shù)據(jù)的共性與特征惜姐,明確產(chǎn)出羊毛的途徑,與行為路徑椿息。

step5:補(bǔ)漏從開源歹袁、節(jié)流、數(shù)據(jù)監(jiān)控三個方面展開:

開源填補(bǔ):對惡性刷單用戶進(jìn)行懲罰(例如:押金不退)寝优,對于交易金額較少或僅活動交易的用戶条舔,在產(chǎn)品推薦機(jī)制上,增加低價產(chǎn)品的曝光率乏矾,將這類用戶的共性孟抗,加入下次產(chǎn)品活動的規(guī)則考量迁杨。

節(jié)流控制:對于惡性薅羊毛行為,設(shè)置薅羊毛警告(例如:刷單用戶一經(jīng)舉報合適凄硼,取消活動資格铅协,押金不退等手段),對于大批量用戶可以通過技術(shù)手段實(shí)現(xiàn)控制(例如:驗(yàn)證碼摊沉、IP等)警医。此外,可從用戶坯钦、設(shè)備、渠道侈玄、補(bǔ)貼上限婉刀、活動時間、獲利門檻等角度對產(chǎn)品活動設(shè)置限制(例如:實(shí)名認(rèn)證序仙、信用分突颊、設(shè)備參與次數(shù)、紅包上限等)潘悼。

數(shù)據(jù)監(jiān)控:對突增的數(shù)據(jù)進(jìn)行跟蹤(如用戶量律秃、交易額),對關(guān)鍵用戶的數(shù)據(jù)(也就是對整體數(shù)據(jù)影響較大的用戶數(shù)據(jù))進(jìn)行檢查治唤,通過實(shí)時在線的手段棒动,來檢查風(fēng)險,并作出相應(yīng)的風(fēng)險處理宾添,控制整體產(chǎn)品活動效果船惨。




3、用戶分析是電商數(shù)據(jù)分析中重要的模塊缕陕,在對用戶特征深度理解和用戶需求充分挖掘基礎(chǔ)上粱锐,進(jìn)行全生命周期的運(yùn)營管理(拉新—>活躍—>留存—>價值提升—>忠誠),請嘗試回答以下3個問題:

問題一:用戶第一單購買的行為往往反映了用戶對平臺的信任度和消費(fèi)能力】敢兀現(xiàn)在數(shù)據(jù)庫中有一張用戶交易表order怜浅,其中有userid(用戶ID)、amount(消費(fèi)金額)蔬崩、paytime(支付時間)恶座,請寫出對應(yīng)的SQL語句,查出每個用戶第一單的消費(fèi)金額舱殿。

select userid, amount from(select userid, amount, min(payment) from order group by userid);

問題二:當(dāng)你發(fā)現(xiàn)本月的支付用戶數(shù)環(huán)比上月大幅下跌(超30%)奥裸,你會如何去探查背后的原因?請描述你的思路和其中涉及的關(guān)鍵指標(biāo)

step1:從長期/短期角度考慮沪袭,支付率的下降是否存在問題湾宙。長期角度從既往數(shù)據(jù)出發(fā)樟氢,對本月數(shù)據(jù)做預(yù)測,以2-3個標(biāo)準(zhǔn)差范圍衡量數(shù)據(jù)的下降是長期趨勢侠鳄,還是短期問題埠啃。如果是短期問題,那么考慮是否是近期的社會事件伟恶、上月是否存在特殊促銷活動碴开、是否存在疫情等外部情況導(dǎo)致的全面范圍影響。

step2:明確“支付用戶數(shù)=瀏覽用戶數(shù)*支付率”博秫,就可進(jìn)一步從瀏覽用戶數(shù)潦牛、支付率維度,觀察影響因子的變化挡育,確定是瀏覽用戶數(shù)下降導(dǎo)致巴碗,還是支付率下降導(dǎo)致。

step3:拆分維度:從新老用戶維度(新增客戶數(shù)即寒、留存率橡淆、復(fù)購率等)、生命周期維度(新用戶增量母赵、活躍用戶數(shù)量逸爵、留存用戶數(shù)量、支付用戶數(shù)量)凹嘲、人口統(tǒng)計(jì)學(xué)維度(性別师倔、年齡、職業(yè)等)周蹭、用戶群體(RFM模型用戶分層)溯革、渠道(拉新、付費(fèi)谷醉、推薦等)致稀、地域(區(qū)域、城市俱尼、線級等)抖单、內(nèi)外部(產(chǎn)品策略、市場趨勢遇八、競品)等因素進(jìn)一步細(xì)化假設(shè)矛绘,找出相關(guān)用戶群體,以及相關(guān)衡量指標(biāo)刃永,進(jìn)一步分析支付用戶數(shù)下降的原因货矮。

step4:回歸分析與預(yù)測:根據(jù)上述分析結(jié)果,對影響因子建立預(yù)測模型斯够,預(yù)估下跌趨勢的持續(xù)狀態(tài)以及跌幅程度囚玫。

step5:風(fēng)險與損失評估:評估支付用戶數(shù)的下降對核心KPI(商品總營收)的影響程度喧锦。

step6:根據(jù)業(yè)務(wù)分析、預(yù)測以及風(fēng)險評估結(jié)果抓督,制定下一步運(yùn)營策略燃少。

問題三:為了更好的理解用戶,我們通常會基于用戶的特征對用戶進(jìn)行分類铃在,便于更加精細(xì)化的理解用戶阵具,設(shè)計(jì)產(chǎn)品和運(yùn)營玩法,請你設(shè)計(jì)對應(yīng)的聚類方法定铜,包括重點(diǎn)的用戶特征的選擇及聚類算法并說明其基本原理和步驟

用戶特征選擇:人口統(tǒng)計(jì)學(xué)特征(包括性別阳液、年齡、地域揣炕、薪資趁舀、家庭成員)、用戶分層特征(最近一次消費(fèi)時間祝沸、消費(fèi)金額、消費(fèi)頻率)越庇、購買物品類別

聚類方法:Kmeans聚類算法罩锐,處理連續(xù)且數(shù)據(jù)量較大的數(shù)據(jù)。

基本原理:通過特征分析對用戶進(jìn)行分類卤唉,采用距離作為相似性的評價指標(biāo)涩惑,即認(rèn)為兩個對象的距離越近,其相似度就越大桑驱。

step1:先隨機(jī)選取K個對象作為初始的聚類中心:竭恬;

step2:計(jì)算每個對象與各種子聚類中心間的歐式距離,把每個對象分配給他最近的聚類中心熬的。

step3:一旦全部對象被分配了痊硕,每個聚類的聚類中心會根據(jù)聚類中現(xiàn)有的對象被重新計(jì)算,重新分配押框。依次循環(huán)岔绸,直到聚類中心點(diǎn)不再改變時循環(huán)結(jié)束。




4橡伞、某款游戲10月份收入比同年9月份下降了20%盒揉,作為數(shù)據(jù)分析師,你會從哪些方面分析收入下降原因兑徘?(列舉至少2種以上拆分思路刚盈,并寫清楚每種思路下對應(yīng)的數(shù)據(jù)指標(biāo))

step1:基于既往數(shù)據(jù),判斷10月份的收入下降是否是一個問題挂脑。確認(rèn)數(shù)據(jù)的真實(shí)性藕漱,存在下降異常后欲侮,拆分?jǐn)?shù)據(jù)維度。(注意谴分,由于是環(huán)比下降锈麸,需考察上月及下月是否存在促銷。)

step2:

思路一:用戶維度拆分牺蹄,明確收入計(jì)算公式忘伞,從新老維度、分層維度沙兰,對相關(guān)指標(biāo)進(jìn)一步分析

收入 = 用戶數(shù) * 人均消費(fèi)金額(ARPU)?

? ? ? ? ?= 用戶數(shù) * 人均消費(fèi)次數(shù) * 單均消費(fèi)金額

? ? ? ? ?= 用戶數(shù) * 付費(fèi)用戶比率(PUR) *?付費(fèi)用戶人均消費(fèi)金額(ARPPU)

? ? ? ? ?= 用戶數(shù) * 活躍用戶比率 * 活躍用戶付費(fèi)比率 * 付費(fèi)用戶人均消費(fèi)金額(ARPPU)

? 新老用戶維度:收入 = 新用戶數(shù)*新用戶付費(fèi)比率*新付費(fèi)用戶人均消費(fèi)金額 + 老用戶數(shù)*老用戶活躍用戶比率*老用戶活躍用戶付費(fèi)比率*老用戶付費(fèi)用戶人均消費(fèi)金額氓奈。基于上述公式鼎天,對新老用戶的用戶行為進(jìn)行研究舀奶,從新老用戶數(shù)、活躍比率斋射、消費(fèi)比率育勺、人均消費(fèi)金額、付費(fèi)用戶人均消費(fèi)金額等角度分析收入下降的原因罗岖。

??用戶分層維度:基于RFM模型(最近一次消費(fèi)時間涧至、消費(fèi)頻率、消費(fèi)金額)桑包,結(jié)合游戲相關(guān)指標(biāo)(包括:用戶等級南蓬、鉆級、游戲時長等)哑了,對用戶進(jìn)行分層處理赘方。針對每類用戶群體,進(jìn)一步研究用戶行為(包括每類用戶群體的用戶數(shù)弱左、活躍比率窄陡、消費(fèi)比率、人均消費(fèi)金額等)拆火。

? 用戶轉(zhuǎn)化維度:基于AARRR模型泳梆,對各階段相關(guān)的用戶數(shù)據(jù)指標(biāo)進(jìn)行同比、環(huán)比的分析:

① 用戶獲劝裾啤:渠道曝光量优妙、渠道轉(zhuǎn)化率、ROI憎账、獲客成本

② 用戶活躍:活躍用戶數(shù)套硼、用戶訪問時長、平均訪問次數(shù)胞皱、新老客占比

③ 用戶留存:次日留存率邪意、7日留存率九妈、15日留存率、30日留存率

④ 營收:訂單量雾鬼、訂單金額萌朱、付費(fèi)用戶占比、活躍用戶的平均消費(fèi)金額策菜、付費(fèi)用戶的平均消費(fèi)金額晶疼、人均消費(fèi)金額、用戶生命價值(LTV)

⑤ 傳播:平均用戶分享率又憨、老帶新平均新量翠霍、活動曝光量


思路二:內(nèi)外部維度拆分,從產(chǎn)品內(nèi)部變化蠢莺,與外部市場情況寒匙,分析影響整體收入的因素

? 內(nèi)部模塊維度:考察游戲各個模塊的收入情況(總收入=所有模塊收入之和)

將各模塊收入同比、環(huán)比情況躏将,與整體收入的同比锄弱、環(huán)比情況做對比,考察收入的下降是整體趨勢祸憋,還是單個会宪、或某幾個模塊的收入下降導(dǎo)致。

如果是各模塊與整體下降情況都呈現(xiàn)較為一致夺衍,且無單個模塊下降或增長異常,通關(guān)人數(shù)占比處于正常水平喜命,說明下降的原因主要是外部因素導(dǎo)致沟沙。

如果出現(xiàn)某個或某幾個模塊數(shù)據(jù)異常,則針對這類模塊進(jìn)一步從產(chǎn)品壁榕、運(yùn)營矛紫、技術(shù)維度分析:

① 產(chǎn)品角度:產(chǎn)品模塊是否版本更新、是否存在模塊玩法封頂牌里、上新需求是否急切等颊咬。

② 運(yùn)營角度:折扣優(yōu)惠額度、促銷活動次數(shù)牡辽、推廣渠道喳篇、各模塊的DAU、MAU态辛、游戲時長麸澜、付費(fèi)用戶數(shù)、平均付費(fèi)金額等奏黑,考察渠道炊邦、內(nèi)容编矾、促銷、推廣等運(yùn)營模式是否存在異常馁害。

③ 技術(shù)數(shù)角度:檢驗(yàn)是否存在Bug窄俏、不流暢、質(zhì)量下降等情況碘菜。

同時凹蜈,針對出現(xiàn)異常的模塊,要注意傾聽用戶的聲音炉媒,收集評論與輿論等信息踪区,做用戶調(diào)研,為下一步的優(yōu)化策略提供用戶需求基礎(chǔ)吊骤。

? 外部環(huán)境維度分析:基于PEST模型缎岗,對比事件前后,用戶數(shù)白粉、年齡传泊、下載次數(shù)、消費(fèi)金額等數(shù)據(jù)的變化鸭巴,考察外部環(huán)境變化對收入產(chǎn)生的影響眷细。

政策因素(例如禁止18歲以下兒童使用)、市場趨勢(手游&端游占比趨勢鹃祖,團(tuán)競溪椎、休閑等游戲類型的占比趨勢)、競品因素(競品下載次數(shù)恬口、熱度數(shù)據(jù))校读、節(jié)日及社會輿論熱點(diǎn)(寒暑假、高考中考祖能、游戲沉迷等負(fù)面輿論)歉秫。對比事件前后,各年齡層比率的變化养铸,對比總收入變化雁芙。




5、用戶分析是電商數(shù)據(jù)分析中重要的模塊钞螟,在對用戶特征深度理解和用戶需求充分挖掘基礎(chǔ)上兔甘,進(jìn)行全生命周期的運(yùn)營管理(拉新—>活躍—>留存—>價值提升—>忠誠),請嘗試回答以下3個問題:

問題一:現(xiàn)在數(shù)據(jù)庫中有一張用戶交易表order鳞滨,其中有userid(用戶ID)裂明、orderid(訂單ID)、amount(訂單金額)、paytime(支付時間)闽晦,請寫出對應(yīng)的SQL語句扳碍,查出每個月的新客數(shù)(新客指在嚴(yán)選首次支付的用戶),當(dāng)月有復(fù)購的新客數(shù)仙蛉,新客當(dāng)月復(fù)購率(公式=當(dāng)月有復(fù)購的新客數(shù)/月總新客數(shù))笋敞。

① 查詢每個月的新客數(shù):

step1:將時間格式的payment,轉(zhuǎn)化為年-月格式荠瘪,新增列 ym

ALTER TABLE order ADD COLUMN ym VARCHAR(255) NOT NULL;

UPDATE order SET ym=DATE_FORMAT(paytime, '%Y-%m');

step 2:創(chuàng)建新客戶userid和第一次的支付時間的視圖夯巷,方便后續(xù)調(diào)用:

CREATE VIEW t1 AS

SELECT userid, MIN(paytime), ym FROM order_t GROUP BY userid ;

step 3:查詢每個月的新客戶數(shù):

SELECT ym AS 年月名稱, COUNT(userid) AS 新客戶數(shù)

FROM t1 GROUP BY ym;

② 查詢當(dāng)月有復(fù)購的新客戶數(shù):

step1:查詢每個月新客戶的購買數(shù)量

CREATE VIEW t2 AS

SELECT t0.userid AS 用戶編號, COUNT(t0.userid) AS 購買次數(shù), t0.ym AS 年月名稱

FROM order_t AS t0, t1

WHERE t0.userid = t1.userid AND t0.ym = t1.ym

GROUP BY t0.userid;

step 2:篩選每個月新客戶購買數(shù)量大于1次的客戶及客戶數(shù)

CREATE VIEW t3 AS

SELECT 年月名稱, COUNT(用戶編號) AS 復(fù)購新用戶數(shù) FROM t2

WHERE 購買次數(shù) > 1 GROUP BY 年月名稱;

SELECT * FROM t3;

③ 新客當(dāng)月復(fù)購率

SELECT t2.`年月名稱`, t3.復(fù)購新用戶數(shù)/COUNT(t2.`用戶編號`) AS 新客當(dāng)月復(fù)購率

FROM t2, t3 WHERE t2.`年月名稱`=t3.`年月名稱` GROUP BY t2.`年月名稱`;

問題二:當(dāng)你發(fā)現(xiàn)最近一周APP端新訪用戶當(dāng)天轉(zhuǎn)化率(公式=新訪當(dāng)天支付人數(shù)/新訪用戶數(shù),新訪是指首次訪問嚴(yán)選APP的設(shè)備)環(huán)比最近4周日均轉(zhuǎn)化率大幅下跌(超30%)哀墓,你會如何去探查背后的原因趁餐?請描述你的思路和其中涉及的關(guān)鍵指標(biāo)

step 1:判斷數(shù)據(jù)真實(shí)性,由于環(huán)比最近4周日均轉(zhuǎn)化率下跌篮绰,可初步排除趨勢類因素

step 2:拆分?jǐn)?shù)據(jù)維度后雷,并觀察各維度下新訪當(dāng)天支付人數(shù)、當(dāng)天新訪用戶數(shù)的環(huán)比情況:

????人口統(tǒng)計(jì)維度:年齡吠各、性別臀突、職業(yè)、薪資等

????地理位置維度:區(qū)域贾漏、城市候学、線級

????渠道維度:引流渠道、支付渠道纵散、分享渠道梳码、渠道曝光率

????內(nèi)外部因素:市場趨勢、競品數(shù)據(jù)伍掀、促銷活動掰茶、社會熱點(diǎn)、輿論硕盹、節(jié)假日等維度

當(dāng)定位到異常數(shù)據(jù)后符匾,可進(jìn)一步細(xì)化假設(shè)叨咖,從產(chǎn)品瘩例、運(yùn)營、技術(shù)等角度甸各,考察具體轉(zhuǎn)化率下降的原因垛贤。例如:產(chǎn)品的更新是否不符合用戶需求、運(yùn)營活動是否吸引力較小趣倾、支付渠道是否存在問題聘惦。

再如:若發(fā)現(xiàn)渠道數(shù)據(jù)異常,則探究該渠道的投放素材儒恋、運(yùn)營策略是否存在問題善绎。以及產(chǎn)品策略是否存在調(diào)整黔漂,調(diào)整后的產(chǎn)品策略是否與該渠道用戶需求不符。如果是個別渠道的新訪客增多禀酱,那么說明該渠道的前期運(yùn)營還不錯炬守,但該渠道獲得的用戶價值可能不高,或者該渠道對用戶的推薦可能不夠準(zhǔn)確剂跟,導(dǎo)致用戶的轉(zhuǎn)化率低减途。

可針對異常數(shù)據(jù),進(jìn)一步從用戶行為數(shù)據(jù)(對各功能模塊的使用情況曹洽、瀏覽-收藏-加購-購買的漏斗模型等)進(jìn)一步觀察用戶在哪些功能模塊停留時長較短鳍置、退出路徑等,分析該類渠道用戶的真實(shí)需求送淆,進(jìn)而優(yōu)化算法推薦等税产,或調(diào)整渠道策略,以提高轉(zhuǎn)化率坊夫。

問題三:在進(jìn)行用戶運(yùn)營之前砖第,我們通常會對用戶進(jìn)行分層,針對不同類型用戶實(shí)施差異化的運(yùn)營策略和資源投入环凿,請你幫助設(shè)計(jì)嚴(yán)選用戶分層的方案梧兼,包括關(guān)鍵特征的選擇,分層的方法智听,如涉及模型/算法羽杰,請說明選擇的算法類型、基本原理和步驟

step 1:明確用戶分層的目的

針對用戶全生命周期(拉新—>活躍—>留存—>價值提升—>忠誠)實(shí)施差異化的運(yùn)營管理和資源投入到推,也就是更關(guān)注用戶生命周期與各階段的用戶價值考赛。

step 2:選擇關(guān)鍵特征

? ? 用戶屬性:獲客渠道、城市莉测、家庭颜骤、薪資、職業(yè)捣卤、信息完善度忍抽、支付方式種數(shù)(忠誠度)

????用戶價值:最近一次消費(fèi)、消費(fèi)頻率董朝、消費(fèi)金額鸠项、會員狀態(tài)

????用戶活躍度:注冊時間、距離最近一次活躍天數(shù)子姜、活躍頻率祟绊、使用時長

而后利用統(tǒng)計(jì)分析技術(shù)(例如相關(guān)性分析),結(jié)合轉(zhuǎn)化率情況,對上述各特征進(jìn)行相關(guān)性檢驗(yàn)牧抽,而后選取相關(guān)程度較高的指標(biāo)嘉熊,進(jìn)行下一步的分層設(shè)計(jì)。

而后利用K-means聚類算法扬舒,針對上述篩選后連續(xù)且數(shù)據(jù)量較大的指標(biāo)记舆,對應(yīng)其轉(zhuǎn)化率情況,各計(jì)算3-5個聚類中心呼巴,構(gòu)建每個指標(biāo)的層次維度泽腮,結(jié)合分類性指標(biāo),構(gòu)建最終的關(guān)鍵特征群衣赶。

step 3:設(shè)計(jì)用戶分層方案

首先诊赊,從業(yè)務(wù)層面對各指標(biāo)對整體結(jié)果的影響權(quán)重進(jìn)行打分;

而后府瞄,基于K-means聚類結(jié)果碧磅,對每個指標(biāo)的子維度權(quán)重進(jìn)行打分;

最后遵馆,參考RFM模型思路鲸郊,對用戶屬性、用戶價值货邓、用戶活躍度構(gòu)建融合模型

(以下權(quán)重占比以及評分范圍秆撮,未經(jīng)檢驗(yàn),僅用作示例)

算法解釋與說明:

① 相關(guān)性分析:指對兩個或多個具備相關(guān)性的變量元素進(jìn)行分析换况,從而衡量兩個變量因素的相關(guān)密切程度职辨。相關(guān)系數(shù) r = (x和y的協(xié)方差)/(x的標(biāo)準(zhǔn)差 * y的標(biāo)準(zhǔn)差),相關(guān)系數(shù) r 的正負(fù)表示相關(guān)性方向戈二,其大小表示相關(guān)性程度舒裤。

② K-means 聚類算法:適合處理連續(xù)且數(shù)據(jù)量較大的數(shù)據(jù)。通過特征分析對指標(biāo)進(jìn)行分類觉吭,采用距離作為相似性的評價指標(biāo)腾供,即認(rèn)為兩個對象的距離越近,其相似度就越大鲜滩。

實(shí)現(xiàn)步驟:先隨機(jī)選取K個對象作為初始的聚類中心:伴鳖;計(jì)算每個對象與各種子聚類中心間的歐式距離,把每個對象分配給他最近的聚類中心绒北。一旦全部對象被分配了黎侈,每個聚類的聚類中心會根據(jù)聚類中現(xiàn)有的對象被重新計(jì)算察署,重新分配闷游。依次循環(huán),直到聚類中心點(diǎn)不再改變時循環(huán)結(jié)束。

③ 融合模型:建立母維度脐往,并賦予每個維度各自權(quán)重占比休吠。而后拆分各個母維度,并對其子維度進(jìn)行范圍劃定(基于上述K-means聚類結(jié)果)业簿,對各子維度賦予各自權(quán)重占比瘤礁,基于子母維度的得分情況,繪制融合模型梅尤,實(shí)現(xiàn)多維度的用戶分層柜思。



以上僅代表個人看法,對于算法模型在運(yùn)營維度的邏輯性巷燥、以及在數(shù)據(jù)維度的可操作性赡盘,還有待實(shí)際驗(yàn)證。歡迎各位留言交流探討~~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末缰揪,一起剝皮案震驚了整個濱河市陨享,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌钝腺,老刑警劉巖抛姑,帶你破解...
    沈念sama閱讀 217,406評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異艳狐,居然都是意外死亡定硝,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,732評論 3 393
  • 文/潘曉璐 我一進(jìn)店門毫目,熙熙樓的掌柜王于貴愁眉苦臉地迎上來喷斋,“玉大人,你說我怎么就攤上這事蒜茴⌒亲Γ” “怎么了?”我有些...
    開封第一講書人閱讀 163,711評論 0 353
  • 文/不壞的土叔 我叫張陵粉私,是天一觀的道長顽腾。 經(jīng)常有香客問我,道長诺核,這世上最難降的妖魔是什么抄肖? 我笑而不...
    開封第一講書人閱讀 58,380評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮窖杀,結(jié)果婚禮上漓摩,老公的妹妹穿的比我還像新娘。我一直安慰自己入客,他們只是感情好管毙,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,432評論 6 392
  • 文/花漫 我一把揭開白布腿椎。 她就那樣靜靜地躺著,像睡著了一般夭咬。 火紅的嫁衣襯著肌膚如雪啃炸。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,301評論 1 301
  • 那天卓舵,我揣著相機(jī)與錄音南用,去河邊找鬼。 笑死掏湾,一個胖子當(dāng)著我的面吹牛裹虫,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播融击,決...
    沈念sama閱讀 40,145評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼恒界,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了砚嘴?” 一聲冷哼從身側(cè)響起十酣,我...
    開封第一講書人閱讀 39,008評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎际长,沒想到半個月后耸采,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,443評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡工育,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,649評論 3 334
  • 正文 我和宋清朗相戀三年虾宇,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片如绸。...
    茶點(diǎn)故事閱讀 39,795評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡嘱朽,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出怔接,到底是詐尸還是另有隱情搪泳,我是刑警寧澤,帶...
    沈念sama閱讀 35,501評論 5 345
  • 正文 年R本政府宣布扼脐,位于F島的核電站岸军,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏瓦侮。R本人自食惡果不足惜艰赞,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,119評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望肚吏。 院中可真熱鬧方妖,春花似錦、人聲如沸罚攀。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,731評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至仔役,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間是己,已是汗流浹背又兵。 一陣腳步聲響...
    開封第一講書人閱讀 32,865評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留卒废,地道東北人沛厨。 一個月前我還...
    沈念sama閱讀 47,899評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像摔认,于是被迫代替她去往敵國和親逆皮。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,724評論 2 354