絢麗的小海螺 | 作者
知乎專欄 |?來(lái)源
https://zhuanlan.zhihu.com/p/163531470
用戶分析是電商數(shù)據(jù)分析中重要的模塊糊探,在對(duì)用戶特征深度理解和用戶需求充分挖掘基礎(chǔ)上,進(jìn)行全生命周期的運(yùn)營(yíng)管理(拉新—>活躍—>留存—>價(jià)值提升—>忠誠(chéng))河闰,請(qǐng)嘗試回答以下3個(gè)問(wèn)題:
① 用戶第一單購(gòu)買的行為往往反映了用戶對(duì)平臺(tái)的信任度和消費(fèi)能力】破剑現(xiàn)在數(shù)據(jù)庫(kù)中有一張用戶交易表order,其中有userid(用戶ID)姜性、amount(消費(fèi)金額)瞪慧、paytime(支付時(shí)間),請(qǐng)寫出對(duì)應(yīng)的SQL語(yǔ)句部念,查出每個(gè)用戶第一單的消費(fèi)金額弃酌。
查出每個(gè)用戶第一單的消費(fèi)金額
--使用窗口函數(shù)(考慮一個(gè)用戶不能同時(shí)下兩單)
selecta.userid,a.amount
from
(select* ,rank()over(partitionbyuseridorderbypaytime)aspaytime_rankfromorder)as
awherepaytime_rank=1
--使用聯(lián)結(jié)方法
--查出第一單消費(fèi)時(shí)間
creatviewtas
(selectuserid,min(paytime)as首次消費(fèi)時(shí)間fromordergroupbyuserid)
--找出第一消費(fèi)金額
selectt.userid,t.首次消費(fèi)時(shí)間 ,b.amountfromtinnerjoin
orderasb
on(t.userid=b.useridandt.首次消費(fèi)時(shí)間=b.paytime)
② 當(dāng)你發(fā)現(xiàn)本月的支付用戶數(shù)環(huán)比上月大幅下跌(超30%),你會(huì)如何去探查背后的原因儡炼?請(qǐng)描述你的思路和其中涉及的關(guān)鍵指標(biāo)
第一步:明確問(wèn)題
在筆試中這一步就比較明確了妓湘,面試時(shí)還需要像面試官明確這些具體的詳細(xì)信息:
明確數(shù)據(jù)來(lái)源和準(zhǔn)確性:時(shí)間是本月,對(duì)比的基準(zhǔn)是上月乌询,地點(diǎn)是哪個(gè)城市的支付用戶還是所有的支付用戶?數(shù)據(jù)來(lái)源哪個(gè)部門榜贴,數(shù)據(jù)是否無(wú)誤,
業(yè)務(wù)指標(biāo)理解:支付用戶數(shù)=用戶數(shù)*轉(zhuǎn)化率 楣责。明確是和上月對(duì)比下跌超過(guò)30%竣灌,運(yùn)用多維度拆解分析方法,把整體拆成部分秆麸,查看內(nèi)部的差異初嘹。
現(xiàn)在的問(wèn)題是為什么支付用戶數(shù)下降?是用戶數(shù)下降了還是轉(zhuǎn)化率下降了沮趣?
第二步:分析原因
使用多維度拆解分析方法對(duì)支付用戶數(shù)這個(gè)指標(biāo)進(jìn)行拆解:支付用戶數(shù)=用戶數(shù)*轉(zhuǎn)化率
從新老用戶維度進(jìn)行拆解屯烦,把用戶數(shù)拆解成新用戶數(shù)和老用戶活躍人數(shù),其中新用戶數(shù)在平臺(tái)購(gòu)買過(guò)的用戶人數(shù)房铭,老用戶活躍人數(shù)是在平臺(tái)購(gòu)買過(guò)的用戶在平臺(tái)活躍的人數(shù)
新用戶數(shù)按渠道維度驻龟,又繼續(xù)拆解為渠道A新用戶,渠道B新用戶等缸匪,考慮不同渠道的轉(zhuǎn)化率也可能不一樣翁狐,同樣分渠道拆解為渠道A轉(zhuǎn)化率,渠道B轉(zhuǎn)化率凌蔬,渠道C轉(zhuǎn)化率
對(duì)以上分析?做出假設(shè)一:渠道A露懒、B闯冷、C新用戶人數(shù)減少
收集證據(jù),分析渠道投放效果懈词。使用對(duì)比分析方法蛇耀,如果確認(rèn)某渠道用戶相比上月確實(shí)降低
則對(duì)渠道用戶數(shù)進(jìn)行多維度拆解,可以從年齡構(gòu)成拆分坎弯,性別構(gòu)成拆分纺涤,職業(yè)結(jié)構(gòu)拆分和地域組成拆分,分別進(jìn)行假設(shè)檢驗(yàn)抠忘,手機(jī)證據(jù)撩炊,將渠道人數(shù)降低定位到是那個(gè)人群用戶數(shù)降低,渠道的導(dǎo)入量降低的原因崎脉,分析渠道投放是否有效衰抑。
繼續(xù)考慮用戶數(shù)假設(shè)二:渠道A、B荧嵌、C轉(zhuǎn)化率降低
使用對(duì)比分析如果確認(rèn)某渠道轉(zhuǎn)化率降低,繼續(xù)按業(yè)務(wù)流程對(duì)該渠道具體哪一步出現(xiàn)的問(wèn)題進(jìn)行拆解砾淌,假設(shè)平臺(tái)用戶的流程有廣告啦撮、進(jìn)店、選擇商品汪厨、購(gòu)買
則按業(yè)務(wù)流程拆解如下赃春,通過(guò)假設(shè)檢驗(yàn),收集數(shù)據(jù)劫乱,查看產(chǎn)品板塊是否更新织中,詢問(wèn)客服是否有投訴,有頁(yè)面崩潰衷戈,不能成功下單導(dǎo)致某一環(huán)節(jié)流失率高狭吼,閃退,使用漏斗模型殖妇,判斷是哪個(gè)產(chǎn)品環(huán)節(jié)出了問(wèn)題刁笙。使用假設(shè)檢驗(yàn),驗(yàn)證每個(gè)環(huán)節(jié)的假設(shè)谦趣。
假設(shè)三:老用戶活躍人數(shù)出了問(wèn)題
通過(guò)假設(shè)檢驗(yàn)和對(duì)比分析方法分析老用戶活躍人數(shù)是否降低疲吸,如果降低的話,思考老用戶活躍人數(shù)為什么會(huì)降低呢前鹅?我們從用戶摘悴、產(chǎn)品、競(jìng)品三個(gè)維度分析原因
1.?用戶購(gòu)買體驗(yàn)不好舰绘,產(chǎn)品描述與實(shí)際不符
2.?產(chǎn)品售后服務(wù)不夠好等
3.?上月做活動(dòng)蹂喻,上月活躍人數(shù)大幅上漲等
4.?競(jìng)品在搞活動(dòng)葱椭,用戶被對(duì)手吸引
可以分別從幾個(gè)假設(shè)去分析原因,如果以上三大部分假設(shè)有問(wèn)題,總結(jié)原因如下:
原始渠道A用戶發(fā)生改變叉橱,導(dǎo)致渠道導(dǎo)入量下降挫以,具體表現(xiàn)20-35歲年齡段人數(shù)下降,該35-50人群年齡段占比上升窃祝,而20-30歲群體是為我們平臺(tái)的主要使用人群掐松。
產(chǎn)品更新迭代,用戶習(xí)慣之前的界面粪小,還沒(méi)有適應(yīng)
由于之前平臺(tái)大促大磺,導(dǎo)致平臺(tái)的售后和產(chǎn)品質(zhì)量方面波動(dòng)較大,用戶頗為不滿
總結(jié)新用戶引入不夠探膊,老用戶留存沒(méi)做好杠愧,產(chǎn)品本身改動(dòng),導(dǎo)致出現(xiàn)了這種大幅下跌的情況
第三步:提出建議
針對(duì)以上的分析提出以下建議:
渠道A用戶人群轉(zhuǎn)移逞壁,考慮撤回渠道投放或者修改投放內(nèi)容流济,吸引35-50歲人群用戶進(jìn)入平臺(tái),提高轉(zhuǎn)化
用戶使用體驗(yàn)不佳腌闯,建議對(duì)部分用戶推更新版本绳瘟,建立對(duì)照組,進(jìn)行AB測(cè)試
從平臺(tái)的評(píng)論姿骏,對(duì)于中差評(píng)老用戶進(jìn)行回訪糖声,明確原因,進(jìn)行挽回分瘦。
③ 為了更好的理解用戶蘸泻,我們通常會(huì)基于用戶的特征對(duì)用戶進(jìn)行分類,便于更加精細(xì)化的理解用戶嘲玫,設(shè)計(jì)產(chǎn)品和運(yùn)營(yíng)玩法悦施,請(qǐng)你設(shè)計(jì)對(duì)應(yīng)的聚類方法,包括重點(diǎn)的用戶特征的選擇及聚類算法并說(shuō)明其基本原理和步驟
1. K-means聚類
使用K-means聚類的好處是可以加入性別去团,地域歼争,薪資等特征,這樣就可以得到的分類的年齡分布情況渗勘,薪資情況沐绒,職業(yè)分布等情況,比RFM會(huì)信息更多旺坠,但類別的解釋性沒(méi)有RFM用戶分層強(qiáng)乔遮。
特征選擇:人口統(tǒng)計(jì)學(xué)特征(性別,地域 ,年齡取刃,薪資蹋肮,職業(yè)出刷,家庭成員),用戶分層特征(消費(fèi)頻率坯辩,平均消費(fèi)金額馁龟,最近一次消費(fèi)時(shí)間)產(chǎn)品特征(購(gòu)買物品類別)
基本原理:
step1:選舉K個(gè)對(duì)象作為初始的聚類中心;
step2:計(jì)算每個(gè)對(duì)象與各種子聚類中心間的歐式距離漆魔,把每個(gè)對(duì)象分配給他最近的聚類中心坷檩;
step3:一旦全部對(duì)象被分配了,每個(gè)聚類的聚類中心會(huì)根據(jù)聚類中現(xiàn)有的對(duì)象被重新計(jì)算改抡,重新分配矢炼。依次循環(huán),直到聚類中心點(diǎn)不再改變時(shí)循環(huán)結(jié)束阿纤。
2. RFM分層
根據(jù)業(yè)務(wù)需求句灌,使用RFM對(duì)用戶進(jìn)行分層,使用RFM的好處是得到的類別結(jié)果具有更明確的實(shí)際業(yè)務(wù)意義欠拾,能指導(dǎo)精細(xì)化運(yùn)營(yíng)胰锌。缺點(diǎn)是沒(méi)有考慮用戶的人口統(tǒng)計(jì)學(xué)特征。
主要得到分層結(jié)果重要(一般)價(jià)值藐窄、發(fā)展匕荸、挽留、保持客戶八類
step1:計(jì)算RFM值(消費(fèi)頻率枷邪,平均消費(fèi)金額,最近一次消費(fèi)時(shí)間)
step2:分別RFM進(jìn)行打分诺凡,確定打分體系东揣,按價(jià)值打分,,計(jì)算均值或中值,超過(guò)均值/中值則該項(xiàng)指標(biāo)分類為高腹泌,低于均值則該指標(biāo)分類為低嘶卧,
step3:進(jìn)行用戶分類,根據(jù)用戶分類規(guī)則找到是否高低
step4:對(duì)應(yīng)表格找到用戶屬于哪個(gè)分類
網(wǎng)易嚴(yán)選是網(wǎng)易旗下原創(chuàng)生活類自營(yíng)電商品牌凉袱,深度貫徹“好的生活芥吟,沒(méi)那么貴”的品牌理念。商品覆蓋居家专甩、餐廚钟鸵、配件、服裝涤躲、洗護(hù)棺耍、母嬰、原生態(tài)飲食等幾大類目种樱,兼具品質(zhì)和性價(jià)比蒙袍,得到用戶的廣泛好評(píng)俊卤。若你是網(wǎng)易嚴(yán)選負(fù)責(zé)商品的數(shù)據(jù)分析師,當(dāng)面對(duì)以下業(yè)務(wù)問(wèn)題時(shí)害幅,你會(huì)如何解決消恍?
① 用戶增長(zhǎng)團(tuán)隊(duì)期望選擇一批合適的商品用于吸引新客,期望你幫助從數(shù)據(jù)的角度篩選出一批合適的商品以现,你會(huì)如何幫助他們進(jìn)行篩選狠怨?請(qǐng)描述你的思路。
答:該問(wèn)題的目的是吸引新客叼风,而新客的難點(diǎn)是沒(méi)有過(guò)去的歷史消費(fèi)記錄和瀏覽記錄取董,那如何進(jìn)行推薦來(lái)吸引呢?這本質(zhì)上一個(gè)推薦系統(tǒng)的用戶冷啟動(dòng)問(wèn)題无宿,有如下幾個(gè)步驟:
1.?對(duì)已有的用戶進(jìn)行分類茵汰,假設(shè)目前對(duì)于平臺(tái)已有的用戶有如下分類(高消費(fèi)人群、中高消費(fèi)人群孽鸡、中消費(fèi)人群蹂午、低消費(fèi)人群),找到最能吸引每類用戶的產(chǎn)品排行榜彬碱,比如最能吸引低消費(fèi)人群是性價(jià)比排行榜豆胸,最能吸引高消費(fèi)人群的是品質(zhì)排行榜,最能吸引中消費(fèi)人群的是熱銷排行榜等等巷疼,把用戶分類和排行榜對(duì)應(yīng)好晚胡。
2.?如何找到每個(gè)類別對(duì)應(yīng)的排行榜呢?對(duì)已經(jīng)分好的類嚼沿,結(jié)合該類用戶對(duì)商品購(gòu)買量和點(diǎn)擊量估盘,進(jìn)行綜合評(píng)價(jià),需要考慮商品的兩大屬性骡尽,一個(gè)是能否吸引用戶屬性遣妥,另一個(gè)是商品的價(jià)值收益屬性。因?yàn)橛行┥唐繁旧砗苁軞g迎攀细,但是單價(jià)低收益少箫踩,比如抽紙?jiān)擃惿唐罚巳硕夹枰诽埃麧?rùn)空間透明境钟,因此還要考慮該類商品的價(jià)值收益。
通過(guò)每類用戶商品的點(diǎn)擊量俭识、購(gòu)買量吱韭、客單價(jià)、利潤(rùn)等進(jìn)行綜合評(píng)價(jià)打分,得到每類商品的對(duì)應(yīng)排行榜
3.?盡可能拿到用戶登錄的信息理盆,登錄信息有年齡痘煤,性別,職業(yè)猿规,家庭成員(婚育情況)衷快,感興趣的領(lǐng)域和方向后,將用戶進(jìn)行初步分類姨俩,假設(shè)該用戶通過(guò)注冊(cè)時(shí)填入的感興趣信息和年齡等信息將其分入低消費(fèi)人群蘸拔,則給出該類別人群所對(duì)應(yīng)的性價(jià)比排行榜商品進(jìn)行推薦
4.?初步推薦后獲得用戶的點(diǎn)擊和轉(zhuǎn)化之后再進(jìn)行個(gè)性化的推薦
② 商品研發(fā)負(fù)責(zé)人期望能有一套指標(biāo)幫助衡量開(kāi)發(fā)的商品表現(xiàn),請(qǐng)你幫助設(shè)計(jì)對(duì)應(yīng)的評(píng)估方案环葵,包括設(shè)計(jì)思路调窍、涉及的數(shù)據(jù)指標(biāo)等。
答:該問(wèn)題是幫助衡量開(kāi)發(fā)的商品表現(xiàn)张遭,參考了《游戲數(shù)據(jù)分析實(shí)戰(zhàn)》這本書的一些內(nèi)容邓萨,提煉如下思維導(dǎo)圖
1. 在研發(fā)方向選擇和調(diào)研論證階段
需求角度:需求的強(qiáng)度也就是否用戶剛需(用戶生命周期和留存)、寬度(人群受眾分析菊卷,用戶年齡段缔恳,使用時(shí)間段、性別洁闰、職業(yè)等目標(biāo)群體大不大歉甚、需求的寬度是否會(huì)演變等、是否會(huì))和頻度(該類需求頻率高不高扑眉,平臺(tái)類要判斷是否有高頻和低頻都有纸泄,可以采用高頻帶動(dòng)低頻的方法)。有些行業(yè)是采用問(wèn)卷和預(yù)訂的方式進(jìn)行需求分析
宏觀環(huán)境:使用PEST進(jìn)行行業(yè)分析和競(jìng)爭(zhēng)市場(chǎng)分析
2. 產(chǎn)品研發(fā)和內(nèi)測(cè)階段
產(chǎn)品粘性指標(biāo):獲客總數(shù)腰素、留存率和用戶對(duì)產(chǎn)品的粘性聘裁,生命周期維度(新用戶增量、活躍用戶數(shù)量耸弄、留存用戶數(shù)量、支付用戶數(shù)量)觀察少量用戶具體行為卓缰,根據(jù)用戶留存情況不斷加大產(chǎn)品黏性计呈,不斷反饋。針對(duì)不同的APP征唬,有不同的北極星指標(biāo)捌显,比如電商類產(chǎn)品是GMV,抖音類短視頻是用戶使用時(shí)長(zhǎng)等指標(biāo)
用戶分析:用戶人群屬性(人口統(tǒng)計(jì)學(xué)維度)這些用戶對(duì)產(chǎn)品界面总寒、新手引導(dǎo)扶歪、軟件功能、社交功能等內(nèi)容的體驗(yàn)和評(píng)價(jià)如何,有什么建議善镰。便于對(duì)產(chǎn)品進(jìn)行修訂和優(yōu)化妹萨。
3. 產(chǎn)品優(yōu)化和小規(guī)模推廣階段
渠道質(zhì)量分析:通過(guò)接入渠道的導(dǎo)入量、留存率和付費(fèi)數(shù)據(jù)炫欺,進(jìn)行綜合排名乎完,全面了解渠道表現(xiàn)。幫助篩選渠道品洛,獲取更多的有效用戶树姨,讓產(chǎn)品收益最大化。
漏斗模型:這部分關(guān)注核心環(huán)節(jié)轉(zhuǎn)化率桥状,使用AARRR漏斗模型帽揪,做好每個(gè)環(huán)節(jié)的細(xì)節(jié),從渠道曝光量辅斟,激活转晰,注冊(cè),留存砾肺,購(gòu)買或者價(jià)值的部分挽霉,實(shí)現(xiàn)自增長(zhǎng)
產(chǎn)品留存優(yōu)化:繼續(xù)優(yōu)化產(chǎn)品的留存
4. 爆發(fā)式增長(zhǎng)
競(jìng)品調(diào)研:全方位了解產(chǎn)品動(dòng)態(tài),評(píng)價(jià)競(jìng)品壓力变汪。其主要的價(jià)值是上線時(shí)機(jī)的選擇侠坎,避重就輕,和競(jìng)品打差異化裙盾。
APP使用人數(shù)預(yù)估:在產(chǎn)品上線实胸、版本重大更新前,提前預(yù)測(cè)最高在線人數(shù)番官,避免出現(xiàn)產(chǎn)品崩潰庐完、充值排隊(duì)等現(xiàn)象。
廣告投放效果分析:每天監(jiān)控廣告投放數(shù)據(jù)徘熔,一旦發(fā)現(xiàn)數(shù)據(jù)異常门躯,及時(shí)預(yù)警,優(yōu)化酷师、調(diào)整廣告投放形式或素材讶凉,甚至及時(shí)停止廣告,以此提高整體投放效果山孔,降低投放風(fēng)險(xiǎn)懂讯。
用戶手機(jī)機(jī)型分布:了解用戶手機(jī)設(shè)備平臺(tái)構(gòu)成比例;獲得用戶當(dāng)季的主流機(jī)型的硬件配置台颠,作為研發(fā)項(xiàng)目兼容性測(cè)試的必過(guò)機(jī)型褐望,替代原先的兼容性方法,從而提高產(chǎn)品質(zhì)量。
-?END -