01 ?數(shù)據(jù)運(yùn)營都需要學(xué)習(xí)些什么知識(shí)届宠?
1、明確數(shù)據(jù)分析的目的
做數(shù)據(jù)分析壳咕,必須要有一個(gè)明確的目的,知道自己為什么要做數(shù)據(jù)分析顽馋,想要達(dá)到什么效果谓厘。
比如:為了評(píng)估產(chǎn)品改版后的效果比之前有所提升;或通過數(shù)據(jù)分析寸谜,找到產(chǎn)品迭代的方向等竟稳。
2、收集數(shù)據(jù)的方法
明確了數(shù)據(jù)分析的目的熊痴,接下來需要確定應(yīng)該收集的數(shù)據(jù)都有哪些他爸。說到收集數(shù)據(jù),首先要做好數(shù)據(jù)埋點(diǎn)果善。
所謂“埋點(diǎn)”诊笤,就是在正常的功能邏輯中添加統(tǒng)計(jì)代碼,將自己需要的數(shù)據(jù)統(tǒng)計(jì)出來巾陕。
目前主流的數(shù)據(jù)埋點(diǎn)方式有兩種:
(1)自己開發(fā)讨跟。開發(fā)時(shí)加入統(tǒng)計(jì)代碼,并搭建自己的數(shù)據(jù)查詢系統(tǒng)鄙煤。
(2)利用第三方統(tǒng)計(jì)工具晾匠。
常見的第三方統(tǒng)計(jì)工具有:
網(wǎng)站分析工具:Alexa、Google Analytics梯刚、百度統(tǒng)計(jì)
移動(dòng)應(yīng)用分析工具:Google Analytics凉馆、友盟、TalkingData、Crashlytics
不同產(chǎn)品澜共,不同目的向叉,需要的支持?jǐn)?shù)據(jù)不同,確定好數(shù)據(jù)指標(biāo)后咳胃,選擇適合自己公司的方式來收集相應(yīng)數(shù)據(jù)植康。
3、產(chǎn)品的基本數(shù)據(jù)指標(biāo)
新增:新用戶增加的數(shù)量和速度展懈。如:日新增销睁、月新增等。
活躍:有多少人正在使用產(chǎn)品存崖。如日活躍(DAU)冻记、月活躍(MAU)等,用戶的活躍數(shù)越多来惧,越有可能為產(chǎn)品帶來價(jià)值冗栗。
留存率:用戶會(huì)在多長時(shí)間內(nèi)使用產(chǎn)品。如:次日留存率供搀、周留存率等隅居。
傳播:平均每位老用戶會(huì)帶來幾位新用戶。
流失率:一段時(shí)間內(nèi)流失的用戶葛虐,占這段時(shí)間內(nèi)活躍用戶數(shù)的比例胎源。
4、常見的數(shù)據(jù)分析法和模型
這里講下漏斗分析法和AARRR分析模型屿脐。
(1)漏斗分析法
用來分析從潛在用戶到最終用戶這個(gè)過程中用戶數(shù)量的變化趨勢涕蚤,從而尋找到最佳的優(yōu)化空間,這個(gè)方法被普遍用于產(chǎn)品各個(gè)關(guān)鍵流程的分析中的诵。
案例:這個(gè)例子是分析從用戶進(jìn)入網(wǎng)站到最終購買商品的變化趨勢万栅。
從用戶進(jìn)入網(wǎng)站到瀏覽商品頁面,轉(zhuǎn)化率是40%西疤;瀏覽商品到加入購物車轉(zhuǎn)化率是20%等烦粒,那要找出哪個(gè)環(huán)節(jié)的轉(zhuǎn)化率最低,我們需要有對(duì)比數(shù)據(jù)代赁。
比如第一個(gè)撒遣,進(jìn)入網(wǎng)站到瀏覽商品,如果同行業(yè)水平的轉(zhuǎn)化率是45%管跺,而我們只有40%义黎,那說明這個(gè)過程,沒有達(dá)到行業(yè)平均水平豁跑,我們就需要分析具體原因在哪里廉涕,再有針對(duì)性的去優(yōu)化和改善泻云。
當(dāng)然,上面這是我們?cè)O(shè)計(jì)的一種理想化的漏斗模型狐蜕,數(shù)據(jù)有可能是經(jīng)過匯總后得出的宠纯。而真實(shí)的用戶行為往往可能并不是按照這個(gè)簡單流程來的。此時(shí)需要分析用戶為什么要經(jīng)過那么復(fù)雜的路徑來達(dá)到最終目的层释,思考這中間有沒有可以優(yōu)化的空間婆瓜。
(2)AARRR模型
這個(gè)是所有的做產(chǎn)品的小伙伴都必須要掌握的一個(gè)數(shù)據(jù)分析模型。
① AARRR模型 – 獲取用戶(Acquisition)
所謂獲取用戶贡羔,就是拉新廉白,就是吸引新的用戶。對(duì)于APP來說乖寒,拉新意味著新的用戶下載注冊(cè)猴蹂;而對(duì)于眾多的微信公眾號(hào)、微博楣嘁、貼吧運(yùn)營個(gè)體而言磅轻,拉新指的是吸引新的粉絲關(guān)注。
在羅列你的渠道時(shí)逐虚,需要注意的是每個(gè)渠道都需要有根有據(jù)聋溜,包括這個(gè)渠道是不是跟你的目標(biāo)人群相契合、還有單價(jià)高或低以及渠道的二次傳播行不行等等因素叭爱。
獲取用戶就是通過各個(gè)渠道拉新的過程撮躁。除了換量合作、在各大論壇貼吧等社區(qū)發(fā)帖涤伐、社群營銷等免費(fèi)方式馒胆,付費(fèi)方式包括但不限于利用搜索引擎缨称、微信微博頭條等自媒體凝果、網(wǎng)盟廣告、線下活動(dòng)睦尽,互聯(lián)網(wǎng)電視這些方式器净。增長黑客這種特別的方式也有人在使用。
拉新是否有效有一個(gè)評(píng)判標(biāo)準(zhǔn)——觸發(fā)關(guān)鍵行為当凡。比如用戶下載了APP不一定會(huì)使用山害。關(guān)鍵行為根據(jù)產(chǎn)品的情況而定,它可能是瀏覽文章沿量、觀看視頻浪慌、發(fā)送消息、開始游戲或者填寫郵箱等朴则。
好渠道并不意味著是用戶量最大的渠道权纤,也不是成本最低的渠道。不斷探索用戶的喜好和分布,才能更加優(yōu)化合理的確定投入策略汹想,不斷最小化CAC外邓。每個(gè)渠道獲取用戶的數(shù)量、質(zhì)量古掏、成本都不一樣损话,需要通過用戶獲取成本(CAC)、用戶量槽唾、留存率丧枪、ARPU 數(shù)劇等綜合評(píng)判。
當(dāng)然除了通過外部渠道獲得新客戶夏漱,如果用戶體量較大豪诲,也可以從產(chǎn)品設(shè)計(jì)的角度完成拉新。
A挂绰、主動(dòng)告知用戶屎篱,有三種方式:APP 的 push 消息、EDM 郵件葵蒂、短信通知交播,可以根據(jù)用戶畫像來進(jìn)行消息推送的時(shí)間,內(nèi)容和用戶践付。
B秦士、被動(dòng)告知用戶,開屏廣告永高,設(shè)置明顯的入口隧土,功能入口添加優(yōu)惠便簽,首頁設(shè)置相關(guān)的輪播圖等命爬;如摩拜 APP 的開屏廣告顯示有網(wǎng)約車曹傀,滴滴 APP 的其他各種功能。
② AARRR模型 – 提高活躍度(Activation)
活躍度指用戶使用產(chǎn)品的時(shí)間以及頻率饲宛。每個(gè)產(chǎn)品對(duì)活躍度的定義不一樣皆愉,比如百度貼吧希望用戶能夠每天都能登錄、發(fā)帖艇抠、評(píng)論幕庐;在線教育類產(chǎn)品,則更關(guān)注用戶的學(xué)習(xí)時(shí)長家淤、練習(xí)次數(shù)等异剥。
活躍度建立在產(chǎn)品的核心價(jià)值上,如高質(zhì)量的內(nèi)容絮重,越來越好的用戶體驗(yàn)感冤寿,多功能的需求等错妖,在用戶最初使用的幾十秒鐘內(nèi)抓住用戶。
還有一些輔助手段疚沐,包括滿足用戶需求的活動(dòng)暂氯、完善的用戶激勵(lì)體系,成長體系亮蛔、增加用戶與其他用戶的互動(dòng)的方式痴施,還有APP的新手指引這類更細(xì)致化的操作等。
一個(gè)比較全面的分析思路是究流,把用戶從使用產(chǎn)品開始到結(jié)束的每一個(gè)流程單獨(dú)列出來辣吃,站在用戶角度,不斷尋找可促活的途徑芬探。比如神得,分析新功能的轉(zhuǎn)化率,使用過程的流暢性偷仿,延長用戶的產(chǎn)品使用流程哩簿。
當(dāng)然,我們還可以篩選出優(yōu)質(zhì)用戶酝静。如果某個(gè)渠道的用戶节榜,使用產(chǎn)品的時(shí)間和啟動(dòng)次數(shù)很可觀,則應(yīng)加大這個(gè)渠道的投入别智。此外宗苍,還有些用戶只啟動(dòng)過一次產(chǎn)品,這類用戶大多屬于被動(dòng)激活薄榛。
除了渠道讳窟,另一個(gè)和活躍度相關(guān)的分析維度是版本。但這會(huì)產(chǎn)生兩個(gè)錯(cuò)覺:用戶習(xí)慣了現(xiàn)在的產(chǎn)品敞恋,所以不希望產(chǎn)品迭代更新丽啡;用戶會(huì)要求你增加新功能。
例如耳舅,2006 年 Facebook 首次推出新聞?lì)l道碌上,造成巨大的用戶反彈倚评。但隨著時(shí)間的推移浦徊,這個(gè)產(chǎn)品卻成為了Facebook 的核心功能。Facebook忽視了少數(shù)派的反對(duì)聲音天梧,堅(jiān)持了自己的戰(zhàn)略盔性。
我們既不想刺激現(xiàn)有的忠誠用戶,又需要獲取下一個(gè)百萬用戶呢岗,添加功能比砍掉功能更容易冕香。通常用戶要求的功能是解決很小的便利問題蛹尝,而不是真正的解決方案。我們需要積極地與用戶溝通悉尾,如果數(shù)據(jù)告訴你新方向是正確的突那,那么忽略發(fā)聲的少數(shù)用戶。
③ AARRR模型 – 提高留存率(Retention)
用戶開始使用產(chǎn)品并且一段時(shí)間后仍然繼續(xù)使用构眯,被認(rèn)作是留存用戶愕难,而留存用戶占當(dāng)時(shí)新增用戶的比例即是留存率。
用戶在每個(gè)應(yīng)用中的生命周期是接觸—使用—放棄或者遺忘的過程惫霸。在用戶使用階段猫缭,有效的促活手段也能提高留存,但同樣重要的是挽回用戶壹店,而挽回用戶有一個(gè)通用的流程猜丹。
先確定流失用戶的標(biāo)準(zhǔn);再建立一個(gè)用戶流失模型硅卢,分析用戶為何流失射窒,采取相應(yīng)的手段補(bǔ)救;同時(shí)通過EDM将塑,短信等方式讓用戶知道你在召回轮洋;最后通過新手引導(dǎo)重新讓用戶熟悉產(chǎn)品操作,繼續(xù)留存抬旺。
?
④ AARRR模型 – 獲取收入(Revenue)
現(xiàn)階段移動(dòng)應(yīng)用獲取收入的途徑主要有三種:付費(fèi)應(yīng)用弊予、應(yīng)用內(nèi)付費(fèi),以及廣告开财。付費(fèi)下載多見于蘋果APP Store汉柒,廣告是大部分開發(fā)者的收入來源,而應(yīng)用內(nèi)付費(fèi)也較為普遍责鳍,比如游戲類碾褂,增值服務(wù)類,自營商城等历葛。特別說明正塌,高德地圖的盈利模式除了廣告之外,還在于其本身的地圖數(shù)據(jù)和用戶數(shù)據(jù)與其他領(lǐng)域的結(jié)合恤溶。
大家通常采用ARPU(平均每用戶收入)值來判定收入標(biāo)準(zhǔn)乓诽。但對(duì)于一個(gè)既有付費(fèi)用戶,又有未付費(fèi)用戶的應(yīng)用而言咒程,還需要看 ARPPU(平均每付費(fèi)用戶收入)鸠天。
因?yàn)樯婕暗礁顿M(fèi)用戶在全部用戶中所占的比例,如果付費(fèi)用戶的數(shù)量較低帐姻,那么就要思考產(chǎn)品盈利方式是否有問題稠集,包括定價(jià)奶段,產(chǎn)品功能特性,變現(xiàn)方式等剥纷。
計(jì)算收入的同時(shí)也要考慮利潤痹籍。計(jì)算利潤的時(shí)候有一個(gè)指標(biāo):LTV(生命周期價(jià)值)。用戶的生命周期是指一個(gè)用戶從第一次啟動(dòng)應(yīng)用晦鞋,到最后一次啟動(dòng)應(yīng)用之間词裤,為該應(yīng)用創(chuàng)造的收入總計(jì)。LTV – CAC的差值鳖宾,就可以視為該應(yīng)用從每個(gè)用戶身上獲取的利潤吼砂。
⑤ AARRR模型 – 自傳播(Refer)
社交網(wǎng)絡(luò)的興起,為產(chǎn)品帶來了更強(qiáng)的生命力——基于社交網(wǎng)絡(luò)的自傳播鼎文。自傳播渔肩,或者說病毒式營銷,來源于病毒傳播學(xué)拇惋,即一個(gè)已經(jīng)感染了病毒的宿主在接觸其他宿主的過程中也會(huì)被傳染上病毒周偎。K因子量化了“感染”的概率。
K = (每個(gè)用戶向他的朋友們發(fā)出的邀請(qǐng)的數(shù)量) * (接收到邀請(qǐng)的人轉(zhuǎn)化為新用戶的轉(zhuǎn)化率)撑帖。當(dāng)K>1時(shí)蓉坎,用戶群就會(huì)象滾雪球一樣增大,但是絕大部分移動(dòng)應(yīng)用還是必須和其它營銷方式相結(jié)合胡嘿。
自傳播除了產(chǎn)品足夠好蛉艾,傳播過程的受眾足夠準(zhǔn)確,能夠引發(fā)用戶的需求也同樣重要衷敌,比如利益勿侯,虛榮心,稀缺性缴罗,試用等等助琐。比如滴滴,美團(tuán)的紅包好友分享面氓;付費(fèi)用戶免費(fèi)邀請(qǐng)朋友試用產(chǎn)品兵钮;轉(zhuǎn)發(fā)朋友圈送禮品等。
以一個(gè)成功的微信百日跑活動(dòng)為案例舌界,展現(xiàn)自傳播過程中部分可調(diào)整的點(diǎn)掘譬。
A、拉新分發(fā)機(jī)制
對(duì)跑步KOL拉新做梯度激勵(lì)手段:隊(duì)每多10人禀横,就發(fā)群紅包屁药;隊(duì)滿80人則隊(duì)長可以獲得跑鞋一雙粥血。同時(shí)每天在隊(duì)長群中做群運(yùn)營柏锄,曬隊(duì)人數(shù)排行榜酿箭,“XX隊(duì)滿80人啦”,“XX隊(duì)隊(duì)長領(lǐng)取跑鞋”趾娃,讓隊(duì)長被充分激勵(lì)缭嫡。
B、常規(guī)分享機(jī)制
在微信體系內(nèi)抬闷,分享海報(bào)比分享鏈接更引人注目妇蛀。結(jié)合“贏取iPhone8”賣點(diǎn)的海報(bào)讓用戶發(fā)朋友圈時(shí)比較搶眼。同時(shí)分享流程也要做充分的引導(dǎo)笤成,比如“長按圖片评架,發(fā)送給朋友”。
C炕泳、誘導(dǎo)分享機(jī)制
活動(dòng)有報(bào)名費(fèi)纵诞,所以設(shè)計(jì)了“報(bào)名成功后分享活動(dòng)頁到朋友圈立返20元現(xiàn)金”的獎(jiǎng)勵(lì)。因?yàn)榕懿接脩糁g有公用的微信群培遵,所以必須是用戶分享朋友圈才最有效浙芙。同時(shí)又擔(dān)心用戶發(fā)朋友圈時(shí)選擇部分可見,或發(fā)完立刪籽腕,所以補(bǔ)充了“需要10人通過朋友圈點(diǎn)開你的分享”這個(gè)機(jī)制嗡呼。
? ? ? ??a、分享機(jī)制的詳細(xì)說明
? ? ??? b皇耗、對(duì)分享標(biāo)題做改版南窗,帶來二次分享
凡是可以數(shù)據(jù)化的地方就能做成排行榜,用戶都在曬自己是第幾個(gè)報(bào)名的郎楼,能激發(fā)人類心中攀比炫耀的心理矾瘾,這就促成了分享。
? ??? ? c箭启、利用H5設(shè)計(jì)“假活動(dòng)圖文”壕翩,在這個(gè)H5上可以自由定義閱讀數(shù)(直接100000+),點(diǎn)贊數(shù)和用戶留言傅寡。通過設(shè)計(jì)的用戶留言放妈,引導(dǎo)用戶報(bào)名并對(duì)一些疑慮進(jìn)行破解。
?
? ? ? ? d荐操、“10人點(diǎn)開閱讀的提醒”
朋友圈里如果有朋友點(diǎn)開就收到提醒一次芜抒。同時(shí),部分人分享朋友圈后并沒有10人打開托启,或錯(cuò)分享給好友或群宅倒,所以我們每兩天,會(huì)發(fā)模板消息提醒未領(lǐng)20元的用戶再次發(fā)朋友圈屯耸。
02 ?數(shù)據(jù)運(yùn)營需要分析什么拐迁?
1蹭劈、按不同階段來分:
(1)拉新階段:關(guān)注用戶來源的類型:純新用戶(第一次注冊(cè))還是老用戶(再注冊(cè));貼片廣告的用戶來源有多少线召,彈窗廣告的用戶來源有多少等等铺韧。
(2)轉(zhuǎn)化階段:關(guān)注轉(zhuǎn)化率:200個(gè)用戶瀏覽了你的宣傳頁面,注冊(cè)的有100人缓淹,這100人就是實(shí)現(xiàn)了轉(zhuǎn)化哈打,轉(zhuǎn)化率為50%(=100/200);同樣的除了注冊(cè)轉(zhuǎn)化率還有付費(fèi)轉(zhuǎn)化率等等讯壶。
(3)活躍階段:關(guān)注用戶在產(chǎn)品內(nèi)的活躍量料仗,不同的產(chǎn)品表現(xiàn)形式不同。例如伏蚊,貼吧:發(fā)帖量罢维、回帖量等等;視頻網(wǎng)站:點(diǎn)擊量丙挽,觀看量等等肺孵。
(4)留存階段:關(guān)注留存或流失的用戶量。例如颜阐,第一天新增的用戶有300人平窘,300人中第二天還在活躍的有100人,第三天還在活躍的呢凳怨?第四天呢瑰艘?一直類推。
用戶運(yùn)營只是運(yùn)營的職能之一肤舞,貫穿在各種產(chǎn)品的運(yùn)營中紫新。用戶運(yùn)營所關(guān)注的數(shù)據(jù)指標(biāo),不同行業(yè)李剖、不同平臺(tái)等等都有不同的側(cè)重點(diǎn)芒率。
2、根據(jù)運(yùn)營的平臺(tái)來劃分
(1)網(wǎng)站運(yùn)營:
① 流量方面需要關(guān)注:
PV(page view)訪問頁面產(chǎn)生的數(shù)據(jù)篙顺。 一個(gè)用戶訪問了5個(gè)頁面偶芍,那么就產(chǎn)生了5個(gè) ?PV。
UV(user view)某個(gè)特定頁面的訪客數(shù)德玫。一個(gè)頁面一個(gè)賬號(hào)無論點(diǎn)進(jìn)去幾次匪蟀,UV都是1,因?yàn)橹挥幸粋€(gè)訪客宰僧。
VV(visit view)針對(duì)于全站的訪客數(shù)材彪。一個(gè)賬號(hào)進(jìn)入一個(gè)網(wǎng)站,無論這個(gè)賬號(hào)瀏覽了這個(gè)網(wǎng)站多少個(gè)網(wǎng)頁,VV都是1 段化,因?yàn)檫@個(gè)網(wǎng)站只有一個(gè)訪客嘁捷。
IP:針對(duì)于全站的網(wǎng)絡(luò)IP數(shù)。你在家用電腦登錄了這個(gè)網(wǎng)站穗泵,之后你表哥也用同一臺(tái)電腦登陸了他的賬號(hào)普气,訪問了同一個(gè)網(wǎng)站谜疤,但這個(gè)時(shí)候IP還是只有1佃延,因?yàn)槟愫捅砀缬玫耐慌_(tái)電腦,網(wǎng)絡(luò)的IP地址也是一個(gè)夷磕。
② 訪問方面需要關(guān)注:
跳出率:頁面停留訪客有300人履肃,但是有150人不喜歡這個(gè)頁面,選擇離開坐桩,那么跳出率就是50%(=150/300)
二跳率:首頁頁面停留訪客有300人尺棋,有150人覺得這個(gè)網(wǎng)站很喜歡,于是點(diǎn)擊瀏覽下一個(gè)頁面绵跷,那么二跳率就是50%(=150/300)膘螟。以此類推還有三跳率,四跳率等等碾局。
轉(zhuǎn)化率:轉(zhuǎn)化到最終產(chǎn)品目的頁面的比率荆残。如果是電商的話,最終目的就是下單净当,那么就是新增用戶和轉(zhuǎn)化到下單頁面的用戶 的比率内斯。以此類推,還有付費(fèi)轉(zhuǎn)率像啼,注冊(cè)轉(zhuǎn)化率等等俘闯。
③ 活躍方面需要關(guān)注:
DAU(daily active user),即 日活躍用戶量忽冻。
MAU(monthly active user)真朗,即 月活躍用戶量。
相關(guān)的僧诚,還可以有周活躍用戶量蜜猾、年活躍用戶量等等。
④ 轉(zhuǎn)化方面需要關(guān)注:(這里的轉(zhuǎn)化振诬,單指電商運(yùn)營方面蹭睡,與上文轉(zhuǎn)化率做區(qū)分)
成單量:用戶共成了多少單
付費(fèi)金額:用戶共付費(fèi)多少元
客單價(jià):付費(fèi)金額/成單量=客單價(jià)。這里需要的是赶么,每單平均多少錢的數(shù)據(jù)
付費(fèi)率:走到付費(fèi)這一步的轉(zhuǎn)化率
APP運(yùn)營:
? ? A肩豁、新增:新增的設(shè)備數(shù)(按手機(jī)型號(hào)分);新注冊(cè)的設(shè)備數(shù)(注冊(cè)新用戶。)
? ? B清钥、活躍:活躍的設(shè)備數(shù)琼锋;活躍的用戶數(shù)
? ? C、留存:
次日留存率:例如祟昭,第一天新增300人缕坎,第二天還登錄的有150,那么次日的留存率就是50%(=150/300)篡悟。以此類推谜叹,還有三日留存率(第三日登錄數(shù)/第一天新增數(shù))……n日留存率等等。
TAD:比如搬葬,7日TAD=第一天留存量+第二天仍在留存的數(shù)量……+第七天仍在留存的數(shù)量荷腊。用于計(jì)算七天內(nèi),一臺(tái)設(shè)備活躍過幾天急凰。
? ? D女仰、轉(zhuǎn)化:這里也特指電商,同上文網(wǎng)站運(yùn)營里的轉(zhuǎn)化抡锈。
3疾忍、根據(jù)運(yùn)營的行業(yè)來劃分
內(nèi)容型行業(yè):關(guān)注PV,UV,V V,帖子數(shù)床三,頁面停留時(shí)間一罩,分享數(shù)等等
社交類行業(yè):關(guān)注發(fā)帖量,發(fā)言數(shù)勿璃,PV,UV擒抛,活躍占比等等
電商類行業(yè):關(guān)注銷售收入,成單量补疑,客單價(jià)等等
游戲類行業(yè):關(guān)注活躍用戶量歧沪,付費(fèi)率,收入莲组,ARPU(每用戶平均收入)等等
除了運(yùn)營平臺(tái)和運(yùn)營行業(yè)兩個(gè)劃分角度外诊胞,還有很多劃分角度,其中用戶運(yùn)營所要關(guān)注的數(shù)據(jù)指標(biāo)都是有不同側(cè)重的锹杈。
03 ?如何進(jìn)行數(shù)據(jù)分析
?
1撵孤、數(shù)據(jù)采集
好的數(shù)據(jù)源主要有兩個(gè)基本的原則,一個(gè)是全竭望,一個(gè)是細(xì)邪码。
(1)全:就是說我們要拿多種數(shù)據(jù)源撒轮,不能說只拿一個(gè)客戶端的數(shù)據(jù)源只锭,服務(wù)端的數(shù)據(jù)源沒有拿,數(shù)據(jù)庫的數(shù)據(jù)源沒有拿逗余,做分析的時(shí)候沒有這些數(shù)據(jù)你可能是搞不了的。另外影钉,大數(shù)據(jù)里面講的是全量画髓,而不是抽樣。不能說只抽了某些省的數(shù)據(jù)平委,然后就開始說全國是怎么樣奈虾。可能有些省非常特殊廉赔,比如新疆肉微、西藏這些地方它客戶端跟內(nèi)地可能有很大差異的。
(2)細(xì):其實(shí)就是強(qiáng)調(diào)多維度昂勉,在采集數(shù)據(jù)的時(shí)候盡量把每一個(gè)的維度浪册、屬性扫腺、字段都給它采集過來岗照。比如:像where、who笆环、how這些東西給它采集下來攒至,后面分析的時(shí)候就跳不出這些能夠所選的這個(gè)維度,而不是說開始的時(shí)候也圍著需求躁劣。根據(jù)這個(gè)需求確定了產(chǎn)生某些數(shù)據(jù)迫吐,到了后面真正有一個(gè)新的需求來的時(shí)候,又要采集新的數(shù)據(jù)账忘,這個(gè)時(shí)候整個(gè)迭代周期就會(huì)慢很多志膀,效率就會(huì)差很多,盡量從源頭抓的數(shù)據(jù)去做好采集鳖擒。
2溉浙、數(shù)據(jù)建模
有了數(shù)據(jù)之后,就要對(duì)數(shù)據(jù)進(jìn)行加工蒋荚,不能把原始的數(shù)據(jù)直接暴露給上面的業(yè)務(wù)分析人員戳稽,它可能本身是雜亂的,沒有經(jīng)過很好的邏輯抽象的期升。這里就牽扯到數(shù)據(jù)建模惊奇。首先,提一個(gè)概念就是數(shù)據(jù)模型播赁。許多人可能對(duì)數(shù)據(jù)模型這個(gè)詞產(chǎn)生一種畏懼感颂郎,覺得模型這個(gè)東西是什么高深的東西,很復(fù)雜容为,但其實(shí)這個(gè)事情非常簡單乓序。
在數(shù)據(jù)分析領(lǐng)域領(lǐng)域領(lǐng)域诞吱,特別是針對(duì)用戶行為分析方面,目前比較有效的一個(gè)模型就是多維數(shù)據(jù)模型竭缝,“在線分析處理”這個(gè)模型房维。它里面有這個(gè)關(guān)鍵的概念,一個(gè)是維度抬纸,一個(gè)是指標(biāo)咙俩。
維度比如城市,然后北京湿故、上海這些一個(gè)維度阿趁,維度西面一些屬性,然后操作系統(tǒng)坛猪,還有iOS脖阵、安卓這些就是一些維度,然后維度里面的屬性墅茉。通過維度交叉命黔,就可以看一些指標(biāo)問題,比如用戶量就斤、銷售額悍募,這些就是指標(biāo)。比如洋机,通過這個(gè)模型就可以看來自北京坠宴,使用iOS的,他們的整體銷售額是怎么樣的绷旗。
3喜鼓、數(shù)據(jù)分析方法
數(shù)據(jù)分析方法是有多種的,比如多維度事件分析衔肢、漏斗分析(文章前面已經(jīng)做了簡單分析)庄岖、回訪分析、交叉分析等膀懈,在這里我們就挑一個(gè)交叉分析來做個(gè)案例分析顿锰。
交叉分析法:通常是把縱向?qū)Ρ群蜋M向?qū)Ρ染C合起來,對(duì)數(shù)據(jù)進(jìn)行多角度的結(jié)合分析启搂。舉個(gè)例子:
(1)交叉分析角度:客戶端+時(shí)間
從這個(gè)數(shù)據(jù)中硼控,可以看出iOS端每個(gè)月的用戶數(shù)在增加,而Android端在降低胳赌,總體數(shù)據(jù)沒有增長的主要原因在于Android端數(shù)據(jù)下降所導(dǎo)致的牢撼。
那接下來要分析下為什么Android端二季度新增用戶數(shù)據(jù)在下降呢?一般這個(gè)時(shí)候,會(huì)加入渠道維度疑苫。
(2)交叉分析角度:客戶端+時(shí)間+渠道
從這個(gè)數(shù)據(jù)中可以看出熏版,Android端A預(yù)裝渠道占比比較高纷责,而且呈現(xiàn)下降趨勢,其他渠道的變化并不明顯撼短。
因此可以得出結(jié)論:Android端在二季度新增用戶降低主要是由于A預(yù)裝渠道降低所導(dǎo)致的再膳。
所以說,交叉分析的主要作用曲横,是從多個(gè)角度細(xì)分?jǐn)?shù)據(jù)喂柒,從中發(fā)現(xiàn)數(shù)據(jù)變化的具體原因。
更多干貨關(guān)注公眾號(hào):yunyingren2014