數(shù)據(jù)分析的工作在大公司里一般是由專門的數(shù)據(jù)分析師進(jìn)行,非技術(shù)的同學(xué)在日常業(yè)務(wù)中也需要有一些數(shù)據(jù)分析的能力搅荞,本文就是寫給非技術(shù)同學(xué)的红氯,沒有太多復(fù)雜的數(shù)據(jù)挖掘知識框咙。數(shù)據(jù)分析過程包括明確目的、理清流程痢甘、數(shù)據(jù)采集喇嘱、構(gòu)建體系、數(shù)據(jù)分析塞栅、數(shù)據(jù)可視化這六大步驟者铜,有些需要技術(shù)人員的參與,非技術(shù)的同學(xué)也可以獨(dú)立完成放椰。
第一步 明確目的
數(shù)據(jù)分析的開始要提出問題作烟,明確為什么研究數(shù)據(jù),可能有以下的情況:
1砾医、定期數(shù)據(jù)檢測拿撩,關(guān)注有沒有數(shù)據(jù)異常的情況
2、業(yè)務(wù)出現(xiàn)問題如蚜,比如最近流量下降了压恒,通過數(shù)據(jù)研究為什么
3、數(shù)據(jù)探索怖亭,也是就是說根本就沒有目標(biāo),看看某個行業(yè)的發(fā)展如何坤检,可以自己選擇切入點(diǎn)兴猩。
第二步 理清流程
1、一個方法是通過研究用戶行為來理清要分析的指標(biāo)有哪些早歇,梳理產(chǎn)品線的業(yè)務(wù)倾芝,知道什么時候要進(jìn)行數(shù)據(jù)分析,體現(xiàn)了運(yùn)營的流程化思維箭跳。
例如想要分析網(wǎng)易考拉海購用戶首次登錄注冊以及購物的數(shù)據(jù)晨另,可以先理清流程如下:
來到網(wǎng)站這一步可以收集到UV、PV谱姓、來源渠道借尿,首次登錄的步驟可以收集登錄設(shè)備、用戶性別屉来、興趣愛好路翻,購物的步驟可以收集到商品代碼、商品類型茄靠、商品名稱茂契、價格、購買方式慨绳、是否優(yōu)惠掉冶、是否包郵真竖、用戶住址等信息。用戶在網(wǎng)站的所有活動厌小,點(diǎn)擊恢共、跳出都是可以收集的數(shù)據(jù)。
2召锈、一個方法是看你要分析的指標(biāo)由哪些分支指標(biāo)或哪些要素構(gòu)成,可以列出一個公式涨岁,公式里單個的指標(biāo)又是由什么來影響的梢薪。
例如網(wǎng)站銷量=流量*轉(zhuǎn)化率*客單價
這三個數(shù)據(jù)都要往前透視,其中流量可以關(guān)注流量的大小甜攀、渠道來源规阀、渠道投放等瘦麸,轉(zhuǎn)化率就需要收集數(shù)據(jù)以后進(jìn)行轉(zhuǎn)化漏斗分析。
第三步 采集數(shù)據(jù)
采集數(shù)據(jù)的對象包括:
前端數(shù)據(jù):頁面瀏覽厉碟、交互事件箍鼓、客戶端屬性款咖、渠道屬性
后端數(shù)據(jù):業(yè)務(wù)數(shù)據(jù)奄喂、用戶數(shù)據(jù)砍聊、廣告費(fèi)用玻蝌、產(chǎn)品數(shù)據(jù)词疼、內(nèi)容數(shù)據(jù)贰盗、客服系統(tǒng)
歷史數(shù)據(jù):log數(shù)據(jù)舵盈、歷史數(shù)據(jù)秽晚、csv筒愚、mysql
其中前端的數(shù)據(jù)其實(shí)有很多巢掺,從大眾普遍關(guān)注的PV陆淀、UV、廣告點(diǎn)擊量楚堤,到客戶端的網(wǎng)絡(luò)環(huán)境钾军、登陸狀態(tài),再到瀏覽器拗小、操作系統(tǒng)信息,最后到頁面性能剿配、JS 異常呼胚,這些數(shù)據(jù)都可以在前端收集到蝇更。他們是線上用戶的真實(shí)反饋,直接體現(xiàn)著產(chǎn)品的用戶體驗(yàn)蚁廓。
埋點(diǎn)是網(wǎng)站分析的一種常用的數(shù)據(jù)采集方法厨幻,例如有可視化埋點(diǎn)和代碼埋點(diǎn)。
可視化埋點(diǎn):嵌入一個SDK在終端上面饭宾,通過界面配置的方式確定采集哪些數(shù)據(jù)捏雌,比如對于一些重要的按鈕上性湿,不用技術(shù)人員參與肤频,業(yè)務(wù)同學(xué)可以自己根據(jù)業(yè)務(wù)采集到數(shù)據(jù)算墨,評估也很快报咳,缺點(diǎn)是數(shù)據(jù)采集不夠細(xì)致暑刃。
代碼埋點(diǎn):除了嵌入一個SDK在終端上面膜眠,還有服務(wù)端SDK宵膨,針對關(guān)鍵環(huán)節(jié)嵌入代碼辟躏,比如提交訂單捎琐、支付訂單,可以做精細(xì)化分析幻件。
采集的原則是:
全:覆蓋各種端绰沥,比如客戶端徽曲、服務(wù)端麸塞,盡可能地全量
細(xì):多個維度哪工,從who雁比、where、what蠢终、when寻拂、why去考慮
準(zhǔn):前端會存在網(wǎng)絡(luò)傳輸丟包的問題丈牢,后端會更準(zhǔn)確
第四步 構(gòu)建體系
介紹一個概念聯(lián)機(jī)分析處理(On-Line Analytical Processing朴皆,OLAP)泛粹,OLAP 數(shù)據(jù)庫分為一個或多個多維數(shù)據(jù)集晶姊,每個多維數(shù)據(jù)集都由多維數(shù)據(jù)集管理員組織和設(shè)計(jì)以適應(yīng)用戶檢索和分析數(shù)據(jù)的方式钾怔,從而更易于創(chuàng)建和使用所需的數(shù)據(jù)透視表和數(shù)據(jù)透視圖。
非技術(shù)同學(xué)不用自己建立OLAP數(shù)據(jù)庫矾利,但要知道構(gòu)成這個數(shù)據(jù)庫的要素是什么男旗,也就是要分清維度與指標(biāo)察皇。
維度是第一列什荣,在上圖中就是城市,可以理解為屬性怀酷、標(biāo)簽溃睹,其他的比如版本、渠道胰坟、地域因篇、終端、操作系統(tǒng)笔横、登錄時間等都是維度竞滓,看維度也可以說是去看待不同數(shù)據(jù)的角度。
指標(biāo)就是維度對應(yīng)的值吹缔,是具體的數(shù)據(jù)指標(biāo)商佑。指標(biāo)分為基礎(chǔ)指標(biāo)和復(fù)合指標(biāo),復(fù)合指標(biāo)是通過基礎(chǔ)指標(biāo)計(jì)算出來的,復(fù)合指標(biāo)相比基礎(chǔ)指標(biāo)更具有意義。
基礎(chǔ)指標(biāo):注冊用戶量笛求、訂單量、PV、UV新增用戶
復(fù)合指標(biāo):退出率、平均停留時長界阁、留存率较剃、支付轉(zhuǎn)化率啊送、跳出率篷朵、平均訪問深度
分析這些數(shù)據(jù)本質(zhì)就是用維度來拆解指標(biāo)腮猖,上面這個表格就是不同的城市的流量獲取鹦赎、行為陪踩、轉(zhuǎn)化率的指標(biāo)數(shù)據(jù)的表現(xiàn)。首先你要清楚評估的指標(biāo)有哪些,比如UV、PV、轉(zhuǎn)化率等,然后你要知道從哪些維度去看待這些指標(biāo)祠斧,比如不同地區(qū)吴超、不同來源渠道等鸟悴,然后進(jìn)行數(shù)據(jù)分析和比對震贵,最后從中發(fā)現(xiàn)問題得出結(jié)論季希。
下面一步說說看數(shù)據(jù)的時候我們要關(guān)注一些什么重要的點(diǎn)峰尝。
第五步 數(shù)據(jù)分析
1、看數(shù)據(jù)是否有一些異常的情況票编,如果出現(xiàn)異常就要分析原因
數(shù)據(jù)變化可能是業(yè)務(wù)發(fā)生了變化昔榴,比如一月的某幾天是不是運(yùn)營同學(xué)做了個拉新的活動辛藻,比如某幾個課程的瀏覽量特別高吱肌,是不是他們的文案寫的很好;但也有可能統(tǒng)計(jì)的算法或者是其他沒有預(yù)料的因素改變诚镰,舉一個例子抠艾,app統(tǒng)計(jì)數(shù)據(jù)中,? 蘋果手機(jī)從ios6到7以后會發(fā)生串號的改變,本來是同一個用戶菱父,變成了新用戶颈娜,就會影響我們分析數(shù)據(jù)剑逃,還有比如說某天PV值特別高,也可能是競爭對手在研究我們的網(wǎng)站官辽。
2蛹磺、通過對比發(fā)現(xiàn)問題
例如可以在同一總體條件下,對不同時期指標(biāo)數(shù)據(jù)的比較同仆,與上季度比較萤捆、與上年同期比較、與活動前比較俗批、與計(jì)劃比較俗或。指標(biāo)的口徑范圍、計(jì)算方法岁忘、計(jì)量單位必須一致辛慰,即要使用同一種單位或標(biāo)準(zhǔn)去衡量,否則干像,必須進(jìn)行調(diào)整后才能比較帅腌。
3、通過數(shù)據(jù)細(xì)分下鉆麻汰,從當(dāng)前數(shù)據(jù)往下展開下一層數(shù)據(jù)速客,維度的順序就代表了由高而低的鉆取粒度。通過各種維度比較五鲫、分組溺职、篩選、下轉(zhuǎn)指標(biāo)臣镣,研究在哪一個維度那個異常點(diǎn)在哪里辅愿,才能知道那個異常點(diǎn)的原因
第六步 數(shù)據(jù)可視化或者數(shù)據(jù)報告
數(shù)據(jù)可視化是借助于圖形化手段,清晰有效地傳達(dá)與溝通信息忆某,數(shù)據(jù)分析報告是以數(shù)據(jù)為基礎(chǔ)点待,發(fā)現(xiàn)問題,說明事實(shí)弃舒,給出結(jié)論的報告癞埠。
一份好的報告要在一開始就提出你的目標(biāo)和要解決的需求,盡量收集更多的數(shù)據(jù)聋呢,通過數(shù)據(jù)發(fā)現(xiàn)問題并且提出你的結(jié)論和建議苗踪,建議的是誰做,什么時候做都要寫明削锰,如果這么做可以幫助我們的業(yè)務(wù)得到什么東西通铲,站在業(yè)務(wù)方去考慮有沒有可執(zhí)行性,最后運(yùn)用可視化的圖形來表達(dá)便于理解器贩。
---END---