作者:hooly
微信公眾號(hào):一口袋星光
什么是數(shù)據(jù)分析?
數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計(jì)分析對(duì)收集來的大量數(shù)據(jù)進(jìn)行分析慕蔚,提取有用信息和形成結(jié)論而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程孔飒。在實(shí)用中,數(shù)據(jù)分析可幫助人們作出判斷鸠匀,以便采取適當(dāng)行動(dòng)狮崩。
數(shù)據(jù)分析的目的是什么?
數(shù)據(jù)分析的目的是把隱沒在一大批看來雜亂無章的數(shù)據(jù)中的信息集中睦柴、萃取和提煉出來,以找出所研究對(duì)象的內(nèi)在規(guī)律狱窘。
在實(shí)用中蘸炸,數(shù)據(jù)分析可幫助人們作出判斷搭儒,以便采取適當(dāng)行動(dòng)。數(shù)據(jù)分析是組織有目的地收集數(shù)據(jù)铃岔、分析數(shù)據(jù)毁习,使之成為信息的過程纺且。在產(chǎn)品的整個(gè)壽命周期,包括從市場(chǎng)調(diào)研到售后服務(wù)和最終處置的各個(gè)過程都需要適當(dāng)運(yùn)用數(shù)據(jù)分析過程恐仑,以提升有效性裳仆。
在企業(yè)里面歧斟,數(shù)據(jù)分析可以幫助我們掌握企業(yè)的運(yùn)營(yíng)狀況,商品的出售情況队橙,用戶的特征捐康、產(chǎn)品的粘性、等等花枫。
數(shù)據(jù)分析的步驟乌昔?
1.首先明確分析的思路和目的:
數(shù)據(jù)分析一定的帶著某種業(yè)務(wù)目的的。它可能是要追蹤一個(gè)新產(chǎn)品上線之后的用戶使用情況溺蕉;也可能是觀察用戶在某段時(shí)間的留存情況疯特,還有可能是運(yùn)營(yíng)某種優(yōu)惠券是否有效录别。帶著一定的目的组题,確定要從哪幾個(gè)角度進(jìn)行分析崔列。然后找到能夠說明目的的指標(biāo)。
比如想要驗(yàn)證運(yùn)營(yíng)最近的一批優(yōu)惠券是否有效边翼。我們可以從優(yōu)惠券的領(lǐng)取情況和優(yōu)惠券的使用情況兩個(gè)方面分析讯私,而優(yōu)惠券的領(lǐng)取情況的指標(biāo)可以細(xì)化為領(lǐng)取率斤寇;使用情況可細(xì)化為:使用率、客單價(jià)等莫秆。
2.數(shù)據(jù)的收集:
在確定了此次數(shù)據(jù)分析的核心指標(biāo)后镊屎,就要針對(duì)數(shù)據(jù)指標(biāo)做數(shù)據(jù)收集缝驳。
有些企業(yè)的數(shù)據(jù)準(zhǔn)備非常充分运怖,數(shù)據(jù)倉庫摇展、數(shù)據(jù)集市等早早就建設(shè)好。有一些企業(yè)在數(shù)據(jù)分析上比較落后捻勉,那就需要我們自己做前期大量的數(shù)據(jù)收集工作。比如使用一些自己公司的或者第三方的數(shù)據(jù)分析工具進(jìn)行埋點(diǎn)研底,拿到日志榜晦。或者使用數(shù)據(jù)庫中的現(xiàn)有數(shù)據(jù)识窿,比如訂單數(shù)據(jù)喻频、基礎(chǔ)的用戶信息等等甥温。
3.數(shù)據(jù)處理:
數(shù)據(jù)提取出來之后,要剔除臟數(shù)據(jù)(清洗)狰挡,然后數(shù)據(jù)轉(zhuǎn)化圆兵。在進(jìn)行最基本的數(shù)據(jù)匯總刀脏、聚合之后愈污,我們就可以拿到比較簡(jiǎn)單的字段相對(duì)豐富的數(shù)據(jù)寬表暂雹。
4.數(shù)據(jù)分析:
數(shù)據(jù)分析是用適當(dāng)?shù)姆治龇椒肮ぞ撸瑢?duì)處理過的數(shù)據(jù)進(jìn)行分析,提取有價(jià)值的信息,形成有效結(jié)論的過程桥言。
一般公司所需要觀察的數(shù)據(jù)大致分為如下幾類:
商業(yè)數(shù)據(jù):付費(fèi)金額号阿,付費(fèi)用戶數(shù),付費(fèi)率客單價(jià)
運(yùn)營(yíng)數(shù)據(jù):新增用戶數(shù)扰柠,日活卤档、周活劝枣、月活(AARRR模型)
產(chǎn)品數(shù)據(jù):關(guān)鍵頁面的pv溪胶、uv(漏斗模型)
用戶數(shù)據(jù):用戶生命周期哗脖、用戶留存才避、用戶客單價(jià)、用戶類型(RFM模型...)
商品數(shù)據(jù):商品售賣情況楞遏,毛利分析....
隨著數(shù)據(jù)的重要性的凸顯寡喝,越來越多的公司已經(jīng)認(rèn)識(shí)到數(shù)據(jù)對(duì)于公司的經(jīng)營(yíng)是十分重要的。所以絕大部分企業(yè)都有專門的BI部門進(jìn)行初步的數(shù)據(jù)加工撬陵、分析,以周報(bào)表的形式匯總給管理層做為日常數(shù)據(jù)所需以及企業(yè)決策使用草添。
在這里主要介紹兩個(gè)簡(jiǎn)單的數(shù)據(jù)分析模型:
AARRR模型:
Acquisition(獲取)远寸、Activation(活躍)驰后、Retention(留存)、Revenue(收益)夜涕、Refer(傳播)
1.獲取用戶(Acquisition)
如何獲取用戶酸役?線上通過網(wǎng)站通過SEO,SEM簇捍,app通過市場(chǎng)首發(fā)、ASO等方式獲取事格。還有運(yùn)營(yíng)活動(dòng)的H5頁面驹愚,自媒體等方式逢捺。線下通過地推和傳單進(jìn)行獲取用戶。
2.提高活躍度(Activation)
來了用戶后志于,通過運(yùn)營(yíng)價(jià)格優(yōu)惠伺绽、編輯內(nèi)容等方式進(jìn)行提高活躍度奈应。把內(nèi)容做多,商品做多程梦,價(jià)格做到優(yōu)惠,但需要控制在成本至上的有生長(zhǎng)空間郎逃。這樣的用戶是最有價(jià)值進(jìn)行活躍。
產(chǎn)品策略上优训,除了提供運(yùn)營(yíng)模塊和內(nèi)容深化揣非。進(jìn)行產(chǎn)品會(huì)員激勵(lì)機(jī)制成長(zhǎng)體制進(jìn)行活躍用戶早敬。不僅商品優(yōu)惠的,VIP等標(biāo)示的ICON琐驴,對(duì)于長(zhǎng)業(yè)務(wù)流程绝淡,進(jìn)行流程激勵(lì)體制够委,產(chǎn)品策略更具多元化。
3.提高留存率(Retention)
提高活躍度的屈嗤,有了忠實(shí)的用戶,就開始慢慢沉淀下來了茫船。運(yùn)營(yíng)上,采用內(nèi)容涩禀,相互留言等社區(qū)用戶共建UCG,擺脫初期的PCG模式屿岂。電商通過商品質(zhì)量爷怀,O2O通過優(yōu)質(zhì)服務(wù)提高留存霉撵。這些都是業(yè)務(wù)層面的提高留存。
產(chǎn)品模式上喇完,通過會(huì)員機(jī)制的簽到和獎(jiǎng)勵(lì)的機(jī)制去提高留存锦溪。包括app推送和短信激活方式都是激活用戶刻诊,提高留存的產(chǎn)品方式。
通過日留存率粟判、周留存率档礁、月留存率等指標(biāo)監(jiān)控應(yīng)用的用戶流失情況呻澜,并采取相應(yīng)的手段在用戶流失之前宰衙,激勵(lì)這些用戶繼續(xù)使用應(yīng)用供炼。
4.獲取收入(Revenue)
獲取收入其實(shí)是應(yīng)用運(yùn)營(yíng)最核心的一塊袋哼。即使是免費(fèi)應(yīng)用,也應(yīng)該有其盈利的模式弟翘。
收入來源主要有三種:付費(fèi)應(yīng)用稀余、應(yīng)用內(nèi)付費(fèi)睛琳、以及廣告。付費(fèi)應(yīng)用在國(guó)內(nèi)的接受程度很低辟癌,包括Google Play Store在中國(guó)也只推免費(fèi)應(yīng)用黍少。在國(guó)內(nèi)仍侥,廣告是大部分開發(fā)者的收入來源,而應(yīng)用內(nèi)付費(fèi)目前在游戲行業(yè)應(yīng)用比較多或颊。
前面所提的提高活躍度囱挑、提高留存率游添,對(duì)獲取收入來說唆涝,是必需的基礎(chǔ)。用戶基數(shù)大了赏枚,收入才有可能上量凡辱。
5.自傳播(Refer)
以前的運(yùn)營(yíng)模型到第四個(gè)層次就結(jié)束了煞茫,但是社交網(wǎng)絡(luò)的興起,使得運(yùn)營(yíng)增加了一個(gè)方面钦扭,就是基于社交網(wǎng)絡(luò)的病毒式傳播客情,這已經(jīng)成為獲取用戶的一個(gè)新途徑膀斋。這個(gè)方式的成本很低,而且效果有可能非常好;唯一的前提是產(chǎn)品自身要足夠好摔蓝,有很好的口碑。
從自傳播到再次獲取新用戶拌滋,應(yīng)用運(yùn)營(yíng)形成了一個(gè)螺旋式上升的軌道。而那些優(yōu)秀的應(yīng)用就很好地利用了這個(gè)軌道吠卷,不斷擴(kuò)大自己的用戶群體祭隔。
漏斗模型:
漏斗模型廣泛應(yīng)用于流量監(jiān)控、產(chǎn)品目標(biāo)轉(zhuǎn)化等日常數(shù)據(jù)運(yùn)營(yíng)工作中搞坝。之所以稱為漏斗,就是因?yàn)橛脩簦ɑ蛘吡髁浚┘袕哪硞€(gè)功能點(diǎn)進(jìn)入(這是可以根據(jù)業(yè)務(wù)需求來自行設(shè)定的)店量,可能會(huì)通過產(chǎn)品本身設(shè)定的流程完成操作融师。
按照流程操作的用戶進(jìn)行各個(gè)轉(zhuǎn)化層級(jí)上的監(jiān)控旱爆,尋找每個(gè)層級(jí)的可優(yōu)化點(diǎn);對(duì)沒有按照流程操作的用戶繪制他們的轉(zhuǎn)化路徑房待,找到可提升用戶體驗(yàn),縮短路徑的空間砂蔽。
運(yùn)用漏斗模型比較典型的案例就是電商網(wǎng)站的轉(zhuǎn)化镣隶,用戶在選購商品的時(shí)候必然會(huì)按照預(yù)先設(shè)計(jì)好的購買流程進(jìn)行下單安岂,最終完成支付域那。
需要注意的是:?jiǎn)我坏穆┒纺P蛯?duì)于分析來說沒有任何意義,我們不能單從一個(gè)漏斗模型中評(píng)價(jià)網(wǎng)站某個(gè)關(guān)鍵流程中各步驟的轉(zhuǎn)化率的好壞淑蔚,所以必須通過趨勢(shì)刹衫、比較和細(xì)分的方法對(duì)流程中各步驟的轉(zhuǎn)化率進(jìn)行分析:
趨勢(shì)(Trend):從時(shí)間軸的變化情況進(jìn)行分析,適用于對(duì)某一流程或其中某個(gè)步驟進(jìn)行改進(jìn)或優(yōu)化的效果監(jiān)控邮旷;
比較(Compare):通過比較類似產(chǎn)品或服務(wù)間購買或使用流程的轉(zhuǎn)化率婶肩,發(fā)現(xiàn)某些產(chǎn)品或應(yīng)用中存在的問題律歼;
細(xì)分(Segment):細(xì)分來源或不同的客戶類型在轉(zhuǎn)化率上的表現(xiàn),發(fā)現(xiàn)一些高質(zhì)量的來源或客戶畔况,通常用于分析網(wǎng)站的廣告或推廣的效果及ROI馋嗜。
5.數(shù)據(jù)展現(xiàn):
數(shù)據(jù)可視化-基本的圖表
數(shù)據(jù)可視化是關(guān)于數(shù)據(jù)視覺表現(xiàn)形式的科學(xué)技術(shù)研究葛菇。其中眯停,這種數(shù)據(jù)的視覺表現(xiàn)形式被定義為,一種以某種概要形式抽提出來的信息九府,包括相應(yīng)信息單位的各種屬性和變量侄旬。
圖表是"數(shù)據(jù)可視化"的常用手段儡羔,其中又以基本圖表----柱狀圖、折線圖族操、餅圖等等----最為常用色难。
有人覺得,基本圖表太簡(jiǎn)單笤妙、太原始蹲盘,不高端召衔,不大氣氧急,因此追求更復(fù)雜的圖表。但是毒姨,越簡(jiǎn)單的圖表闸迷,越容易理解腥沽,而快速易懂地理解數(shù)據(jù)今阳,不正是"數(shù)據(jù)可視化"的最重要目的和最高追求嗎?
所以妖谴,請(qǐng)不要小看這些基本圖表膝舅。因?yàn)橛脩糇钍煜に鼈冎罚灾灰沁m用的場(chǎng)合判沟,就應(yīng)該考慮優(yōu)先使用挪哄。
一迹炼、柱狀圖(Bar Chart)
柱狀圖是最常見的圖表,也最容易解讀刻两。
它的適用場(chǎng)合是二維數(shù)據(jù)集(每個(gè)數(shù)據(jù)點(diǎn)包括兩個(gè)值x和y)磅摹,但只有一個(gè)維度需要比較。年銷售額就是二維數(shù)據(jù)帝美,"年份"和"銷售額"就是它的兩個(gè)維度悼潭,但只需要比較"銷售額"這一個(gè)維度女责。
柱狀圖利用柱子的高度,反映數(shù)據(jù)的差異刷喜。肉眼對(duì)高度差異很敏感掖疮,辨識(shí)效果非常好浊闪。柱狀圖的局限在于只適用中小規(guī)模的數(shù)據(jù)集折汞。
通常來說爽待,柱狀圖的X軸是時(shí)間維鸟款,用戶習(xí)慣性認(rèn)為存在時(shí)間趨勢(shì)。如果遇到X軸不是時(shí)間維的情況富俄,建議用顏色區(qū)分每根柱子而咆,改變用戶對(duì)時(shí)間趨勢(shì)的關(guān)注。
上圖是英國(guó)足球聯(lián)賽某個(gè)年度各隊(duì)的贏球場(chǎng)數(shù)涯捻,X軸代表不同球隊(duì)障癌,Y軸代表贏球數(shù)。
二轿亮、折線圖(Line Chart)數(shù)據(jù)
折線圖適合二維的大數(shù)據(jù)集我注,尤其是那些趨勢(shì)比單個(gè)數(shù)據(jù)點(diǎn)更重要的場(chǎng)合但骨。
它還適合多個(gè)二維數(shù)據(jù)集的比較呀伙。
上圖是兩個(gè)二維數(shù)據(jù)集(大氣中二氧化碳濃度,地表平均氣溫)的折線圖雨女。
三氛堕、餅圖(Pie Chart)
餅圖是一種應(yīng)該避免使用的圖表,因?yàn)槿庋蹖?duì)面積大小不敏感绕沈。
上圖中,左側(cè)餅圖的五個(gè)色塊的面積排序浅蚪,不容易看出來洽故。換成柱狀圖时甚,就容易多了撞秋。
一般情況下,總是應(yīng)該用柱狀圖替代餅圖哑子。但是有一個(gè)例外,就是反映某個(gè)部分占整體的比重把敞,比如貧窮人口占總?cè)丝诘陌俜直取?/p>
四、散點(diǎn)圖(Scatter Chart)
散點(diǎn)圖適用于三維數(shù)據(jù)集耽装,但其中只有兩維需要比較掉奄。
上圖是各國(guó)的醫(yī)療支出與預(yù)期壽命,三個(gè)維度分別為國(guó)家速兔、醫(yī)療支出憨栽、預(yù)期壽命,只有后兩個(gè)維度需要比較珍剑。
為了識(shí)別第三維招拙,可以為每個(gè)點(diǎn)加上文字標(biāo)示别凤,或者不同顏色。
五诉稍、氣泡圖(Bubble Chart)
氣泡圖是散點(diǎn)圖的一種變體杯巨,通過每個(gè)點(diǎn)的面積大小杜恰,反映第三維箫章。
上圖是卡特里娜颶風(fēng)的路徑檬寂,三個(gè)維度分別為經(jīng)度、緯度镣屹、強(qiáng)度女蜈。點(diǎn)的面積越大伪窖,就代表強(qiáng)度越大覆山。因?yàn)橛脩舨簧朴谂袛嗝娣e大小,所以氣泡圖只適用不要求精確辨識(shí)第三維的場(chǎng)合魏割。
如果為氣泡加上不同顏色(或文字標(biāo)簽)钞它,氣泡圖就可用來表達(dá)四維數(shù)據(jù)盐股。比如下圖就是通過顏色疯汁,表示每個(gè)點(diǎn)的風(fēng)力等級(jí)幌蚊。
六、雷達(dá)圖(Radar Chart)
雷達(dá)圖適用于多維數(shù)據(jù)(四維以上)漩仙,且每個(gè)維度必須可以排序(國(guó)籍就不可以排序)跋选。但是钠糊,它有一個(gè)局限垢啼,就是數(shù)據(jù)點(diǎn)最多6個(gè)芭析,否則無法辨別,因此適用場(chǎng)合有限。
下面是邁阿密熱火隊(duì)首發(fā)的五名籃球選手的數(shù)據(jù)助币。除了姓名迹栓,每個(gè)數(shù)據(jù)點(diǎn)有五個(gè)維度克伊,分別是得分愿吹、籃板犁跪、助攻寝优、搶斷乏矾、封蓋妻熊。
畫成雷達(dá)圖,就是下面這樣亿胸。
面積越大的數(shù)據(jù)點(diǎn)侈玄,就表示越重要。很顯然潘悼,勒布朗·詹姆斯(紅色區(qū)域)是熱火隊(duì)最重要的選手治唤。
需要注意的時(shí)候宾添,用戶不熟悉雷達(dá)圖粱锐,解讀有困難怜浅。使用時(shí)盡量加上說明海雪,減輕解讀負(fù)擔(dān)奥裸。
七、總結(jié)
寫在最后:
數(shù)據(jù)分析這個(gè)領(lǐng)域侠鳄,需要學(xué)習(xí)的內(nèi)容伟恶,不僅這些,如果對(duì)數(shù)據(jù)分析很感興趣的小伙伴挡育,也可以看看這兩個(gè)網(wǎng)站:
藍(lán)鯨的網(wǎng)站分析筆記:http://bluewhale.cc
網(wǎng)站分析在中國(guó):http://www.chinawebanalytics.cn
作者:hooly
微信公眾號(hào):一口袋星光
我會(huì)在微信公號(hào)上持續(xù)更新我的文章即寒,你來討論我很歡迎母赵。