前言:
“數(shù)據(jù)”這個詞,是產(chǎn)品經(jīng)理永遠繞不過的話題,但從我多年面試經(jīng)驗看炉媒,很多2-3歲的產(chǎn)品經(jīng)理對數(shù)據(jù)的理解仍是模糊無章法的,鑒于本人也有著2年的數(shù)據(jù)產(chǎn)品經(jīng)驗昆烁,特整理成文吊骤,給產(chǎn)品新人普及一下基本的數(shù)據(jù)知識。
1静尼、基本概念
什么是“移動App的數(shù)據(jù)分析”白粉?為什么要進行“移動App的數(shù)據(jù)分析”?
簡單來說鼠渺,通過在App中進行埋點采集鸭巴,或讀取App存儲在數(shù)據(jù)庫中的業(yè)務數(shù)據(jù),以一定目的拦盹,將數(shù)據(jù)進行“篩選鹃祖、清洗、加工普舆、解析”恬口,產(chǎn)出對產(chǎn)品設計校读、運營計劃有幫助的結(jié)論的過程,就是“數(shù)據(jù)分析”的過程祖能。持續(xù)的數(shù)據(jù)分析可監(jiān)控產(chǎn)品的運營狀態(tài)歉秫、提升推廣效果、發(fā)現(xiàn)產(chǎn)品問題芯杀、優(yōu)化產(chǎn)品體驗端考。
2、基本術(shù)語
這里舉幾個我常遇到的術(shù)語揭厚,便于同開發(fā)和運營進行溝通却特。
埋點:一般意義上的埋點,是利用如友盟筛圆、Talkingdata等第三方公司的SDK裂明,通過在App中嵌入一段SDK代碼,設定觸發(fā)條件太援,當滿足條件時闽晦,SDK會記錄日志,并將日志發(fā)送到第三方服務器進行解析提岔,并可視化地呈現(xiàn)給我們仙蛉。這一過程就叫埋點。埋點方式也分“簡單埋點”和“自定義埋點”碱蒙,所謂“簡單埋點”就是直接拿到第三方key荠瘪,寫到App代碼的配置文件中即可。而“自定義埋點”則對應一種叫“自定義事件”的功能赛惩,一般第三方統(tǒng)計工具都支持哀墓,我們可通過設置“自定義事件”查看App特定的操作行為數(shù)據(jù),如點擊按鈕次數(shù)喷兼、打開指定頁面次數(shù)等篮绰,通常創(chuàng)建“自定義事件”都需要產(chǎn)品經(jīng)理告知開發(fā)App的哪些條件下需要觸發(fā)“自定義事件”,以及觸發(fā)時要如何通過不同參數(shù)區(qū)分不同的點擊行為季惯。如同樣是點擊按鈕事件吠各,可通過設置參數(shù)“Action”,來區(qū)分Action=Yes和Action=No這兩個按鈕分別點擊的次數(shù)星瘾。整個埋點流程如下圖所示:
維度:維度就是指我們平時看事物的角度走孽,也可理解成分析一個數(shù)據(jù)能從哪些方面去分析,這些“角度”都是有值且可被枚舉的琳状。比如我們注冊用戶數(shù)有10萬磕瓷,那可分析的維度有:用戶所在省份、用戶性別、用戶角色困食、用戶來源等边翁。不同維度來觀察數(shù)據(jù),可以得出不同結(jié)論硕盹,能否拓展觀察維度符匾,也是評估數(shù)據(jù)分析能力的一個關鍵。
度量:度量和維度相輔相成瘩例,是指可量化的數(shù)值澄成,用于考察不同維度觀察的效果强霎,也可理解成“數(shù)據(jù)指標”。觀察度量值可總體查看,如App總用戶數(shù)包吝,也可配合“維度”分層查看棕孙,如不同省份的注冊用戶數(shù)遮婶、活躍用戶數(shù)蹋艺,不同來源的App啟動次數(shù)、平均日使用時長等善绎。
渠道:指App的不同安裝來源黔漂,如通過第三方應用市場安裝,通過廣告點擊安裝禀酱,通過地推二維碼掃碼安裝炬守,通過官網(wǎng)下載安裝等〖粮互聯(lián)網(wǎng)公司的商務工作一般就是拓展渠道劳较,觀察不同渠道帶來的數(shù)據(jù)表現(xiàn),不斷優(yōu)化渠道質(zhì)量浩聋。
3、基本指標
注:以下所說的指標臊恋,均以移動App常見的核心指標為主衣洁,不涉及業(yè)務相關指標。目的是希望產(chǎn)品經(jīng)理在談起某個數(shù)據(jù)時抖仅,能統(tǒng)一認識坊夫。
新增用戶:安裝App后,首次啟動App的設備數(shù)撤卢,需要按“設備號”去重环凿。新增用戶主要為了衡量推廣效果,以及當前產(chǎn)品在整個生命周期所處階段放吩。
活躍用戶:時間段內(nèi)智听,啟動過App的設備數(shù),需要按“設備號”去重〉酵疲活躍用戶主要為了衡量運營效果考赛,以及產(chǎn)品使用情況。
啟動次數(shù):時間段內(nèi)莉测,啟動App的次數(shù)颜骤,無需去重。啟動次數(shù)主要為了衡量推送效果捣卤,以及App的內(nèi)容是否足夠吸引人忍抽。
留存率:時間段內(nèi)的新增用戶,經(jīng)過一段時間仍啟動App的用戶董朝,占原新增用戶的比例鸠项。“時間段”的劃分方式有:按日益涧、按周锈锤、按月,對應指標還可細分為“日留存率闲询、周留存率久免、月留存率”。而“經(jīng)過一段時間”的劃分方式有:次日扭弧、7日阎姥、14日;次周鸽捻、+2周呼巴;次月、+2月等御蒲。一般一款App的次日留存率為30-40%衣赶,次月留存率為20%,已經(jīng)算是不錯的成績了厚满。
使用時長:時間段內(nèi)府瞄,從啟動到結(jié)束App使用的總時長。所謂“結(jié)束App”碘箍,通常指殺掉進程遵馆,或者將App退到后臺超過30秒。一般會按“人均使用時長丰榴、次均使用時長货邓、單次使用時長”分析,衡量產(chǎn)品粘性和活躍情況四濒。
使用頻率:用戶上次啟動App的時間换况,與再次啟動的時間差职辨。使用頻數(shù)分布,可觀察到App對用戶的粘性复隆,以及運營內(nèi)容的深度拨匆。
4、基本技術(shù)
數(shù)據(jù)采集技術(shù)——抓包挽拂。所謂“抓包”惭每,一般指觀察App上傳到服務器上的數(shù)據(jù)都有哪些。通過“抓包”觀察亏栈,一方面可判斷自家App是否正確上傳了想要統(tǒng)計的數(shù)據(jù)台腥,另一方面還可抓取到手機上安裝的其他App的上傳數(shù)據(jù),用來分析競品內(nèi)容更新情況绒北。一般在Mac系統(tǒng)上黎侈,我習慣用Charles工具,Windows系統(tǒng)可以用Wireshark闷游。當然抓到的數(shù)據(jù)如果想進行詳盡分析峻汉,需要一點基本的http協(xié)議知識和json格式知識。
數(shù)據(jù)提取技術(shù)——sql語言脐往。sql語言一般用于從數(shù)據(jù)庫中進行數(shù)據(jù)的增刪改查休吠,需要企業(yè)運維人員或DBA人員開啟權(quán)限才可訪問,大公司的產(chǎn)品經(jīng)理基本沒機會用到业簿,但如果你是小公司的高級產(chǎn)品經(jīng)理瘤礁,且和技術(shù)商議僅開啟只讀權(quán)限,還是可以嘗試使用的梅尤。
以我個人經(jīng)驗柜思,掌握sql只是基本要求,更關鍵的在于了解數(shù)據(jù)庫表結(jié)構(gòu)和關聯(lián)關系巷燥,以及你提取數(shù)據(jù)的思路赡盘,sql只是工具而已。sql語言本身也和數(shù)據(jù)庫軟件相關缰揪,推薦學習mysql的sql語法亡脑,簡單易試。至于語句邀跃,只要掌握group by的維度,where的限制條件蛙紫,還有join語句的表連接邏輯拍屑,基本就能應對80%的數(shù)據(jù)查詢需求,剩下的就是熟能生巧了坑傅。
數(shù)據(jù)處理技術(shù)——Excel僵驰、Python、JS。提取出來的數(shù)據(jù)蒜茴,要深入分析星爪,肯定得進行二次加工。按使用的難度高低粉私,需要掌握工具如下:
Excel:大名鼎鼎的office工具顽腾,有著極其強大的數(shù)據(jù)處理能力。常用數(shù)據(jù)分析功能有透視表和命令行诺核。推薦一個我喜歡的處理命令:
VLOOKUP:這是一個查找函數(shù)抄肖,給定一個查找目標,它就能從指定的查找區(qū)域中返回想要查找到的值窖杀。它的基本語法為:
VLOOKUP(查找目標漓摩,查找范圍,返回值的列數(shù)入客,false)
我們可在一堆數(shù)據(jù)中管毙,根據(jù)指定條件,進行二次篩選桌硫,非常方便夭咬。當然這個函數(shù)的作用還不止如此,有興趣的同學可以深入研究一下鞍泉。
此外皱埠,包括COUNTIF、IF等判斷語句咖驮,也是篩選數(shù)據(jù)非常好用的函數(shù)边器。
Python、JS:Python托修、JS其實是一種通用腳本語言忘巧,不止適用于數(shù)據(jù)分析,但由于其安裝睦刃、使用方便砚嘴,函數(shù)庫豐富,特別適合有開發(fā)基礎的同學嘗試涩拙。舉個例子际长,mysql提取出來的數(shù)據(jù),DBA通常會以Excel格式提供兴泥,簡單的二次處理可用Excel完成工育,但涉及根據(jù)業(yè)務不同,要根據(jù)Excel做數(shù)據(jù)的條件判斷計算搓彻,以及循環(huán)處理如绸,就要借助第三方開發(fā)語言了(當然Excel自帶的VBA也很強大)嘱朽。此外,如果希望以更可視化的方式查看數(shù)據(jù)怔接,還可通過JS技術(shù)搪泳,調(diào)取第三方開發(fā)庫,如百度地圖的API扼脐,進行更豐富的呈現(xiàn)岸军。比如之前我在e代駕做的車輛運行軌跡圖:
5、基本分析方法
介紹幾個常用的數(shù)據(jù)分析思路:
對比:字面上理解谎势,就是非孤立地看數(shù)據(jù)凛膏,而是多個數(shù)據(jù)提取進行比較。根據(jù)對比方法不同脏榆,分為“橫向?qū)Ρ取焙汀翱v向?qū)Ρ取薄?/p>
橫向?qū)Ρ龋褐缚臻g維度的對比猖毫。相當于一個指標,在不同條件下的對比须喂,但每個條件都屬于一個層級吁断。舉個例子,App功能的A/B測試數(shù)據(jù)對比坞生,各個渠道的新增用戶對比仔役,都屬于橫向?qū)Ρ取?/p>
縱向?qū)Ρ龋褐笗r間維度的對比。一般的對比方法有:同比是己、環(huán)比又兵。同比一般指是指本期數(shù)據(jù)與上年同期數(shù)據(jù)對比,環(huán)比則是本期統(tǒng)計數(shù)據(jù)與上期比較卒废。觀察時間軸上的數(shù)據(jù)折線圖來判斷產(chǎn)品運營狀態(tài)也是一種縱向?qū)Ρ取?/p>
拆分:分析這個詞沛厨,從字面意義上理解,就是“拆分”和“解析”摔认,當某個維度對比后發(fā)現(xiàn)問題需要找原因時逆皮,就需要進一步“拆分”了。舉個例子参袱,如果發(fā)現(xiàn)某日的銷售額只有昨日的50%电谣,就需要對銷售額指標拆分為:成交用戶數(shù) x 客單價,而成交用戶數(shù) = 訪客數(shù) x 轉(zhuǎn)化率抹蚀。那么我們接下來就可分別針對:訪客數(shù)剿牺、轉(zhuǎn)化率、客單價环壤,觀察今日和昨日相比的數(shù)據(jù)變化晒来,找出原因。
降維:當維度太多時镐捧,我們不可能全部分析潜索,這時就要篩選出有代表性的關鍵維度,去除掉那些無關數(shù)據(jù)懂酱,這就是“降維”竹习。比如“成交用戶數(shù) = 訪客數(shù) x 轉(zhuǎn)化率”,當同時存在這三個指標時列牺,其實我們只要三選二就能得出結(jié)論了整陌。
增維:增維和降維是相對的,如果當前觀察的維度無法解釋當前問題瞎领,就需要對數(shù)據(jù)進行運算泌辫,多增加一個指標。在可視化分析領域九默,也可將不同類型的圖表嵌套使用震放,能達到增加信息展現(xiàn)維度,擴展分析廣度的目的驼修,如下圖所示:(將環(huán)形圖和折線圖進行增維嵌套)殿遂。
分組:也可叫聚類,合適的分組能更好地理解業(yè)務和場景乙各。例如用戶畫像過程墨礁,就是一個按不同維度對數(shù)據(jù)分組的過程。通過用戶畫像耳峦,可以很清晰地知道產(chǎn)品的用戶地區(qū)恩静、用戶興趣、用戶年齡蹲坷、用戶性別等屬性占比驶乾,產(chǎn)品經(jīng)理可通過畫像進一步了解用戶需求。
漏斗分析:主要用于分析產(chǎn)品使用的關鍵路徑冠句,通過設定一系列操作步驟轻掩,統(tǒng)計每一步中的操作用戶數(shù),并將用戶數(shù)以柱狀圖縱向排列懦底,就可形成用戶流失漏斗唇牧,我們可分析漏斗每個環(huán)節(jié)的流失率,并觀察改進環(huán)節(jié)交互體驗后聚唐,流失用戶的變化情況丐重,以此來驗證改動效果。
AARRR模型:該模型一般用于游戲數(shù)據(jù)分析杆查,是Acquisition扮惦、Activation、Retention亲桦、Revenue崖蜜、Refer浊仆,這五個單詞的縮寫,分別對應一款移動應用生命周期中的5個重要環(huán)節(jié)豫领。AARRR本身是一個循環(huán)抡柿,使用者需觀察每個環(huán)節(jié)的數(shù)據(jù)情況,以此來分析產(chǎn)品是否在執(zhí)行一個正循環(huán)過程等恐。這其中的任一環(huán)節(jié)除了問題洲劣,都會導致產(chǎn)品數(shù)據(jù)的異常。
6课蔬、總結(jié)
以上內(nèi)容囱稽,從“基本概念、基本術(shù)語二跋、基本指標战惊、基本技術(shù)、基本分析方法”這幾個方面同欠,講解了產(chǎn)品經(jīng)理應了解的基本數(shù)據(jù)知識样傍,其實每個方面都可再深入講解,但由于篇幅有限铺遂,只能擇期再開新話題衫哥,有興趣的同學可私信溝通~
===============================
作者申悅 ?6年產(chǎn)品汪 現(xiàn)紅演圈公司產(chǎn)品VP
本文為作者原創(chuàng),未經(jīng)作者允許襟锐,嚴禁第三方轉(zhuǎn)載撤逢,謝謝~