? ? 數(shù)據(jù)的重要性毋庸置疑凄贩,所謂成大事者誓军,三觀要正。數(shù)據(jù)分析大致可以分為描述性數(shù)據(jù)分析疲扎、診斷性數(shù)據(jù)分析和預(yù)測性數(shù)據(jù)分析昵时。
????從分類不難看出,數(shù)據(jù)無非就是要有龐大的數(shù)據(jù)然后利用一定的技術(shù)進(jìn)行預(yù)測椒丧。
????那么數(shù)據(jù)常用的分析方法包括對比分析壹甥、平均分析、交叉分析等數(shù)壶熏。不同的人有不同的技巧和方法句柠,當(dāng)然目的是一致的。都是一定的方法(比如:機(jī)器學(xué)習(xí))建立模型棒假,預(yù)測數(shù)據(jù)溯职。
????那么數(shù)據(jù)分析又有各種各樣的工具,常見的比如:Excel帽哑、SPSS谜酒、PYTHON、R還有其他的工具(比如:JMP妻枕、SAS僻族、ALstat等),當(dāng)然咯我最喜歡的事python屡谐。曾經(jīng)鬧出一個笑話述么,在做一個獎勵機(jī)制,我用python吭哧坑次搞了好久搞出來了愕掏,然后一同事說這個用Excel不是很簡單嗎碉输?仔細(xì)一想還真是,哈哈哈(這怕是python被黑比較慘的一次了)
??? 喲亭珍,扯遠(yuǎn)了敷钾,是說產(chǎn)品與數(shù)據(jù)糾纏不清的關(guān)系,“數(shù)據(jù)”這個詞肄梨,是產(chǎn)品經(jīng)理永遠(yuǎn)繞不過的話題阻荒,很多產(chǎn)品對數(shù)據(jù)的理解任然是一團(tuán)漿糊,甚至在做產(chǎn)品的時候從不考慮數(shù)據(jù)众羡。就會有很多的理所當(dāng)然的事情發(fā)生侨赡,最近發(fā)生了一件很有趣的事情,市場部門售賣一款產(chǎn)品,產(chǎn)品開始介入主導(dǎo)羊壹,做著做著發(fā)現(xiàn)業(yè)績不行了蓖宦,至于原因不得而知了,后來大佬調(diào)整油猫,說按照原來的模式吧稠茂,還是銷售部門的老套路,業(yè)績突然就上去了情妖。為啥睬关?產(chǎn)品部門造出來的產(chǎn)品為啥市場不買賬?(這里就不說原因了毡证,以后再說吧电爹,我想表達(dá)的意思是一定要有數(shù)據(jù)來支撐產(chǎn)品,不能瞎想料睛,胡編亂造)
??? 什么是數(shù)據(jù)分析丐箩?
數(shù)據(jù)分析就是提取有用的數(shù)據(jù)來指導(dǎo)實踐。
1恤煞、數(shù)據(jù)不要流于形式屎勘,要以結(jié)果為導(dǎo)向。
2阱州、數(shù)據(jù)可視化,這樣便于發(fā)現(xiàn)數(shù)據(jù)背后提供的信息法梯。
3苔货、提取有用的數(shù)據(jù),不是自嗨立哑。
????舉個例子:互聯(lián)網(wǎng)金融都會有渠道推廣這個東西夜惭,比如有A B C D 四個渠道,可以統(tǒng)計從各個渠道過來的用戶數(shù)量和在投金額铛绰。站在老板的角度就會選擇花的錢最少诈茧,但是帶來收益最高的那個渠道,也就是ROI最高的那個渠道捂掰。
????如果再進(jìn)一步細(xì)分敢会,如果A渠道10個人帶來了200萬,B渠道300個人帶來了200萬这嚣,那么說明A渠道高凈值人群比較多鸥昏,如果和我們目標(biāo)用戶一樣的話,可以重點維護(hù)姐帚!加大宣傳投入成本吏垮,所以目的不一樣,看的數(shù)據(jù)也不一樣
1、入口分析
????用戶從哪些渠道進(jìn)入產(chǎn)品膳汪,對比運營策略分析量多或量少的原因唯蝶,提出優(yōu)化方案。例如遗嗽,你的app用戶有從app store來的粘我,有從不同的安卓市場來的,有從第三方渠道來的媳谁,有地推來的涂滴,有運營發(fā)布的文章來的,你需要分析從不同渠道來的用戶數(shù)量和質(zhì)量以及投入成本晴音,就像我上面舉得互聯(lián)網(wǎng)金融的例子柔纵,通過投入產(chǎn)出比來選擇渠道,同時通過每個渠道來的用戶貢獻(xiàn)程度锤躁,來分析出每個渠道的用戶質(zhì)量搁料。
2、用戶分析
????分類用戶群體系羞,獲取用戶基本信息郭计,包括地區(qū)、性別椒振、職業(yè)等你的產(chǎn)品需要關(guān)心的元素昭伸;這一部分相當(dāng)于用戶畫像,你可以通過自己建立的power BI系統(tǒng)來進(jìn)行分析澎迎,也可以通過第三方提供的工具來進(jìn)行分析庐杨,可以根據(jù)這些數(shù)據(jù)信息來做你的用戶畫像。用戶畫像的五個維度夹供,可以參考我之前的文章《產(chǎn)品經(jīng)理如何進(jìn)行用戶畫像上》
????統(tǒng)計新增用戶灵份、活躍用戶、流失用戶數(shù)據(jù)哮洽,思考如何刺激轉(zhuǎn)化填渠;這就是用戶運營的工作,哪些是新增用戶鸟辅,哪些是活躍用戶氛什,哪些是流失用戶。重點考慮新增用戶的轉(zhuǎn)化和流失用戶流失的原因匪凉,以及定期做一些運營活動來促進(jìn)用戶的活躍屉更。
3、事件分析
????各個功能的使用情況洒缀,驗證功能設(shè)計時的想法瑰谜,有沒有出現(xiàn)與設(shè)計時相悖的數(shù)據(jù)欺冀,例如 PV、UV萨脑、頁面跳出率隐轩、頁面停留時長、轉(zhuǎn)化率這些指標(biāo)渤早。一件很有趣的事情职车,愛彼迎民宿剛上線的時候用戶多轉(zhuǎn)化率低,到后來轉(zhuǎn)化率大大提升就是數(shù)據(jù)分析起到了主導(dǎo)性的作用鹊杖。
4悴灵、漏斗分析
????也叫做漏斗模型,比如一個p2p購買流程骂蓖。
瀏覽標(biāo)的—-》查看標(biāo)的詳情—》購買—》輸入支付密碼—》成功支付
????你可以分析用戶的每一個操作步驟积瞒,你如有100個人瀏覽你的標(biāo)的,80個人查看詳情登下,60個購買茫孔,5個人購買成功。說明用戶在輸入支付密碼那一塊漏的比較厲害被芳,需要重點優(yōu)化缰贝,這就是漏斗模型的作用。
????我覺得對于產(chǎn)品來說畔濒,有兩大流程需要進(jìn)行漏斗模型分析剩晴。一個就是注冊流程,這個決定了用戶會不會在你注冊環(huán)節(jié)流失侵状。另外一個就是主要流程赞弥。例如電商的支付流程,金融平臺產(chǎn)品購買流程和充值流程壹将。
5嗤攻、留存分析
????次日留存毛嫉、三日留存诽俯、月留存。所謂留存率承粤,就是指一組用戶在初始時間(比如首次打開應(yīng)用)之后第 N 天暴区,還在使用產(chǎn)品的用戶比例(即留存下來的用戶比例),一般稱之為N 天留存率辛臊。對于留存率你要辯證的看仙粱,如果你是做的社交產(chǎn)品,那么留存率是一個很重要的指標(biāo)彻舰。如果你做的是旅游機(jī)票這種產(chǎn)品伐割,類似于攜程候味,可能有的用戶半年就買一次機(jī)票,買機(jī)票的時候才想起你隔心,這種低頻的使用產(chǎn)品白群,你再分析留存率就沒啥意思。
????總而言之硬霍,數(shù)據(jù)分析是一個很重要的產(chǎn)品需求來源帜慢,你自己提的想法可能不靠譜,老板的想法可能在天上唯卖,覺得運營提的需求太傻逼粱玲,但是數(shù)據(jù)永遠(yuǎn)不會說謊,
附上基本術(shù)語:
埋點:一般意義上的埋點拜轨,是利用如友盟抽减、Talkingdata等第三方公司的SDK,通過在App中嵌入一段SDK代碼撩轰,設(shè)定觸發(fā)條件胯甩,當(dāng)滿足條件時,SDK會記錄日志堪嫂,并將日志發(fā)送到第三方服務(wù)器進(jìn)行解析偎箫,并可視化地呈現(xiàn)給我們。這一過程就叫埋點皆串。埋點方式也分“簡單埋點”和“自定義埋點”淹办,所謂“簡單埋點”就是直接拿到第三方key,寫到App代碼的配置文件中即可恶复。而“自定義埋點”則對應(yīng)一種叫“自定義事件”的功能怜森,一般第三方統(tǒng)計工具都支持,我們可通過設(shè)置“自定義事件”查看App特定的操作行為數(shù)據(jù)谤牡,如點擊按鈕次數(shù)副硅、打開指定頁面次數(shù)等,通常創(chuàng)建“自定義事件”都需要產(chǎn)品經(jīng)理告知開發(fā)App的哪些條件下需要觸發(fā)“自定義事件”翅萤,以及觸發(fā)時要如何通過不同參數(shù)區(qū)分不同的點擊行為恐疲。如同樣是點擊按鈕事件,可通過設(shè)置參數(shù)“Action”套么,來區(qū)分Action=Yes和Action=No這兩個按鈕分別點擊的次數(shù)培己。
維度:維度就是指我們平時看事物的角度,也可理解成分析一個數(shù)據(jù)能從哪些方面去分析胚泌,這些“角度”都是有值且可被枚舉的省咨。比如我們注冊用戶數(shù)有10萬,那可分析的維度有:用戶所在省份玷室、用戶性別零蓉、用戶角色笤受、用戶來源等。不同維度來觀察數(shù)據(jù)敌蜂,可以得出不同結(jié)論感论,能否拓展觀察維度,也是評估數(shù)據(jù)分析能力的一個關(guān)鍵紊册。
度量:度量和維度相輔相成比肄,是指可量化的數(shù)值,用于考察不同維度觀察的效果囊陡,也可理解成“數(shù)據(jù)指標(biāo)”芳绩。觀察度量值可總體查看,如App總用戶數(shù)撞反,也可配合“維度”分層查看妥色,如不同省份的注冊用戶數(shù)、活躍用戶數(shù)遏片,不同來源的App啟動次數(shù)嘹害、平均日使用時長等。
渠道:指App的不同安裝來源吮便,如通過第三方應(yīng)用市場安裝笔呀,通過廣告點擊安裝,通過地推二維碼掃碼安裝髓需,通過官網(wǎng)下載安裝等许师。互聯(lián)網(wǎng)公司的商務(wù)工作一般就是拓展渠道僚匆,觀察不同渠道帶來的數(shù)據(jù)表現(xiàn)微渠,不斷優(yōu)化渠道質(zhì)量。
新增用戶:安裝App后咧擂,首次啟動App的設(shè)備數(shù)逞盆,需要按“設(shè)備號”去重。新增用戶主要為了衡量推廣效果松申,以及當(dāng)前產(chǎn)品在整個生命周期所處階段云芦。
活躍用戶:時間段內(nèi),啟動過App的設(shè)備數(shù)攻臀,需要按“設(shè)備號”去重焕数∩疵粒活躍用戶主要為了衡量運營效果刨啸,以及產(chǎn)品使用情況。
啟動次數(shù):時間段內(nèi)识脆,啟動App的次數(shù)设联,無需去重善已。啟動次數(shù)主要為了衡量推送效果,以及App的內(nèi)容是否足夠吸引人离例。
留存率:時間段內(nèi)的新增用戶换团,經(jīng)過一段時間仍啟動App的用戶,占原新增用戶的比例宫蛆∷野“時間段”的劃分方式有:按日、按周耀盗、按月想虎,對應(yīng)指標(biāo)還可細(xì)分為“日留存率、周留存率叛拷、月留存率”舌厨。而“經(jīng)過一段時間”的劃分方式有:次日、7日忿薇、14日裙椭;次周、+2周署浩;次月揉燃、+2月等。一般一款A(yù)pp的次日留存率為30-40%筋栋,次月留存率為20%你雌,已經(jīng)算是不錯的成績了。
使用時長:時間段內(nèi)二汛,從啟動到結(jié)束App使用的總時長婿崭。所謂“結(jié)束App”,通常指殺掉進(jìn)程肴颊,或者將App退到后臺超過30秒氓栈。一般會按“人均使用時長、次均使用時長婿着、單次使用時長”分析授瘦,衡量產(chǎn)品粘性和活躍情況。
使用頻率:用戶上次啟動App的時間竟宋,與再次啟動的時間差零聚。使用頻數(shù)分布,可觀察到App對用戶的粘性瞬矩,以及運營內(nèi)容的深度攒磨。
介紹幾個常用的數(shù)據(jù)分析思路:
對比:字面上理解,就是非孤立地看數(shù)據(jù)蜗字,而是多個數(shù)據(jù)提取進(jìn)行比較打肝。根據(jù)對比方法不同脂新,分為“橫向?qū)Ρ取焙汀翱v向?qū)Ρ取薄?/p>
橫向?qū)Ρ龋?/b>指空間維度的對比。相當(dāng)于一個指標(biāo)粗梭,在不同條件下的對比争便,但每個條件都屬于一個層級。舉個例子断医,App功能的A/B測試數(shù)據(jù)對比滞乙,各個渠道的新增用戶對比,都屬于橫向?qū)Ρ取?/p>
縱向?qū)Ρ龋?/b>指時間維度的對比鉴嗤。一般的對比方法有:同比酷宵、環(huán)比。同比一般指是指本期數(shù)據(jù)與上年同期數(shù)據(jù)對比躬窜,環(huán)比則是本期統(tǒng)計數(shù)據(jù)與上期比較浇垦。觀察時間軸上的數(shù)據(jù)折線圖來判斷產(chǎn)品運營狀態(tài)也是一種縱向?qū)Ρ取?/p>
拆分:分析這個詞,從字面意義上理解荣挨,就是“拆分”和“解析”男韧,當(dāng)某個維度對比后發(fā)現(xiàn)問題需要找原因時,就需要進(jìn)一步“拆分”了默垄。舉個例子此虑,如果發(fā)現(xiàn)某日的銷售額只有昨日的50%,就需要對銷售額指標(biāo)拆分為:成交用戶數(shù) x 客單價口锭,而成交用戶數(shù) = 訪客數(shù)x 轉(zhuǎn)化率朦前。那么我們接下來就可分別針對:訪客數(shù)、轉(zhuǎn)化率鹃操、客單價韭寸,觀察今日和昨日相比的數(shù)據(jù)變化,找出原因荆隘。
降維:當(dāng)維度太多時恩伺,我們不可能全部分析,這時就要篩選出有代表性的關(guān)鍵維度椰拒,去除掉那些無關(guān)數(shù)據(jù)晶渠,這就是“降維”。比如“成交用戶數(shù) = 訪客數(shù) x 轉(zhuǎn)化率”燃观,當(dāng)同時存在這三個指標(biāo)時褒脯,其實我們只要三選二就能得出結(jié)論了。
增維:增維和降維是相對的缆毁,如果當(dāng)前觀察的維度無法解釋當(dāng)前問題番川,就需要對數(shù)據(jù)進(jìn)行運算,多增加一個指標(biāo)。在可視化分析領(lǐng)域爽彤,也可將不同類型的圖表嵌套使用,能達(dá)到增加信息展現(xiàn)維度缚陷,擴(kuò)展分析廣度的目的适篙,如下圖所示:(將環(huán)形圖和折線圖進(jìn)行增維嵌套)。
分組:也可叫聚類箫爷,合適的分組能更好地理解業(yè)務(wù)和場景嚷节。例如用戶畫像過程,就是一個按不同維度對數(shù)據(jù)分組的過程虎锚。通過用戶畫像硫痰,可以很清晰地知道產(chǎn)品的用戶地區(qū)、用戶興趣窜护、用戶年齡效斑、用戶性別等屬性占比,產(chǎn)品經(jīng)理可通過畫像進(jìn)一步了解用戶需求柱徙。
漏斗分析:主要用于分析產(chǎn)品使用的關(guān)鍵路徑缓屠,通過設(shè)定一系列操作步驟,統(tǒng)計每一步中的操作用戶數(shù)护侮,并將用戶數(shù)以柱狀圖縱向排列敌完,就可形成用戶流失漏斗,我們可分析漏斗每個環(huán)節(jié)的流失率羊初,并觀察改進(jìn)環(huán)節(jié)交互體驗后滨溉,流失用戶的變化情況,以此來驗證改動效果长赞。
漏斗分析模型
AARRR模型:該模型一般用于游戲數(shù)據(jù)分析晦攒,是Acquisition、Activation得哆、Retention勤家、Revenue、Refer柳恐,這五個單詞的縮寫伐脖,分別對應(yīng)一款移動應(yīng)用生命周期中的5個重要環(huán)節(jié)。AARRR本身是一個循環(huán)乐设,使用者需觀察每個環(huán)節(jié)的數(shù)據(jù)情況讼庇,以此來分析產(chǎn)品是否在執(zhí)行一個正循環(huán)過程。這其中的任一環(huán)節(jié)除了問題近尚,都會導(dǎo)致產(chǎn)品數(shù)據(jù)的異常蠕啄。
AARRR模型
最近迷上了python做數(shù)據(jù)分析,發(fā)現(xiàn)這東西越來越有意思。有沒有感興趣的一起學(xué)習(xí)一下