前言
工具改變一個時代牡昆,或者說,時代的變革都離不開工具的變革,這或許是工具類的產(chǎn)品給我們帶來的最大的吸引力丢烘。
拍照工具的變革柱宦,引起了自拍的時代,而且這個時代將會一直持續(xù)下去播瞳,直到被下一個工具再次改變掸刊。
時代便是如此被工具所影響,作為產(chǎn)品經(jīng)理而言赢乓,我們也將會被工具所影響忧侧,包括墨刀,釘釘牌芋,藍湖蚓炬,石墨等等,越來越多新的工具變革在悄悄的改變著這個行業(yè)躺屁。
當然肯夏,這篇文章的主角:MTA(騰訊移動分析),也會持續(xù)發(fā)生新的變革楼咳,發(fā)揮他作為工具的使命價值熄捍,為整個移動互聯(lián)網(wǎng)行業(yè)帶來新的數(shù)據(jù)驅(qū)動方式。
數(shù)據(jù)驅(qū)動產(chǎn)品/運營母怜,永遠不會是一個即定的目標余耽,而是一個可持續(xù)的過程,在這個過程中苹熏,我們手中用來做數(shù)據(jù)監(jiān)控碟贾,分析的工具,將會直接影響我們?nèi)粘5墓ぷ鞴煊颍绊懳覀儗Ξa(chǎn)品走向的判斷袱耽,影響我們的決策。
最終干发,數(shù)據(jù)工具將會影響我們的產(chǎn)品是成功朱巨,或是失敗。
事實上枉长,我對于接下來要展開講述的主題抱有十分的期待冀续,如果能夠進入MTA的迭代排期,我將十分慶幸必峰,能夠是這樣一款產(chǎn)品的受眾用戶洪唐。
我所期待的,便是 “活躍天數(shù)”的一小步變革吼蚁。
活躍天數(shù)概述
活躍天數(shù)是MTA比較早的一個功能了凭需,具體上線時間未知,記憶中2017年,已經(jīng)存在這個模塊了粒蜈。
簡單來講顺献,活躍天數(shù)是在統(tǒng)計周期內(nèi)記錄用戶的登錄天數(shù)為數(shù)據(jù)對象,我們認為薪伏,周期范圍內(nèi)滚澜,活躍天數(shù)越多粗仓,用戶的粘性越強嫁怀,活躍天數(shù)越低,用戶的粘性越弱借浊。
在mta提供的demo數(shù)據(jù)里塘淑,我們發(fā)現(xiàn)在2018-5-25至2018-6-1日 這7天的周期里,5-29日這一天蚂斤,有兩天登錄行為的用戶占比11%存捺,有5天登錄行為的用戶占比5%
(由于是demo數(shù)據(jù),又或者是因為該模塊的設計問題曙蒸,導致數(shù)據(jù)難以解讀捌治,以上數(shù)據(jù)僅作為文章觀點闡述,不代表正式數(shù)據(jù)解讀纽窟。)
我們可以通過demo數(shù)據(jù)來做一次簡單的解讀肖油,該產(chǎn)品的用戶粘性并不是十分強,高頻用戶僅占活躍用戶的5%臂港,而一周內(nèi)森枪,僅存在兩天登錄行為的用戶卻占比11%。
換個說法审孽,會更容易闡述我的觀點县袱,低頻用戶是無限接近流失用戶的,案例對象在5月29日的活躍用戶里佑力,存在11%的用戶即將流失式散。
正常情況下,喜歡的將會更加喜歡打颤,不喜歡的將會更加不喜歡暴拄,常態(tài)數(shù)據(jù)從來不是瞬間的變化,他是一個持續(xù)的趨勢瘸洛,是A點到B點的一個過程揍移。
(活動,服務器崩潰反肋,業(yè)務異常等特殊事件會導致數(shù)據(jù)瞬間的變化那伐,但這種變化并不是常態(tài)的,而是由事件觸發(fā)的。)
這個過程恰恰就是數(shù)據(jù)所反饋給我們的核心價值之一罕邀,常態(tài)下畅形,人們不可能突然從喜歡變成不喜歡,一個連續(xù)使用7天的用戶 不可能突然流失诉探,必然會經(jīng)過 活躍7天日熬,活躍5天,活躍2天 這些階段肾胯,活躍天數(shù)變化的過程竖席,恰恰是用戶粘性變化的最好體現(xiàn)。
借助活躍天數(shù)敬肚,我們可以判斷用戶的粘性毕荐,產(chǎn)品的健康度,這更加有利于我們?nèi)ゴ蛟煲豢钌钍苡脩粝矏鄣漠a(chǎn)品艳馒。
我曾打造過這樣一款產(chǎn)品憎亚,在30天的觀察周期里,超過50%的用戶弄慰,活躍天數(shù)在25天以上第美,超過70%的用戶,活躍天數(shù)在20天以上陆爽。
這個數(shù)據(jù)表明什往,我的用戶對這款產(chǎn)品十分滿意,他們愿意讓這款產(chǎn)品成為日常生活中的一部分墓陈,就如同微信一樣恶守,融入到我們的生活當中。且在不發(fā)生突發(fā)事件的情況下贡必,會有較長的安全周期兔港,用戶不會太快的流失。
如果超過50%的活躍天數(shù)在5天以下仔拟,我可能就會很焦慮了衫樊,因為我即將面臨一半用戶以上的流失。
活性概念闡述及應用場景利花。
我將通過活躍天數(shù)來判斷用戶粘性的數(shù)據(jù)指標稱之為“用戶活性”科侈,以活躍天數(shù)為基礎,輔助以加權(quán)分炒事,得到用戶活性分臀栈,再對活性分進行等級劃分,得到用戶活性等級挠乳。
活性是一個可量化的詞权薯,我們可以說某款產(chǎn)品的用戶活性高姑躲,這將會是一款非常不錯的產(chǎn)品,我們也可以說某款產(chǎn)品的用戶活性低盟蚣,那這款產(chǎn)品就要注意了黍析,他的用戶隨時都有可能流失。
對用戶活性進行數(shù)據(jù)量化屎开,其價值遠超活躍數(shù)據(jù)阐枣,流失數(shù)據(jù),留存數(shù)據(jù)奄抽,后者反饋的是一個即定的結(jié)果蔼两,而活性反饋的則是一個變化中的過程。
我相信如孝,作為產(chǎn)品經(jīng)理的我們宪哩,必然經(jīng)歷過或者正在經(jīng)歷一些數(shù)據(jù)迷宮, 他的表現(xiàn)形式是這樣的第晰。
第一天,新增10000用戶彬祖, 日活20000用戶
第二天茁瘦,新增10000用戶, 日活20000用戶
第三天储笑,新增10000用戶甜熔, 日活20000用戶
第四天,新增10000用戶突倍, 日活20000用戶
四天總共新增了40000用戶腔稀,但日活卻未曾發(fā)生過變化,我們當然可以對數(shù)據(jù)進行解讀(任何數(shù)據(jù)都是可被解讀的羽历,盡管有時候我們難以接受)
解讀一:來了多少用戶焊虏,流失多少用戶,產(chǎn)品留存有問題(新用流失:需要關聯(lián)留存率深入分析)
解讀二:新用戶的增量秕磷,和老用戶的流失持平诵闭。(老用戶流失:若用戶生命周期有限,非可持續(xù)化的產(chǎn)品澎嚣,必然出現(xiàn)的場景疏尿,需要關聯(lián)用戶生命周期深入分析)
可是,真實的情況卻比以上兩種解讀要復雜的多易桃,第一天活躍的20000用戶褥琐,和第二天的相比,并不是同一批用戶晤郑,我們并不能因為日活未發(fā)生變化敌呈,就判斷用戶流失嚼鹉,我們也不清楚第一天活躍的20000用戶里有多少是第二天流失了的,有多少是持續(xù)留下來的驱富。
未能解開的謎題還有很多锚赤,我們需要一些新的數(shù)據(jù)維度,來幫我們解開這個謎題褐鸥,活性不是唯一解開謎題的數(shù)據(jù)线脚,但卻是可以解開一部分謎題的數(shù)據(jù)維度。
用戶活性等級是對活躍的精細化數(shù)據(jù)分析
我們不妨補充一些假設性質(zhì)的數(shù)據(jù)叫榕,來看看會發(fā)現(xiàn)什么奇妙的變化浑侥,以每一天活躍用戶數(shù)為樣本,將數(shù)據(jù)進行精細化處理晰绎。
第一天寓落,50%高活性等級,30%中活性等級荞下,20%低活性等級
第二天伶选,40%高活性等級,40%中活性等級尖昏,20%低活性等級
第三天仰税,30%高活性等級,40%中活性等級抽诉,30%低活性等級
第四天陨簇,30%高活性等級,30%中活性等級迹淌,40%低活性等級
日活不變的情況下河绽,我們可以發(fā)現(xiàn)用戶的活性等級越來越低了,這表示產(chǎn)品對用戶的粘性逐漸降低了唉窃,我們會震驚于到了第四天有接近40%的用戶即將流失耙饰,因為用戶活性等級正在持續(xù)的降低,當降低為0時句携,也就流失了榔幸。
活性等級變化趨勢代表了用戶粘性的變化趨勢
固定周期內(nèi),活性等級的占比變化趨勢矮嫉,也能夠為我們預測活躍數(shù)據(jù)走向提供了正面的參考價值削咆,這源于我在前文所提到的觀點“喜歡的會更喜歡,不喜歡的會更不喜歡”蠢笋。
人們對某件事物的情感變化是一個線性的過程拨齐,而非點性的變化,這一點將會給我們做產(chǎn)品的方法帶來本質(zhì)的改變昨寞,或許瞻惋,我們可以嘗試回答下列幾個問題厦滤。
產(chǎn)品/運營在什么時候去做提升活躍的功能?
產(chǎn)品/運營在什么時候去做拉新的功能?
產(chǎn)品/運營在什么時候去做提升留存率的功能?
目前歼狼,我能想象到的答案有兩個掏导。
A:活躍降低的時候提活,新增降低的時候拉新羽峰,流失大的時候做留存
B:任何時候都需要持續(xù)的做提活趟咆,拉新,提升留存
沒有意外的話梅屉,你的答案會屬于兩者之一值纱,在現(xiàn)有工具里,我們僅僅能給出這兩個答案坯汤,這和我們的經(jīng)驗虐唠,能力,技能無關惰聂,僅僅是因為我們?nèi)鄙僖豢罟ぞ呓ィ且驗槲覀兯莆盏臄?shù)據(jù)稍顯欠缺的原因?qū)е隆?/p>
引入活性數(shù)據(jù),會給我們第三個答案庶近,基于他的預測特性翁脆,不妨一同思考一番。
在活性降低鼻种,而活躍數(shù)據(jù)尚未改變時,提升活躍度(如同文中的案例)
在活性較高時沙热,去做新用戶增長叉钥。(如70%的日活用戶都是高活性的用戶)
在主要活性等級不高時,去做留存篙贸。(如70%的日活用戶只是中活性的用戶)
活性等級的占比率是基于動態(tài)數(shù)據(jù)分析的結(jié)果
活性等級的占比率依賴的是變化的日活投队,每一天的數(shù)據(jù)樣本都是不同的,這是另一個維度的數(shù)據(jù)分析方式爵川。
傳統(tǒng)的占比率敷鸦,都是基于固定的或者說是持續(xù)增長的數(shù)據(jù)樣本,比如日活率寝贡。
我們知道日活率是必然降低的扒披,提升日活率的唯一方法是“老用戶回歸”,不管我們?nèi)绾握{(diào)動新用戶的活躍度圃泡,能夠達到的效果僅僅只能是放慢日活率的降低速度碟案,無法對日活率起到提高的作用。
原因在于颇蜡,日活率的計算公式=當日登錄用戶/總用戶數(shù)价说。 流失的用戶將會對日活率產(chǎn)生永久的影響辆亏,而新用戶的活躍度極限情況,只能保障日活率不再降低鳖目,這幾乎是不可能的扮叨,這要求我們的新用戶不再出現(xiàn)流失。新用戶的活躍度僅能讓我們減緩活躍率的降低速度领迈,而不能提高活躍率彻磁。
只有老用戶的回歸,在不增加總用戶數(shù)的情況下惦费,增加當日登錄用戶才能達到提升活躍率的目的兵迅。
活性等級的占比率,則比活躍率更能準確的表達用戶的活躍狀態(tài)薪贫,由于每天的分母樣本不同(日活用戶)恍箭,導致每天的數(shù)據(jù)占比不同。不會受到累計用戶的影響瞧省,能夠更準確的反應當前階段產(chǎn)品真正的健康狀態(tài)扯夭。
我們再來看一組案例,仍然是以日活20000來做數(shù)據(jù)推演
1.第一天 70%高活性等級 活躍率10%
2.第二天 50%高活性等級 活躍率7%
3.第三天 70%高活性等級 活躍率6.5%
我們可以準確的解讀出鞍匾,第二天日活用戶活躍度降低交洗,第三天用戶活躍度顯著提升,如果用活躍率來判斷橡淑,我們能得出的結(jié)論僅僅只是第三天阻止了活躍率的降低趨勢构拳。
實際上隨著我們累計用戶的數(shù)量增長,活躍率作為參考指標的辨識度將會越來越低梁棠,也許10%高活性等級的占比置森,在活躍率上體現(xiàn)出來的數(shù)值不到0.0001%。
一小步符糊,活躍天數(shù)變活性
活性的取材樣本來自于 活躍天數(shù)凫海,以目前MTA所提供的活躍天數(shù)模塊,是不足以支撐對用戶活性的觀察的男娄,甚至大部分用戶不知道如何使用活躍天數(shù)行贪,也不知道活躍天數(shù)有何使用場景,存在何種價值模闲。
很遺憾建瘫,我也屬于那大部分用戶中的一員。围橡。暖混。。
僅僅需要MTA繼續(xù)向前一小步翁授,就能讓活躍天數(shù)變成用戶活性拣播,而這一小步晾咪,卻能改變整個移動互聯(lián)網(wǎng)數(shù)據(jù)分析的方式,能夠影響所有APP開發(fā)者判斷贮配,分析谍倦,預測的方式,能讓產(chǎn)品經(jīng)理泪勒,在更加合適的時間昼蛀,做合適的事情。
用戶活性的第一特征是指觀察固定周期內(nèi)的活性圆存,而非持續(xù)累加的數(shù)據(jù)叼旋,活性所反應的信息,也是指觀察周期內(nèi)真實的狀況沦辙,不受周期外的數(shù)據(jù)影響夫植,其中就包括 已經(jīng)確定流失的用戶。
當我們篩選統(tǒng)計周期為7日時油讯,便是表示觀察用戶在7日內(nèi)的活躍天數(shù)详民。在這個期間里,最大值不會超過7陌兑,最小值也不會超過1.
而在視覺的表達里沈跨,用戶活性的數(shù)據(jù)分析則包含單日占比,相對上一日的增長幅度兔综,以及7日的趨勢走向三個主體分析維度饿凛。
粗略畫了個構(gòu)思原型,僅供參考软驰。
后續(xù)笤喳,我們在觀察產(chǎn)品數(shù)據(jù)時,活性等級相關的數(shù)據(jù)將會僅次于新增和活躍數(shù)據(jù)的觀察力度碌宴,某種意義上而言,活性數(shù)據(jù)或許比活躍數(shù)據(jù)的力度更重蒙畴。
因為活性數(shù)據(jù)贰镣,能夠更準確的反應用戶的粘性,且能對活躍數(shù)據(jù)的走勢進行相對準確的預測和監(jiān)控膳凝。
我會在文末的附文里碑隆,帶上我對用戶活性等級的設計方案,在我所孵化的早期項目里蹬音,多是以監(jiān)控活性來做迭代規(guī)劃上煤,由于工具的缺失,我的做法只能是導出用戶的登錄日志著淆,再用excel進行計算分析劫狠。
活性數(shù)據(jù)的讀取拴疤,計算和呈現(xiàn)對于許多團隊而言,成本都是非常昂貴的独泞,而且可行度是比較低的呐矾,除非企業(yè)規(guī)模達到一定量級,能夠組建自己的數(shù)據(jù)中心團隊懦砂,用來探索第三方所不能提供的數(shù)據(jù)蜒犯,對于中小型團隊而言,幾乎無法觸及荞膘,無法實現(xiàn)罚随。
如果你擅長excel的使用,或許也可以嘗試像我一樣羽资,導出用戶的登錄日志淘菩,并通過excel來計算自己想要的數(shù)據(jù),可excel的計算承載能力是極其有限的削罩,一旦度過項目初創(chuàng)期瞄勾,引來數(shù)據(jù)大量增長時,就沒有辦法使用excel來進行計算了弥激。
這是我們需要依賴工具的原因进陡,很少有團隊能夠獨立負擔活性數(shù)據(jù)的挖掘成本。
此時微服,作為受眾用戶而言趾疚,我們其實特別期待諸如MTA(騰訊移動分析)類似的第三方數(shù)據(jù)統(tǒng)計分析系統(tǒng),能夠為我們帶來這樣一個能力以蕴,能夠為APP的開發(fā)團隊糙麦,產(chǎn)品團隊追加賦能。
我仍然認為丛肮,數(shù)據(jù)驅(qū)動產(chǎn)品赡磅,數(shù)據(jù)驅(qū)動運營遠遠未達到終點,我們目前所使用的主流數(shù)據(jù)維度十分薄弱宝与,還需要引入更多的維度焚廊,來幫助我們達到數(shù)據(jù)驅(qū)動產(chǎn)品的目的。
由衷的希望能盡早的看到MTA的活躍天數(shù)能夠邁出一小步习劫,讓我們能夠近乎0成本的使用“活性數(shù)據(jù)”來觀察咆瘟,監(jiān)控產(chǎn)品的健康度,也能更加細致的了解產(chǎn)品用戶的粘性诽里。
根據(jù)我的實踐袒餐,活性數(shù)據(jù)的引入會帶來以下變化是可以確定的:
預測活躍度的走向趨勢
活躍降低之前,提升活躍,而非降低之后再來提升
活躍較高時灸眼,拉動新增卧檐,避免“來多少,走多少”
更準確的判斷用戶粘性
更準確的判斷產(chǎn)品健康度幢炸。
你希望在你的團隊 引入活性數(shù)據(jù)這樣一個新的數(shù)據(jù)分析維度嗎泄隔?
你覺得,這會給我們的產(chǎn)品工作帶來什么樣的變化呢宛徊?
以下內(nèi)容為 “附文:活性數(shù)據(jù)” 的設計思路佛嬉。
附文:活性數(shù)據(jù)設計思路
活性數(shù)據(jù)包含五個數(shù)據(jù)項:統(tǒng)計周期,活躍天數(shù)闸天,活性分暖呕,活性等級,活性等級占比苞氮。
統(tǒng)計周期:是指我們的觀察周期湾揽。
活躍天數(shù):是指觀察周期內(nèi),用戶使用的天數(shù)笼吟。
活性分:活性分是觀察周期內(nèi)不同日期對應的加權(quán)項库物。
活性等級:是根據(jù)用戶活性分計算的等級。
活性等級占比:是指定活躍等級用戶于當日登錄用戶的比值贷帮。
活性分是一個比較特殊的概念戚揭,我們通過一個案例來認識活性分。
若觀察周期為6月1日至6月7日撵枢,總計7天的周期民晒,這里有3位用戶A,B锄禽,C拐迁,他們的活躍天數(shù)都為一天误窖,即在觀察周期內(nèi),都有1天的登錄行為茵乱,但登錄的日期不同料仗,你認為誰的活性等級高一點呢梦鉴?
A用戶 在6月1日 登錄
B用戶 在6月3日 登錄
C用戶 在6月7日 登錄
事實上筑舅,即使是在一個觀察周期內(nèi)媒吗,不同的日期也會導致活性等級偏差,反向解讀會更清晰一點坝疼。
A用戶已有6天未登錄
B用戶已有4天未登錄
C用戶已有1天未登錄
如此我們是否能判斷出A,B,C三位用戶的活性等級C>B>A呢。
針對具備相同活躍天數(shù)谆沃,但日期不同的情況下钝凶,我們需要引入活性分作為加權(quán)項目,距離開始時間越近,活性分越低耕陷,距離結(jié)束時間越近掂名,活性分越高。
我們以0.1至0.7來設計活性分哟沫,A用戶的活性分為0.1分饺蔑,B用戶的活性分為0.3分,C用戶的活性分為0.7分嗜诀。
若活躍天數(shù)>=2天猾警,只需要將多日的活性分計算加法即可。
如D用戶隆敢,在觀察周期內(nèi)发皿,活躍天數(shù)為7天(每日都使用),活性分便是0.1+0.2+0.3+0.4+0.5+0.6+0.7=2.8分拂蝎。
當我們計算出每個用戶的活性分時穴墅,為了讓我們更好的去對整體情況進行把控,需要對分值進行等級劃分温自,我們知道最低分是0.1分玄货,即第一天有登錄行為,也知道最高分是所有日期的分數(shù)總和悼泌,就可以對總分數(shù)進行等級的劃分松捉,以此得到活性等級
如 我們設置三個活性等級分別為高(2分以上),中(1-2分)券躁,低(1分以下)
僅以高活性等級為例惩坑,只有符合以下條件之一的用戶,才會被我們記錄為高活性等級的用戶也拜。
(以A以舒,B,C慢哈,D蔓钟,E,F(xiàn)卵贱,G對應6月1日至6月7日的日期)
*ABCDEF(2.1分)(6天)
*ABCDEFG (2.1分) (7天)
*BCDEFG(2.7分)(6天)
*CDEFG(2.5分)(5)
*DEFG(2.2分)(4)
(……組合有點多滥沫,不再贅述)
我們發(fā)現(xiàn)按照2分的標準來判定用戶的高活性等級,需要最少最近4天的連續(xù)登錄行為键俱,若最后一天未登錄兰绣,則需要7天內(nèi)有6天的登錄行為,才能判定為高活性等級的用戶编振。
當然缀辩,案例中的分值劃分,包括活性分的定義都是隨意構(gòu)造,我們可以讓這些活性分變得更加貼近真實場景臀玄,只需要我們設計不同日期的活性分值瓢阴,以及不同等級所覆蓋的活性分范圍即可。
這包括健无,我們可以使用非連續(xù)的數(shù)值作為活性分荣恐,比如 第一天0.1分 第二天0.2分 第三天0.5分,第四天0.7分累贤,第五天0.9分叠穆,我們還可以使用相同的數(shù)值作為不同日期的活性分比如第一天和第二天都是0.1分。
這取決于我們?nèi)绾味x觀察周期里畦浓,不同日期多代表的價值痹束,但務必遵守活性分定義的核心原則:距離開始日期越近,活性分越低讶请,距離結(jié)束日期越近祷嘶,活性分越高。
除非你有一些特殊的構(gòu)思夺溢。
我們將不同活性等級的用戶數(shù)與觀察日期的總活躍用戶數(shù)進行對比论巍,就能得到活性等級占比,這個數(shù)據(jù)相比活躍率具備更高的參考價值风响。
也就是我們在正文當中多次提及的70%高活性等級用戶
嘗試解讀一下文中的數(shù)據(jù)案例吧嘉汰。
6月1日 70%高活性等級 日活20000
6月2日 50%高活性等級 日活20000
6月3日 70%高活性等級 日活20000