1、前言:本篇目的在于介紹一種數(shù)據(jù)預(yù)測方式,幫助大家在遇到實(shí)際業(yè)務(wù)需求時找到解決方案蟀俊!如有不清晰之處分歇,歡迎指正探討~
假定你的老板,給你這樣一個任務(wù)欧漱,你是否知道怎么解決?老板:小麗葬燎,做一個日活預(yù)測误甚,看看按照當(dāng)前策略增量情況下,到年底我們的日活是否能達(dá)到400萬谱净?如果你對這個問題窑邦,不知道如何下手,那么本篇內(nèi)容壕探,將對你有所幫助~
2冈钦、解決方案:
DAU=新用戶活躍用戶數(shù)+老用戶活躍用戶數(shù)(下文的預(yù)測,僅介紹對于增量部分的日活預(yù)測李请,存量用戶需要考慮時間衰減因素瞧筛,相較更為復(fù)雜,不在本次分享討論范圍)
第2日活躍用戶數(shù)=第2日新增用戶數(shù)+第1日留存用戶數(shù)(其中:第1日留存用戶數(shù)=第1日新增用戶數(shù)*第1日留存率)
第3日活躍用戶數(shù)=第3日新增用戶數(shù)+第2日留存用戶數(shù)+第1日留存用戶數(shù)(其中:第2日留存用戶數(shù)=第2日新增用戶數(shù)*第2日留存率)
....以此類推
第30日活躍用戶數(shù)=第30日新增用戶數(shù)+第29日留存用戶數(shù)+第28日留存用戶數(shù)+第27日留存用戶數(shù)...+第1日留存用戶數(shù)(其中:第2日留存用戶數(shù)=第2日新增用戶數(shù)*第2日留存率)
設(shè):DAU(n)為第n天的日活导盅,A(n)為第n天的新增较幌,R(n-1)為第n-1天的留存率。則:DAU(n)=A(n)+A(n-1)R(n-1)+A(n-2)R(n-2)+... ...+A(1)R(1)
假設(shè)每日的新增用戶數(shù)是一個固定值白翻,那么基于上面的公式乍炉,唯一需要確定的變量則是第1日-第n日,每日的留存率滤馍。
留存率怎么求岛琼?
大部分產(chǎn)品的留存衰減曲線,基本都是符合冪函數(shù)曲線巢株。我們可以通過冪函數(shù)來近似擬合留存率的衰減曲線槐瑞,也就可以順利的預(yù)估出日活模型中需要的留存之和。
案例:假設(shè)現(xiàn)在7月1日纯续,我們現(xiàn)有數(shù)據(jù)如下随珠,第1日留存率、第7日留存率猬错、第14日留存率窗看、第30日留存率,需要我們預(yù)測到今年底的日活數(shù)據(jù)倦炒。(下發(fā)截圖數(shù)據(jù)显沈,為作者整理的虛擬數(shù)據(jù),不代表任意業(yè)務(wù)數(shù)據(jù))
解:
第一步:在excel借助散點(diǎn)圖,用已有數(shù)據(jù)拉讯,繪制一個冪函數(shù)曲線涤浇,得到公式:y = 0.3325x-0.36,其中R的平方=0.9976,一般來說R的平方超過60%魔慷,這個結(jié)果可以用只锭,越接近1,其結(jié)果也越與真實(shí)情況接近院尔。因為7月1日-12月31日蜻展,相距183天,留存率預(yù)測超過50天邀摆,其實(shí)第≥50日的留存率纵顾,可以簡單采用一個恒定的值,如下圖是模擬的一個處理過程栋盹。
第二步:假設(shè)每日新增用戶數(shù)固定是100000施逾,現(xiàn)在我們可以通過每日留存率,來預(yù)測每日活躍用戶數(shù)例获。每日留存率*每日新增用戶數(shù)=每日活躍用戶數(shù)(下文的預(yù)測汉额,僅介紹對于增量部分的日活預(yù)測,存量用戶需要考慮時間衰減因素躏敢,相較更為復(fù)雜闷愤,不在本次分享討論范圍)以下是操作執(zhí)行的細(xì)節(jié):
表單解釋:橫坐標(biāo)第1行,是7月1日-12月31日件余,每天的日期讥脐,第二行是第N天,7月1日-12月31日是183天啼器,因此是1-183旬渠,第3行是上一步我們預(yù)測出來的每日留存率,將它填充到這個sheet表單即可端壳。D4=C4*D3告丢、E4=C4*E3、....损谦,一直算到第183天后的月活岖免,即GD4=C4*GD3,最后我們將第183天的活躍用戶數(shù)=第183天新增用戶數(shù)+(1-182天的留存用戶數(shù))照捡,計算得出的結(jié)果就是第183天的日活了颅湘,如下圖是對應(yīng)執(zhí)行細(xì)節(jié)圖: