問題一:什么是用戶行為數(shù)據(jù),怎么采集用戶行為數(shù)據(jù)看杭?
用戶無(wú)論在哪個(gè)客戶端(iOS端忠藤、安卓端、小程序端楼雹、H5端)操作模孩,用戶產(chǎn)生的行為數(shù)據(jù)都分為兩種:一種是瀏覽尖阔,一種是點(diǎn)擊。這些隱性的行為數(shù)據(jù)榨咐,一般不會(huì)存儲(chǔ)在業(yè)務(wù)線的數(shù)據(jù)庫(kù)中介却,而是通過(guò)異步傳輸?shù)姆绞絺鬏敳⒋鎯?chǔ)到數(shù)據(jù)采集服務(wù)器中。
為什么要花那么多的資源采集這些行為數(shù)據(jù)呢块茁?因?yàn)檫@些數(shù)據(jù)對(duì)后期數(shù)據(jù)的挖掘應(yīng)用是十分有用的齿坷。
舉個(gè)例子,對(duì)于電商產(chǎn)品数焊,如果沒有行為數(shù)據(jù)的采集胃夏,我們是無(wú)法判斷用戶對(duì)某個(gè)商品的感興趣程度,但是如果有了這些數(shù)據(jù)昌跌,我們就可以定義用戶對(duì)商品的感興趣程度仰禀,比如用戶對(duì)某商品的1次點(diǎn)擊,代表用戶對(duì)該商品的興趣度增加10分蚕愤,而用戶的3次點(diǎn)擊代表他對(duì)這件商品非常有興趣答恶。
用戶行為數(shù)據(jù)的采集有如下三種方式:
1、與第三方移動(dòng)應(yīng)用統(tǒng)計(jì)公司合作完成數(shù)據(jù)采集萍诱。
2悬嗓、采用前后端埋點(diǎn)結(jié)合的方式完成數(shù)據(jù)采集。
3裕坊、采用可視化埋點(diǎn)與后端埋點(diǎn)結(jié)合的方式完成數(shù)據(jù)采集包竹。
問題二:你是怎么管理公司的數(shù)據(jù)指標(biāo)?
如何讓指標(biāo)定義清晰且沒有歧義呢籍凝?解決這個(gè)問題的核心方法就是拆解——將一個(gè)數(shù)據(jù)指標(biāo)拆解到不能再繼續(xù)拆解為止周瞎,這樣就能夠最大化地保證大家的理解無(wú)誤。假設(shè)我們要計(jì)算電商產(chǎn)品最近3個(gè)月的iOS客戶端的下單金額饵蒂。
首先這個(gè)指標(biāo)屬于電商產(chǎn)品業(yè)務(wù)板塊声诸,那么它的業(yè)務(wù)板塊就可以定義為某電商業(yè)務(wù)線,下單金額在電商產(chǎn)品中屬于交易模塊這個(gè)指標(biāo)的數(shù)據(jù)域就屬于交易數(shù)據(jù)域退盯。
下單金額是從訂單中獲得的彼乌,要基于訂單的金額和下單的時(shí)間去統(tǒng)計(jì)下單金額,那么這個(gè)指標(biāo)的維度就是訂單渊迁。
原子指標(biāo)是不可繼續(xù)拆解的下單金額慰照,由于加上了時(shí)間周期和修飾詞(iOS客戶端),那么這個(gè)指標(biāo)就成為一個(gè)派生指標(biāo)琉朽。
這樣我們就把一個(gè)比較復(fù)雜的指標(biāo)進(jìn)行拆解和歸類:
問題三:怎么識(shí)別虛榮指標(biāo)毒租?
比如常見的PV、UV漓骚、月活(即月活躍用戶數(shù))蝌衔、總用戶數(shù)榛泛、總商品數(shù)等指標(biāo)都是虛榮指標(biāo),因?yàn)檫@些指標(biāo)無(wú)法直接促進(jìn)交易額增長(zhǎng)噩斟,只起到對(duì)產(chǎn)品線監(jiān)控的作用曹锨。
虛榮指標(biāo)只能作為我們定的目標(biāo),并不能幫助我們?cè)鲩L(zhǎng)剃允,如果用戶不下單沛简,再多的UV、月活也沒什么用斥废。
問題四:數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)有什么區(qū)別椒楣?
數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)的用途是完全不同的。數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)雖然都是用來(lái)存儲(chǔ)數(shù)據(jù)的牡肉,但數(shù)據(jù)庫(kù)是用來(lái)存儲(chǔ)業(yè)務(wù)數(shù)據(jù)的捧灰,而數(shù)據(jù)倉(cāng)庫(kù)是用來(lái)存儲(chǔ)匯總后的報(bào)表數(shù)據(jù)的,以支撐公司的決策分析统锤。
問題五:簡(jiǎn)單介紹一下數(shù)據(jù)倉(cāng)庫(kù)的分層機(jī)制毛俏?
業(yè)界比較通用的分層方式是將數(shù)據(jù)模型分為5層:
①ODS(Operate Data Store,操作數(shù)據(jù)層)
②DIM(Dictionary Data Layer饲窿,維度數(shù)據(jù)層)
③DWD(Data WarehouseDetail煌寇,明細(xì)數(shù)據(jù)層)
④DWS(Data Warehouse Service,匯總數(shù)據(jù)層)
⑤ADS(Application Data Store逾雄,數(shù)據(jù)應(yīng)用層)阀溶。
題六:有無(wú)負(fù)責(zé)過(guò)標(biāo)簽平臺(tái)?標(biāo)簽平臺(tái)是怎么做的鸦泳?
1银锻、數(shù)據(jù)寬表功能。用來(lái)存儲(chǔ)用戶辽故、商品等所有的指標(biāo)徒仓。
2腐碱、標(biāo)簽體系功能誊垢。將各條產(chǎn)品線共用的標(biāo)簽和非共用的標(biāo)簽,按照統(tǒng)一的層級(jí)結(jié)構(gòu)組織起來(lái)症见。
3喂走、標(biāo)簽工廠功能∧弊鳎可以基于規(guī)則選擇指標(biāo)生成標(biāo)簽芋肠。
4、人群圈選功能遵蚜。通過(guò)組合不同標(biāo)簽組合形成人群帖池。該功能一般與推送奈惑、營(yíng)銷系統(tǒng)對(duì)接。
問題七:怎么評(píng)估一個(gè)拉新渠道值不值得做睡汹?
某個(gè)渠道是否值得投入是可以計(jì)算出來(lái)的肴甸。當(dāng)我們?cè)谶M(jìn)行大范圍推廣前要進(jìn)行小規(guī)模的灰度測(cè)試來(lái)證明渠道的可持續(xù)性。
比如地推人員拉來(lái)了一批新用戶囚巴,就要看下接下來(lái)這批用戶在平臺(tái)上實(shí)際產(chǎn)生了多少交易額原在,如果周期內(nèi)帶來(lái)的交易額與周期內(nèi)地推成本之比是大于1的,那么這個(gè)渠道就是可持續(xù)的彤叉。
如果兩者之比小于1庶柿,一方面可以判斷地推人員帶來(lái)的用戶質(zhì)量是不合格的,另外一方面可以采取一些手段秽浇,看看能否促進(jìn)地推人員的拉新質(zhì)量浮庐。
如果采取了很多的手段,收入都無(wú)法覆蓋成本柬焕,那就應(yīng)該果斷放棄這條拉新渠道兔辅,尋找其他更合適的拉新渠道。
問題八:你是怎么理解留存率的击喂?
留存率分為訪問留存率和購(gòu)買留存率维苔。訪問留存率是指新注冊(cè)用戶次日、7日懂昂、14日介时、30日后再次訪問我們的產(chǎn)品的數(shù)量百分比;購(gòu)買留存率是指首次購(gòu)買用戶在接下來(lái)的7日凌彬、14日沸柔、30日再次購(gòu)買我們的商品的數(shù)量百分比。
問題九:怎么理解訪問時(shí)長(zhǎng)铲敛、和跳出率褐澎?
訪問時(shí)長(zhǎng):訪問頁(yè)面時(shí)長(zhǎng),即用戶離開頁(yè)面時(shí)間與用戶進(jìn)入頁(yè)面時(shí)間的差值伐蒋。
跳出率:訪問頁(yè)面一定時(shí)間內(nèi)跳出的用戶數(shù)與頁(yè)面UV的比值工三。