數(shù)據(jù)中臺(tái)常見問題


問題一:什么是用戶行為數(shù)據(jù),怎么采集用戶行為數(shù)據(jù)看杭?

用戶無(wú)論在哪個(gè)客戶端(iOS端忠藤、安卓端、小程序端楼雹、H5端)操作模孩,用戶產(chǎn)生的行為數(shù)據(jù)都分為兩種:一種是瀏覽尖阔,一種是點(diǎn)擊。這些隱性的行為數(shù)據(jù)榨咐,一般不會(huì)存儲(chǔ)在業(yè)務(wù)線的數(shù)據(jù)庫(kù)中介却,而是通過(guò)異步傳輸?shù)姆绞絺鬏敳⒋鎯?chǔ)到數(shù)據(jù)采集服務(wù)器中。

為什么要花那么多的資源采集這些行為數(shù)據(jù)呢块茁?因?yàn)檫@些數(shù)據(jù)對(duì)后期數(shù)據(jù)的挖掘應(yīng)用是十分有用的齿坷。

舉個(gè)例子,對(duì)于電商產(chǎn)品数焊,如果沒有行為數(shù)據(jù)的采集胃夏,我們是無(wú)法判斷用戶對(duì)某個(gè)商品的感興趣程度,但是如果有了這些數(shù)據(jù)昌跌,我們就可以定義用戶對(duì)商品的感興趣程度仰禀,比如用戶對(duì)某商品的1次點(diǎn)擊,代表用戶對(duì)該商品的興趣度增加10分蚕愤,而用戶的3次點(diǎn)擊代表他對(duì)這件商品非常有興趣答恶。

用戶行為數(shù)據(jù)的采集有如下三種方式:

1、與第三方移動(dòng)應(yīng)用統(tǒng)計(jì)公司合作完成數(shù)據(jù)采集萍诱。
2悬嗓、采用前后端埋點(diǎn)結(jié)合的方式完成數(shù)據(jù)采集。
3裕坊、采用可視化埋點(diǎn)與后端埋點(diǎn)結(jié)合的方式完成數(shù)據(jù)采集包竹。


問題二:你是怎么管理公司的數(shù)據(jù)指標(biāo)?

如何讓指標(biāo)定義清晰且沒有歧義呢籍凝?解決這個(gè)問題的核心方法就是拆解——將一個(gè)數(shù)據(jù)指標(biāo)拆解到不能再繼續(xù)拆解為止周瞎,這樣就能夠最大化地保證大家的理解無(wú)誤。假設(shè)我們要計(jì)算電商產(chǎn)品最近3個(gè)月的iOS客戶端的下單金額饵蒂。

首先這個(gè)指標(biāo)屬于電商產(chǎn)品業(yè)務(wù)板塊声诸,那么它的業(yè)務(wù)板塊就可以定義為某電商業(yè)務(wù)線,下單金額在電商產(chǎn)品中屬于交易模塊這個(gè)指標(biāo)的數(shù)據(jù)域就屬于交易數(shù)據(jù)域退盯。

下單金額是從訂單中獲得的彼乌,要基于訂單的金額和下單的時(shí)間去統(tǒng)計(jì)下單金額,那么這個(gè)指標(biāo)的維度就是訂單渊迁。

原子指標(biāo)是不可繼續(xù)拆解的下單金額慰照,由于加上了時(shí)間周期和修飾詞(iOS客戶端),那么這個(gè)指標(biāo)就成為一個(gè)派生指標(biāo)琉朽。

這樣我們就把一個(gè)比較復(fù)雜的指標(biāo)進(jìn)行拆解和歸類:



問題三:怎么識(shí)別虛榮指標(biāo)毒租?

比如常見的PV、UV漓骚、月活(即月活躍用戶數(shù))蝌衔、總用戶數(shù)榛泛、總商品數(shù)等指標(biāo)都是虛榮指標(biāo),因?yàn)檫@些指標(biāo)無(wú)法直接促進(jìn)交易額增長(zhǎng)噩斟,只起到對(duì)產(chǎn)品線監(jiān)控的作用曹锨。

虛榮指標(biāo)只能作為我們定的目標(biāo),并不能幫助我們?cè)鲩L(zhǎng)剃允,如果用戶不下單沛简,再多的UV、月活也沒什么用斥废。


問題四:數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)有什么區(qū)別椒楣?

數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)的用途是完全不同的。數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)雖然都是用來(lái)存儲(chǔ)數(shù)據(jù)的牡肉,但數(shù)據(jù)庫(kù)是用來(lái)存儲(chǔ)業(yè)務(wù)數(shù)據(jù)的捧灰,而數(shù)據(jù)倉(cāng)庫(kù)是用來(lái)存儲(chǔ)匯總后的報(bào)表數(shù)據(jù)的,以支撐公司的決策分析统锤。


問題五:簡(jiǎn)單介紹一下數(shù)據(jù)倉(cāng)庫(kù)的分層機(jī)制毛俏?

業(yè)界比較通用的分層方式是將數(shù)據(jù)模型分為5層:
①ODS(Operate Data Store,操作數(shù)據(jù)層)
②DIM(Dictionary Data Layer饲窿,維度數(shù)據(jù)層)
③DWD(Data WarehouseDetail煌寇,明細(xì)數(shù)據(jù)層)
④DWS(Data Warehouse Service,匯總數(shù)據(jù)層)
⑤ADS(Application Data Store逾雄,數(shù)據(jù)應(yīng)用層)阀溶。



題六:有無(wú)負(fù)責(zé)過(guò)標(biāo)簽平臺(tái)?標(biāo)簽平臺(tái)是怎么做的鸦泳?

1银锻、數(shù)據(jù)寬表功能。用來(lái)存儲(chǔ)用戶辽故、商品等所有的指標(biāo)徒仓。
2腐碱、標(biāo)簽體系功能誊垢。將各條產(chǎn)品線共用的標(biāo)簽和非共用的標(biāo)簽,按照統(tǒng)一的層級(jí)結(jié)構(gòu)組織起來(lái)症见。
3喂走、標(biāo)簽工廠功能∧弊鳎可以基于規(guī)則選擇指標(biāo)生成標(biāo)簽芋肠。
4、人群圈選功能遵蚜。通過(guò)組合不同標(biāo)簽組合形成人群帖池。該功能一般與推送奈惑、營(yíng)銷系統(tǒng)對(duì)接。


問題七:怎么評(píng)估一個(gè)拉新渠道值不值得做睡汹?

某個(gè)渠道是否值得投入是可以計(jì)算出來(lái)的肴甸。當(dāng)我們?cè)谶M(jìn)行大范圍推廣前要進(jìn)行小規(guī)模的灰度測(cè)試來(lái)證明渠道的可持續(xù)性。

比如地推人員拉來(lái)了一批新用戶囚巴,就要看下接下來(lái)這批用戶在平臺(tái)上實(shí)際產(chǎn)生了多少交易額原在,如果周期內(nèi)帶來(lái)的交易額與周期內(nèi)地推成本之比是大于1的,那么這個(gè)渠道就是可持續(xù)的彤叉。

如果兩者之比小于1庶柿,一方面可以判斷地推人員帶來(lái)的用戶質(zhì)量是不合格的,另外一方面可以采取一些手段秽浇,看看能否促進(jìn)地推人員的拉新質(zhì)量浮庐。

如果采取了很多的手段,收入都無(wú)法覆蓋成本柬焕,那就應(yīng)該果斷放棄這條拉新渠道兔辅,尋找其他更合適的拉新渠道。


問題八:你是怎么理解留存率的击喂?

留存率分為訪問留存率和購(gòu)買留存率维苔。訪問留存率是指新注冊(cè)用戶次日、7日懂昂、14日介时、30日后再次訪問我們的產(chǎn)品的數(shù)量百分比;購(gòu)買留存率是指首次購(gòu)買用戶在接下來(lái)的7日凌彬、14日沸柔、30日再次購(gòu)買我們的商品的數(shù)量百分比。


問題九:怎么理解訪問時(shí)長(zhǎng)铲敛、和跳出率褐澎?

訪問時(shí)長(zhǎng):訪問頁(yè)面時(shí)長(zhǎng),即用戶離開頁(yè)面時(shí)間與用戶進(jìn)入頁(yè)面時(shí)間的差值伐蒋。

跳出率:訪問頁(yè)面一定時(shí)間內(nèi)跳出的用戶數(shù)與頁(yè)面UV的比值工三。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市先鱼,隨后出現(xiàn)的幾起案子俭正,更是在濱河造成了極大的恐慌,老刑警劉巖焙畔,帶你破解...
    沈念sama閱讀 219,490評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件掸读,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)儿惫,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門澡罚,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人肾请,你說(shuō)我怎么就攤上這事始苇。” “怎么了筐喳?”我有些...
    開封第一講書人閱讀 165,830評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵催式,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我避归,道長(zhǎng)荣月,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,957評(píng)論 1 295
  • 正文 為了忘掉前任梳毙,我火速辦了婚禮哺窄,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘账锹。我一直安慰自己萌业,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,974評(píng)論 6 393
  • 文/花漫 我一把揭開白布奸柬。 她就那樣靜靜地躺著生年,像睡著了一般。 火紅的嫁衣襯著肌膚如雪廓奕。 梳的紋絲不亂的頭發(fā)上抱婉,一...
    開封第一講書人閱讀 51,754評(píng)論 1 307
  • 那天,我揣著相機(jī)與錄音桌粉,去河邊找鬼蒸绩。 笑死,一個(gè)胖子當(dāng)著我的面吹牛铃肯,可吹牛的內(nèi)容都是我干的患亿。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼押逼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼步藕!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起宴胧,我...
    開封第一講書人閱讀 39,357評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤漱抓,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后恕齐,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,847評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,995評(píng)論 3 338
  • 正文 我和宋清朗相戀三年显歧,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了仪或。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,137評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡士骤,死狀恐怖范删,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情拷肌,我是刑警寧澤到旦,帶...
    沈念sama閱讀 35,819評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站巨缘,受9級(jí)特大地震影響添忘,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜若锁,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,482評(píng)論 3 331
  • 文/蒙蒙 一搁骑、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧又固,春花似錦仲器、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至洋只,卻和暖如春煤辨,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背木张。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工众辨, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人舷礼。 一個(gè)月前我還...
    沈念sama閱讀 48,409評(píng)論 3 373
  • 正文 我出身青樓鹃彻,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親妻献。 傳聞我的和親對(duì)象是個(gè)殘疾皇子蛛株,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,086評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容