數(shù)據(jù)埋點(diǎn)采集的那些事兒

? ? ? ?數(shù)據(jù)采集是數(shù)據(jù)分析的基礎(chǔ)井濒,而埋點(diǎn)是最主要的采集方式灶似。那么數(shù)據(jù)埋點(diǎn)采集到底都是哪些事呢?我們主要從三個(gè)方面來(lái)看:什么是埋點(diǎn)瑞你,埋點(diǎn)怎么設(shè)計(jì)酪惭,埋點(diǎn)的應(yīng)用。

一者甲、數(shù)據(jù)采集以及常見數(shù)據(jù)問(wèn)題

1.1數(shù)據(jù)采集

? ? ? ?數(shù)據(jù)采集有多種方式春感,埋點(diǎn)采集是其中非常重要的一部分,不論對(duì)c端還是b端產(chǎn)品都是主要的采集方式过牙,數(shù)據(jù)采集甥厦,顧名思義采集相應(yīng)的數(shù)據(jù),是整個(gè)數(shù)據(jù)流的起點(diǎn)寇钉,采集的全不全刀疙,對(duì)不對(duì),直接決定數(shù)據(jù)的廣度和質(zhì)量扫倡,影響后續(xù)所有的環(huán)節(jié)谦秧;在數(shù)據(jù)采集有效性竟纳,完整性不好的公司,經(jīng)常會(huì)有業(yè)務(wù)發(fā)現(xiàn)數(shù)據(jù)發(fā)生大幅度變化疚鲤。

數(shù)據(jù)的處理锥累,通常由以下5步構(gòu)成:

1.2常見數(shù)據(jù)問(wèn)題

大體知道數(shù)據(jù)采集及其架構(gòu)之后,我們看看工作中遇到的問(wèn)題集歇,有多少是跟數(shù)據(jù)采集環(huán)節(jié)有關(guān)的

1桶略、數(shù)據(jù)和后臺(tái)差距很大,數(shù)據(jù)不準(zhǔn)確-統(tǒng)計(jì)口徑不一樣诲宇、埋點(diǎn)定義不一樣密浑、采集方式帶來(lái)誤差

2荆几、想用的時(shí)候赢赊,沒有我想要的數(shù)據(jù)-沒有提數(shù)據(jù)采集需求锅移、埋點(diǎn)不正確不完整

3、事件太多纺荧,不清楚含義-埋點(diǎn)設(shè)計(jì)的方式旭愧、埋點(diǎn)更新迭代的規(guī)則和維護(hù)

4、分析數(shù)據(jù)不知道看哪些數(shù)據(jù)和指標(biāo)-數(shù)據(jù)定義不清楚宙暇,缺乏分析思路

??? 我們需要根源性解決問(wèn)題:把采集當(dāng)成獨(dú)立的研發(fā)業(yè)務(wù)來(lái)對(duì)待输枯,而不是產(chǎn)品研發(fā)中的附屬品

二、埋點(diǎn)是什么

2.1埋點(diǎn)是什么

? ? ???所謂埋點(diǎn)占贫,就是數(shù)據(jù)采集領(lǐng)域的術(shù)語(yǔ)用押。它的學(xué)名應(yīng)該叫做事件追蹤,對(duì)應(yīng)的英文是EventTracking? 指的是針對(duì)特定用戶行為或事件進(jìn)行捕獲靶剑,處理和發(fā)送的相關(guān)技術(shù)及其實(shí)施過(guò)程。數(shù)據(jù)埋點(diǎn)是數(shù)據(jù)分析師池充,數(shù)據(jù)產(chǎn)品經(jīng)理和數(shù)據(jù)運(yùn)營(yíng)桩引,基于業(yè)務(wù)需求或者產(chǎn)品需求對(duì)用戶行為的每一個(gè)事件對(duì)應(yīng)位置進(jìn)行開發(fā)埋點(diǎn),并通過(guò)SDK上報(bào)埋點(diǎn)的數(shù)據(jù)結(jié)果收夸,記錄匯總數(shù)據(jù)后進(jìn)行分析坑匠,推動(dòng)產(chǎn)品優(yōu)化和指導(dǎo)運(yùn)營(yíng)。

? ? ? ?流程伴隨著規(guī)范卧惜,通過(guò)定義我們看到厘灼,特定用戶行為和事件是我們的采集重點(diǎn),還需要處理和發(fā)送相關(guān)技術(shù)及實(shí)施過(guò)程咽瓷;數(shù)據(jù)埋點(diǎn)是服務(wù)于產(chǎn)品设凹,又來(lái)源于產(chǎn)品中,所以跟產(chǎn)品息息相關(guān)茅姜,埋點(diǎn)在于具體的實(shí)戰(zhàn)過(guò)程闪朱,跟每個(gè)人對(duì)數(shù)據(jù)底層的理解程度有關(guān)。

2.2為什么要做埋點(diǎn)

? ? ? ?埋點(diǎn)就是為了對(duì)產(chǎn)品進(jìn)行全方位的持續(xù)追蹤,通過(guò)數(shù)據(jù)分析不斷指導(dǎo)優(yōu)化產(chǎn)品奋姿。數(shù)據(jù)埋點(diǎn)的質(zhì)量直接影響到數(shù)據(jù)锄开,產(chǎn)品,運(yùn)營(yíng)等質(zhì)量称诗。

?1萍悴、數(shù)據(jù)驅(qū)動(dòng)-埋點(diǎn)將分析的深度下鉆到流量分布和流動(dòng)層面,通過(guò)統(tǒng)計(jì)分析寓免,對(duì)宏觀指標(biāo)進(jìn)行深入剖析癣诱,發(fā)現(xiàn)指標(biāo)背后的問(wèn)題,洞察用戶行為與提升價(jià)值之間的潛在關(guān)聯(lián)

?2再榄、產(chǎn)品優(yōu)化-對(duì)產(chǎn)品來(lái)說(shuō)狡刘,用戶在產(chǎn)品里做了什么,停留多久困鸥,有什么異常都需要關(guān)注嗅蔬,這些問(wèn)題都可以通過(guò)埋點(diǎn)的方式實(shí)現(xiàn)

?3、精細(xì)化運(yùn)營(yíng)-埋點(diǎn)可以貫徹整個(gè)產(chǎn)品的生命周期疾就,流量質(zhì)量和不同來(lái)源的分布澜术,人群的行為特點(diǎn)和關(guān)系,洞察用戶行為與提升業(yè)務(wù)價(jià)值之間的潛在關(guān)聯(lián)猬腰。

2.3埋點(diǎn)的方式

埋點(diǎn)的方式都有哪些呢鸟废,當(dāng)前大多數(shù)公司都是客戶端,服務(wù)端相結(jié)合的方式

準(zhǔn)確性:代碼埋點(diǎn)>可視化埋點(diǎn)>全埋點(diǎn)

?

三姑荷、埋點(diǎn)的框架和設(shè)計(jì)

3.1埋點(diǎn)采集的頂層設(shè)計(jì)

? ? ? ?所謂的頂層設(shè)計(jì)就是想清楚怎么做埋點(diǎn)盒延,用什么方式,上傳機(jī)制是什么鼠冕,具體怎么定義添寺,具體怎么落地等等;我們遵循唯一性懈费,可擴(kuò)展性计露,一致性等的基礎(chǔ)上,我們要設(shè)計(jì)一些通用字段及生成機(jī)制憎乙,比如:cid, idfa,idfv等票罐。

用戶識(shí)別:用戶識(shí)別機(jī)制的混亂會(huì)導(dǎo)致兩個(gè)結(jié)果:一是數(shù)據(jù)不準(zhǔn)確,比如UV數(shù)據(jù)對(duì)不上泞边;二是涉及到漏斗分析環(huán)節(jié)出現(xiàn)異常该押。因此應(yīng)該做到:a.嚴(yán)格規(guī)范ID的本身識(shí)別機(jī)制;b.跨平臺(tái)用戶識(shí)別

同類抽象: 同類抽象包括事件抽象和屬性抽象阵谚。事件抽象即瀏覽事件沈善,點(diǎn)擊事件的聚合乡数;屬性抽象,即多數(shù)復(fù)用的場(chǎng)景來(lái)進(jìn)行合并,增加來(lái)源區(qū)分

采集一致:采集一致包括兩點(diǎn):一是跨平臺(tái)頁(yè)面命名一致闻牡,二是按鈕命名一致净赴;埋點(diǎn)的制定過(guò)程本身就是規(guī)范底層數(shù)據(jù)的過(guò)程,所以一致性是特別重要罩润,只有這樣才能真正的用起來(lái)

渠道配置:渠道主要指的是推廣渠道玖翅,落地頁(yè),網(wǎng)頁(yè)推廣頁(yè)面割以,APP推廣頁(yè)面等金度,這個(gè)落地頁(yè)的配置要有統(tǒng)一規(guī)范和標(biāo)準(zhǔn)

3.2埋點(diǎn)采集事件及屬性設(shè)計(jì)

? ? ? ?在設(shè)計(jì)屬性和事件的時(shí)候,我們要知道哪些經(jīng)常變严沥,哪些不變猜极,哪些是業(yè)務(wù)行為,哪些是基本屬性消玄「基于基本屬性事件,我們認(rèn)為屬性是必須采集項(xiàng)翩瓜,只是屬性里面的事件屬性根據(jù)業(yè)務(wù)不同有所調(diào)整而已受扳,因此,我們可以把埋點(diǎn)采集分為協(xié)議層和業(yè)務(wù)層埋點(diǎn)兔跌。

業(yè)務(wù)分解:梳理確認(rèn)業(yè)務(wù)流程勘高、操作路徑和不同細(xì)分場(chǎng)景、定義用戶行為路徑

分析指標(biāo):對(duì)特定的事件進(jìn)行定義坟桅、核心業(yè)務(wù)指標(biāo)需要的數(shù)據(jù)

事件設(shè)計(jì):APP啟動(dòng)华望,退出、頁(yè)面瀏覽仅乓、事件曝光點(diǎn)擊

屬性設(shè)計(jì):用戶屬性立美、事件屬性、對(duì)象屬性方灾、環(huán)境屬性

3.3數(shù)據(jù)采集事件及屬性設(shè)計(jì)

Ev事件的命名,也遵循一些規(guī)則碌更,同一類功能在不同頁(yè)面或位置出現(xiàn)時(shí)裕偿,按照功能名稱命名,頁(yè)面和位置在ev參數(shù)中進(jìn)行區(qū)分痛单。僅是按鈕點(diǎn)擊時(shí)嘿棘,按照按鈕名稱命名。

ev事件格式:ev分為ev標(biāo)識(shí)和ev參數(shù)

規(guī)則:

ev標(biāo)識(shí)和ev參數(shù)之間用“#”連接(一級(jí)連接符)旭绒;

ev參數(shù)和ev參數(shù)之間用“/”來(lái)連接(二級(jí)連接符)鸟妙;

ev參數(shù)使用key=value的結(jié)構(gòu)焦人,當(dāng)一個(gè)key對(duì)應(yīng)多個(gè)value值時(shí),value1與value2之間用“重父,”連接(三級(jí)連接符)花椭;

當(dāng)埋點(diǎn)僅有ev標(biāo)識(shí)沒有ev參數(shù)的時(shí)候,不需要帶#房午;

備注

ev標(biāo)識(shí):作為埋點(diǎn)的唯一標(biāo)識(shí)矿辽,用來(lái)區(qū)分埋點(diǎn)的位置和屬性,不可變郭厌,不可修改袋倔;

ev參數(shù):埋點(diǎn)需要回傳的參數(shù),ev參數(shù)順序可變折柠,可修改宾娜;

app埋點(diǎn)調(diào)整的時(shí),ev標(biāo)識(shí)不變扇售,只修改后面的埋點(diǎn)參數(shù)(參數(shù)取值變化或者增加參數(shù)類型)

一般埋點(diǎn)文檔中所包含的sheet名稱以及作用:

A前塔、曝光埋點(diǎn)匯總;

B缘眶、點(diǎn)擊和瀏覽埋點(diǎn)匯總嘱根;

C、失效埋點(diǎn)匯總:一般會(huì)記錄埋點(diǎn)失效版本或時(shí)間巷懈;

D该抒、PC和M端頁(yè)面埋點(diǎn)所對(duì)應(yīng)的pageid;

E顶燕、各版本上線時(shí)間記錄凑保;

埋點(diǎn)文檔中,所有包含的列名及功能:

?

3.4基于埋點(diǎn)的數(shù)據(jù)統(tǒng)計(jì)

用埋點(diǎn)統(tǒng)計(jì)數(shù)據(jù)怎么查找埋點(diǎn)ev事件:

1.????? [endif]明確埋點(diǎn)類型(點(diǎn)擊/曝光/瀏覽)——篩選type字段

2.????? [endif]明確按鈕埋點(diǎn)所屬頁(yè)面(頁(yè)面或功能)——篩選功能模塊字段

3.????? [endif]明確埋點(diǎn)事件名稱——篩選名稱字段

4.????? [endif]知道ev標(biāo)識(shí)涌攻,可直接用ev來(lái)進(jìn)行篩選

根據(jù)ev事件怎么進(jìn)行查數(shù)統(tǒng)計(jì):當(dāng)查詢按鈕點(diǎn)擊統(tǒng)計(jì)時(shí)欧引,可直接用ev標(biāo)識(shí)進(jìn)行查詢,當(dāng)有所區(qū)分可限定埋點(diǎn)參數(shù)取值恳谎;因?yàn)閑v參數(shù)的順序不做要求可變芝此,所以查詢統(tǒng)計(jì)時(shí),不能按照參數(shù)的順序進(jìn)行限定因痛;

四婚苹、應(yīng)用-數(shù)據(jù)流程的基礎(chǔ)

4.1指標(biāo)體系

體系化的指標(biāo)可以綜合不同的指標(biāo)不同的維度串聯(lián)起來(lái)進(jìn)行全面的分析,會(huì)更快的發(fā)現(xiàn)目前產(chǎn)品和業(yè)務(wù)流程存在的問(wèn)題鸵膏。

4.2可視化

人對(duì)圖像信息的解釋效率比文字更高膊升,可視化對(duì)數(shù)據(jù)分析極為重要,利用數(shù)據(jù)可視化可以揭示出數(shù)據(jù)內(nèi)在的錯(cuò)綜復(fù)雜的關(guān)系谭企。

4.3埋點(diǎn)元信息api提供

數(shù)據(jù)采集服務(wù)會(huì)對(duì)采集到的埋點(diǎn)寫入到Kafka 中廓译,對(duì)于各個(gè)業(yè)務(wù)的實(shí)時(shí)數(shù)據(jù)消費(fèi)需求评肆,我們?yōu)槊總€(gè)業(yè)務(wù)提供了單獨(dú)的Kafka,流量分發(fā)模塊會(huì)定期讀取埋點(diǎn)管理平臺(tái)提供的元信息非区,將流量實(shí)時(shí)分發(fā)的各業(yè)務(wù)Kafka 中瓜挽。

? ? ??數(shù)據(jù)采集猶如設(shè)計(jì)產(chǎn)品,不能過(guò)度院仿,留出擴(kuò)展余地秸抚,但要經(jīng)常思考數(shù)據(jù)有沒有,全不全歹垫,細(xì)不細(xì)剥汤,穩(wěn)不穩(wěn),快不快.


歡迎關(guān)注我的微信公眾號(hào):趙小洛洛洛

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末排惨,一起剝皮案震驚了整個(gè)濱河市吭敢,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌暮芭,老刑警劉巖鹿驼,帶你破解...
    沈念sama閱讀 217,542評(píng)論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異辕宏,居然都是意外死亡畜晰,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門瑞筐,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)凄鼻,“玉大人,你說(shuō)我怎么就攤上這事聚假】榘觯” “怎么了?”我有些...
    開封第一講書人閱讀 163,912評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵膘格,是天一觀的道長(zhǎng)峭范。 經(jīng)常有香客問(wèn)我,道長(zhǎng)瘪贱,這世上最難降的妖魔是什么纱控? 我笑而不...
    開封第一講書人閱讀 58,449評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮菜秦,結(jié)果婚禮上甜害,老公的妹妹穿的比我還像新娘。我一直安慰自己喷户,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,500評(píng)論 6 392
  • 文/花漫 我一把揭開白布访锻。 她就那樣靜靜地躺著褪尝,像睡著了一般闹获。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上河哑,一...
    開封第一講書人閱讀 51,370評(píng)論 1 302
  • 那天避诽,我揣著相機(jī)與錄音,去河邊找鬼璃谨。 笑死沙庐,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的佳吞。 我是一名探鬼主播拱雏,決...
    沈念sama閱讀 40,193評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼底扳!你這毒婦竟也來(lái)了铸抑?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,074評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤衷模,失蹤者是張志新(化名)和其女友劉穎鹊汛,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體阱冶,經(jīng)...
    沈念sama閱讀 45,505評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡刁憋,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,722評(píng)論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了木蹬。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片至耻。...
    茶點(diǎn)故事閱讀 39,841評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖届囚,靈堂內(nèi)的尸體忽然破棺而出有梆,到底是詐尸還是另有隱情,我是刑警寧澤意系,帶...
    沈念sama閱讀 35,569評(píng)論 5 345
  • 正文 年R本政府宣布泥耀,位于F島的核電站,受9級(jí)特大地震影響蛔添,放射性物質(zhì)發(fā)生泄漏痰催。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,168評(píng)論 3 328
  • 文/蒙蒙 一迎瞧、第九天 我趴在偏房一處隱蔽的房頂上張望夸溶。 院中可真熱鬧,春花似錦凶硅、人聲如沸缝裁。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,783評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)捷绑。三九已至韩脑,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間粹污,已是汗流浹背段多。 一陣腳步聲響...
    開封第一講書人閱讀 32,918評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留壮吩,地道東北人进苍。 一個(gè)月前我還...
    沈念sama閱讀 47,962評(píng)論 2 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像鸭叙,于是被迫代替她去往敵國(guó)和親觉啊。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,781評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容