? ? ? ?數(shù)據(jù)采集是數(shù)據(jù)分析的基礎(chǔ)井濒,而埋點(diǎn)是最主要的采集方式灶似。那么數(shù)據(jù)埋點(diǎn)采集到底都是哪些事呢?我們主要從三個(gè)方面來(lái)看:什么是埋點(diǎn)瑞你,埋點(diǎn)怎么設(shè)計(jì)酪惭,埋點(diǎn)的應(yīng)用。
一者甲、數(shù)據(jù)采集以及常見數(shù)據(jù)問(wèn)題
1.1數(shù)據(jù)采集
? ? ? ?數(shù)據(jù)采集有多種方式春感,埋點(diǎn)采集是其中非常重要的一部分,不論對(duì)c端還是b端產(chǎn)品都是主要的采集方式过牙,數(shù)據(jù)采集甥厦,顧名思義采集相應(yīng)的數(shù)據(jù),是整個(gè)數(shù)據(jù)流的起點(diǎn)寇钉,采集的全不全刀疙,對(duì)不對(duì),直接決定數(shù)據(jù)的廣度和質(zhì)量扫倡,影響后續(xù)所有的環(huán)節(jié)谦秧;在數(shù)據(jù)采集有效性竟纳,完整性不好的公司,經(jīng)常會(huì)有業(yè)務(wù)發(fā)現(xiàn)數(shù)據(jù)發(fā)生大幅度變化疚鲤。
數(shù)據(jù)的處理锥累,通常由以下5步構(gòu)成:
1.2常見數(shù)據(jù)問(wèn)題
大體知道數(shù)據(jù)采集及其架構(gòu)之后,我們看看工作中遇到的問(wèn)題集歇,有多少是跟數(shù)據(jù)采集環(huán)節(jié)有關(guān)的
1桶略、數(shù)據(jù)和后臺(tái)差距很大,數(shù)據(jù)不準(zhǔn)確-統(tǒng)計(jì)口徑不一樣诲宇、埋點(diǎn)定義不一樣密浑、采集方式帶來(lái)誤差
2荆几、想用的時(shí)候赢赊,沒有我想要的數(shù)據(jù)-沒有提數(shù)據(jù)采集需求锅移、埋點(diǎn)不正確不完整
3、事件太多纺荧,不清楚含義-埋點(diǎn)設(shè)計(jì)的方式旭愧、埋點(diǎn)更新迭代的規(guī)則和維護(hù)
4、分析數(shù)據(jù)不知道看哪些數(shù)據(jù)和指標(biāo)-數(shù)據(jù)定義不清楚宙暇,缺乏分析思路
??? 我們需要根源性解決問(wèn)題:把采集當(dāng)成獨(dú)立的研發(fā)業(yè)務(wù)來(lái)對(duì)待输枯,而不是產(chǎn)品研發(fā)中的附屬品
二、埋點(diǎn)是什么
2.1埋點(diǎn)是什么
? ? ???所謂埋點(diǎn)占贫,就是數(shù)據(jù)采集領(lǐng)域的術(shù)語(yǔ)用押。它的學(xué)名應(yīng)該叫做事件追蹤,對(duì)應(yīng)的英文是EventTracking? 指的是針對(duì)特定用戶行為或事件進(jìn)行捕獲靶剑,處理和發(fā)送的相關(guān)技術(shù)及其實(shí)施過(guò)程。數(shù)據(jù)埋點(diǎn)是數(shù)據(jù)分析師池充,數(shù)據(jù)產(chǎn)品經(jīng)理和數(shù)據(jù)運(yùn)營(yíng)桩引,基于業(yè)務(wù)需求或者產(chǎn)品需求對(duì)用戶行為的每一個(gè)事件對(duì)應(yīng)位置進(jìn)行開發(fā)埋點(diǎn),并通過(guò)SDK上報(bào)埋點(diǎn)的數(shù)據(jù)結(jié)果收夸,記錄匯總數(shù)據(jù)后進(jìn)行分析坑匠,推動(dòng)產(chǎn)品優(yōu)化和指導(dǎo)運(yùn)營(yíng)。
? ? ? ?流程伴隨著規(guī)范卧惜,通過(guò)定義我們看到厘灼,特定用戶行為和事件是我們的采集重點(diǎn),還需要處理和發(fā)送相關(guān)技術(shù)及實(shí)施過(guò)程咽瓷;數(shù)據(jù)埋點(diǎn)是服務(wù)于產(chǎn)品设凹,又來(lái)源于產(chǎn)品中,所以跟產(chǎn)品息息相關(guān)茅姜,埋點(diǎn)在于具體的實(shí)戰(zhàn)過(guò)程闪朱,跟每個(gè)人對(duì)數(shù)據(jù)底層的理解程度有關(guān)。
2.2為什么要做埋點(diǎn)
? ? ? ?埋點(diǎn)就是為了對(duì)產(chǎn)品進(jìn)行全方位的持續(xù)追蹤,通過(guò)數(shù)據(jù)分析不斷指導(dǎo)優(yōu)化產(chǎn)品奋姿。數(shù)據(jù)埋點(diǎn)的質(zhì)量直接影響到數(shù)據(jù)锄开,產(chǎn)品,運(yùn)營(yíng)等質(zhì)量称诗。
?1萍悴、數(shù)據(jù)驅(qū)動(dòng)-埋點(diǎn)將分析的深度下鉆到流量分布和流動(dòng)層面,通過(guò)統(tǒng)計(jì)分析寓免,對(duì)宏觀指標(biāo)進(jìn)行深入剖析癣诱,發(fā)現(xiàn)指標(biāo)背后的問(wèn)題,洞察用戶行為與提升價(jià)值之間的潛在關(guān)聯(lián)
?2再榄、產(chǎn)品優(yōu)化-對(duì)產(chǎn)品來(lái)說(shuō)狡刘,用戶在產(chǎn)品里做了什么,停留多久困鸥,有什么異常都需要關(guān)注嗅蔬,這些問(wèn)題都可以通過(guò)埋點(diǎn)的方式實(shí)現(xiàn)
?3、精細(xì)化運(yùn)營(yíng)-埋點(diǎn)可以貫徹整個(gè)產(chǎn)品的生命周期疾就,流量質(zhì)量和不同來(lái)源的分布澜术,人群的行為特點(diǎn)和關(guān)系,洞察用戶行為與提升業(yè)務(wù)價(jià)值之間的潛在關(guān)聯(lián)猬腰。
2.3埋點(diǎn)的方式
埋點(diǎn)的方式都有哪些呢鸟废,當(dāng)前大多數(shù)公司都是客戶端,服務(wù)端相結(jié)合的方式
準(zhǔn)確性:代碼埋點(diǎn)>可視化埋點(diǎn)>全埋點(diǎn)
?
三姑荷、埋點(diǎn)的框架和設(shè)計(jì)
3.1埋點(diǎn)采集的頂層設(shè)計(jì)
? ? ? ?所謂的頂層設(shè)計(jì)就是想清楚怎么做埋點(diǎn)盒延,用什么方式,上傳機(jī)制是什么鼠冕,具體怎么定義添寺,具體怎么落地等等;我們遵循唯一性懈费,可擴(kuò)展性计露,一致性等的基礎(chǔ)上,我們要設(shè)計(jì)一些通用字段及生成機(jī)制憎乙,比如:cid, idfa,idfv等票罐。
用戶識(shí)別:用戶識(shí)別機(jī)制的混亂會(huì)導(dǎo)致兩個(gè)結(jié)果:一是數(shù)據(jù)不準(zhǔn)確,比如UV數(shù)據(jù)對(duì)不上泞边;二是涉及到漏斗分析環(huán)節(jié)出現(xiàn)異常该押。因此應(yīng)該做到:a.嚴(yán)格規(guī)范ID的本身識(shí)別機(jī)制;b.跨平臺(tái)用戶識(shí)別
同類抽象: 同類抽象包括事件抽象和屬性抽象阵谚。事件抽象即瀏覽事件沈善,點(diǎn)擊事件的聚合乡数;屬性抽象,即多數(shù)復(fù)用的場(chǎng)景來(lái)進(jìn)行合并,增加來(lái)源區(qū)分
采集一致:采集一致包括兩點(diǎn):一是跨平臺(tái)頁(yè)面命名一致闻牡,二是按鈕命名一致净赴;埋點(diǎn)的制定過(guò)程本身就是規(guī)范底層數(shù)據(jù)的過(guò)程,所以一致性是特別重要罩润,只有這樣才能真正的用起來(lái)
渠道配置:渠道主要指的是推廣渠道玖翅,落地頁(yè),網(wǎng)頁(yè)推廣頁(yè)面割以,APP推廣頁(yè)面等金度,這個(gè)落地頁(yè)的配置要有統(tǒng)一規(guī)范和標(biāo)準(zhǔn)
3.2埋點(diǎn)采集事件及屬性設(shè)計(jì)
? ? ? ?在設(shè)計(jì)屬性和事件的時(shí)候,我們要知道哪些經(jīng)常變严沥,哪些不變猜极,哪些是業(yè)務(wù)行為,哪些是基本屬性消玄「基于基本屬性事件,我們認(rèn)為屬性是必須采集項(xiàng)翩瓜,只是屬性里面的事件屬性根據(jù)業(yè)務(wù)不同有所調(diào)整而已受扳,因此,我們可以把埋點(diǎn)采集分為協(xié)議層和業(yè)務(wù)層埋點(diǎn)兔跌。
業(yè)務(wù)分解:梳理確認(rèn)業(yè)務(wù)流程勘高、操作路徑和不同細(xì)分場(chǎng)景、定義用戶行為路徑
分析指標(biāo):對(duì)特定的事件進(jìn)行定義坟桅、核心業(yè)務(wù)指標(biāo)需要的數(shù)據(jù)
事件設(shè)計(jì):APP啟動(dòng)华望,退出、頁(yè)面瀏覽仅乓、事件曝光點(diǎn)擊
屬性設(shè)計(jì):用戶屬性立美、事件屬性、對(duì)象屬性方灾、環(huán)境屬性
3.3數(shù)據(jù)采集事件及屬性設(shè)計(jì)
Ev事件的命名,也遵循一些規(guī)則碌更,同一類功能在不同頁(yè)面或位置出現(xiàn)時(shí)裕偿,按照功能名稱命名,頁(yè)面和位置在ev參數(shù)中進(jìn)行區(qū)分痛单。僅是按鈕點(diǎn)擊時(shí)嘿棘,按照按鈕名稱命名。
ev事件格式:ev分為ev標(biāo)識(shí)和ev參數(shù)
規(guī)則:
ev標(biāo)識(shí)和ev參數(shù)之間用“#”連接(一級(jí)連接符)旭绒;
ev參數(shù)和ev參數(shù)之間用“/”來(lái)連接(二級(jí)連接符)鸟妙;
ev參數(shù)使用key=value的結(jié)構(gòu)焦人,當(dāng)一個(gè)key對(duì)應(yīng)多個(gè)value值時(shí),value1與value2之間用“重父,”連接(三級(jí)連接符)花椭;
當(dāng)埋點(diǎn)僅有ev標(biāo)識(shí)沒有ev參數(shù)的時(shí)候,不需要帶#房午;
備注:
ev標(biāo)識(shí):作為埋點(diǎn)的唯一標(biāo)識(shí)矿辽,用來(lái)區(qū)分埋點(diǎn)的位置和屬性,不可變郭厌,不可修改袋倔;
ev參數(shù):埋點(diǎn)需要回傳的參數(shù),ev參數(shù)順序可變折柠,可修改宾娜;
app埋點(diǎn)調(diào)整的時(shí),ev標(biāo)識(shí)不變扇售,只修改后面的埋點(diǎn)參數(shù)(參數(shù)取值變化或者增加參數(shù)類型)
一般埋點(diǎn)文檔中所包含的sheet名稱以及作用:
A前塔、曝光埋點(diǎn)匯總;
B缘眶、點(diǎn)擊和瀏覽埋點(diǎn)匯總嘱根;
C、失效埋點(diǎn)匯總:一般會(huì)記錄埋點(diǎn)失效版本或時(shí)間巷懈;
D该抒、PC和M端頁(yè)面埋點(diǎn)所對(duì)應(yīng)的pageid;
E顶燕、各版本上線時(shí)間記錄凑保;
埋點(diǎn)文檔中,所有包含的列名及功能:
?
3.4基于埋點(diǎn)的數(shù)據(jù)統(tǒng)計(jì)
用埋點(diǎn)統(tǒng)計(jì)數(shù)據(jù)怎么查找埋點(diǎn)ev事件:
1.????? [endif]明確埋點(diǎn)類型(點(diǎn)擊/曝光/瀏覽)——篩選type字段
2.????? [endif]明確按鈕埋點(diǎn)所屬頁(yè)面(頁(yè)面或功能)——篩選功能模塊字段
3.????? [endif]明確埋點(diǎn)事件名稱——篩選名稱字段
4.????? [endif]知道ev標(biāo)識(shí)涌攻,可直接用ev來(lái)進(jìn)行篩選
根據(jù)ev事件怎么進(jìn)行查數(shù)統(tǒng)計(jì):當(dāng)查詢按鈕點(diǎn)擊統(tǒng)計(jì)時(shí)欧引,可直接用ev標(biāo)識(shí)進(jìn)行查詢,當(dāng)有所區(qū)分可限定埋點(diǎn)參數(shù)取值恳谎;因?yàn)閑v參數(shù)的順序不做要求可變芝此,所以查詢統(tǒng)計(jì)時(shí),不能按照參數(shù)的順序進(jìn)行限定因痛;
四婚苹、應(yīng)用-數(shù)據(jù)流程的基礎(chǔ)
4.1指標(biāo)體系
體系化的指標(biāo)可以綜合不同的指標(biāo)不同的維度串聯(lián)起來(lái)進(jìn)行全面的分析,會(huì)更快的發(fā)現(xiàn)目前產(chǎn)品和業(yè)務(wù)流程存在的問(wèn)題鸵膏。
4.2可視化
人對(duì)圖像信息的解釋效率比文字更高膊升,可視化對(duì)數(shù)據(jù)分析極為重要,利用數(shù)據(jù)可視化可以揭示出數(shù)據(jù)內(nèi)在的錯(cuò)綜復(fù)雜的關(guān)系谭企。
4.3埋點(diǎn)元信息api提供
數(shù)據(jù)采集服務(wù)會(huì)對(duì)采集到的埋點(diǎn)寫入到Kafka 中廓译,對(duì)于各個(gè)業(yè)務(wù)的實(shí)時(shí)數(shù)據(jù)消費(fèi)需求评肆,我們?yōu)槊總€(gè)業(yè)務(wù)提供了單獨(dú)的Kafka,流量分發(fā)模塊會(huì)定期讀取埋點(diǎn)管理平臺(tái)提供的元信息非区,將流量實(shí)時(shí)分發(fā)的各業(yè)務(wù)Kafka 中瓜挽。
? ? ??數(shù)據(jù)采集猶如設(shè)計(jì)產(chǎn)品,不能過(guò)度院仿,留出擴(kuò)展余地秸抚,但要經(jīng)常思考數(shù)據(jù)有沒有,全不全歹垫,細(xì)不細(xì)剥汤,穩(wěn)不穩(wěn),快不快.
歡迎關(guān)注我的微信公眾號(hào):趙小洛洛洛