2019/11/23 Caesar
前言
埋點是數(shù)據(jù)采集的一種重要方式韩容,主要記錄和收集用戶在終端的操作行為;其基本原理是在app/H5/pc上布置采集數(shù)據(jù)的SDK代碼,當(dāng)用戶的行為滿足某種條件后,比如進(jìn)入某個界面,點擊某個button,會自動觸發(fā)記錄和存儲澡刹,然后這些數(shù)據(jù)會被實時或延遲傳遞到終端服務(wù)器,或者通過后端采集用戶使用服務(wù)過程中的請求數(shù)據(jù)耘婚。(前端:客戶端埋點罢浇,在客戶端上寫代碼SDK;后端:服務(wù)器埋點沐祷,在服務(wù)器上寫代碼)嚷闭。
埋點應(yīng)用場景
驅(qū)動決策:ABtest、漏斗優(yōu)化赖临、用戶增長胞锰、bug修復(fù)、精準(zhǔn)營銷兢榨、流失用戶預(yù)警
驅(qū)動產(chǎn)品智能:智能推薦(千人千面)嗅榕、場景化提示(私人助理)等
驅(qū)動安全:風(fēng)險識別
埋點分類
??從位置上可以分為前端埋點和后端埋點,從形式上可以分為顯性埋點和隱性埋點吵聪,從路徑上可以分為路徑埋點和獨立埋點凌那,從需求上分為業(yè)務(wù)埋點和監(jiān)測埋點。
目前吟逝,大家主要采用前端埋點技術(shù)帽蝶。
埋點方式
前端埋點:
??前端埋點是在用戶端(APP、Web块攒、客戶端)等嵌入數(shù)據(jù)采集代碼励稳,比如友盟等均采用的是前端埋點,比如通過嵌入一段代碼就就可以對網(wǎng)頁數(shù)據(jù)的訪問數(shù)據(jù)進(jìn)行采集局蚀。相比于后端埋點麦锯,前端埋點能方便收集到用戶在界面上的行為數(shù)據(jù),比如用戶點了哪個按鈕琅绅、頁面之間的跳轉(zhuǎn)次序、停留時長等鹅巍,這些數(shù)據(jù)是后面進(jìn)行數(shù)據(jù)分析的主要來源千扶。
前端埋點分類:
- 代碼埋點:代碼埋點是直接將采集SDK集成在終端,然后不斷在此基礎(chǔ)上添加調(diào)整采集方案骆捧,是目前主流的埋點采集方案澎羞。高度定制、控制精準(zhǔn)敛苇、采集的數(shù)據(jù)豐富準(zhǔn)確妆绞。首先是每當(dāng)有采集需求顺呕,需要開發(fā)人員不斷添加采集代碼,工作量大括饶;其次變更采集策略株茶,需要發(fā)布新版本,代價巨大图焰,存在滯后效應(yīng)启盛;最后由于采集代碼常駐終端,不斷將采集的用戶行為數(shù)據(jù)進(jìn)行記錄和上報技羔,對于終端尤其是移動終端來說還有耗電僵闯、消耗數(shù)據(jù)流量等負(fù)載,此外在數(shù)據(jù)上報傳輸?shù)倪^程中也存在丟失數(shù)據(jù)的風(fēng)險藤滥。
- 可視化埋點:由于代碼埋點需要終端開發(fā)人員來執(zhí)行采集方案鳖粟,對業(yè)務(wù)的功能開發(fā)侵入性較高。有的公司開發(fā)出了可視化埋點技術(shù)拙绊,只需要產(chǎn)品與運(yùn)營人員通過GUI界面進(jìn)行鼠標(biāo)簡單點擊牺弹,就可以隨時增加、取消时呀、調(diào)整采集數(shù)據(jù)的位置和方式张漂,此種埋點方式避開了終端開發(fā)人員的介入,由需求人員直接執(zhí)行采集谨娜,減輕了需求傳遞過程中的信息損耗和誤解航攒,另外可視化埋點技術(shù)往往由服務(wù)端直接下發(fā)采集的配置文件,而不用跟隨版本發(fā)布趴梢,從而加快了數(shù)據(jù)采集的流程漠畜。
- 無埋點:無埋點與可視化埋點原理基本一致,區(qū)別在于無埋點是先遍歷所有的控件和操作行為的組合情況坞靶,然后將這些組合情況交給埋點后臺憔狞,由數(shù)據(jù)分析人員選擇對哪些組合的埋點數(shù)據(jù)進(jìn)行分析,收集數(shù)據(jù)全面彰阴,無漏報瘾敢。采集數(shù)據(jù)量巨大,增加了終端流量消耗和服務(wù)器存儲負(fù)擔(dān)尿这。
后端埋點:
??前端埋點需要對采集的數(shù)據(jù)壓縮簇抵、暫存,為減少移動端的數(shù)據(jù)流量射众,除一些需要實時上報的重要事件不限制網(wǎng)絡(luò)環(huán)境碟摆,其它事件一般只在wifi情況下上報,因此數(shù)據(jù)會有延遲叨橱,丟數(shù)據(jù)等弊端典蜕,而在后端采集數(shù)據(jù)断盛,由于數(shù)據(jù)是在內(nèi)網(wǎng)傳輸,數(shù)據(jù)傳輸?shù)募磿r性強(qiáng)愉舔,丟失數(shù)據(jù)的風(fēng)險小钢猛。