一、什么是埋點
數(shù)據(jù)埋點是數(shù)據(jù)采集的一種重要方式,主要用來記錄和收集終端用戶的操作行為吉拳,其基本原理是在App/H5/PC等終端部署采集的SDK代碼,當用戶的行為滿足某種條件的時候适揉,比如進入某個頁面留攒、點擊某個按鈕等,會自動觸發(fā)記錄和存儲嫉嘀,然后這些數(shù)據(jù)會被收集并被傳輸?shù)浇K端提供商炼邀,或者是通過后端采集用戶使用服務(wù)過程中的請求數(shù)據(jù)。
一個典型的埋點采集處理流程如下圖所示:
二剪侮、埋點的用途
終端提供商在收集到埋點數(shù)據(jù)之后拭宁,通過大數(shù)據(jù)處理、數(shù)據(jù)統(tǒng)計瓣俯、數(shù)據(jù)分析杰标、數(shù)據(jù)挖掘等加工處理,可以得到衡量產(chǎn)品狀態(tài)的一些基本指標彩匕,比如活躍腔剂、留存、新增等大盤數(shù)據(jù)推掸,從而洞察產(chǎn)品的狀態(tài)桶蝎。此外更重要的是隨著數(shù)據(jù)挖掘等技術(shù)的興起驻仅,埋點采集到的數(shù)據(jù)在以下方面的作用也越來越凸顯:
驅(qū)動決策:ABtest谅畅、漏斗優(yōu)化登渣、用戶增長、bug修復(fù)毡泻、精準營銷胜茧、流失用戶預(yù)警
驅(qū)動產(chǎn)品智能:智能推薦(千人千面)、場景化提示(私人助理)等
驅(qū)動安全:風(fēng)險識別
三仇味、埋點的分類
從位置上分為前端埋點和后端埋點呻顽,從形式上分為顯性埋點和隱性埋點,從路徑上又可以分為路徑埋點和獨立埋點丹墨,從需求上分為業(yè)務(wù)埋點和監(jiān)測埋點廊遍。
由于埋點的主要操作過程是以終端的交互界面為基礎(chǔ),制定數(shù)據(jù)采集的方案贩挣,其它的埋點分類也只是從不同的角度來進行埋點設(shè)計喉前。前端埋點是當前主要采用的埋點方式,下面主要對前端埋點進行闡述王财。
1.? 前端埋點
前端埋點是在用戶端(APP卵迂、Web、客戶端)等嵌入數(shù)據(jù)采集代碼绒净,比如友盟等均采用的是前端埋點见咒,比如通過嵌入一段代碼就就可以對網(wǎng)頁數(shù)據(jù)的訪問數(shù)據(jù)進行采集。相比于后端埋點挂疆,前端埋點能方便收集到用戶在界面上的行為數(shù)據(jù)改览,比如用戶點了哪個按鈕、頁面之間的跳轉(zhuǎn)次序缤言、停留時長等宝当,這些數(shù)據(jù)是后面進行數(shù)據(jù)分析的主要來源。
前端埋點技術(shù)有以下三類:
代碼埋點
代碼埋點是直接將采集SDK集成在終端墨闲,然后不斷在此基礎(chǔ)上添加調(diào)整采集方案今妄,是目前主流的埋點采集方案,其優(yōu)缺點如下:
優(yōu)點:
高度定制鸳碧、控制精準盾鳞、采集的數(shù)據(jù)豐富準確
缺點:
首先是每當有采集需求,需要開發(fā)人員不斷添加采集代碼瞻离,工作量大腾仅;
其次變更采集策略,需要發(fā)布新版本套利,代價巨大推励,存在滯后效應(yīng)鹤耍;
最后由于采集代碼常駐終端,不斷將采集的用戶行為數(shù)據(jù)進行記錄和上報验辞,對于終端尤其是移動終端來說還有耗電稿黄、消耗數(shù)據(jù)流量等負載,此外在數(shù)據(jù)上報傳輸?shù)倪^程中也存在丟失數(shù)據(jù)的風(fēng)險跌造。
可視化埋點
由于代碼埋點需要終端開發(fā)人員來執(zhí)行采集方案杆怕,對業(yè)務(wù)的功能開發(fā)侵入性較高。有的公司開發(fā)出了可視化埋點技術(shù)壳贪,只需要產(chǎn)品與運營人員通過GUI界面進行鼠標簡單點擊陵珍,就可以隨時增加、取消违施、調(diào)整采集數(shù)據(jù)的位置和方式互纯,此種埋點方式避開了終端開發(fā)人員的介入,由需求人員直接執(zhí)行采集磕蒲,減輕了需求傳遞過程中的信息損耗和誤解留潦,另外可視化埋點技術(shù)往往由服務(wù)端直接下發(fā)采集的配置文件,而不用跟隨版本發(fā)布亿卤,從而加快了數(shù)據(jù)采集的流程愤兵。
具體實現(xiàn)方式參考:
具體實現(xiàn)是SDK定時做界面截圖,在截圖的同時從界面UI的根對象開始遍歷所有的可視化子對象排吴,得到其層級關(guān)系秆乳。根據(jù)截圖和UI元素的可視化信息重新渲染頁面,識別可埋點的控件钻哩。當產(chǎn)品人員在后臺管理端的截屏畫面上點擊可埋點控件屹堰,設(shè)置事件關(guān)聯(lián)方面的配置,服務(wù)器保存這些配置街氢,客戶端在獲取到這些配置信息以后扯键,按照新配置采集數(shù)據(jù)。
無埋點
無埋點與可視化埋點原理基本一致珊肃,區(qū)別在于無埋點是先遍歷所有的控件和操作行為的組合情況荣刑,然后將這些組合情況交給埋點后臺,由數(shù)據(jù)分析人員選擇對哪些組合的埋點數(shù)據(jù)進行分析伦乔,其優(yōu)缺點如下:
優(yōu)點:
收集數(shù)據(jù)全面厉亏,無漏報
缺點:
采集數(shù)據(jù)量巨大,增加了終端流量消耗和服務(wù)器存儲負擔烈和。
埋點的上報時機相對呆板爱只,不能靈活的根據(jù)特定的場景進行特殊設(shè)置
前端埋點的注意事項:
頁面和控件標示上報要從頂層進行合理的設(shè)計,層次感要明顯
埋點數(shù)據(jù)的漏報和重復(fù)上報如何衡量
前端埋點不僅可以處理不需要和服務(wù)器交互的曝光和點擊事件招刹,也可以將與服務(wù)器交互的結(jié)果恬试,比如關(guān)注成功窝趣、分享成功、優(yōu)惠券領(lǐng)取成功等原屬于后端埋點里的事件放在前端來上報训柴。
2. 后端埋點
后端埋點為了避免前端埋點的以下問題:
前端埋點需要對采集的數(shù)據(jù)壓縮哑舒、暫存,為減少移動端的數(shù)據(jù)流量畦粮,除一些需要實時上報的重要事件不限制網(wǎng)絡(luò)環(huán)境散址,其它事件一般只在wifi情況下上報乖阵,因此數(shù)據(jù)會有延遲宣赔,丟數(shù)據(jù)等弊端,而在后端采集數(shù)據(jù)瞪浸,由于數(shù)據(jù)是在內(nèi)網(wǎng)傳輸儒将,數(shù)據(jù)傳輸?shù)募磿r性強,丟失數(shù)據(jù)的風(fēng)險小对蒲。
前端埋點采集程序由于需要常駐钩蚊,監(jiān)測實時和延遲埋點上報,不可避免的帶來額外的耗電蹈矮。
前端埋點若要新增或調(diào)整采集方案砰逻,需要開發(fā)人員修改客戶端代碼,然后發(fā)版之后才能解決泛鸟,受發(fā)布周期的影響較大蝠咆,而且通常用戶的版本更新并不會及時,這將導(dǎo)致新方案不能及時覆蓋所有用戶北滥。雖然現(xiàn)在部分埋點管理后臺也支持熱配置更新刚操,但功能一般都很弱,只支持一些基礎(chǔ)的埋點事件熱更新部署再芋,
注意:
很多時候并不把后端埋點獨立出來菊霜,而是混合在前端埋點中,等用戶和服務(wù)器端的交互返回結(jié)果之后济赎,將結(jié)果進行上報鉴逞。
對一下需要精確采集的數(shù)據(jù),比如代金券發(fā)放等司训,實施的時候盡量采用后端埋點构捡,除非后端無法采集到所需要的數(shù)據(jù),前端埋點只是用來參考豁遭。此外也可以將業(yè)務(wù)數(shù)據(jù)庫代金券領(lǐng)取數(shù)據(jù)同步到數(shù)據(jù)倉庫中進行分析叭喜。
3. 其它埋點
路徑埋點和獨立埋點:
這部分的埋點根據(jù)業(yè)務(wù)對路徑的追蹤需求和SDK的開發(fā)能力,可為每個事件設(shè)計上下文的路徑信息蓖谢,路徑信息的組成一般由頁面捂蕴、控件譬涡、行為三部分組成,而路徑的深度也不宜太深啥辨,一般小于五層涡匀。
顯性埋點和隱性埋點:
顯性和隱性是從用戶有感和無感來區(qū)分的,有感事件是用戶的主動事件溉知,比如展示和點擊事件陨瘩;無感事件主要用來處理后臺的數(shù)據(jù)請求和拉取,用以監(jiān)控和服務(wù)器的數(shù)據(jù)交互是否正常等级乍,無感事件中常用的是掃描采集舌劳,比如app啟動之后,掃描各設(shè)置開關(guān)的狀態(tài)信息進行上報等
業(yè)務(wù)埋點和監(jiān)測埋點:
業(yè)務(wù)埋點是從業(yè)務(wù)需求的角度而言玫荣,比如產(chǎn)品需要統(tǒng)計某個頁面的曝光和點擊甚淡,算法人員需要的推薦項點擊率等;而監(jiān)測埋點是從業(yè)務(wù)的流程上來講的捅厂,一般是指隱性的(比如服務(wù)器交互的內(nèi)容拉取情況贯卦、本地潛在信息的生成情況等),此外業(yè)務(wù)埋點中的關(guān)鍵部分也可以用作監(jiān)測埋點焙贷。
四撵割、參考資料
一些資料參考:
可視化埋點參考:Mixpanel, Inc · GitHub
產(chǎn)品經(jīng)理如何做數(shù)據(jù)埋點:產(chǎn)品經(jīng)理該如何做好數(shù)據(jù)埋點? | 人人都是產(chǎn)品經(jīng)理
常見的埋點平臺參考:
Growing io:GrowingIO 官網(wǎng)-硅谷新一代無埋點用戶行為數(shù)據(jù)分析產(chǎn)品
神策:神策數(shù)據(jù) | 大數(shù)據(jù)用戶行為分析產(chǎn)品 | Sensors Data
諸葛IO:諸葛io - 深入業(yè)務(wù)場景的數(shù)據(jù)智能決策平臺
talking data:TalkingData-移動.數(shù)據(jù).價值
友盟:友盟+辙芍,國內(nèi)領(lǐng)先的第三方全域數(shù)據(jù)服務(wù)商
百度統(tǒng)計:百度移動統(tǒng)計|移動應(yīng)用APP統(tǒng)計|android統(tǒng)計分析|iOS統(tǒng)計分析
作者:Kince_X
鏈接:http://www.reibang.com/p/e3a315b8849e