一、數(shù)據(jù)過程
數(shù)據(jù)生產(chǎn)-數(shù)據(jù)采集-數(shù)據(jù)處理-數(shù)據(jù)分析和挖掘-數(shù)據(jù)驅(qū)動/反饋
eg.用戶操作app時產(chǎn)生行為數(shù)據(jù)遮精,通過數(shù)據(jù)采集系統(tǒng)采集居夹,對采集的數(shù)據(jù)進(jìn)行處理(實(shí)時數(shù)據(jù)處理+離線數(shù)據(jù)處理)得到統(tǒng)計數(shù)據(jù)進(jìn)行數(shù)據(jù)分析 并將結(jié)果呈現(xiàn)出來以復(fù)盤總結(jié)當(dāng)前版本并驅(qū)動下一個產(chǎn)品迭代,或者 清洗后的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘本冲,實(shí)時反饋給用戶(如推薦)准脂。
數(shù)據(jù)采集,顧名思義采集相應(yīng)的數(shù)據(jù)檬洞,是整個數(shù)據(jù)流的起點(diǎn)狸膏,采集的全不全、對不對添怔,直接決定數(shù)據(jù)廣度和質(zhì)量湾戳,影響后續(xù)所有的環(huán)節(jié)。在數(shù)據(jù)采集失效性广料、完整性不好的公司砾脑,經(jīng)常會有業(yè)務(wù)方發(fā)現(xiàn)數(shù)據(jù)發(fā)生的大幅度變化,追其所以時發(fā)現(xiàn)是數(shù)據(jù)采集的問題(見附注)艾杏。而另一方面韧衣,采集什么數(shù)據(jù)才能有效的得到數(shù)據(jù)分析結(jié)論,才能有效的進(jìn)行推薦购桑,就需要提前規(guī)劃【埋點(diǎn)】畅铭。
當(dāng)前數(shù)據(jù)采集普遍遇到的幾個問題:
1.實(shí)時性,對于工具性產(chǎn)品在無網(wǎng)條件下的數(shù)據(jù)勃蜘,無法實(shí)時上報顶瞒;
2.完整性,由于用戶隱私協(xié)議&歐盟通用數(shù)據(jù)保護(hù)條例的元旬,部分?jǐn)?shù)據(jù)無法采集榴徐;
3.異常,android_id匀归、idfa坑资、idfv 隨版本升級變化 或 無法獲取。
二穆端、數(shù)據(jù)埋點(diǎn)
接下來用5w2h的思路來看埋點(diǎn)
1.埋點(diǎn)是什么袱贮?
所謂“埋點(diǎn)”,是數(shù)據(jù)采集領(lǐng)域(尤其是用戶行為數(shù)據(jù)采集領(lǐng)域)的術(shù)語体啰,指的是針對特定用戶行為或事件進(jìn)行捕獲攒巍、處理和發(fā)送的相關(guān)技術(shù)及其實(shí)施過程嗽仪。
埋點(diǎn)的技術(shù)實(shí)質(zhì),是先監(jiān)聽軟件應(yīng)用運(yùn)行過程中的事件柒莉,當(dāng)需要關(guān)注的事件發(fā)生時進(jìn)行判斷和捕獲闻坚,然后獲取必要的上下文信息,最后將信息整理后發(fā)送至服務(wù)器端兢孝。所監(jiān)聽的事件窿凤,通常由操作系統(tǒng)、瀏覽器跨蟹、APP框架等平臺提供雳殊,也可以在基礎(chǔ)事件之上進(jìn)行觸發(fā)條件的自定義(如點(diǎn)擊某一個特定按鈕)。
2.埋點(diǎn)是誰的工作
現(xiàn)在公司通常都會有數(shù)據(jù)產(chǎn)品經(jīng)理 或 業(yè)務(wù)線數(shù)據(jù)分析師 結(jié)合版本迭代過程進(jìn)行埋點(diǎn)窗轩。
3.when&where
埋點(diǎn)是目的導(dǎo)向夯秃。
在產(chǎn)品規(guī)劃時就要思考數(shù)據(jù)埋點(diǎn)問題,如果在產(chǎn)品外發(fā)后再考慮怎么埋點(diǎn)痢艺,就會導(dǎo)致前期版本用戶的數(shù)據(jù)無法收集仓洼,想要看某個數(shù)據(jù)時就無可奈何,只有等到新版本完善來彌補(bǔ)腹备。
思考要埋哪些點(diǎn)衬潦、埋點(diǎn)的形式斤蔓,需要緊密結(jié)合產(chǎn)品迭代的方向植酥、運(yùn)營需求,并和數(shù)據(jù)開發(fā)等進(jìn)行充分溝通 以確認(rèn) 1.埋點(diǎn)能夠得到想要的數(shù)據(jù)解決/支持弦牡;2.能夠得到當(dāng)前版本的復(fù)盤情況友驮;3.后續(xù)版本的數(shù)據(jù)支撐.
通常的溝通過程以 埋點(diǎn)文檔為載體;數(shù)據(jù)埋點(diǎn)評審 為終結(jié)驾锰。
當(dāng)前版本的復(fù)盤情況
(1).新版本功能使用情況卸留,是否符合預(yù)期;
(2).新功能上線后對其他功能點(diǎn)的影響椭豫?是否為整體均有積極作用耻瑟;
(3).版本運(yùn)營活動目標(biāo)群體的特征獲取;
(4).新增商業(yè)化目標(biāo)的監(jiān)測...
后續(xù)版本的數(shù)據(jù)支撐
(1).規(guī)劃方向的用戶行為分析
(2).畫像特征分析
5.為什么埋點(diǎn)
上述第一節(jié)已經(jīng)講過,不再復(fù)述赏酥。
6.怎么埋點(diǎn)呢喳整?
?????1).埋點(diǎn)技術(shù)
????監(jiān)測代碼、SDK和埋點(diǎn)
接著【埋點(diǎn)是什么裸扶?】來看下埋點(diǎn)技術(shù)層面的區(qū)分:代碼埋點(diǎn)框都、可視化埋點(diǎn)和無埋點(diǎn)
????代碼埋點(diǎn)
能夠監(jiān)測網(wǎng)站上用戶的行為,或者app上用戶的行為呵晨,是需要在網(wǎng)站的每一頁或者app中加上一些程序代碼的(這里就不考慮日志分析這種方法了)魏保,也就是**代碼埋點(diǎn)**熬尺。這樣的程序代碼,在網(wǎng)站上叫**監(jiān)測代碼**谓罗,在app中叫**SDK(Software Development Kit)**粱哼。無論你是要監(jiān)測網(wǎng)站,還是要監(jiān)測app妥衣,你都必須加上這類代碼皂吮,不加代碼就收集不到數(shù)據(jù)。
優(yōu)點(diǎn):控制發(fā)送數(shù)據(jù)時間税手,事件自定義屬性詳細(xì)記錄蜂筹;
缺點(diǎn):時間、人力成本大芦倒,數(shù)據(jù)傳輸?shù)臅r效性艺挪。
????可視化埋點(diǎn)
利用可視化交互手段,通過可視化界面配置控件操作與事件操作發(fā)生關(guān)系兵扬,通過后臺截屏的方式采集數(shù)據(jù)麻裳。
優(yōu)點(diǎn):成本低,速度快器钟;
缺點(diǎn):行為記錄信息少津坑,支持的分析方式少。
????無埋點(diǎn)
用戶展現(xiàn)界面元素時傲霸,通過控件綁定觸發(fā)事件疆瑰,事件被觸發(fā)的時候系統(tǒng)會有相應(yīng)的接口讓開發(fā)者處理這些行為。現(xiàn)在市面上主流無埋點(diǎn)做法有兩種昙啄,一種是預(yù)先跟蹤所有的渲染信息穆役,一種是滯后跟蹤的渲染信息。
優(yōu)點(diǎn):無需埋點(diǎn)梳凛,方便快捷耿币;
缺點(diǎn):行為記錄信息少,傳輸壓力大韧拒。
Question:無埋點(diǎn)是真的不用埋點(diǎn)么淹接?
無埋點(diǎn)是指開發(fā)人員集成采集 SDK 后,SDK 便直接開始捕捉和監(jiān)測用戶在應(yīng)用里的所有行為叛溢,并全部發(fā)送到分析平臺塑悼,不需要開發(fā)人員添加額外代碼。在分析時雇初,業(yè)務(wù)人員通過分析平臺的圈選功能來選出自己關(guān)注的用戶行為拢肆,并給出事件命名。之后便可以對特定用戶行為(事件)進(jìn)行多維分析了。無埋點(diǎn)和可視化埋點(diǎn)是比較像郭怪,都不需要開發(fā)人員手工加代碼支示,也都需要業(yè)務(wù)人員進(jìn)行所關(guān)注的用戶行為的圈選。**兩者最大的不同是在用戶終端的表現(xiàn)上鄙才,可視化埋點(diǎn)只采集業(yè)務(wù)人員關(guān)注的用戶行為數(shù)據(jù)颂鸿,而無埋點(diǎn)是會采集所有用戶的行為數(shù)據(jù),通常情況下數(shù)據(jù)量后者比前者大很多攒庵。**
客戶端埋點(diǎn) & 服務(wù)端埋點(diǎn)
客戶端埋點(diǎn)的優(yōu)缺點(diǎn)
好處
(1)能夠搜集頁面展示嘴纺、點(diǎn)擊行為;
(2)可以收集不需要請求服務(wù)器的數(shù)據(jù)浓冒,如音樂的本地播放栽渴、頁面停留時長等。
缺點(diǎn)
(1)由于數(shù)據(jù)上報需要網(wǎng)絡(luò)稳懒,當(dāng)用戶產(chǎn)生行為而沒有網(wǎng)絡(luò)時闲擦,則會延遲上報數(shù)據(jù),影響數(shù)據(jù)的實(shí)時性场梆。這點(diǎn)在工具型產(chǎn)品上表現(xiàn)尤其強(qiáng)烈墅冷。
(2)如果用戶刪除自己的APP操作記錄,或者無網(wǎng)連接時數(shù)據(jù)存儲達(dá)到上限或油,則會造成數(shù)據(jù)丟失寞忿,影響數(shù)據(jù)的完整性。
(3) 當(dāng)需要改變埋點(diǎn)時顶岸,需要更新版本才行腔彰,但是會存在有些用戶不更新版本情況,影響數(shù)據(jù)質(zhì)量蜕琴。
服務(wù)端埋點(diǎn)
**優(yōu)點(diǎn)**
(1)實(shí)時性好:實(shí)時收集萍桌,數(shù)據(jù)很準(zhǔn)確宵溅,不存在延時上報凌简;
(2)變更成本小:當(dāng)要改變埋點(diǎn)時恃逻,只要改變雏搂,上報數(shù)據(jù)就會改變;
(3)能夠收集不在APP內(nèi)發(fā)生的行為寇损,只要請求服務(wù)器就行凸郑,而客戶端只能收集在客戶端中的操作行為,如統(tǒng)計從其他APP引流的安裝量矛市。
缺點(diǎn)
(1)不能收集不需要請求服務(wù)器的數(shù)據(jù)芙沥;
(2)用戶沒聯(lián)網(wǎng)的時候不能夠采集數(shù)據(jù)。
當(dāng)前大多數(shù)產(chǎn)品&公司都是客戶端、服務(wù)端相結(jié)合而昨。
各種埋點(diǎn)場景&埋點(diǎn)建議
客戶端數(shù)據(jù):頁面點(diǎn)擊數(shù)據(jù)救氯,eg.tab欄的點(diǎn)擊,某個icon的點(diǎn)擊(各入口點(diǎn)擊對比使用情況歌憨,統(tǒng)計頁面點(diǎn)擊行為的轉(zhuǎn)化漏斗)
服務(wù)端數(shù)據(jù):安裝數(shù)據(jù)着憨,下載后安裝情況;內(nèi)容數(shù)據(jù)务嫡,eg.某個視頻內(nèi)容 曝光/展示/播放數(shù)據(jù)甲抖;搜索內(nèi)容
以視頻產(chǎn)品為例的一次埋點(diǎn)過程
1. 明確產(chǎn)品動態(tài),梳理數(shù)據(jù)需求心铃;
eg.當(dāng)前為一個視頻社區(qū)軟件准谚,增加了**舞蹈跟拍**功能,用戶可以根據(jù)不用的舞蹈來進(jìn)行拍攝(運(yùn)營同學(xué)對舞蹈進(jìn)行了分類去扣,主打幾個舞蹈)氛魁,目的是為了給用戶提供低成本創(chuàng)造視頻內(nèi)容的方式。
基于上述的產(chǎn)品目的厅篓,期望能了解 a.該功能的使用情況(uv秀存,pv,使用過程漏斗); b.生產(chǎn)的視頻情況(視頻數(shù),視頻的互動情況)羽氮,是否能實(shí)現(xiàn)促進(jìn)內(nèi)容生產(chǎn)帶動社區(qū)氛圍的目標(biāo);
2. 數(shù)據(jù)需求轉(zhuǎn)化為指標(biāo)&埋點(diǎn)或链,并與數(shù)據(jù)開發(fā)進(jìn)行討論;
????a.功能使用uv档押、pv澳盐,
????b.對其他拍攝功能的影響;
????a令宿,b:可以服務(wù)端打點(diǎn)叼耙,也可以客戶端打點(diǎn),但因為視頻社區(qū)的基于內(nèi)容的互動行為基本都在服務(wù)端粒没,所以建議服務(wù)端打點(diǎn)筛婉。
????c.拍攝流程的轉(zhuǎn)化漏斗;
? ??拍攝流程主要是頁面的點(diǎn)擊過程癞松,故使用客戶端埋點(diǎn)爽撒,并記錄uv,pv响蓉。
????d.跟拍視頻的播放硕勿、點(diǎn)贊、評論枫甲、分享源武、關(guān)注扼褪、二次被跟拍的情況;
????f.跟拍舞蹈的類型粱栖,明確用戶是否偏向于某個類型的舞蹈跟拍迎捺;
????d,f服務(wù)端查排,基于內(nèi)容的互動行為基本都在服務(wù)端凳枝。
3. 版本上線
4. 按照預(yù)期進(jìn)行數(shù)據(jù)分析,產(chǎn)品迭代復(fù)盤跋核。數(shù)據(jù)分析過程岖瑰,注意查看是否與預(yù)期相符,是否有優(yōu)化點(diǎn)砂代。
參考:
https://blog.csdn.net/heatdeath/article/details/72817838
http://www.chinawebanalytics.cn/auto-event-tracking-good-bad-ugly/
https://blog.csdn.net/wangyiyungw/article/details/80179730
https://www.cnblogs.com/111testing/p/7672833.html
https://blog.csdn.net/wangyiyungw/article/details/80179730
https://www.zhihu.com/question/36411025/answer/144973846