頁面日志采集
- 頁面瀏覽日志采集。指的是當(dāng)一個(gè)頁面被瀏覽器或者APP加載呈現(xiàn)時(shí)采集的日志灭必,也是頁面瀏覽量(Page View, PV)和訪客數(shù)(Unique Visitors,UV)的統(tǒng)計(jì)基礎(chǔ)蚯嫌。
- 頁面交互日志采集拢操。獲取用戶操作日志,通過量化獲知用戶的興趣點(diǎn)或者體驗(yàn)優(yōu)化點(diǎn)茶凳。
頁面瀏覽日志采集流程
目前典型的網(wǎng)頁訪問過程是以客戶端發(fā)送請求嫂拴、服務(wù)器響應(yīng)并返回所請求的內(nèi)容進(jìn)行的。
客戶端日志采集
如果要進(jìn)行日志采集的動(dòng)作贮喧,需要在服務(wù)器響應(yīng)并返回所請求的內(nèi)容之后筒狠,對應(yīng)頁面的onload
事件。 一般需要采集當(dāng)前頁面參數(shù)箱沦、瀏覽行為的上下文信息(如讀取用戶訪問當(dāng)前頁面時(shí)的上一個(gè)頁面)以及一些運(yùn)行環(huán)境信息(如當(dāng)前瀏覽器和分辨率等)辩恼。
客戶端日志發(fā)送
正常情況下,在進(jìn)入頁面onload
生命周期的時(shí)候谓形,向服務(wù)端發(fā)送日志信息灶伊。采集到的日志信息一般以URL參數(shù)的形式放在HTTP日志請求的請求行內(nèi)。
服務(wù)端日志收集
日志服務(wù)器收到客戶端發(fā)來的日志請求后寒跳,一般會立即向?yàn)g覽器返回一個(gè)請求成功的響應(yīng)聘萨,以免對頁面的正常加載造成影響。
服務(wù)器端日志解析存檔
頁面交互日志采集
隨著互聯(lián)網(wǎng)業(yè)務(wù)的發(fā)展童太,僅了解用戶訪問過的頁面已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足用戶細(xì)分研究的需求米辐,在很多場景下,需要了解用戶在訪問某個(gè)頁面時(shí)具體的互動(dòng)行為特征书释。因?yàn)檫@些行為往往不會觸發(fā)頁面的特定事件翘贮,因此很多時(shí)候需要我們手動(dòng)收集。
頁面日志采集面臨的問題
- 識別流量攻擊征冷、網(wǎng)絡(luò)爬蟲和流量作弊择膝。
- 數(shù)據(jù)標(biāo)準(zhǔn)化(結(jié)構(gòu)化)。
- 無效數(shù)據(jù)剔除检激。
- 降低日志服務(wù)器壓力肴捉。
日志采集實(shí)現(xiàn)思路
首先明確我們想要采集的數(shù)據(jù)-頁面瀏覽日志和頁面交互日志。正常情況下我們會在進(jìn)入頁面時(shí)發(fā)送日志信息叔收,但是用戶在每個(gè)頁面的停留時(shí)間我們將很難統(tǒng)計(jì)到齿穗。因此考慮在離開頁面時(shí)發(fā)送日志信息,并且在頁面跳轉(zhuǎn)時(shí)將上一個(gè)頁面的一些信息也一并加入日志信息中饺律。由于在離開頁面時(shí)發(fā)送日志窃页,因此還需要考慮監(jiān)控客戶端的異常關(guān)閉狀態(tài)。
日志采集Vue實(shí)現(xiàn)
在下一節(jié)中將使用Vue進(jìn)行多端埋點(diǎn)并配合服務(wù)端實(shí)現(xiàn)日志采集。