作者:今日頭條技術(shù)
鏈接:https://techblog.toutiao.com/2018/06/05/ru-he-jing-que-tong-ji-ye-mian-ting-liu-shi-chang/
1汰现、背景
頁面停留時間(Time on Page)簡稱 Tp逊笆,是網(wǎng)站分析中很常見的一個指標(biāo)欺矫,用于反映用戶在某些頁面上停留時間的長短,傳統(tǒng)的Tp統(tǒng)計方法會存在一定的統(tǒng)計盲區(qū)虾标,比如無法監(jiān)控單頁應(yīng)用,沒有考慮用戶切換Tab多律、最小化窗口等操作場景刑巧。基于上述背景逆皮,重新調(diào)研和實現(xiàn)了精確統(tǒng)計頁面停留時長的方案宅粥,需要 兼容單頁應(yīng)用和多頁應(yīng)用,并且不耦合或入侵業(yè)務(wù)代碼电谣。
2秽梅、分析
我們可以把一個頁面生命周期抽象為三個動作:「進(jìn)入」抹蚀、「活躍狀態(tài)切換」、「離開」
如下圖企垦,計算頁面停留時長既如何監(jiān)控這三個動作环壤,然后在對應(yīng)觸發(fā)的事件中記錄時間戳,比如要統(tǒng)計活躍停留時長就把 active 區(qū)間相加即可钞诡,要統(tǒng)計總時長既 tn -t0 郑现。
2.1 如何監(jiān)聽頁面的進(jìn)入和離開?
對于常規(guī)頁面的 首次加載荧降、頁面關(guān)閉接箫、刷新 等操作都可以通過 window.onload 和 window.onbeforeunload 事件來監(jiān)聽頁面進(jìn)入和離開,瀏覽器前進(jìn)后退可以通過 pageshow 和 pagehide 處理朵诫。
load / beforeunload
pageshow / pagehide
對于單頁應(yīng)用內(nèi)部的跳轉(zhuǎn)可以轉(zhuǎn)化為兩個問題:
監(jiān)聽路由變化
判斷變化的URL是否為不同頁面 辛友。
2.1.1 監(jiān)聽路由變化
目前主流的單頁應(yīng)用大部分都是基于 browserHistory (history api) 或者 hashHistory 來做路由處理,我們可以通過監(jiān)聽路由變化來判斷頁面是否有可能切換拗窃。注意是有可能切換,因為URL發(fā)生變化不代表頁面一定切換泌辫,具體的路由配置是由業(yè)務(wù)決定的(既URL和頁面的匹配規(guī)則)随夸。
browserHistory
路由的變化本質(zhì)都會調(diào)用 History.pushState() 或 History.replaceState() ,能監(jiān)聽到這兩個事件就能知道震放。通過 popstate 事件能解決一半問題宾毒,因為 popstate 只會在瀏覽器前進(jìn)后退的時候觸發(fā),當(dāng)調(diào)用 history.pushState() or history.replaceState() 的時候并不會觸發(fā)殿遂。
The popstate event is fired when the active history entry changes. If the history entry being activated was created by a call to history.pushState() or was affected by a call to history.replaceState(), the popstate event’s state property contains a copy of the history entry’s state object.
Note that just calling history.pushState() or history.replaceState() won’t trigger apopstateevent. The popstate event will be triggered by doing a browser action such as a click on the back or forward button (or calling诈铛。history.back() or history.forward() in JavaScript).
這里需要通過猴子補丁(Monkeypatch)解決,運行時重寫 history.pushState 和 history.replaceState 方法:
let _wr = function (type) {
let orig = window.history[type]
return function () {
let rv = orig.apply(this, arguments)
let e = new Event(type.toLowerCase())
e.arguments = arguments
window.dispatchEvent(e)
return rv
}}
window.history.pushState = _wr('pushState')
window.history.replaceState = _wr('replaceState')
window.addEventListener('pushstate', function (event) {})
window.addEventListener('replacestate', function (event) {})
hashHistory
hashHistory 的實現(xiàn)是基于 hash 的變化墨礁,hash 的變化可以通過 hashchange 來監(jiān)聽
2.1.2 判斷URL是否為不同頁面
方案1: 客戶端定義
通過業(yè)務(wù)方在初始化的時候配置頁面規(guī)則幢竹,然后JS通過URL匹配不同的規(guī)則來區(qū)分不同的頁面,這種方案在客戶端數(shù)據(jù)上報的時候就已經(jīng)明確了不同的頁面恩静,偽代碼:
new Tracer({
rules: [
{ path: '/index' },
{ path: '/detail/:id' },
{ path: '/user', query: {tab: 'profile'} }
])
方案2: 數(shù)據(jù)分析平臺定義
假設(shè)我們最終上報后有一個數(shù)據(jù)分析平臺來展現(xiàn)焕毫,我們可以在類似數(shù)據(jù)平臺來配置頁面規(guī)則,這樣在客戶端實現(xiàn)的代碼邏輯就不需要區(qū)分頁面驶乾,而是每次URL發(fā)生變化就將數(shù)據(jù)上報邑飒,最終通過數(shù)據(jù)平臺配置的頁面URL規(guī)則來求和、過濾數(shù)據(jù)等级乐。
當(dāng)數(shù)據(jù)展現(xiàn)平臺不支持配置URL規(guī)則來區(qū)分頁面的時候疙咸,可以采用方案1;當(dāng)有數(shù)據(jù)平臺支持的時候采用方案2更合理风科;
2.1.3 對于頁面進(jìn)入和離開相關(guān)事件整理
2.2 如何監(jiān)聽頁面活躍狀態(tài)切換撒轮?
可以通過 Page Visibility API 以及在 window 上聲明 onblur/onfocus 事件來處理乞旦。
2.2.1 Page Visibility API
一個網(wǎng)頁的可見狀態(tài)可以通過 Page Visibility API 獲取,比如當(dāng)用戶 切換瀏覽器Tab腔召、最小化窗口杆查、電腦睡眠 的時候,系統(tǒng)API會派發(fā)一個當(dāng)前頁面可見狀態(tài)變化的 visibilitychange 事件臀蛛,然后在事件綁定函數(shù)中通過 document.hidden 或者 document.visibilityState 讀取當(dāng)前狀態(tài)亲桦。
document.addEventListener('visibilitychange', function (event) {
console.log(document.hidden, document.visibilityState)})
2.2.2 onblur/onfocus
可以通過 Page Visibility API 以及在 window 上聲明 onblur/onfocus 事件來處理。對于PC端來說浊仆,除了監(jiān)聽上述相關(guān)事件外客峭,還可以考慮監(jiān)聽鼠標(biāo)行為,比如當(dāng)一定時間內(nèi)鼠標(biāo)沒有操作則認(rèn)為用戶處于非活躍狀態(tài)抡柿。
2.3 什么時機上報數(shù)據(jù)舔琅?
2.3.1 頁面離開時上報
對于頁面刷新或者關(guān)閉窗口觸發(fā)的操作可能會造成數(shù)據(jù)丟失
2.3.2 下次打開頁面時上報
會丟失歷史訪問記錄中的最后一個頁面數(shù)據(jù)
目前采用的方案2,對于單頁內(nèi)部跳轉(zhuǎn)是即時上報洲劣,對于單頁/多頁應(yīng)用觸發(fā) window.onbeforeunload 事件的時候會把當(dāng)前頁面數(shù)據(jù)暫存在 localStorage 中备蚓,當(dāng)用戶下次進(jìn)入頁面的時候會把暫存數(shù)據(jù)上報。有個細(xì)節(jié)問題囱稽,如果用戶下次打開頁面是在第二天郊尝,對于統(tǒng)計當(dāng)天的活躍時長會有一定的誤差,所以在數(shù)據(jù)上報的同時會把該條數(shù)據(jù)的頁面進(jìn)入時間/離開時間帶上战惊。
3流昏、設(shè)計
3.1 UML類關(guān)系圖
Tracer
核心類,用來實例化一個監(jiān)控吞获,對原生事件和自定義事件的封裝况凉,監(jiān)聽 enter activechange exit 事件來操作當(dāng)前 Page 實例。
P.S. 取名來自暴雪旗下游戲守望先鋒英雄獵空(Tracer)各拷,直譯為:追蹤者刁绒。
Page
頁面的抽象類,用來實例化一個頁面烤黍,封裝了 enter exit active inactive 等操作膛锭,內(nèi)部通過 state 屬性來維護(hù)當(dāng)前頁面狀態(tài)。
3.2 事件派發(fā)關(guān)系圖
4蚊荣、兼容性
Desktop
Mobile
5初狰、思考
對于頁面停留時長的定義可能在不同場景會有差異,比如內(nèi)部業(yè)務(wù)系統(tǒng)或者OA系統(tǒng)互例,產(chǎn)品可能更關(guān)心用戶在頁面的活躍時長奢入;而對于資訊類型的產(chǎn)品,頁面可見時長會更有價值。單一的數(shù)據(jù)對業(yè)務(wù)分析是有限的腥光,所以在具體的代碼實過程中我們會把停留時長分三個指標(biāo)关顷,這樣能更好的幫助產(chǎn)品/運營分析。
active 頁面活躍時長
visible 頁面可見時長 //僅支持Desktop
duration 頁面總停留時長