日志采集

一.日志采集兩大體系

1)Aplus.JS是Web端(基于瀏覽器)日志采集技術(shù)方案

2)UserTrack是APP端(無線客戶端)日志采集技術(shù)方案


1.1瀏覽器頁面日志采集

(1)頁面瀏覽日志采集,PV,UV.

(2)頁面交互日志采集


頁面日志采集思路:

在HTML文檔內(nèi)的適當位置增加一個日志采集節(jié)點肥哎,當瀏覽器解析到這個節(jié)點時睛蛛,將自動觸發(fā)一個特定的http請求到日志采集服務壹甥。

所以阿里的頁面日志采集流程如下:

1)客戶端日志采集驰后,一般由一小段被植入頁面HTML文檔內(nèi)的JSP腳本執(zhí)行翰蠢。

2)客戶端日志發(fā)送状原,采集腳本執(zhí)行時菩收,會向日志服務器發(fā)起一個日志請求拨齐,將采集的數(shù)據(jù)發(fā)送給日志服務器驰贷。

3)服務器端日志收集盛嘿。服務器接收后立馬回應瀏覽器,并將收集內(nèi)容放入緩沖區(qū)異步處理饱苟。

4)服務器端日志解析文檔孩擂。


2.2?頁面交互日志采集

“黃金令箭”

1)業(yè)務方在"黃金令箭"的元數(shù)據(jù)管理界面依次注冊需要采集交互日志的業(yè)務,具體的業(yè)務場景以及場景下的具體交互采集點箱熬,注冊后生成與之對應的交互日志采集代碼模板类垦。

2)業(yè)務方將交互日志采集代碼植入目標頁面,并將采集代碼與需要監(jiān)測的交互行為做綁定城须。

3)當用戶在頁面上產(chǎn)生指定行為時蚤认,采集代碼和正常的業(yè)務互動響應代碼一起被觸發(fā)和執(zhí)行。

4)采集代碼在采集動作完成后將對應的日志通過HTTP協(xié)議發(fā)送到日志服務器糕伐,日志服務器接收到日志后砰琢,對于保存在HTTP請求參數(shù)部分的自定義數(shù)據(jù),即用戶上傳的數(shù)據(jù),原則上不做解析處理,只做簡單的轉(zhuǎn)儲陪汽。

2.3?頁面日志的服務器端清洗和預處理

(1)識別流量攻擊训唱,網(wǎng)絡爬蟲,流量作弊挚冤。

(2)數(shù)據(jù)缺項補正况增。

(3)無效數(shù)據(jù)剔除。

(4)日志隔離分發(fā)训挡。


2.4無線客戶端的日志采集

無線客戶端的日志采集采用采集SDK來完成澳骤,使用名為UserTrack的SDK來進行無線客戶端的日志采集。UT把時間分為幾類澜薄,常用包括頁面事件和控件點擊事件为肮。

2.5日志采集的挑戰(zhàn)

1.日志分流與定制處理

針對短時間的流量熱點爆發(fā),使得日志服務器端采用集中統(tǒng)一的解析處理方案變得不可能肤京,要求在日志解析和處理過程中必須考慮業(yè)務分流颊艳,日志優(yōu)先級控制以及根據(jù)業(yè)務特定定制處理。

阿里PV日志的請求位置URL是隨著頁面所在業(yè)務類型的不同而變化的蟆沫。通過盡可能靠前地布置路由差異籽暇,就可以盡可能早地進行分流温治,降低日志處理過程中的分支判斷消耗饭庞,并作為后續(xù)的計算資源調(diào)配的前提,提高資源利用效率熬荆。

2.采集和計算一體化設計

對于PV日志的問題(大規(guī)模URL正則)采用用戶可直觀感知的SPM規(guī)范和SPM元數(shù)據(jù)中心舟山。

3.大促銷保障

整個鏈路從端上埋點采集->日志服務器的收集->數(shù)據(jù)傳輸->日志實時解析->實時分析.

整個鏈路需要考慮服務器的收集能力(如峰值qps),數(shù)據(jù)傳輸能力卤恳,實時解析的吞吐量累盗,實時業(yè)務的分析能力。

所以首先?我們要實現(xiàn)服務器端推送配置到客戶端突琳,且做到高到達率若债;其次對日志進行分流,結(jié)合日志的重要程序及各類日志的大小拆融,實現(xiàn)了日志服務器端的拆分蠢琳,在實時處理上也要做優(yōu)化提高吞吐量。結(jié)合實時處理能力镜豹,評估峰值數(shù)據(jù)量傲须,在高峰期通過服務器端推送配置的方式對非重要日志進行適當?shù)南蘖鳎e峰后逐步恢復趟脂,還可以采用延時上報泰讽,部分采樣。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市已卸,隨后出現(xiàn)的幾起案子佛玄,更是在濱河造成了極大的恐慌,老刑警劉巖累澡,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件翎嫡,死亡現(xiàn)場離奇詭異,居然都是意外死亡永乌,警方通過查閱死者的電腦和手機惑申,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來翅雏,“玉大人圈驼,你說我怎么就攤上這事⊥福” “怎么了绩脆?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長橄抹。 經(jīng)常有香客問我靴迫,道長,這世上最難降的妖魔是什么楼誓? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任玉锌,我火速辦了婚禮,結(jié)果婚禮上疟羹,老公的妹妹穿的比我還像新娘主守。我一直安慰自己,他們只是感情好榄融,可當我...
    茶點故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布参淫。 她就那樣靜靜地躺著,像睡著了一般愧杯。 火紅的嫁衣襯著肌膚如雪涎才。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天力九,我揣著相機與錄音耍铜,去河邊找鬼。 笑死畏邢,一個胖子當著我的面吹牛业扒,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播舒萎,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼程储,長吁一口氣:“原來是場噩夢啊……” “哼蹭沛!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起章鲤,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤摊灭,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后败徊,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體帚呼,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年皱蹦,在試婚紗的時候發(fā)現(xiàn)自己被綠了煤杀。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡沪哺,死狀恐怖沈自,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情辜妓,我是刑警寧澤枯途,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站籍滴,受9級特大地震影響酪夷,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜孽惰,卻給世界環(huán)境...
    茶點故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一晚岭、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧灰瞻,春花似錦腥例、人聲如沸辅甥。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽璃弄。三九已至要销,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間夏块,已是汗流浹背疏咐。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留脐供,地道東北人浑塞。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像政己,于是被迫代替她去往敵國和親酌壕。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內(nèi)容