如何分析accesslog

  • accesslog是apache或者nginx等web service生成的日志,對應于網頁的每一次請求斑唬,包含有大量的信息市埋,分析好accesslog可以對網站的運行情況有一個整體的認識,在出現問題的情況下恕刘,也可以通過對accesslog的數據分析結果缤谎,大致定位出問題所在。負責網站的運維褐着、架構相關的工程師需要對accesslog非常熟悉坷澡,策略效果相關的工程師也可以通過對accesslog的分析,得到用戶的行為數據含蓉。
  • 同時分析accesslog的日志也可以估算出用戶訪問量频敛,高峰訪問時間段,區(qū)域訪問數據等馅扣,為性能測試和服務器擴展提供很好的數據參考

accesslog的組成

  • 一條典型的accesslog
101.226.166.254 - - [21/Oct/2013:20:34:28 +0800] "
GET /movie_cat.php?year=2013 HTTP/1.1" 
200 5209 "http://www.baidu.com" 
"Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; 
Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; 
.NET CLR 3.0.30729; Media Center PC 6.0; MDDR; .NET4.0C; .NET4.0E; .NET CLR 1.1.4322; Tablet PC 2.0); 
360Spider"
下面我們來說說這一行記錄的意思:
  • 101.226.166.254:(用戶IP)
  • [21/Oct/2013:20:34:28 +0800]:(訪問時間)
  • GET:http請求方式斟赚,有GET和POST兩種
  • /movie_cat.php?year=2013:當前訪問的網頁是動態(tài)網頁,movie_cat.php即請求的后臺接口差油,year=2013為具體接口的參數
  • 200:服務狀態(tài)拗军,200表示正常,常見的還有厌殉,301永久重定向食绿、4XX表示請求出錯、5XX服務器內部錯誤
  • 5209:傳送字節(jié)數為5209公罕,單位為byte
  • "http://www.baidu.com":refer:即當前頁面的上一個網頁
  • "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; MDDR; .NET4.0C; .NET4.0E; .NET CLR 1.1.4322; Tablet PC 2.0); 360Spider": agent字段:通常用來記錄操作系統器紧、瀏覽器版本渊迁、瀏覽器內核等信息
數據統計及分析
  • 接口請求頻次:分接口敦跌、按天和小時分別統計。了解網站的運行情況膏潮,每個接口的請求頻次罐柳,用戶的行為習慣等掌腰。
  • 響應時間:一天的平均響應時間、分接口的平均響應時間张吉、分接口按小時統計平均響應時間齿梁。響應時間過長的請求可能說明服務性能上存在缺陷,就需要對相應的接口進行優(yōu)化了。
  • 異常分析:狀態(tài)碼非200的請求勺择、響應時間超過一定域值的請求创南。大量的404不利用SEO,應該盡量避免省核。
  • 具體參數統計:對于動態(tài)頁面稿辙,一個接口通常帶有多個參數,其中某個或者某幾個參數特別重要气忠,可以進一步細化邻储,產生接口對應的參數的統計結果
  • ip來源的統計:可以統計出網頁訪問的ip來源,進一步通過ip定位旧噪,可以產生網站按地域的訪問情況吨娜,同時對ip的統計舌菜,也可以對一些可能的攻擊或者黑客行為進行識別。
  • 蜘蛛抓取情況分析:搜索引擎的蜘蛛通常會設置agent字段日月,通過分析agent字段缤骨,可以得到網站一天被百度爱咬、谷歌等搜索引擎抓取的次數,以及哪些網頁經常被spider爬過绊起,這也是SEO的基礎精拟。

accesslog的shell 腳本分析

  • 查看80端口的tcp連接
netstat -tan | grep "ESTABLISHED" | grep ":80" | wc -l
  • 當前WEB服務器中聯接次數最多的ip地址:
netstat -ntu |awk '{print $5}' |sort | uniq -c| sort -n -r
231 ::ffff:127.0.0.1:8095
23 ::ffff:192.168.50.201:5432
2 ::ffff:192.168.50.203:80
1 servers)
1 ::ffff:192.168.50.56:43314
1 ::ffff:192.168.50.21:2996
1 ::ffff:192.168.50.21:2989
1 ::ffff:192.168.50.200:8060
1 ::ffff:192.168.50.12:1300
1 ::ffff:192.168.50.12:1299
1 ::ffff:192.168.50.12:1298
1 ::ffff:127.0.0.1:57933
1 Address
1 192.168.50.41:65310
1 192.168.50.41:64949
1 192.168.50.41:49653
  • 查看日志中訪問次數最多的前10個IP
cat access_log |cut -d ' ' -f 1 |sort |uniq -c | sort -nr | awk '{print $0 }' | head -n 10 |less

14085 121.207.252.122
13753 218.66.36.119
11069 220.162.237.6
1188 59.63.158.118
1025 ::1
728 220.231.141.28
655 114.80.126.139
397 117.25.55.100
374 222.76.112.211
348 120.6.214.70
  • 查看日志中出現100次以上的IP
cat access_log |cut -d ' ' -f 1 |sort |uniq -c | awk '{if ($1 > 100) print $0}'|sort -nr |less

14085 121.207.252.122
13753 218.66.36.119
11069 220.162.237.6
1188 59.63.158.118
1025 ::1
728 220.231.141.28
655 114.80.126.139
397 117.25.55.100
374 222.76.112.211
348 120.6.214.70
252 58.211.82.150
252 159.226.126.21
206 121.204.57.94
192 59.61.111.58
186 218.85.73.40
145 221.231.139.30
134 121.14.148.220
123 222.246.128.220
122 61.147.123.46
119 121.204.105.58
107 116.9.75.237
105 118.123.5.173
.....
  • 查看某一天的訪問量
cat access_log|grep '12/Nov/2012'|grep "******.htm"|wc|awk '{print $1}'|uniq 
  • 查看訪問時間超過30ms的url列表
cat access_log|awk ‘($NF > 30){print $7}’|sort -n|uniq -c|sort -nr|head -20   
  • 列出響應時間超過60m的url列表并統計出現次數
cat access_log |awk ‘($NF > 60 && $7~/\.php/){print $7}’|sort -n|uniq -c|sort -nr|head -100   
  • 統計/index.[html]頁面的訪問uv
grep "/index.html" access.log | cut –d “ ” –f 4| sort | uniq | wc –l
  • PV
grep "/index.html" access.log  | wc -l 

更多參考https://www.cnblogs.com/centos2017/p/7896700.html

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市笋鄙,隨后出現的幾起案子师枣,更是在濱河造成了極大的恐慌,老刑警劉巖萧落,帶你破解...
    沈念sama閱讀 218,451評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異陨倡,居然都是意外死亡,警方通過查閱死者的電腦和手機许布,發(fā)現死者居然都...
    沈念sama閱讀 93,172評論 3 394
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蜜唾,“玉大人庶艾,你說我怎么就攤上這事解阅÷渲瘢” “怎么了货抄?”我有些...
    開封第一講書人閱讀 164,782評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長积暖。 經常有香客問我,道長夺刑,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,709評論 1 294
  • 正文 為了忘掉前任遍愿,我火速辦了婚禮耘斩,結果婚禮上,老公的妹妹穿的比我還像新娘括授。我一直安慰自己,他們只是感情好荚虚,可當我...
    茶點故事閱讀 67,733評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著梯澜,像睡著了一般。 火紅的嫁衣襯著肌膚如雪腊徙。 梳的紋絲不亂的頭發(fā)上檬某,一...
    開封第一講書人閱讀 51,578評論 1 305
  • 那天,我揣著相機與錄音恢恼,去河邊找鬼。 笑死,一個胖子當著我的面吹牛漓踢,可吹牛的內容都是我干的牵署。 我是一名探鬼主播,決...
    沈念sama閱讀 40,320評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼喧半,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了挺据?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,241評論 0 276
  • 序言:老撾萬榮一對情侶失蹤暇检,失蹤者是張志新(化名)和其女友劉穎婉称,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體王暗,經...
    沈念sama閱讀 45,686評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,878評論 3 336
  • 正文 我和宋清朗相戀三年蜜暑,在試婚紗的時候發(fā)現自己被綠了策肝。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片隐绵。...
    茶點故事閱讀 39,992評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖依许,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情峭跳,我是刑警寧澤,帶...
    沈念sama閱讀 35,715評論 5 346
  • 正文 年R本政府宣布悬襟,位于F島的核電站拯刁,受9級特大地震影響脊岳,放射性物質發(fā)生泄漏。R本人自食惡果不足惜割捅,卻給世界環(huán)境...
    茶點故事閱讀 41,336評論 3 330
  • 文/蒙蒙 一亿驾、第九天 我趴在偏房一處隱蔽的房頂上張望嘹黔。 院中可真熱鬧莫瞬,春花似錦、人聲如沸乏悄。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,912評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至筐付,卻和暖如春阻肿,著一層夾襖步出監(jiān)牢的瞬間瓦戚,已是汗流浹背丛塌。 一陣腳步聲響...
    開封第一講書人閱讀 33,040評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留赴邻,地道東北人。 一個月前我還...
    沈念sama閱讀 48,173評論 3 370
  • 正文 我出身青樓奸焙,卻偏偏與公主長得像彤敛,于是被迫代替她去往敵國和親与帆。 傳聞我的和親對象是個殘疾皇子墨榄,可洞房花燭夜當晚...
    茶點故事閱讀 44,947評論 2 355

推薦閱讀更多精彩內容

  • Spring Cloud為開發(fā)人員提供了快速構建分布式系統中一些常見模式的工具(例如配置管理渠概,服務發(fā)現茶凳,斷路器,智...
    卡卡羅2017閱讀 134,657評論 18 139
  • Http協議詳解 標簽(空格分隔): Linux 聲明:本片文章非原創(chuàng)筒狠,內容來源于博客園作者MIN飛翔的HTTP協...
    Sivin閱讀 5,223評論 3 82
  • 前言:最近發(fā)現自己在網絡相關這一塊基礎很是欠缺箱沦,所以準備花時間了解一下,本文主要是講http協議的一些基礎谓形,和一些...
    justCode_閱讀 2,094評論 0 23
  • 昨日下午在群里,看著姐妹們聊了很多童太,先從時下最時髦的話題——二胎開聊米辐,聊著聊著聊到了懷孕、聊到性翘贮,繼而聊到婚姻,再...
    稻草人CX閱讀 492評論 2 6
  • 我也不清楚這樣的生活幾年了狸页,我不去記不是因為不在意喜歡你的日子扯再,而是想過得糊涂芍耘,好怕又是嫌太長了熄阻,更覺得沒有機會齿穗。...
    孤鳥差魚閱讀 1,256評論 0 2