awk是一個強大的文本分析工具,相對于grep的查找镀岛,sed的編輯
awk在其對數(shù)據(jù)分析并生成報告時弦牡,顯得尤為強大。
簡單來說awk就是把文件逐行的讀入漂羊,以空格為默認分隔符將每行切片驾锰,切開的部分再進行各種分析處理。
1走越、日均訪問量(日志已做好切割)
awk '{print $1}' access.log | wc -l
2椭豫、統(tǒng)計今日前五個訪問最多的ip地址
awk '{a[$1]++}END{for (i in a){print a[i]" "i;}}' access.log | sort -rn | head -n 5
3、統(tǒng)計當日前五個訪問最多的URL
awk '{a[$11]++}END{for (i in a){print a[i]" "i;}}' access.log | sort -rn | head -n 5
4旨指、統(tǒng)計當日的下載量以GB或MB形式表現(xiàn)出來兩次除以1024是兆赏酥,三次除以1024是G
awk '{sum+=$10}END{print sum}' access.log
5、統(tǒng)計出當天的http狀態(tài)碼
awk '{a[$9]++}END{for (i in a){print a[i]" "i;}}' access.log | sort -rn
6谆构、查看URL中的404(出問題的狀態(tài)碼文件不存在)狀態(tài)碼都有哪些網(wǎng)址
grep "\<404\>" access.log > 404
結(jié)束拉O_O