什么是網(wǎng)站日志 聘鳞?網(wǎng)站日志怎么分析


什么是網(wǎng)站日志

網(wǎng)站日志對于網(wǎng)站建設(shè)的作用相當于監(jiān)控攝像頭對我們的房間,它可以記錄下來滔蝉,這一段時間里面所有的訪客到我們家來訪問的這個記錄。

那我們一個網(wǎng)站每天有很多的用戶來訪問塔沃,同時每天還有很多的搜索引擎的蜘蛛來抓取日志蝠引,網(wǎng)站日志就能夠把所有訪客訪問的情況,它用什么瀏覽器蛀柴,什么操作系統(tǒng)螃概,什么時間點來訪問,訪問了哪些頁面鸽疾?日志能夠把這些數(shù)據(jù)全部記錄下來吊洼。

同時呢搜索引擎的蜘蛛過來抓取,它是百度的搜索引擎的蜘蛛制肮,還是google的還是360的冒窍?他們過來抓取,分別是什么時間點抓取的哪些頁面弄企,抓取的時候返回值是什么超燃?是正常打開還是打不開,所有這些數(shù)據(jù)都能夠記錄到一個叫做日志的一個文件里拘领。

網(wǎng)站日志怎么分析

1.網(wǎng)站日志下載及數(shù)據(jù)解讀

分析網(wǎng)站日志意乓,我們可以了解搜索引擎蜘蛛來到我們網(wǎng)站訪問的時候,它獲取到的信息是什么?網(wǎng)站跟搜索引擎之間它是什么樣的一個對話届良,那網(wǎng)站日志怎么進行分析笆凌,從哪里下載到這個數(shù)據(jù)?

通過FTP訪問網(wǎng)站的根目錄士葫∑蚨可以看到一個包含log的文件夾,這是存放日志的地方慢显。

如何查看網(wǎng)站日志

下載爪模、解壓、打開日志文件荚藻,日志文件內(nèi)容如:

61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html?HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)" (注:百度屋灌,這部分為本文添加)

203.208.60.43 - - [11/Jan/2009:04:02:43 +0800] "GET /sns/space-13563-do-friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" (注:Google)

202.160.178.21 - - [11/Jan/2009:04:02:44 +0800] "GET /sns/space.php?uid=323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)" (注:雅虎)

65.55.220.217 - - [11/Jan/2009:04:02:57 +0800] "GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)" (注:MSN)

65.55.109.46 - - [11/Jan/2009:04:02:57 +0800] "GET /sns/source/script_menu.js HTTP/1.0" 200 7219 "http:/sns/space-5755-do-blog-view-me.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)

大概就是上面這樣密密麻麻的代碼,但是這些代碼怎么理解呢应狱。比較好理解共郭,我們看一下這一串日志的內(nèi)容。前面這個ip代表今天來訪問我們的網(wǎng)站疾呻,它是什么ip除嘹?是用戶呢還是搜索引擎蜘蛛它都有一個ip,就是把他的ip記錄下來岸蜗。后面這個是一個時間點尉咕,什么時間來訪問我們的網(wǎng)站?然后呢get就是抓取散吵,抓取的哪一個文件呢?抓取了這個文件龙考。

就是我們的域名下面的www.xxx.com/BBS什么什么,把這個文件抓取回去矾睦。抓取回去之后呢200,這是http狀態(tài)碼炎功,它代表抓取成功枚冗,然后后面這個數(shù)字代表抓取了多少個字節(jié)?那200蛇损,然后這個8000多就是代表成功抓取了8000多個字節(jié)赁温,也就是我們一個網(wǎng)頁的大概的大小。那后面這一段就是代表蜘蛛淤齐,Baidu Spider就代表百度的蜘蛛股囊,那這一句就代表這個內(nèi)容是百度蜘蛛過來抓取,成功抓取了這么多個字節(jié)更啄。

好稚疹,那我們再看這個上面就可以看出這個是誰的蜘蛛,yahuspider這是雅虎的它是這個時間點祭务。然后這上面是誰的呢内狗?google的怪嫌,對吧?最下面看一下柳沙,里面沒有看到這是哪一個具體的搜索引擎岩灭。那它是誰?你看這個有MSIE6.0赂鲤。這就說明微軟的ie6.0噪径,這是一個用戶在來抓取和訪問的一個頁面。

所以日志它就這樣的一個文件数初,把每天每時每刻用戶和蜘蛛來抓取我們網(wǎng)站的所有的情況熄云,把它記錄下來。


2.分析網(wǎng)站日志工具是什么?

這個日志文件妙真,里面看起來密密麻麻的缴允,非常的費勁。一般人是沒法看明白的珍德。而且如果我們的網(wǎng)站的訪問量非常大的話练般,那這個日志往往會有幾十兆幾百兆甚至幾個G的這個大小。那我們在電腦上打開的時候锈候,有的時候電腦都會卡死掉薄料。那么就會用到網(wǎng)站日志分析工具。

一般分析網(wǎng)站日志我們用光年日志工具分析.關(guān)于這個工具的使用泵琳,大家可以看一下這篇https://jingyan.baidu.com/article/15622f240a2e6afdfcbea58a.html百度經(jīng)驗了解一下摄职,也可以去搜外的網(wǎng)站上看一下有免費的教程。

3.網(wǎng)站日志分析http狀態(tài)碼的解讀

那剛才我們看這個日志的時候获列,看到里面有一些剛才提到一個詞叫做http狀態(tài)碼谷市,有看到200或者404,這個叫做HTTP狀態(tài)碼击孩。

那這個http狀態(tài)碼迫悠,就是代表搜索引擎蜘蛛或者用戶來訪問我們網(wǎng)站的時候,它是什么樣的一個狀態(tài)巩梢?什么樣的一個情況创泄?200就代表成功抓取了,如果是404就代表過來抓取這個鏈接括蝠, 但是這個鏈接不存在鞠抑,所以它就返回404。那狀態(tài)碼一般有200或者404忌警,或者500等等這樣的幾個常見的數(shù)字搁拙,

我們不用了解特別多,只要大概的知道這么幾個數(shù)字代表什么?200代表成功抓取感混,404代表錯誤鏈接端幼,500代表服務(wù)器出問題了,大概了解這么幾個數(shù)據(jù)就可以了弧满,不需要把所有的都記住婆跑。那如果想要了解更多http狀態(tài)碼的這個知識的話,可以在百度上搜索一下庭呜,就可以查詢到所有這些代碼分別代表什么意思滑进?

什么樣的場景下需要網(wǎng)站日志分析

那么對于一個職業(yè)網(wǎng)站優(yōu)化人員日志分析的能力是必須要掌握的。那什么樣的場景下需要日志分析,下面我們看一下.

1.比如說我們創(chuàng)建了一個網(wǎng)站募谎,提交給搜索引擎扶关,后來很長時間沒看到搜索引擎的收錄,那這個時候我們就需要下載日志來分析一下数冬,看搜索引擎到底有沒有過來抓取节槐。

2.我們網(wǎng)站原來可能排名很好, 后來突然間發(fā)現(xiàn)異常了拐纱,那我們就需要把日志下載下來看一下搜索引擎這段時間過來抓取我們網(wǎng)站的時候铜异, 它是不是有一些異常情況。

3.網(wǎng)站如果被人攻擊或者入侵秸架,那也要下載一下網(wǎng)站日志來分析我們這個問題出在什么時間點揍庄,什么地方?

做網(wǎng)站日志分析东抹,我們采用的一個方法一般是對比法蚂子, 就是我們網(wǎng)站和排名都正常的情況的日志, 和現(xiàn)在出問題的時候的日志缭黔,拿出來進行對比食茎, 采用光年日志分析,把這個數(shù)據(jù)拿出來看一下试浙,看問題出在哪一個目錄董瞻,或者說哪一些頁面, 然后再去針對性的去研究一下田巴。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市挟秤,隨后出現(xiàn)的幾起案子壹哺,更是在濱河造成了極大的恐慌,老刑警劉巖艘刚,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件管宵,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機箩朴,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進店門岗喉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人炸庞,你說我怎么就攤上這事钱床。” “怎么了埠居?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵查牌,是天一觀的道長。 經(jīng)常有香客問我滥壕,道長纸颜,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任绎橘,我火速辦了婚禮胁孙,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘称鳞。我一直安慰自己涮较,他們只是感情好,可當我...
    茶點故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布胡岔。 她就那樣靜靜地躺著法希,像睡著了一般。 火紅的嫁衣襯著肌膚如雪靶瘸。 梳的紋絲不亂的頭發(fā)上苫亦,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天,我揣著相機與錄音怨咪,去河邊找鬼屋剑。 笑死,一個胖子當著我的面吹牛诗眨,可吹牛的內(nèi)容都是我干的唉匾。 我是一名探鬼主播,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼匠楚,長吁一口氣:“原來是場噩夢啊……” “哼巍膘!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起芋簿,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤峡懈,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后与斤,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體肪康,經(jīng)...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡荚恶,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了磷支。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片谒撼。...
    茶點故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖雾狈,靈堂內(nèi)的尸體忽然破棺而出廓潜,到底是詐尸還是另有隱情,我是刑警寧澤箍邮,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布茉帅,位于F島的核電站,受9級特大地震影響锭弊,放射性物質(zhì)發(fā)生泄漏堪澎。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一味滞、第九天 我趴在偏房一處隱蔽的房頂上張望樱蛤。 院中可真熱鬧,春花似錦剑鞍、人聲如沸昨凡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽便脊。三九已至,卻和暖如春光戈,著一層夾襖步出監(jiān)牢的瞬間哪痰,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工久妆, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留晌杰,地道東北人。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓筷弦,卻偏偏與公主長得像肋演,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子烂琴,可洞房花燭夜當晚...
    茶點故事閱讀 45,685評論 2 360

推薦閱讀更多精彩內(nèi)容

  • 中國互聯(lián)網(wǎng)用戶群已經(jīng)成為世界最大的互聯(lián)網(wǎng)群體爹殊。與此同時,中國互聯(lián)網(wǎng)網(wǎng)站的發(fā)展也歷經(jīng)了幾個階段奸绷,從單純的網(wǎng)絡(luò)媒體到現(xiàn)...
    零一間閱讀 4,271評論 1 41
  • SEO對大家來說并不是什么陌生的字眼边灭,究竟什么是SEO呢? SEO是提高網(wǎng)站瀏量而做的優(yōu)化手段健盒。舉個例子:當有一個...
    nini0705閱讀 2,295評論 0 12
  • 作為一個谷歌SEO的從業(yè)者绒瘦,相信你應(yīng)該經(jīng)常碰到網(wǎng)站無故的流量下跌或者上漲。是不是每次都在猜測說:可能是谷歌算法更...
    小剛談外貿(mào)閱讀 326評論 0 0
  • 韋教授說的“油”到底是什么呢? 積極的品質(zhì):包含了智慧和知識父虑、勇氣该酗、仁愛、修養(yǎng)士嚎、卓越呜魄、正義等。積極的心理品質(zhì)莱衩,就像...
    龍?zhí)?68南星宇閱讀 375評論 1 1
  • 我和哥哥決定離家出走時爵嗅,是盛夏的午后。 那時笨蚁,稻田涌來一陣陣熱浪睹晒,蟬扯著嗓子吼翻了天。 田野邊上括细,有一座小小的青瓦...
    知筆閱讀 531評論 2 10