Tags: .

  在seo的过程中查看IIS日志是一件很重要的事,特别是当页面做了比较大的改动时,通过日志的检测,可以发现很多很有趣的问题。现在空间都提供日志查询的功能,而日志一般存放在网站根目录下的log、wwwlog、logfiles等类似的目录下,通过下载类似的文件解压了就可以用记事本就查看了。

  下面我截取一段代码进行分析。

  2010-07-24 02:20:57 W3SVC133 221.231.137.66 GET http://zuyupen5.com/Index.html – 80 – 123.125.66.111 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 64 0

  2010-07-24 02:20:57 蜘蛛的访问时间

  221.231.137.66 访问的IP地址

  W3SVC133 机器码

  GET 请求方式

  /Index.html 请求的url

  80 服务器端口号

  123.125.66.111 服务器的IP

  baiduspider 百度蜘蛛

  200 0 64 0 200表示请求成功, 64意味着百度对于该页面的爬行并未完全读取完毕,在爬行的过程中放弃了,属于一个错误代码,而最后一个数据为0,则表示抓取的网页大小字节为0。

  200 0 64 状态码的构成是:sc-status(协议状态,200在这里指连接成功) sc-substatus(协议子状态) sc-win32-status(Win32状态码,64是指定的网络名不可用

  看第二个列子:

  2010-07-24 12:37:39 W3SVC133 221.231.137.66 GET http://zero07.cn/501.html – 80 – 203.208.60.79 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 200 0 0 6503

  /501.html 请求的url

  compatible 指兼容性

  Googlebot 谷歌机器人

  200 0 0 6503 请求成功并下载了6503字节数据。

  一般我们只要看百度和google的蜘蛛就可以,其他的方法一样,就不在举例了。下面我列举下常见的HTTP状态码:

  1xx(临时响应);2xx(成功);3xx(已重定向);4xx(请求错误);5xx(服务器错误);

  200 – 服务器成功返回网页

  301 – 永久性资源重定向

  302 – 暂时性资源重定向

  304 – 上次GET后,页面为发生变化

  403 – 服务器已经请求,但还没执行

  404 – 请求错误或请求失败

  505 – HTTP 版本不受支持

  不用太多,以上的HTTP状态码能看懂就好了,其他的状态码比较不常见,所以不要记了,用到的时候自己在搜索引擎里找下就可以了。


评论

评论已关闭.

无觅相关文章插件