- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
解百度蜘蛛的爬行规律从而更好的改善收录情况也是必须要掌握的。
很多网站目前使用的都是虚拟空间,都能够提供日志。从虚拟主机后台登录,点击下载访问日志。
日志是指在网站根目录下的logfiles或W3SVC文件夹里面日期.txt文本文件
开始几行:
#Software: Microsoft Log Parser
#Version: 1.0
#Date: 2008-09-30 23:57:04
#Fields: LogFilename RecordNumber ComputerName SiteID DateTime ClientIpAddress ServerIpAddress ServerPort Method ProtocolVersion ProtocolStatus SubStatus TimeTaken BytesSent BytesReceived Win32Status UriStem UriQuery UserName
说明用的软件,版本,创建日期,字段说明
举例说明:
d:\iislog\W3SVC\ra121105.ibl 3855 USER-C5B039C18F2012-11-05 00:09:43 20 2 80 GET HTTP/1.1 200 0 1468 7507 294 0 /index.php/seo_boke/130/ - -
分别表示:
日志文件名:\iislog\W3SVC\ra121105.ibl
记录数:3855
计算机名称:USER-C5B039C18F
站点ID访问日期:22012-11-05 00:09:43
客户端IP: 20 (客户端IP很重要,有的IP是搜索引擎爬虫的IP)
服务器IP:2
服务端口:80
模式:GET
HTTP协议版本:HTTP/1.1
协议返回状态:200 (这个很重要,200是成功的应答码)
记录的内容大小:35074 267
访问页面: /index.php/seo_boke/130/ (这点是站长分析和以后努力的方向)
都是这种格式的日志如何去分析了,一个一个看的头都大了。
现在网上很多网站日志分析工具,其实你只要打开日志“CRTL+F”查找几个你最关心的IP就OK了。
各类蜘蛛IP收集,不一定完全准确。
序号 IP 注释
1 202.106.186.* 163蜘蛛
2 202.108.36.* 163蜘蛛
3 202.108.44.* 163蜘蛛
4 202.108.45.* 163蜘蛛
5 202.108.5.* 163蜘蛛
6 202.108.9.* 163蜘蛛
7 220.181.12.* 163蜘蛛
8 220.181.13.* 163蜘蛛
9 220.181.14.* 163蜘蛛
10 220.181.15.* 163蜘蛛
11 220.181.28.* 163蜘蛛
12 220.181.31.* 163蜘蛛
13 222.185.245.* 163蜘蛛
14 202.165.100.* 3721蜘蛛
15 220.181.19.* 百度蜘蛛
16 159.226.50.* 百度蜘蛛
17 202.108.11.* 百度蜘蛛
18 202.108.22.* 百度蜘蛛
19 202.108.23.* 百度蜘蛛
20 202.108.249.* 百度蜘蛛
21 202.108.250.* 百度蜘蛛
22 61.135.145.* 百度蜘蛛
23 61.135.146.* 百度蜘蛛
24 64.124.85.*
25 61.151.243.* china蜘蛛
26 202.165.96.* .tw
27 216.239.33.* google蜘蛛
28 216.239.35.* google蜘蛛
29 216.239.37.* google蜘蛛
30 216.239.39.* google蜘蛛
31 216.239.51.* google蜘蛛
32 216.239.53.* google蜘蛛
33 216.239.55.* google蜘蛛
34 216.239.57.* google蜘蛛
35 216.239.59.* google蜘蛛
36 64.233.161.* google蜘蛛
37 64.233.189.* google蜘蛛
38 66.102.11.* google蜘蛛
39 66.102.7.* google蜘蛛
40 66.102.9.* google蜘蛛
41 66.249.64.* google蜘蛛
42 66.249.65.* google蜘蛛
43 66.249.66.* google蜘蛛
44 66.249.71.* google蜘蛛
45 66.249.72.*
文档评论(0)