- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
深入剖析搜索引擎蜘蛛工作对SEO的提升 seo分析 什么是搜索引擎蜘蛛 搜索引擎蜘蛛是搜索引擎自身的一个程序,它的作用是对网站的网页进行访问,抓取网页的文字、图片等信息,建立一个数据库,反馈给搜索引擎,当用户搜索的时候,搜索引擎就会把收集到的信息过滤,通过复杂的排序算法将它认为对用户最有用的信息呈现出来。 优化网站可能会涉及到几个蜘蛛抓取相关的概念: 爬取率:既定时间内网站被蜘蛛获取的页面数量。 爬取频率:搜索引擎多久对网站或单个网页发起一次新的爬行。 爬取深度:一个蜘蛛从开始位置可以点击到多深。 爬取饱和度:唯一页面被获取的数量。 爬取优先:那些页面最常作为蜘蛛的入口。 爬取冗余度:网站一般被多少蜘蛛同时爬取。 .爬取mapping:蜘蛛爬取路径还原。 如何进行这些蜘蛛概念的分析,使其为我们网站服务 分析爬取率验证模糊经验理论 提高爬取频率提高提升收录 研究蜘蛛爬取习惯并优化习惯 分析爬取率验证模糊经验理论一 分析搜索引擎蜘蛛首先会考虑的一个参数就是爬取量,一般我们考虑蜘蛛爬取量的单位是以一天为一个时间段,那么我们很多时候考虑的就是一天时间内的爬取率。当然,你也可以根据自己的需要调整时间段的限定,如划分到每个小时,来充分了解各个时间段的蜘蛛的抓取情况,然后针对性的做一些调整。其中我觉得一类分析可以给我们带来很多的成就感,即对于一些模糊经验理论的验证。 分析爬取率验证模糊经验理论二 例如我们经常听到这样一句话:“做网站内容的时候要定时定量的更新,培养搜索引擎蜘蛛的抓取习惯,随意的改变更新时间,可能影响蜘蛛对网站内容的抓取”,这句话到底正确不正确呢?这里就可以运用网站的日志进行分析搜索引擎蜘蛛的抓取率来解释。如果我们要分析一个站,比如51贷贷网,具体的操作方法就是对一个月内每天每个小时段的蜘蛛抓取情况进行拆分统计(注意数据样本选取的合理性),然后对每个时间段进行分析,对比就可以发现哪个时间段搜索引擎蜘蛛来的比较勤,再和自己做内容更新的情况进行一个对比就可以很快的得出结论。 提高爬取频率提高提升收录一 搜索引擎蜘蛛的爬取频率很多时候是由网站内容质量决定的,因为只有网站有更新鲜更好的内容,才能更吸引蜘蛛来反复抓取,例如很多大型的内容型网站,每天更新大量的内容,这样就把蜘蛛一直留在了站内,页面抓取的频率自然会提高。而提升了爬取频率,对于页面中内容和链接的更新就会被搜索引擎蜘蛛更快的抓取到,能够更充分的收录网站的页面内容信息。 提高爬取频率提高提升收录二 很多朋友都说自己的网站快照不更新,或者滞后好几天,个人觉得也是蜘蛛抓取的频率不够造成的。要想快照更新快,特别是新站,前期一定要多做内容建设,内容页面如果没有内容的更新,一般蜘蛛可能不会抓取收录,或者抓取了但是不返回数据,当下次用户搜索时候可能就会调用搜索引擎数据库中存储的一些数据。 研究蜘蛛爬取习惯并优化习惯一 至于后面谈到搜索引擎蜘蛛的爬取深度,饱和度,优先爬取,冗余度以及爬取路径都是对于蜘蛛爬取习惯和爬取策略的研究,因为自己也没有针对性的去实践分析,所以只能在理论上谈谈自己的一些想法。 研究蜘蛛爬取习惯并优化习惯二 搜索引擎蜘蛛的爬取深度如果不够深,主要是因为网站在结构布局的时候没有考虑到这蜘蛛是否能够充分抓取或者是否按照一层一层的抓取,这里就涉及到链接入口的布局,也就会考虑到蜘蛛爬取优先的一些入口,很多时候对一些大的网站做诊断,来提升其流量和收录主要的策略布局就是优化蜘蛛抓取优先的入口,实现的方法就是采用nofollow标签屏蔽一些页面。还需要分析的可能是爬取的饱和度,因为对于单个页面的爬取太多是在浪费蜘蛛资源,我们如果能够适当的控制这些资源的分配,那么对于页面的抓取和收录的提升肯定有很大的帮助。 研究蜘蛛爬取习惯并优化习惯 至于冗余度和爬取路径可能就需要大家再深入的分析,后面如果还有深入的文章会再和大家一起探讨蜘蛛抓取的情况。 结束语 认真的分析蜘蛛,从蜘蛛的角度和人的角度对网站进行分析,使得网站可以更好地进行seo优化是我们每一个seo的职责和任务,大家共勉之! 谢谢!希望这个资料对大家有用!
文档评论(0)