- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SEO诊断案例:网站收录和快照不及时
SEO诊断案例二:网站收录和快照不及时
对于SEO诊断一直是我坚持的一项工作,前面跟大家谈到很多关于SEO诊断的想法,很多都来自于一些朋友的提问咨询,以及自己网站问题的发现和研究。今天我再给大家带来一个诊断案例,主要问题式针对网站收录和快照不及时的问题。
昨天一个朋友找到我,让我帮他诊断下网站的症状,先和他交流了下,了解了一些他网站的情况:他的网站每天都有更新,但是百度第二天都没有收录放出,只是在每次周更新或者月更新的时候会放出之前的许多页面,快照也更新很慢,但是也会随着收录放出慢慢跟上,情况持续已经一个多月。下面是我的一个思路,希望对大家有一定的帮助。
首先我建议这位朋友查看网站的LOG日志,因为LOG日志能够反映百度蜘蛛在网站内部的抓取情况。据我了解,目前很多朋友是没有查看LOG日志的习惯的,或者说多查看LOG日志有心无力,这位朋友就是,他说他有查看LOG日志,但是却不懂得怎么去分析。下面简单的介绍下我的分析思路。
1、查看搜索引擎蜘蛛的抓取概要分析,了解各个搜索引擎蜘蛛的访问次数,总停留时间,总抓取量和所占比例,下面是朋友网站的概要分析(利用光年日志分析工具查看结果),其中可以很清楚的看出,百度蜘蛛对于网站的抓取量还是不错的,有292词,访问次数有126次,总停留时间8.873小时,所占所有蜘蛛比例的41.011%。/)
?网站LOG日志概要分析
有的朋友可能会产生疑惑,既然百度蜘蛛总停留时间这么长,单次停留时间也不低(PS:蜘蛛单次停留时间=总停留时间/访问次数=0.0704小时/次=4.225分钟),那么为什么网站的收录却跟不上呢?带着这样的疑问,下面再分析下百度蜘蛛对于其他页面的抓取。
2、查看百度蜘蛛对于网站目录抓取的情况,从下面的抓取图中可以很清楚的看出百度蜘蛛对于home,product目录的抓取还是比较多的,对于网站内部另外一个重要的目录news抓取却不多,而这个目录就是网站每日更新做的比较多的工作目录。蜘蛛还抓取了一些后台文件目录如upload,files,img等。
?网站目录抓取情况
从上面的分析可以看出百度蜘蛛对于网页内部的抓取是不合理的,问题主要是:1、网站内部结构对于news栏目抓取力度不足;2、home目录作为社区,product目录作为产品中心,分散了网站蜘蛛抓取的资源;3、网站对于一些不必要抓取的目录没有很好地限制。解决问题就需要从这三个方面入手。
1、引导蜘蛛更多的抓取news目录下面的网页,如针对更新的页面创造更多的链接入口,其中包括站内的互相链接导入,站外的外链发布等。
2、查看网站的社区基本上已经没有更新,可以考虑先将home目录屏蔽掉,让权重和蜘蛛更多的导入进news栏目。product目录是一个比较重要的目录,但是更多的应该引导其抓取没有收录的或者新的产品。查看网站产品页面,发现对于相关产品推荐力度不够,可以在这一块进行改进。
3、运用robots文件或者nofollow标签,对于网站不重要的目录或者页面,以及后台的一些文件进行限制。
另外,还有一点思考,百度蜘蛛停留时间比较多,但是抓取量不算特别多,还需要查看百度蜘蛛抓取页面返回的状态码200,304和404所占比例。如果304比较多,那么是否考虑将这些蜘蛛资源进行合理的分配到未抓取的页面。如果404页面比较多,那就要考虑蜘蛛是不是被带进一些陷阱里面,检查网站内部造成404状态码的页面,并加以改正。
前面谈到的多是站内的蜘蛛抓取分配,但是如果站外的蜘蛛引导不够给力,那么依然不能够做好网站的收录和权重提升(PS:网站快照是网站权重的一个体现)。可以操作的方法如下:
1、重新建立网站地图,其中包括html和xml两种格式地图,在robots文件中书写抓取规则,引导蜘蛛抓取网站sitemap地图。写法如下:
Sitemap:/sitemap.html
2、多建立内链外链,给网站的每个网页尽可能多的蜘蛛抓取入口,让网页抓取量尽可能的提高。特别是对于外链建设这一块,可以考虑网站更新之后,立即去一些高权重的平台,如论坛,博客等,发布文章或者目录的链接,吸引蜘蛛抓取。
简单,粗浅的从自己的角度谈了下LOG日志分析的一点小思路,希望对大家有一定的帮助。
/news/list.asp?newsid=104
您可能关注的文档
最近下载
- 《2013年建设工程工程量清单计价规范》GB50500-2013.pdf VIP
- 2025年南京市教师招聘考试公共知识试题卷(含历年真题赠送).docx
- 生物命题培训课件.pptx VIP
- Schneider施耐德安装和操作手册-ATV930 ATV950 御程系列变频器安装手册.pdf
- 2025年国考《行测》真题及完整答案详解【夺冠系列】.docx
- J-BT 10466-2020星形弹性联轴器.PDF VIP
- 数据容灾备份中心建设方案书.docx VIP
- 卫生服务中心“十五五”五年中长期发展规划(2025-2029年).pptx
- 第十一章 地层与地层单位.ppt VIP
- 石膏板生产线联合车间车间施工组织设计.doc VIP
原创力文档


文档评论(0)