- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网站优化:为何网站不被收录?
云客网 您网站的流量加油站
网站优化:为何网站不被收录?
网站优化过程中收录一直是一个不管是菜鸟还是老鸟都非常揪心的问题,收录尽
管与网站排名没有直接关系,但是排名与收录的的关系总所周知,随着百度算法
的不断更新,百度对于收录的准则也越来越高,如何做好收录成了不管是站长还
是企业都非常关心的一个问题,接下来就来谈谈网站为什么不收录的问题。
一、是否知道这个页面的存在
对页面进行收录当然首先就必须要知道有这个页面,蜘蛛都不知道这个页面,谈
何收录?这一点主要分为2 大类:搜索引擎找不到网页入口和不让搜索引擎抓取。
1.搜索引擎找不到网页入口
很多时候不是你更新了文章搜索引擎就要来抓取收录的,要怎么让蜘蛛知道你的
更新呢?除了有规律的更新,可以向百度站长平台主动提交URL 或者是提交站
点地图,也可以让搜索引擎被动收集,这就是通过外链让蜘蛛知道你的网页,还
有很多时候蜘蛛来到了你的网站,却找不到你更新的链接,因为网站的链接结构
做得太复杂或是内链结构差,以致搜索引擎在抓取时间类不会爬到网站深处的页
面,这也造成蜘蛛不知道该页面的存在。所以不管怎么样,第一步我们要保证页
面能被蜘蛛看到,关于这一点可以通过查看网站日志来判断蜘蛛是否来访过。
2.不让搜索引擎抓取
很多网站有意无意的直接在robots文件屏蔽了百度或网站部分页面,却整天在找
原因为什么蜘蛛不来抓取我的页面,这能怪百度吗?你都不让别人进门了,百度
是怎么收录你的网页?所以有必要时常去检查一下网站robots文件是否正常。
二、是否可以正常的抓取
好了,蜘蛛发现了这个页面,也有权利抓取这个页面了,那能否正常抓取就是一
个很大的问题,我们都知道蜘蛛抓取这个页面要从域名到DNS服务器再到网站
空间,所以其中任何一个环节出现问题,蜘蛛都不能正常的抓取,首先域名需要
备案,然后域名解析要正常,如果解析出现问题,域名是不能访问网站ip 地址
的,这个时候网站打不开,蜘蛛抓取不了页面。
在有就是经常提到的空间服务器了,服务器长期打不开那肯定是抓取不了的,这
个大家都知道。并且如果服务器比较卡或者不稳定,就会影响蜘蛛的抓取,蜘蛛
不能很好的去抓取页面或由于加载慢只抓取到网页一半,这就很大程度上影响了
网站的收录。具体可以看 《草根站长做SEO,如何选择域名和空间》
三、是否达到收录标准
很多人觉得蜘蛛抓取就代表着收录,其实这是错误的,蜘蛛访问网站抓取页面并
不代表就要收录你的网页,页面被抓取后要进行对比筛选,符合要求的才会被收
SEO排名 /
云客网 您网站的流量加油站
录,为什么有的页面会被收录后又被吐出来?就是因为蜘蛛在不停的过滤,这个
我们先不谈。既然是符合要求才会收录,那收录标准到底是什么呢?
1.行业不同标准也不同
这个是显而易见的,新闻类网站肯定比一般企业站容易收录,而对于医疗、博彩、
成人用品等网站,标准肯定是更加严格,所以对于不同的行业,百度给予的收录
标准也是不一样的。
2.不同的网站标准不同
百度有一个优先抓取的原则,对于绝大多数用户喜欢,权重高的网站收录得要快,
就像新浪网、腾讯网收录得肯定要比一般网站要快,为什么?因为信任,这类网
站本身就有其严格的过滤系统,在此类网站公布的内容百度基本是直接抓了就收,
搜索引擎是互联网与用户的桥梁,它的目的就是给用户提供有价值的内容,你能
为它提供良好的内容,它当然也会对你更好,这是互利的。所以搜索引擎不是做
慈善,你的网站能给它什么?
3.主体收录标准
百度有一个收录标准值,对页面进行评分,满足评分收录,否则扔掉。这个在百
度网站综合得分算法一文中已经说过了,主要是从页面基础、站内、站外、用户
四个方面进行评分,感兴趣的可以看一看,这里就简单谈一谈网站页面的内容,
(1)页面字数建议是在500-800字,内容健康良好,信息丰富;
(2)受众多:文章要有一定得用户需求,也即用户检索需求的大小;
(3)时效性:写最新的东西用户和搜索引擎都喜欢
(4)稀缺性:稀缺主要是描述页面在互联网中的独特性。稀缺不等于无重复,只
有对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低。
四、是否有干净的域名
刚说了百度的收录标准,其实这一点也属于一个特别的标准,域名不干净同样是
影响网站收录的一个重要原因,这个不干净我们分为2种情况。第一种就是域名
在购买之前就有人用过了,不仅使用了而且还是用废了,这样的域名背景就是不
干净,这就相当于以前如果你去考警
文档评论(0)