- 1、本文档共56页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
2.3制定搜索引擎喜欢的网站结构W3C是英文WorldWideWebConsortium的缩写,中文意思是W3C理事会或万维网联盟。W3C于1994年10月在麻省理工学院计算机科学实验室成立。W3C组织是对网络标准制定的一个非赢利组织,像HTML、XHTML、CSS、XML的标准就是由W3C来定制。W3C会员包括生产技术产品及服务的厂商、内容供应商、团体用户、研究实验室、标准制定机构和政府部门,一起协同工作,致力在万维网发展方向上达成共识。第32页,共56页,星期六,2024年,5月安徽seo/ahseo0551第33页,共56页,星期六,2024年,5月2.3.2div+css对seo的影响1.采用这种结构后HTML页面里基本只有文字或图片信息,而样式则放在CSS里面,这样搜索爬虫就不会管CSS,只要采集HTML里的内容就可以了,大大提高蜘蛛的效率。2.采用这种结构往往要害词更集中,密度更高。3.DIVCSS相对于table来说比较精简,而且基本不存在网上一直在说的“表格嵌套”的问题。4.符合W3C标准的网页在seo优化方面本身就有优势,更得搜索引擎蜘蛛的喜爱。第34页,共56页,星期六,2024年,5月2.3.3静态化页面对seo的影响几乎所有搜索引擎能手路动态页面静态页面动态页面专成静态页面存储不能及时更新占用存储空间硬盘负担重伪静态url重写安徽seo/ahseo0551第35页,共56页,星期六,2024年,5月2.3.4目录级别对seo的影响尽量不要超过3级重要页面放在顶层目录第36页,共56页,星期六,2024年,5月2.3.5目录文件名对seo的影响在目录名和文件名中使用关键词使用连字符-,不使用下划线_支持中文第37页,共56页,星期六,2024年,5月2.3.6网页大小对seo的影响网页大小=网页地源文件大小,是经过服务器解释而输出地HTML文档。不包括未经过解释地PHP语言、ASP等语言,也不包括Flash、图片、音频、视频文件等,同样也不包括外部调用的CSS、JS文件等100KB限制?网页布局尽量采用DIV+CSS采用外部文件的形式使用css和js清除word格式或者其他格式文档夹带的格式合理分页第38页,共56页,星期六,2024年,5月2.3.7如何使用robots.txtrobots.txt是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。常见robot名称BaiduspiderGooglebotYoudaoBot第39页,共56页,星期六,2024年,5月允许所有的robot访问User-agent:*
Disallow:或者也可以建一个空文件/robots.txtfile禁止所有搜索引擎访问网站的任何部分User-agent:*
Disallow:/禁止所有搜索引擎访问网站的几个部分(01、02、03目录)User-agent:*
Disallow:/01/
Disallow:/02/
Disallow:/03/禁止某个搜索引擎的访问(下例中的BadBot)User-agent:BadBot
Disallow:/只允许某个搜索引擎的访问(下例中的Googlebot)User-agent:Googlebot
Disallow:User-agent:*
Disallow:/第40页,共56页,星期六,2024年,5月第41页,共56页,星期六,2024年,5月第42页,共56页,星期六,2024年,5月第43页,共56页,星期六,2024年,5月RobotsMETA标签针对具体的页面<METANAME=“ROBOTS”CONTENT=“INDEX,FOLLOW”>name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。INDEX指令告诉搜索机器人抓取该页面;FOLLOW指令搜索机器人可以沿着该页面上的链接继续抓取下去;RobotsMeta标签的缺省值是INDEX和FOLLOW共有四种组合:<METANAME=ROBOTSCONTENT=INDEX,FOLLOW>
<METANAME=ROBOTSCONTENT=NOINDEX,FOLLOW>
<METANAME=ROBOTSCONTENT=
文档评论(0)