SEO网站优化课件要点.pptVIP

  • 6
  • 0
  • 约6.43千字
  • 约 60页
  • 2016-11-01 发布于湖北
  • 举报
什么是SEO SEO是英文Search Engine OPtimization的缩写,中文译为搜索引擎优化。 Seo是指在了解搜索引擎自然名的基础上,对网站进行内部及外部的调整优化,改进网站在搜索引擎的关键词名次,获得更多流量,从而达到网站销售的目标。 SEO意义:搜索流量质量高。性价比高。可扩展性。长期有效。提高网站用户体验。 搜索引擎的工作原理 爬行和抓取 搜索引擎蜘蛛通过跟踪链接访问网页,获得页面html代码存入数据库。 预处理 索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理已备排名程序调用。 排名 用户输入关键词后排名程序调用索引数据库,计算相关性,然后按一定格式生成搜索结果页面。 爬行和抓取 1、蜘蛛(apider) 搜索引擎用来爬行和访问页面的程序 也叫机器人(bot) 百度 Baiduspider+ 雅虎中国 Mozilla/5.0 谷歌 Mozilla/5.0 微软bing msnbot/1.1 搜狗 sogou+web+robot+ 搜搜 sosospider+ 有道 Mozilla/5.0 爬行和抓取 2、跟踪链接 深度优先 广度优先 3、吸引蜘蛛 网站和页面权重 页面更新度 导入链接 与首页点击距离 4、地址库 5、文件存储 6、复制内容检测 预处理 1、提取文字 2、中文分词 3、去停止词 4、消除噪声 5、去重复 6、正向索引 7、倒排索引 8、链接关系计算 9、特殊文件处理 排名 1、搜索词处理 (中文分词、去停止词、指令处理、拼写错误矫正、整合搜索触发) 2、文件匹配 3、初始子集的选择 4、相关性计算 5、排名过滤及调整 6、排名显示 7、搜索缓存 8、查询及点击日志 链接原理 1、李彦宏超链分析专利 “超链文件检索系统和方法” 建立一个链接词库,记录链接锚文字的信息,计算出利于链接的文件相关性,在用户搜索时,将得到的基于链接的相关性与基于关键词匹配的传统相关性综合起来,得到准确的排名 专利地址: /netacgi/nph-parser?patentnumber=5,920,859 链接原理 2、HITS算法 HITS(Hyperlink-Induced Topic Search) 超链接诱导主题搜索 用户搜索关键词时,算法对返回的匹配页面计算两种值,一种是枢纽值,一种是权威值,两种值相互依存,互相影响。 通俗的说,HITS算法会提炼出两种比较重要的页面,就是枢纽页面和权威页面,枢纽页面本身没有多少导入链接,但是有很多导出链接,如hao123这样的目录网站。权威页面本身可能导出链接不多,但是有很多来自枢纽页面的导入链接。 /netacgi/nph-parser?patentnumber=6,112,202 链接原理 3、TrustRank算法 又叫信任指数,假设:好的网站很少会链接到坏的网站。反之则不成立,也就是说,坏的网站很少链接到好的网站不成立。相反,很多垃圾网站会链接到高质量网站以提高自己的信任指数。 基于这个假设,TrustRank算法选择一批种子网站,设定一个输出的Trustrank值,根据链接距离衰减指数。 选择种子网站的方式:导出链接多的、 PR高的 计算衰减的公式:随链接次数衰减、按导出处链接数目分配 排名方式:根据Trustrank值的高低、设定一个门槛值过滤垃圾页面。 /conf/2004/RS15P3.PDF 链接原理 4、Google PR PageRank 佩奇级别。 反向链接越多的页面就是重要的页面,PR越高。 PR(A)=(1-d)+d(PR(T1)/C(T1))+…+ d(PR(Tn)/C(Tn)) A代表页面A PR(A)代表A的PR值 D为阻尼系数 一般为0.85 T1 Tn代表链接到A的各个页面 C代表页面上的导出链接数目 链接原理 5、Hilltop算法 Hilltop算法称之为与主题相关的PR值,同样是计算PR值,但更注重来自主题相关页面的链接权重,这样的页面也叫专家文件。 用户搜索关键词后,先按正常排名,再计算LocalRank值(也就是有多少专家文件与指向该页面)再重新排序。 Hilltop算法提示我们做外部链接是一定要注意主题的相关性,另外搜索其关键词是,排在前面的是最好的链接资源。甚至来自竞争对手的链接是最好的资源。 搜索指令 双引号 代表完全匹配 如 “洛阳网络公司” 百度 谷歌都支持 减号 代表搜索不包含减号后面的词的页面 如 苹果 -电影 都支持 星号 常用的通配符 如 海*之星 百度不支持 Inurl: 搜索查询词出现在URL中 都支持 Inanchor: 返回结果是导入链接锚文字中包含关键词的页面 比如:inanthor: 版权所有 百度不支持 Intitle: 返回页面标题中含关键词的页面 都

文档评论(0)

1亿VIP精品文档

相关文档