搜索引擎的原理要点解析.pptVIP

  • 170
  • 0
  • 约5.26千字
  • 约 37页
  • 2016-04-23 发布于湖北
  • 举报
相关性计算 关键词距离 切分后的关键词完整匹配出现,说明与搜索词最相关。比如搜索“减肥方法”时,页面上连续完整出现“减肥方法”四个字是最相关的。如果“减肥”和“方法”两个词没有连续匹配出现,出现的距离近一些,也被搜索引擎认为相关性稍微大一些。 链接分析及页面权重 除了页面本身的因素,页面之间的链接和权重关系也影响关键词的相关性,其中最重要的是锚文字。页面有越多以搜索词为锚文字的导入链接,说明页面的相关性越强。 链接分析还包括了链接源页面本身的主题,锚文字周围的文字等。 排名过滤及调整 计算相关性后,大体排名就已经确定了。之后搜索引擎可能还有一些过滤算法,对排名进行轻微调整,其中最主要的过滤就是施加惩罚。一些有作弊嫌疑的页面,虽然按照正常的权重和相关性计算排到前面,但搜索引擎的惩罚算法却可能在最后一步把这些页面调到后面去。典型的例子是百度的11位,Google的负6、负30、负950等算法。 排名显示 所有排名确定后,排名程序调用原始页面的标题标签、描述标签、快照日期等数据显示在页面上。有时搜索引擎需要动态生成页面摘要,而不是调用页面本身的描述标签。 标题、描述字数限制 百度标题显示最多不超多30个中文字符,谷歌显示65个英文字符,中文32个字符。超出字数限制将无法显示,以省略号代替 百度描述显示最多不超多77个中文字符,谷歌显示165个英

文档评论(0)

1亿VIP精品文档

相关文档