搜索引擎的原理要点解析.pptVIP

下载本文档

170
0
约5.26千字
约 37页
2016-04-23 发布于湖北
举报

搜索引擎的原理要点解析.ppt

相关性计算关键词距离切分后的关键词完整匹配出现，说明与搜索词最相关。比如搜索“减肥方法”时，页面上连续完整出现“减肥方法”四个字是最相关的。如果“减肥”和“方法”两个词没有连续匹配出现，出现的距离近一些，也被搜索引擎认为相关性稍微大一些。链接分析及页面权重除了页面本身的因素，页面之间的链接和权重关系也影响关键词的相关性，其中最重要的是锚文字。页面有越多以搜索词为锚文字的导入链接，说明页面的相关性越强。链接分析还包括了链接源页面本身的主题，锚文字周围的文字等。排名过滤及调整计算相关性后，大体排名就已经确定了。之后搜索引擎可能还有一些过滤算法，对排名进行轻微调整，其中最主要的过滤就是施加惩罚。一些有作弊嫌疑的页面，虽然按照正常的权重和相关性计算排到前面，但搜索引擎的惩罚算法却可能在最后一步把这些页面调到后面去。典型的例子是百度的11位，Google的负6、负30、负950等算法。排名显示所有排名确定后，排名程序调用原始页面的标题标签、描述标签、快照日期等数据显示在页面上。有时搜索引擎需要动态生成页面摘要，而不是调用页面本身的描述标签。标题、描述字数限制百度标题显示最多不超多30个中文字符，谷歌显示65个英文字符，中文32个字符。超出字数限制将无法显示，以省略号代替百度描述显示最多不超多77个中文字符，谷歌显示165个英

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

搜索引擎的原理要点解析.pptVIP