搜索引擎基本原理.pptVIP

  • 6
  • 0
  • 约1.48千字
  • 约 16页
  • 2016-12-31 发布于贵州
  • 举报
排名 排名 五、排名及过滤调整 主要是施加惩罚,对有作弊嫌疑的页面,降低排名等。 六、排名显示 所有排名确定后,排名程序调用原始页面的标题、说明标签、快照日期等数据显示在页面上。 Company Logo 搜索引擎工作原理简介 爱富爸爸网贷平台: 目 录 排名 预处理 爬行和抓取 几大搜索引擎简介 搜索引擎简介 搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。 爱富爸爸网贷平台: 主流搜索引擎 爬行和抓取 蜘蛛:搜索引擎用来爬行和访问页面的程序被称为蜘蛛( spider),也称为机器人(bot) 跟踪链接:为了抓取网上尽量多的页面,搜索引擎蜘蛛会跟踪页面上的链接,从一个页面爬到下一个页面,就好像蜘蛛在蜘蛛网上爬行那样,最简单的爬行策略分为两种,一种是深度优先,另一种是广度优先。 爬行和抓取 深度优先 广度优先 外链的第一个作用:吸引蜘蛛爬行,为抓取做准备 作弊手段:链轮 理论上不管是哪种爬行方法都能爬行和抓取所有页面,但实际不能、也不会这么做 ,所以要想让更多的页面被收录,就要想方设法吸引蜘蛛来抓取 爬行和抓取 蜘蛛不能抓取所有页面,所以要做的就是尽量抓取重要页面 哪些页面被认为比较重要呢?有几

文档评论(0)

1亿VIP精品文档

相关文档