[武汉大学黄如花信息检索3.1搜索引擎.pptVIP

  • 99
  • 0
  • 约 73页
  • 2017-06-10 发布于北京
  • 举报

[武汉大学黄如花信息检索3.1搜索引擎.ppt

[武汉大学黄如花信息检索3.1搜索引擎

第三章 搜索引擎 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. Outline 搜索引擎概念(定义、工作原理、特征) 搜索引擎的分类 搜索引擎的选择与评价 常用综合性搜索引擎 常用学术搜索引擎 使用搜索引擎要注意的问题 跟踪搜索引擎的变化 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 1 搜索引擎概述 你最常用的搜索引擎有哪些? 你认为搜索引擎是什么? Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 1.1 概念 一种Web上应用的软件系统 以一定的策略在Web上搜集、发现和组织信息 使用者的角度:提供一个网页界面供用户输入词语或者短语,系统将返回一个可能和用户输入内容相关的信息列表 Source: 李晓明,闫宏飞,王继民著.搜索引擎——原理、技术与系统.北京:科学出版社,2005:2 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 1.2工作原理 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 1.2 工作原理 网页采集 网站拥有者主动向搜索引擎提交网址 蜘蛛(Spider)扫描网站的所有网页并将相关信息存入数据库 预处理 关键词的提取 重复网页或转载网页的消除 链接分析 网页重要程度的计算 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 用户输入检索式 提交检索要求 搜索引擎提供查询 接受用户提交的查询请求 按照要求检索索引数据库 返回相关记录 以网页链接形式提供 通过链接指向用户所需网页 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 2 搜索引擎的分类 按信息内容组织方式划分 Web Directory 人工参与,主题目录 数据有限,专指性强 Yahoo!Directory Open Directory Keyword search engine 无人工控制,由系统完成 数据量大,更新及时 Google 百度 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 2 搜索引擎的分类 按收录范围划分 综合性搜索引擎 涵盖各学科 涉及生活的各领域 Google Yahoo! 百度 Bing 专业性搜索引擎 特定的功能 特定的学科 特定的用户 特定的信息类型 特定的地域 Lawcrawler,Sciseek Askjeeves for kids IP search Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 2 搜索引擎的分类 按功能划分 独立搜索引擎 具有独立的数据库 Google Yahoo! 百度 Bing 元搜索引擎 一次检索多个数据库 有的提供结果去重等功能 通常不具有独立的数据库 提供多个搜索引擎的统一检索界面 Metacrawle

文档评论(0)

1亿VIP精品文档

相关文档