网站大量收购闲置独家精品文档,联系QQ:2885784924

3-1利用因特网猎取信息.ppt

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3-1利用因特网猎取信息

搜索引擎工作原理 统主要由人工完成,标引专家依靠手工来搜寻不断出现的新网站,给每个网站一个标题和大概的描述,将其放入相应的类目体系中。这些类目在页面上表现为每个类目路径下排列着相关的网站,也称目录导航。 目录搜索引擎提供两种查询方式: 一种是在网页上按分层目录逐级查找,直到找到所需信息为止; 另一种就是选择关键词搜索。 搜索引擎工作原理 元搜索引擎 它一般没有自己的数据库和“蜘蛛”程序,而是一个代理的角色,接受用户的查询请求。 只是提供了一个统一的界面,把多个具有独立功能的搜索引擎组合起来。 使用元搜索引擎,用户只需提交一次查询请求,就可以查询多个搜索引擎,大大提高了检索效率。 检索工具的使用技巧 1、正确选择因特网信息检索工具 2、选择合适的关键词 (1)正确使用布尔运算符 与(+、AND)或(OR)非(NOT、-) (2)用双引号进行精确检索 (3)避免输入错别字及使用太常见的关键词 (4)尝试使用近义词 3、合理利用”网页快照“、”网页预览“和”相关搜索“ 4、研究检索工具提供的说明,提高查询效率 检索工具的发展趋势 1、出现搜索引擎技术和搜索数据库服务提供者 2、网络搜索软件与搜索引擎的智能化 3、搜索引擎的本地化和多语种检索 第一节 利用网络获取信息 达县第四中学 徐兵 网络信息检索工具 全文搜索引擎 目录搜索引擎 元搜索引擎 如何才能从网络获取我们需要的信息呢? 使用信息检索工具。 在因特网发展初期,由于网站较少,网上信息资源也非常有限,通过网络查找信息比较容易,所以不需要专门的信息检索工具。 进入20世纪90年代,面对因特网上无穷无尽的数字化、多媒体、跨时空、跨语种的信息资源,网络用户必须借助信息检索工具才能找到需要的信息。 目前,所有因特网信息检索工具中,数量最多、应用最广的是搜索引擎。 搜索引擎按其检索机制主要可以分为全文搜索引擎、目录搜索引擎和元搜索引擎。 搜索引擎 搜索引擎 全文搜索引擎 是通过用户输入关键词来查找所需的信息资源。 国外代表性的全文搜索引擎有:Google、AltaVista。国内代表性的全文搜索引擎有:百度。 优点:全文检索;检索功能强;信息更新速度快。 不足:提供的信息虽然多而全,信息太多反而降低相应的命中率,查询结果链接较多,层次结构不清晰,给人杂乱的感觉。 搜索引擎 全文搜索引擎分为两种:一种拥有自己的检索程序,自建网页数据库,搜索结果直接从自身的数据库中调用;另一种则租用其他引擎的数据库,按自定的格式排列搜索结果。 目录搜索引擎 是指把搜集到的信息资源按照一定的主题进行分类,建立层次目录。用户查找信息时,只要逐层浏览打开目录,逐步细化,就可以查到要找的信息。 目录搜索引擎代表有:Yahoo、搜狐、新浪、网易等。 搜索引擎 优点:层次结构清晰,易于查找;多级类目,便于找到具体明确的主题;分类目录下有简明扼要的内容,一目了然。 缺点:搜索范围较小;更新速度慢;查找交叉类目时容易遗漏。 元搜索引擎 也称为集成型搜索引擎,它将用户的检索请求同时送到多个引擎上进行搜索,并将结果返回用户。 元搜索引擎有:MetaCrawler、Ask、Dogpile等。 搜索引擎的工作过程和原理 搜索引擎包含技术有:网络技术、数据库技术、自动标引技术、检索技术、自动分类技术等。 基本上都是由:信息搜索系统、索引数据库和查询接口三部分组成。 工作流程 1、由信息搜索系统在因特网中发现、搜索网页信息; 2、对信息进行提取和组织,建立索引数据库; 3、根据用户输入的条件查询,在索引数据库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。 搜索引擎工作原理 全文搜索引擎 信息搜索功能分为两种:一种是定期搜索;另一种是提交网站搜索。 定期搜索利用搜索引擎派出的”蜘蛛“或”机器人“程序对主页中的超文本链接遍历万维网,从一个HTML文档”爬行“到另一个HTML文档。不需任何人工处理,全部由程序自动完成。 全文搜索引擎主要采用关键词索引技术,索引程序生成从关键词到超文本链接的索引表。 搜索引擎工作原理 当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。 目录搜索引擎 目录搜索引擎不同于全文搜索引擎,其信息收集系

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档