网上信息检索及..ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网上信息检索及 杉达图书馆资源利用 上海杉达学院图书馆 201886 信息与教育技术中心 第一章网上信息检索 ◆搜索引擎的工作原理 ◆搜索信息的方法和技巧 ◆著名的中文和英文搜索引擎 201886 信息与教育技术中心 搜索引擎( Search Engine) ◆搜索引擎是一种基于 Internet上的信息查 询系统。是通过在建立引擎的WEB页上输 入我们所查询信息的关键词,经过引擎的 检索服务器在内部数据库找到相关资料并 按一定的规则整理后再输送出来,通过网 络传到本地主机的一种在线服务方式 201886 信息与教育技术中心 搜索引擎的功能 ◆搜索引擎有三个功能 信息集功能:广泛收集因特网上的Web页面 构建一个信息空间的作用 信息组织和标记功能:通过某种形式来组织 标引所收集的Web页面 信息检索功能:通过建立数据库,接受用户查 询,利用信息检索算法,尽可能将最相关的页 面返还给用户,达到有效检索的目的 201886 信息与教育技术中心 搜索引擎的工作原理 ◆使用一种自动跟踪标引软件,也称为“机 器人”程序,它能自动地浏览Web上的超 文本结构。机器人找到一个文件后,对它 进行分析标引,然后把它送到索引数据库 中,索引数据库是搜索引擎搜索信息的信 息源。用户查询时,搜索引擎根据用户输 入的提问式,在索引数据库中找出与之相 匹配的记录,并返回给用户。 201886 信息与教育技术中心 搜索引擎的工作原理 ◆搜索引擎自动获取信息的两种方法 定期搜索:每隔一段时间,搜索引擎派出机 器人程序,对指定范围的P地址的互联网站 进行检索,发现新的网站,就自动提取网页 信息和网址加入自己的数据库。 提交网址:网站拥有者主动向搜索引擎提交 网址。在一定时间内向提交网站派出机器人 程序,扫描该网站并将有关信息存入数据库 201886 信息与教育技术中心 搜索引擎的类型和特点 分类目录搜索引擎 通过人工发现信息,并依靠标记人员区别和分 类,用户在分类体系中直接进行浏览检索,如: Yahoo,Sohu等。信息质量高,检索准确率高。 人力资源花费大,信息量大的情况下,更新慢。 独立搜索引擎(机器人搜索) 独立完成搜索任务。依据一定的网络协议自动 地在 Internet上发现、加工、整理信息,如: google, Alta vista, nfoseek等。信息量大 人力耗费小,但检索准确率低 201886 信息与教育技术中心 搜索引擎的类型和特点 ◆元搜索引擎 查询时向其他多个独立搜索引擎发出搜索请求 并对返回的查询结果进行处理。一般仅支持 AND、OR、NOT等较简单的语法操作。 ◆网络搜索软件 用户可下载网络搜索软件到本地计算机安装使用, 是一种具有网络查询功能的离线浏览器。可以快 速查询网络上的相关资源,灵活的控制输出结果 201886 信息与教育技术中心 搜索引擎的语法规则 ◆使用布尔逻辑操作符 And():AB包含A,B两个关键词 Or(|):AB包含A或B或A,B Not(-):AB包含A,不含B 括号:(AorB)andC包含AC或BC ◆使用逗号:与or相似,但有排列次序 ◆使用空格:类似与 ◆使用双引号:组合关键字作为一个字符串 201886 信息与教育技术中心 搜索引擎的语法规则 ◆使用通配符?:代替任意字母组合 ◆使用+-号:+计算机,-计算机 ◆使用near,in:限定范围 ◆使用t,u: t关键字一查询网站名称 u+关键字一查询网址 不同的搜索引擎提供的查询方法不完全相同 可以去相应的搜索引擎的“帮助”或者“搜索 技巧”中查找。 201886 信息与教育技术中心

文档评论(0)

3471161553 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档