因特网上的信息检索精要.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
因特网上的信息检索精要

3.2 因特网上的信息检索 3.2.1因特网信息检索方法 因特网是全球性的分布式系统,信息组织处于一个无序的状态。 基于超文本/超媒体的信息浏览 基于目录服务的信息查询 基于搜索引擎的信息检索 1990年起搜索引擎发展举例 2 搜索引擎的分类 目录式搜索引擎 全文搜索引擎 元搜索引擎 垂直搜索引擎 集合式搜索引擎 门户搜索引擎 免费链接列表 搜索引擎的分类 搜索引擎的分类 搜索引擎的分类 思考 搜索引擎技术的发展 搜索引擎技术的发展 搜索引擎技术的发展 搜索引擎技术的发展 搜索引擎技术的发展 搜索引擎技术的发展 搜索引擎技术的发展 3.2.3 搜索引擎的工作过程 信息检索 人工智能 计算机网络 分布式处理 数据库 数据挖掘 数字图书馆 自然语言处理 …… 课堂小结 一、信息检索的方法 基于超文本/超媒体的信息浏览 基于目录服务的信息查询 基于搜索引擎的信息检索 二、主要二类搜索引擎 1、目录式搜索引擎 2、全文搜索引擎 一、选择题 1. 以下选项中,不属于因特网中信息检索的主要方法是(  ) A.基于超文本/超媒体的信息浏览 B.基于搜索引擎的信息检索 C.基于“我的电脑”文件搜索 D.基于目录服务的信息查询 答案:C 2.(多选题)以下选项中,属于网络主要搜索引擎的分类是( ) A.全文搜索 B.目录搜索 C.专业搜索 D.元搜索 答案:AB 一、选择题 3.我们通过网页中的链接去访问另外一个信息资源的信息检索方法是( )。 A.基于超文本/超媒体的信息浏览 B.基于目录服务的信息查询 C.基于搜索引擎的信息检索 D.特种搜索引擎 答案:A 4.使用全文搜索引擎,搜索的结果是( )。 A.我们所要找的全部信息 B.互联网上客观存在的网页数据 C.搜索引擎数据库中的数据 D.以上都不是 答案:C 一、选择题 5.全文搜索引擎一般采用什么原理来采集信息( )。 A.人工方式 B.“蜘蛛”程序 C.关键字检索 D.检索工具 答案:B 6.如果要搜索桂林旅游景点,则应该在搜索框输入什么关键字才能高效地找到有用信息( )。 A.桂林or旅游景点 B.桂林or旅游or景点 C.桂林or旅游and景点 D.桂林and旅游and景点 答案:D 二、判断题 7.由于因特网是全球性的分布式系统,数以百万计的信息提供都难以按照一定的约定来提供信息,因此,整个因特网的信息组织处于一个无序状态。( ) 答案:对 8.搜索引擎是因特网上信息检索的软件系统,最早的搜索引擎出现于1994年4月,是由斯坦福大学的两名博士(其中包含美籍华人杨致远)创办的雅虎。( ) 答案:对 9.目录式搜索引擎是以人工方式收集信息,由编辑人员查看信息后并将信息分类置于事先确定的相应目录中。( ) 答案:对 二、判断题 10.目录式搜索引擎是通过计算机进行分类和整理,不需要人工干预。( ) 答案:错 分类不够细,需要人工介入,目录的维护量大, 更新可能不够及时. 11.全文搜索引擎的优点是信息量大、更新较及时、不需人工干预;缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。( ) 答案:对 实践活动 1、应用搜索引擎中的图片搜索功能,查找并整理历届奥运会会徽图片,看谁搜索得又快又全,将图片粘贴在学案相应位置。 2、尝试在百度或google搜索引擎查询中加入以下的过滤词 ,看看效果如何,思考可以用这种方法解决些什么问题? 过滤词:Site:网站网址 例:site: 环境保护 * * 使用不同的搜索引擎在网上获取信息资源 改变关键词 尽量少用通配符与含糊的词 使用逻辑控制符AND,利用多个条件同时满足要求进行限制 使用双引号“””(英文状态下)将连在一起的词变成短语来搜索 用近义词代替关键词 使用逻辑控制符OR 使用其他的搜索网站 讨论交流:哪些搜索技巧可以缩小搜索范围? 1、基于超文本/超媒体的信息浏览 能够灵活、方便地查找信息,但信息检索很大程度上取决于所提供的链接,搜索结果带有偶然性和片面性。 音频资料 视频资料 图形图像 网页 网页 网页 2、基于目录服务的信息查询 人们根据信息的主题将网络上的资源进行分类,并以目录的形式组织和表现。 一级 二级 三级 四级 3、基于搜索引擎的信息检索 查询请求 搜索引擎:信息检索工具 查询结果: 非资源本身 资源的链接 3.2.2 搜索引擎的发展与分类 1994年4月斯坦福大学两名博士生 美籍华人杨致远和美国人David Filo 超级目录索引雅虎 最早的搜索引擎? 1、搜索

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档