信息资源检索与利用第4章.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 搜索引擎及网络信息检索了解搜索引擎的相关知识 理解搜索引擎中关键词检索的语法规则 掌握百度、Google的高级使用方法。 本章要求4.1 基本知识4.1.1基本概念1.搜索引擎1)搜索器 2)索引器3)检索器 4)用户接口 搜索引擎的构成搜索器搜索器的功能是在Internet上漫游,发现和搜集信息。它常常是一个计算机程序,日夜不停地运行。索引器索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档及生成文档库的索引表。检索器检索器的功能是根据用户的查询内容在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。用户接口用户接口的作用是输入用户查询内容、显示查询结果、提供用户相关性反馈机制;主要的目的是方便用户使用搜索引擎。4.1.2 搜索引擎的优点和缺点搜索引擎现在成为网络信息检索最重要的指路标,几乎达到了无所不搜的地步。但是目前的搜索引擎普遍存在着以下缺点,使得搜索引擎还无法完全代替专门的检索工具。例如质量参差不齐,信息的分类加工欠规范,各搜索引擎在检索指令的输入格式与输入内容上存在差异并难以兼容,缺乏通行易用的检索方法与技巧;没有统一的网络信息分类标准,令网络用户无所适从,而且网络信息分类难以与传统的文献分类融合,与常见的学科及知识体系之间缺乏必要的内在联系,使得网络信息的分类体系对知识面或学科的覆盖率达不到要求,对专业性较强的深度信息的查全率较低;建立资源索引时针对性不强,搜索速度慢,死链接过多,重复信息及无效信息过多;对资源不具有选择和价值判断的能力,排序结果不理想,难以搜索根据用户访问而临时动态生成的网页,查全率下降。据调查,功能最强大的搜索引擎最多能覆盖16%的网络信息资源。依照网络信息呈几何级的增长,搜索引擎覆盖的信息资源量还将有所下降。4.1.3 搜索引擎的类型依据不同的原则,网络搜索引擎可划分成不同的类型。根据搜索引擎的数据检索机制划分可分为分类型、主题型。代表性的目录式分类搜索引擎是Yahoo、搜狐、新浪网站。代表性的主题型搜索引擎是Google、百度(Baidu)网站。Yahoo的分类搜索Yahoo的分类搜索按检索内容划分分为综合型、专题型和特殊型。综合型搜索引擎在采集标引信息资源时不限制资源的主题范围和数据类型,又称为通用型检索工具。例如常见的Google、新浪、搜狐和网易,网罗百科,信息种类繁多。专题型搜索引擎专门采集某一主题范围的信息资源,并用更为详细和专业的方法对信息资源进行标引描述。例如针对生物专利的搜索引擎、科技信息搜索引擎Scirus、重点学科导航系统、学科信息门户。特殊型检索工具指那些专门用来检索某一类型信息和数据的检索工具,如查询地图的检索工具“Map Blast”、查询图像的webseek。按来源划分单一型(Singular?search?tools)?:(前面所有的拥有所有搜索引擎,拥有自己的检索机制和数据库)集合型(Collective?search?tools):类似hao1234.2主题搜索引擎的关键词语法规则1.自动将关键词拆分进行模糊查询直接输入“西南大学”,首先检索西南大学的内容 ,然后自动扩展到“西南财经大学”、“西南政法大学”和“西南交通大学”。2.按关键词进行精确查询诸如“新浪”、“网易”、“搜狐”等以前实施精确检索,现在也添加了拆分词语的功能。3.检索式的运算符号如果想要得到最佳的搜索效果,就要使用搜索的基本语法来组织要搜索的条件。 信息检索的运算符号(1) 布尔逻辑检索 逻辑“与”--“AND”或“*” 传统文化 AND 节日 传统文化*节日 逻辑“或”--“OR”或“+” 传统文化 OR 节日 传统文化 +节日 逻辑“非”--“NOT”或“-” 传统文化 NOT 节日 传统文化 -节日(2)(N)与(nN)算符 N是near的缩写 如:information(1N)retrieval(信息检索),命中的记录中会有“information retrieval”或“retrieval of information”等形式。AltaVista使用位置算符“NEAR/n”,n是两个词之间的单词的数目如:“Microsoft NEAR/5 Internet”表示在“Microsoft”和“Internet”这两个关键字之间的单词数目不得超过5个。(3)截词符(* ?)前截断:如*computer可表示 minicomputer、microcomputer。后截断:如work*,可表示work、 worker、working等。 work**,表示work后可加0-2个字母。 中间截断:如wom?n可表示:woman、 women等。4.使用字段限定① intitle ti

文档评论(0)

gcv458 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档