- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机检索的步骤和方法
计算机检索的步骤和方法
计算机检索的步骤和方法
1、明确检索要求和检索目标
计算机检索的第一步准备工作是明确检索要求和检索目标。 明确检索要求就是要搞清楚 本课题属于什么学科,所需文献的类型及语种,查找文献的年代, 所需文献的最佳篇数,允 许支配的检索费用。这些要求对选择数据库、构造检索策略都是十分重要的。
确定检索目标也是进行计算机信息检索前应搞清楚的准备工作。 例如:如果属于开题调 研, 则应尽可能地检索出与之相关的全部文献, 即要求较高的查全率; 以便充分地做好开题 的准备工作;如果属于探索性、 开创性的课题,则只需要查出一些启发性的文献, 对查准率 和查全率要求都不一定有很高的要求。
2、课题分析
2.1课题概念的分析方法
分析课题就是分析出课题所涉及的主要概念, 并找出能代表这些概念的若干个词或词组, 进而分析概念之间的上、下、左、右关系。对于新学科、交叉学科和边缘学科的课题,则要 搞清楚这些概念之间的关系。 概念分析的结果应以概念组为单元的词或词组的形式列出, 以 便下一步制订检索策略时使用。
2.2隐含概念的分析方法
有些课题的实质性内容往往很难从课题的名称上反映出来, 课题所隐含的概念和相关的 内容需要从课题所属的专业角度作深入分析, 才能提炼出能够确切反映课题内容的检索概念。 例如:
2.3 核心概念的选取
有些检索词中已经含有的某些概念,在概念分析中应予以排除。例如:课题
为了提高文献的查准率, 应该从相应的规范词表中选择所需的检索词。 并且在确定检索 词时, 除了要考虑反映主题概念的同义词、 近义词等相关的检索词外, 还要注意选择被选用
检索词的缩写词和不同拼法的词,以避免漏检有关的文献。
3、检索词的扩展、选择和处理
目前的计算机信息检索系统, 还不具备智能思考的能力, 还不会对所输入的检索词以及 涉及的所有词进行自动、 全面的检索, 因此, 必须在概念分析的基础上列出与概念有关的词, 从中做出选择,并利用截词等方法对检索词予以归并。
3.1相同概念的检索词的扩展
扩展相同概念的检索词的方法一般有同义词方法、主题词表方法和截词方法
(1) 同义词方法。在同一概念的范畴内, 从语言角度,选择不同的名称、不同的拼写方 法和单复数形式。不同的名称包括学名和俗名、简称和全称, 商品名和物质或产品名, 事物 的代码和事物的学名。不同的拼写方法,以英语为例,包括英式英语和美式英语的区别。 (2)截词方法。 当某些检索词词干相同、 词义相近, 但词尾或词中间有变化时 (多数英语 单词的单复数变化和英美不同拼写形式 ) ,可以采用截词方法扩展检索词。这种方法要求在 词干后使用截词符。 截词符一般包括
(3)主题词表方法。许多数据库都编有自己的主题词表。在数据库编有主题词表的情况 下,应该尽量从词表中选择检索词。 使用主题词表,不仅可以使检索词更加规范, 提高检索 结果的准确性, 而且可以从同族词中选取更多的上位词、 下位词、 相关词,使获得的检索结 果更为理想。
3.2检索词的选择和处理
运用上述方法得到的词,首先应加以选择,并且注意选用本专业通用的术语 (应避免使 用冷僻词和根据中文术语自译生造的词 ) ,然后以概念为单位,构成组面 (facets)。例如:课题
概念组面 1:
不同数据库的学科范围不同,检索指令不同, 收费的标准也不同。 所以,在检索之前应 该阅读有关数据库的使用介绍,以便选择数据库时做到心中有数。
选择数据库,我们一般应该遵循以下几条原则:
1.按照课题的检索要求和目的,选择收录文献种类多、专业覆盖面宽、年代跨度对口的数 据库;
2.当需要查找最新文献信息时,选择数据更新周期短的数据库;
3.当还需要获取原文时,选取原文获取较容易的数据库;
4.在同时有多个数据库可供选择的情况下,应首先选择比较熟悉的数据库。
5.当几个数据库的内容交 *重复率比较高时,应选择检索费用比较低的数据库。
5、检索策略构成和调整方法
在实际检索过程中, 仅需一个检索词就能满足检索要求的情况并不很多。 通常我们需要 使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂课题的要求。
检索策略, 又称提问逻辑, 就是对多个检索词之间的相互关系和检索顺序作出的某种安 排。 构造检索策略就是运用计算机情报检索系统可以接受的方法, 包括布尔逻辑算符、 位置 逻辑算符等方法,表达课题检索要求的过程。
5.1布尔逻辑算符
规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑
(1) 或 (OR)运算符。也可用
(2) 与 (AND)运算符。 也可用
(
文档评论(0)