第2讲检索语言与检索技术技巧.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关键词语言 关键词语言是自然语言(未经优化和规范化处理),直接取自文献的题名、文摘等,或者取自全文。除了禁用词(冠词、介词、副词代词以及语气助词等 ),凡在概念上有意义的词都可用做关键词。它确保检索用词与文献记录中的词汇完全一致。 特点: 语言未作规范,查准率和查全率都较低 方便计算机作自动编排和检索,适合网络信息检索 标题词语言 标题词语言是最早使用的一主题语言,至今仍被称为主题词语言,而实际上它只是主题词语言的一种。标题词原是从文献中抽出的,能标识文献内容特征的一些规范词。 标题词包括主标题词和副标题词。主标题词反映的是文献论述的主题事物,多为“事物”性的名词,如“机床”。副标题词反映的是主题事物的一个方面,是用来修饰和限定主标题词,如“稳定性”。主标题和副标题词相组配就构成了“机床稳定性”这个复杂的主题概念。 《Ei》查找文献,就必须了解《Ei》的标题词表—《工程标题词表》(Subject Headings for Engineering,简称SHE)。 标题词之间按字顺排列,组成标题词表。对于一些没有被词表收录的“非正式标引词”,系统设立了专门的“参照系统”,指引检索者从其他相关概念的标题中去查找文献。 评价:主标题词与副标题词组配固定,不便表达复杂概念。 叙词语言 叙词语言是在20世纪60年代发展起来的,以自然语言为基础的一种主体语言 常用的叙词表有《汉语主题词表》、《中国中医药到病除主题词表》、美国的《医学主题词表》(MeSH)等。 构成:通常由字顺表和词族索引两部分构成。 字顺表:是叙词表的主体,提示叙词的等同关系、属分关系和相关关系. 词族索引:按概念成族的原理编制而成,将主表中具有族性语义关系的全部叙词逐级展开,全面显示。按音序排列。 作用:增加了叙词表的扩检与缩检功能。 1、字顺表 等同关系:是指一组词的同义、近义关系。用Y(用项)、D(代项)作为语义关系符号。 盘尼西林(非正式叙词) Y青霉素(正式叙词) 青霉素(正式叙词) D盘尼西林(非正式叙词) 属分关系:是指一组词中的种属关系或等级关系。用F(分项)、S(属项)、z(族项)作为参照符号联系。F是指明该款目词的下位概念词;s是指明该款目词的上位概念词;z是指明该款目词的族首概念词。例如: 本草 F食物本草(下位概念、狭义词) S中草药(上位概念,广义词) z医药学(族首概念,族首词) 相关关系:是指一组词中的交叉、矛盾与对立关系,也是相互参照的关系。用c(参项)作为参照符号联系。 对外投资 C 海外企业 经济扩张 资本输出 * * * * * * AND “*”,表示它所连接的两个检索词必须同时出现在结果中 OR “+”,表示它所连接的两个检索词中任意一个出现在结果中 NOT “-”,表示它所连接的两个检索词中从第一个概念中排除第二个概念 以下是一些有关使用检索运算符的范例。 “AND”运算符检索含有所有所给词语的文献。此处所给的范例将检索含有短语“stem cell”以及词语“lymphoma”的数据。 当使用“OR”时,将检索至少含有一个所给关键字的数据。检索“Aspartame OR saccharine OR sweetener” 将得到包含所给的任何一个词语的数据。 “NOT”运算符被用来从您的检索中排除不需要的内容。检索“Aids NOT hearing” 将得到有关“AIDS(一种疾病)” 而不是“hearing aids(助听器)”。 * 截词符号,也叫“通配符”,可被用来检索单词复数形式及不同的词语拼写。在Web of Knowledge有三种不同的通配符。星号,是我在上面的检索中使用的通配符。这是最灵活的符号,可代表任何数字或符号(包括零个字符)。 美元符号代表零个或一个字符,可被用来同时检索英式拼法及美式拼法。 问号代表一个字符,可用来检索拼写时的变体。 这些通配符可以用在检索词句中,或是用在检索词句的末尾。您不可以将通配符用在检索的开头。 前截断:*magnetic ? magnetic, electro-magnetic, electromagnetic, thermo-magnetic, … 后截断:librar* ? library, libraries, librarian,… 中截断:organi?ation ? organization, organisation 无限截断:输入educat?,可以检索educator,educators,educated,educating,education,educational,等等。 有限截断:输入educat**,表示被截断的字符只有两个,可以检索educator,educa

文档评论(0)

希望之星 + 关注
实名认证
文档贡献者

我是一名原创力文库的爱好者!从事自由职业!

1亿VIP精品文档

相关文档