数字文献信息检索与利用7.3DIALOG检索技术.pptVIP

数字文献信息检索与利用7.3DIALOG检索技术.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2. S Select 检索 从该检索过程我们可以看出,Select指令不仅可以进行关键词或检索式检索,而且对每一步检索结果的集合也可以通过逻辑关系编入检索式再进行组合检索。这是一般检索平台做不到的。 2. S Select 检索 与S密切相关的是F(Find)命令。 它是1996年发布的一个新命令, 其功能与Select完全相同,使用区别仅仅在于用s 进行词组检索时在各词之间要加()即W位置算符,而用f 则不加,例如,下列查询式等价: s information()highway f information highway 2. S Select 检索 与s 和f 相关的另外两个命令是ss和sf。 2. S Select 检索 ss是select steps的缩写,当words是一个词时,ss与s 结果一样;但当words为多词逻辑组合时,ss将产生每一步查询结果并依次用集号S1,S2,S3,...标记,而s 只产生一个结果和一个集号。 2. S Select 检索 sf是set files的缩写,只用于411文档查询,表示搜索指定文档,使用格式为: sf fileno 或 sf filegroup 例如: b411; sf 2,4,6,8,347,348,653,654 2. S Select 检索 以上命令对字符数的限制为:每一命令后最多可跟240个字符,包括空格和截词符;每一词或词组最多可以用49个字符,包括前缀代码在内;对同一查询词最多可加7个前缀;对同一查询词最多可跟40字符长的后缀代码;而对逻辑组配的限定是:每一命令最多可用49个逻辑算符。实际上一般都不会超过限制。 7.3 DIALOG检索技术 7.3.1 DIALOG常用字段 7.3.2 DIALOG检索技术 7.3.3 DIALOG基本指令 7.3.4 DIALOG的检察结果输出格式 7.3.1 DIALOG常用字段 DIALOG系统中数据库很多,每个数据库文档都规定自己的索引字段,使用时应通过联机help或数据库蓝页查看一下。这些索引字段又分为基本索引字段和附加索引字段。 基本索引字段 基本索引字段(Basic Index Fields)是对那些表达文献主题内容如标题TI、摘要AB、主题词DE或者自由词ID等字段做索引,把被索引的字段以后缀的形式附加在检索范围后,从而限制所检索的内容范围。 基本索引字段 格式:s检索词(式)/字段名 例如: s train/ti 在标题中检索火车 s train()control/ti 在标题中检索火车控制 s (train and control)/ab 在摘要中同时 检索单词火车和控制 附加索引字段 附加索引字段(Additional Index Fields)是表达文献外表特征的字段,在数据库文档以前缀方式加以限定。一般情况下,包含以下字段: 附加索引字段 AU(作者),例如 s au=wang jianpan, 或 s au=wang, jianpan, 或 s au=wang jp; CS(作者单位),例如 s cs=(E()CHINA()NORMAL()UNIV() DEPT()MATH); 附加索引字段 JN(刊物名称), 例如 s jn=physical()review?; PY(出版年份),例如 s py1994 ; LA(语言) 例如 s la=eng; RN(CA分子式登记号),例如 s rn=120410-24-4。 7.3.2 DIALOG检索技术 DIALOG系统支持的检索技术主要有:布尔逻辑、截词技术、限定技术等。 1.逻辑组配 对话系统所用的布尔逻辑组配与通用的布尔逻辑组配一样,主要包括使用“和(and,*)”,“或(or,+)”,“非(not,-)”三种基本逻辑算符,这是现行计算机检索的基本技术。其优先级依次为NOT,AND,OR,改变优先级的方法是使用()就象数学运算中一样,括号内的逻辑式优先执行。对话系统中*等价于AND,+等价于OR,为缩短检索式和醒目起见常被使用。 2.截词技术 在英语等西方语言中,词根相同,含义相近而词尾变化的词很多,如复数加s ,现在分词和动名词加ing,过去分词加ed,等等,为使查询时不遗漏相关词,很多查询系统都发展了截词技术。各个查询系统使用各自规定的截词符号,在对话系统中,用?作为截词符,而且包括后截,中截,前截等。 主要有以下情形: 2.截词技术 (1)截任意长字符 例如 employ??? 得到 employ, employer, employee, employment ... 等等。 (2)截一个字符 例如 cat? ?(

文档评论(0)

132****9295 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档