信息检索计算机检索基础学科介绍课程讲述.pptVIP

信息检索计算机检索基础学科介绍课程讲述.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索计算机检索基础学科介绍课程讲述.ppt

所谓截词,是指在检索词的适当位置截断,用截断的词的一个局部进行检索,使检索词与数据库所存储信息字符的部分一致性匹配,又称部分一致性检索 在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。借此检索可以扩大检索范围。不同的、检索系统其截词检索的截词也不同,常用截词符包括“?”、“$”、“*”等。 截词的方式有多种,按截断部位可分为前方截词检索、中间截词检索、后方截词检索;按截断的字符数量分,可分为有限截词和无限截词。 后方截词:截去某个词的尾部,是词的前方一致性比较,也称前方一致性检索; 前方截词:截去某个词的前部,是词的后方一致性比较,也称后方一致性检索; 中间截词:截去某个词的中间部分,是词的两边一致性比较,也称两边一致性检索; 有限截词:是指允许截去有限个字符; 无限截词:是指允许截去的字符数量不限,也称开放式截断。 后截断 前截断 中截断 Physic ? Physical,physicalism, physician,physicist… ? magnetic Magnetic,electro-magnetic,paramagnetic Wom ? n Woman,women 例子:信息? 表示数据库中含有信息,信息技术,信息检索方面的文献记录均为命中文献。 ?经济 表示数据库中含有经济,工业经济,农业经济等方面的文献记录均为命中文献。 (1)有限截词: 在检索词的词干后连续加一个或一个以上(不超过4个)“?” ,然后空一格,再加一个“?”。词干后连续输入的问号数表示限定所截字符最大的位数。最后一个问号表示截词停止的符号。 ①cat? ?,可检出cat,cats; ②process??? ?,可检出process,processes,processor,processing,procession等词尾最多有三个字符变化的词。但不能检出processional processability. (2)无限截词 无限截词是在检索词的词干后加一个“?”,表示不限定词尾字符的变化位数。 ①transport?,可检出transport、transporter、transporation、transportability等所有以transport开头,以任意数量字符结尾的词。 (3)中间截词 中间截词是截去检索词的中间部分,截去的字符数与“?”数相等,且问号必须是连续,问号之间不得有空格。 ①wom?n可检出woman和women; ②psych????ist可检出psychologist和psychiatrist等。 4.字段限制检索 在检索系统中,数据库设置的可供检索的字段通常有两种,既表达文献主题内容特征的基本字段和表达文献外部特征的辅助字段。基本字段包括篇名(TI)、文摘(AB)、叙词或受控词(DE或CT)、自由标引词(ID或UT)等。辅助字段包括除基本字段以外的所有字段,包括作者(AU)、语种(LA)、刊名(JN)、文献类型(DT)、年代(PY) 等。 使用字段限制检索时,基本字段用后缀表示,如computer and network/TI。辅助字段用前缀表示,如 AU=Smith,R. 4.字段限制检索 基本索引字段 题名字段(TI) 文摘字段(AB) 叙词字段(DE) 自由词字段(ID) 辅助索引字段 著者字段(AU) 语种字段(LA) 出版年字段(PY) SIGMA(W)DELTA(W)MODULATOR/TI WIDE(W)BAND/AB DELTA MODULATION/DE NTISGPN/ID AU=FISCHER, G. LA=ENGLISH PY=1997 返回 第二节 信息检索步骤 信息检索是根据课题要求,利用有关的检索系统,按照一定的检索程序和方法,采用各种检索策略查找信息的过程。 传统信息检索是检索人员利用手工检索工具通过手翻、眼看、大脑思维判别等方式查找文献信息;现代信息检索式检索人员利用计算机检索系统查找文献的一种检索方式。 与传统信息检索相比,现代信息检索由于方便快捷、全面(全文检索)等特点,因此越来越受到欢迎。 现代信息检索的一般步骤为: ①分析检索课题; ②选择检索系统和数据库; ③确定检索词; ④构建检索表达式; ⑤实施检索并调整检索策略; ⑥输出检索结果。 课题 分析研究课题概念 制定检索策略 选定检 索方法 确定检索途径 选择检索工具 初步检索结果 获取原始文献 结果 调控检索策略 一、分析检索课题 实施检索前,必须对检索课题进行认真分析

文档评论(0)

186****7785 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档