信息检索原理(建筑学院选修)课稿.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章 信息检索的基本原理与方法 2.1 信息检索的基本概念 (1)定义 广义的信息检索(Information Retrieval)是将大量分散的、无组织的信息按照一定的原则和方式搜集、加工和存储起来,并根据用户的特定信息需求,依据一定的规则从信息集合中查找出有关信息的过程,因此又被称为信息存储与检索。 主题法语言 主题法语言是直接用自然语言中代表事物的名词术语(词组)为标识来揭示和表征文献信息的内容,并按字顺排列标识和采用参照系统等方法来间接表达各种概念之间的相互关系的检索语言。 主题结构模式分析法:主题分面公式 主体面——通用面——位置面—— 时间面——文献类型面 例, 信息需求:“中国当代文学评论论文” 文学——评论——中国——当代—— 论文集(期刊) 2.2.2 信息的著录 所谓著录是依据一定的标准,对一种文献信息的形式特征和内容特征进行全面的描述和记录﹐以编制可以揭示文献信息特征的款目的方法。 (1)传统著录法 指按照《国际标准书目著录》(ISBD)等标准和规则的要求统一进行规范化的著录,采用手工或计算机进行分项著录,形成规范的卡片目录,由手工编排款目的著录法。 F127/22 西部大开发指南/西部开发课题组编.— 长春:吉林文史出版社,2000.6 3册 2486页 ISBN7-80626-570-8,精装:Y698.00 内容摘要:该指南系统论述了…… (2)机读目录 指任何形式的计算机可以阅读和识别的目录。是文献内容和外表特征 数据 经过计算机处理,以代码形式记载在一定载体上而形成的一种目录,是书目数据库的基础。 1977年国际图书馆协会和机构联合会主持制定了《国际机读目录格式》 UNIMARC 。中国国家图书馆即北京图书馆于1987年开始了中国机读目录(CNMARC)的开发工作,1991年1月正式发行机读目录。 信息检索系统,全称信息存储与检索系统。以广义上讲,它是将用户的信息需求同信息源之间联系起来,包含有信息集合,具备一定的物质载体和设备,并具有一定的检索功能的有机整体。 这种系统具备信息的采集、标引、组织等存储和检索的全部功能。 2.3 信息检索技术 2.3.1检索方法 (1) 工具法 顺查法 倒查法 抽查法 (2) 追溯法 (3) 循环法 2.3.3 计算机检索技术 (1)布尔检索 布尔逻辑算符常用的有逻辑或、逻辑与、逻辑非、逻辑异或四种。 ② 逻辑与(AND) * A*B 、A AND B ③ 逻辑非(NOT) — A-B 、A NOT B ④ 逻辑异或(XOR ) A XOR B、A B (3)字段限制检索 将检索词限定在一定的字段范围之内的检索方法,主要作用是缩小检索范围。 (4)位置逻辑检索 或称邻接检索,是利用位置算符来限定检索词之间的位置关系,或指定检索词在数据库记录中某一特定位置进行检索。 2.3.4 检索策略 (1)定义 检索策略是根据检索需求,对整个检索过程进行科学而合理的安排,制定出一个能达到理想检索结果的全盘计划和方案。 分析检索课题: 分析并确定信息需求的性质与类型 1. 对现期文献的需求:求新 2. 对某一理论、技术片断性文献的需求:求准 3. 对某一课题的历史、发展等进行了解的检索需求:求全 4. 对已知特定文献的需求:特定需求 前三种:主题需求 第四种:原文需求 检索式:利用布尔逻辑算符、位置算符、截词符等检索逻辑符算符将各个检索词组配起来,用以表达和描述检索提问,并提交计算机检索系统进行运算和匹配的逻辑表达式。 是对检索需求的精确而全面的综合表述 是检索策略的具体体现 例如:检索EBSCO学术信息、商业信息数据库 EBSCO公司的网络版数据库: Academic Search Premier (学术期刊数据库) Business Source Premier (商业资源数据库) ② 同句检索:位置算符为(S) 如:计算机(S)检索技术 ③ 同字段检索:位置算符为(F) 如:计算机(F)检索技术/TI,SU (2)构造检索策略的步骤 ① 分析检索课题的主题内容 。 ② 在分析课题的基础上,确定检索系统。 ③ 确定检索方法。 ④ 确定检索途径。 ⑤ 确定检索词,明确各词之间的逻辑关系,构造检索提问表达式,简称检索式。 ⑥ 输入检索式,对数据库进行检索,查找出相关文献信息,并予以分析筛选。 ⑦ 如果尚未达到检索需求,可以对检索式进行修改,或修改其他步骤,再次检索。 ⑧ 索取原文。 ② 检准率(Pertinency factor) 误检率(Noise factor) 衡量检索系统准确检出相关信息能力的指标。 表示为: 检准率 检出的相关信息量/检出的信息总量 X/X+Y 误检率 检出的无关信息量/检出的

文档评论(0)

bbnnmm885599 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档