信息检索教程 教学课件 作者 冯惠玲 王立清 著 第三章 信息著录和标引.pptVIP

信息检索教程 教学课件 作者 冯惠玲 王立清 著 第三章 信息著录和标引.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 信息著录和标引 第一节 信息著录的含义和标准 一、信息著录的含义和作用 (一)信息著录的含义 信息著录简称著录,是指在组织检索系统时对文献内容和形式特征进行选择和记录的过程。信息著录是组织检索系统的基础,是信息存储过程中的一个重要环节。 (二)信息著录的作用 1.信息著录是揭示文献内容特征及相关信息的有效方法 2.信息著录是编制目录和建立数据库的基础 3.信息著录结果是信息检索的主要依据 二、信息著录的标准 (一)信息著录标准的发展 信息著录标准一直受到信息工作者的重视,世界各国都为信息著录标准的编制和推广付出了多年的努力和积极的探索。 (二)《文献著录总则》 1.著录项目 2.著录级次 3.著录格式 第二节 机读目录与元数据 一、机读目录 机读目录(MARC)即机器可读目录的简称,来自英文Machine-Readable Cataloging,是利用计算机识读和处理的目录。 二、元数据 元数据的英文为Metadata,意为关于数据的数据。在因特网中,元数据是指描述任何因特网数据和资源,促进因特网信息资源的组织和发现的数据,可协助对网络资源进行识别、描述并指示其位置。 (一)元数据的作用 元数据具有描述、定位、搜寻、评估、选择等多种功用,可以连贯有效地描述、管理、编目网络资源,以便用户更方便地找到资源,并找到更多的相关资源。 (二)都柏林核心元数据集 1995年,在美国俄亥俄州的都柏林召开了由OCLC和美国超级计算机应用中心主持的第一届元数据研讨会,与会代表来自信息管理和信息技术领域,他们一致认为有必要产生一个简单的描述网络上文件类对象(DLO)资源的元数据集,并最终产生了一个包括13个元素的都柏林核心元数据集。 三、都柏林核心元数据和机读目录的比较 1.著录的对象不同 2.数据的形式不同 3.著录的主体不同 4.著录的详简程度不同 5.标识的方法不同 第三节 信息标引的含义和步骤 一、信息标引的含义和质量控制 (一)信息标引的含义 信息标引是指在分析文献内容的基础上,用某种检索语言把文献主题以及其他有意义的特征标识出来作为文献存储与检索依据的一种文献处理过程。 (二)信息标引的质量控制 1.标引深度 2.专指度 3.一致性 二、信息标引的步骤 (一)主题分析 1.主题类型和结构 2.主题分析方法 (二)概念转换 主题概念转换是以主题分析为基础,将确定的主题概念赋予检索标识的过程。概念转换的结果是形成检索标识。 一、分类标引 文献分类标引是指依据一定的分类检索语言,对文献内容的学科性质及其有检索意义的形式特征进行分析、归纳,赋予文献分类检索标识(分类号)的过程。目前,国内主要依据《中国图书馆分类法》来进行分类标引。 (一)基本原则 1.学科属性原则 2.专指性原则 3.实用性原则 4.系统性原则 5.一致性原则 (二)各种类型主题文献的分类标引规则 1.单主题文献的分类标引方法 2.多主题文献的分类标引 3.相关关系主题文献的分类标引 二、主题标引 主题标引指依据一定的主题词表,对文献的内容先进行主题分析,并赋予文献语词标识的过程。目前,国内主要采用《汉语主题词表》及其相关的专业词表进行主题标引。 (一)选词规则 (二)组配规则 在主题标引过程中,将两个或两个以上的主题词按照一定的逻辑关系加以组织以表达文献主题的,称为组配标引。组配标引是主题标引中准确揭示文献主题的一种基本的标引方法。 (三)主题词组配标引的形式 1.概念交叉组配 2.概念限定关系组配 3.连接关系组配 第五节 自动标引 一、自动标引概况 自动标引指直接通过计算机的操作处理,赋予检索标识的活动。自动标引是根据检索的需要发展起来的,是电子环境下出现的一种新的标引形式。 二、自动标引方法 人们建立自动标引系统的最终目的是利用机器从输入文献中自动生成能够用以代表文献特征的标识,以利于检索的方便。依据自动标引采用的理论,自动标引的方法主要有统计标引法、语言分析标引法、人工智能标引法等。 (一)统计标引法 1.词频统计法 2.加权标引法 3.n-Gram标引法 4.统计学习标引法 (二)语言分析标引法 1.句法分析标引法 2.语义

您可能关注的文档

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档