第九章 主题分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第九章 主题分析 本章与前后各章的联系 第六章讲述元数据的基本概念和基础知识 第7-8章讲述元数据描述知识 第七章讲述元数据描述规则 第八章讲述元数据描述过程中名称和题名检索点的选择规则,即对名称和题名的规范控制 第9-10章讲述元数据标引知识 第九章讲元数据标引过程:概念分析-概念转换 第十章讲述为提高标引质量而采取的控制措施:主题词的规范控制 引言 为什么要进行主题分析 信息资料的检索方法与检索工具是开启知识宝库的钥匙 重视检索方法与工具的研究与改进才能向读者提供快速而高品质信息服务 研究显示,主题检索是网络资源使用者偏好的检索途径,但也最常遭遇困难 困难的表现是无法准确地表达概念,使用概念检索检全率和检准率都比较低 概念和用词的多样性影响到了对概念的自动标引的效果和效率,需要通过人工加以控制 提纲 一、主题分析的目的 通过检索工具为信息体提供有意义的主题检索入口 类聚近似信息体 排列相似的信息体 节省用户的时间 二、 主题分析的过程 对信息体进行概念分析,确定其知识内容和含义 将分析出的主题概念转换成分类号和主题词 主题分析过程涉及到的问题 2.1 概念分析的信息源 文本信息源 标题和副标题 目次 前言 与其它部分字体不同的索引词、链接、摘要等 插图、图表、说明文字 非文本信息源 审读对象本身、其中的图片和其它代表内容的部分 说明文字 2.2 确定标引深度 2.3 识别主题概念 论题主题 抽象或具体的主题 代表主要目的 贯穿作品始终的思想 名称主题 人名、地名、题名、团体名称 其它专有名称。如建筑物名、城市名等 时间主题 对主题的时间范围进行限制,可看做主题内容的一个方面 时间的表示方法不同,可以用行政阶段、公元纪年、年号等。特别有名的某些时期(如二战期间)和时间段(如文艺复兴时期)也可作论题主题 形式主题 载体特征。如录像带、相片、日记、地图等 数据类型。如大纲、参考书目、索引、调查问卷、统计数据等 体裁、技术、目的、受众等特征。如戏剧、传纪、卡通、商业作品、流行作品等 2.4 主题概念转换 转换成主题词 判断某一信息体是“关于……的”,以便寻找合适的词汇 遵照主题词表使用规则进行标引 转换成分类号 了解分类法的体系和编制规则 等级体系分类法中分类号的确定方式:先内容后外形 确定主题内容所在类号的方法:大类——小类——具体主题 进一步按形式主题细分的顺序:研究方法——时间——地点——载体形式 分面分类法中分类号的确定方式:找出文献主题涉及到的不同分面的类号——按分面类号组合规则进行组合 三、概念分析时遇到的挑战 3.1 如何确定信息体的主题 确定信息体的主题有三个步骤: 明确信息体的内容是什么 判断内容所属的基本学科类别 明确信息体的内容是干什么用的 判断内容所属学科的细分门类 明确信息体的内容是关于什么的 判断内容所属学科的子类中的主题 确定主题困难的原因:信息体的主题不明显;不能容易地识别出信息体的主题;信息体的主题可能隶属于不同的学科;信息体有不止一个主题;信息体可能涉及一个主题的多个方面 3.2 概念分析中的文化差异 不同的语言表达同一概念对象时使用词汇的数量和表达方式都会有所不同,不同地区的人对同一个对象的理解也不一样。因此,语言背景和文化背景会影响到主题分析 3.3 概念分析中的方法差异 3.4 概念分析中的标引一致性差异 不同的人在标引和检索时使用词汇的差异如下: 不同个体在确定相同信息主题时所用的词汇不同 对相同信息主题进行自然语言描述时所用的词汇不同 根据作者的写作目标和意图分析主题 标引一致性差异的原因 不同个体抽取词汇时使用的词表不同 不同个体遵循了不同的选词规则 不同个体所用的概念分析方法不同 解决不一致问题的方法 理解作品是干什么用的,从用途角度区分主题 3.5概念分析中的非文本信息分析难题 非文本信息主题更难确定。可采用如下方法: 识别代表主题范围的概念或概念组合 识别和列举代表对象和情景的一般符号和通用名称 识别描述对象和情景的综合主题或突出思想 无法识别主题时的解决方案:解释主题。 * * 主题分析的目的 主题分析过程 概念分析时遇到的挑战 概念转换为主题词 概念转换为分类号 一、主题分析的目的 二、主题分析过程 选择分析信息源 确定标引深度 识别主题概念 主题概念转换 用广义词标引 检全率高 用专深词汇标引 检准率高 特点 期刊论文标引 电子资源标引 网页标引 全文检索 标引出某一信息资源的所有主要概念 标引主要的细小主题概念 深标引 层次 含义 应用 浅标引 仅标引出主要的、整体的概念 标引隐藏在主要主题中的概念 图书标引 连续出版物标引 实物标引 网站标引 仅关键词检索 三、概念分析时遇到的挑战 如何确定信息体的主题 概念分析中的文化差异 概念分析中的标引一致性

文档评论(0)

jsntrgzxy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档