基于映射方法的叙词表互操作研究.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于映射方法的叙词表互操作研究 作为一种多相操作技术,映射为两个或多个单词表的语言建立了关系,并自动转换和连接单词表。映射结果是关系的集合。映射方法应用到叙词表互操作上即为叙词表映射, 叙词表映射是解决知识组织体系互操作方法的一种技术, 通过建立词表间的映射关系可以实现主题间的交叉检索和浏览, 满足用户“一站式”检索。不同的叙词表在词形、词义和结构等方面存在的差异, 使得映射成为一项非常复杂的工作。M. Doerr认为术语选择、先组和后组程度、学科覆盖范围、语义概念和语义关联的不同是影响叙词表映射的主要问题。准确判定叙词表术语的概念语义是保证映射质量的关键, 依据一定的自动推理规则可减少叙词表映射的人工量, 降低映射的复杂度, 本文通过实施叙词表映射实验, 对叙词表映射语义判定指导规则和自动推理规则进行探析。 1 科学表3asfaciencisp 本文选择剑桥科学文摘数据库 ( CSA) 中生物科学领域的两部叙词表中的部分叙词进行实验, 分别是Aquatic Sciences Fisheries Abstracts ( ASFA) thesaurus ( subjects) ( 水科学和渔业文摘叙词表) 第3版和Life Sciences thesaurus ( subjects) ( 生命科学叙词表) 第4版, 前者是目标词表, 后者是源词表。 本文使用《ISO25964 - 2叙词表与其他词表的互操作》推荐的映射类型进行映射实验, 其中EM表示等价映射, NTM代表下位映射, BTM代表上位映射, RTM代表相关映射, 为便于讨论, 笔者特增加NM, 用以代表无映射。 2 映射术语的概念语义 国际标准化组织制定的ISO25964 - 2中详细探讨了有关叙词表映射的模型、映射类型、映射方法、映射数据的应用和管理等问题, 万维网联盟 ( World WideWeb Consrtium, W3C) 的SKOS映射规范对词表的映射类型及概念组配方式进行了研究, 但都尚未对如何判断映射术语的概念语义进行探讨, 本文根据实验发现, 总结出如下方法进行叙词表术语概念语义的判断, 以保证映射数据的准确性。 2.1 定术语语义范围的前提条件 对叙词表收录的学科范围进行界定, 是确定术语语义范围的前提条件。如果不考虑术语学科范围而是根据词形相似度进行映射, 可能会建立错误的匹配, 示例如表1所示: 2.2 叙词语义范围 范围注释 ( Scope Note, SN) 说明该叙词的使用范围或定义范围, 为叙词语义范围的确定提供重要信息, 在进行叙词表映射时可参照范围注释以保证映射的正确性, 否则就可能会忽视部分语义信息而建立错误的映射关系, 示例如表2所示: 2.3 提供概念语义信息 用代关系 ( USE、UF) , 即叙词表中正式叙词和非正式叙词的关系, 它们表示含义相同、用法相同或者相似的一组概念, 两者结合考虑可提供概念的相关语义信息。“用词”代表“代词”的语义范围进行标引与检索, 映射时也需参照“用词”的语义范围才能进行准确的映射, 否则可能建立错误的映射关系而影响映射数据的后续使用, 示例如表3所示: 2.4 表结构信息的使用 词表本身的语义结构, 即词表中概念的上下位和相关关系等结构信息, 为概念的界定提供重要信息, 叙词表概念映射宜参考语义关系, 否则可能建立错误的映射关系, 示例如表4所示: 2.5 源词表的映射指导规则 在目标词表中, 时间注释属于范围注释的一部分, 是对因修订和重版等原因致使其语义范围发生改变的时间记录, 表示在某个时间点之前和之后该叙词代表的语义发生变化, 映射时应予以注意。 在本实验中, 目标词表在1982年进行了修订, 个别正式叙词的使用情况和范围发生了变化。具体来讲有如下几种情况: 1用代词的替换: 1982年之前使用现在的“代词”进行标引和检索; 2下位词替代上位词: 1982年之前使用现在的下位词进行标引和检索;3上位词替代下位词: 1982年之前使用现在的上位词进行标引和检索; 4相关词的替代: 1982年之前使用现在的相关词进行标引和检索; 5取代关系: 1982年之前用于标引和检索的词删除, 由现在的新词进行标引和检索。其映射指导规则示例见表5。 通过表5可知, 术语时间注释前后语义范围如果没有发生变化, 如“用代”词的代替和取代关系的变化, 源词表映射词和目标词表只需建立一种映射关系;如果术语在时间前后其语义范围上发生变化, 如上下位、相关关系的替代, 为保证检索的全面性, 则需要与目标词表概念建立两种映射关系。 3 映射推理规则 映射推理规则是指在已有映射关系和词表结构关系的基础上自动推断新的映射关系, 从而提高映射效率。常用的映射推理规则有继承性规则和传递性规则, G. Fausto

您可能关注的文档

文档评论(0)

uyyyeuuryw + 关注
实名认证
文档贡献者

专业文档制作

1亿VIP精品文档

相关文档