汉语语义标注理论的新视角——《特征结构及其汉语语义资源建设》书评.pdfVIP

汉语语义标注理论的新视角——《特征结构及其汉语语义资源建设》书评.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉语语义标注理论的新视角——《特征结构及其汉语语义资源建设》书评.pdf

2014年4月 湖北文理学院学报 Apr.,2014 第 35卷第4期 JournalofHubeiUniversityofArtsandScience V01.35No.4 汉语语义标注理论的新视角 — — 《特征结构及其汉语语义资源建设》书评 姬东鸿 (武汉大学 计算机学院,湖北 武汉 430072) 摘要 :中文信息处理的难点就是寻找一种合适汉语独特特点的语义分析方法。大规模面向 真实文本的汉语语义标注资源,也是当前 中文信息处理 中决定语义关系抽取、自动 问答、信息检 索、文本蕴涵等领域的性能优劣的关键因素之一。《特征结构及其汉语语义资源建设》提 出了一 种新的语义分析方法——特征结构理论,并在此基础上建构了一个3万句的大规模标注语料库。 该书为中文信息处理提供 了一种语义分析方法,也提供 了一个可以为各大研究机构共享的汉语 句子级语义资源;同时也为汉语语言学理论中某些问题的解释提供 了一个别样的视角。 关键词:语义标注;特征结构;资源建设;无向图 中图分类号 :I210.3 文献标志码 :A 文章编号:2095—4476(2014)04—0086—03 汉语语义分析 (semanticparsing),特别是大规模真实文本的语义分析,一直是当前 自然语言处理 (natu. rallanguageprocessing)的难点。传统依存分析法(dependencyanalysis)等标注方法在处理汉语特殊句型和特 殊语言现象 (如:主谓谓语句、连动句、兼语句、复杂名词短语、动补结构等)时遇到一系列难题。寻求一种适 合汉语 自己的特点的汉语依存标注体系,是中文信息处理研究的当务之急。湖北文理学院陈波副教授所著 的 《特征结构及其汉语语义资源建设》一书,正文共 199页,18.5万字,配有 114个图表。该书的研究 目的正 是探索一种适合汉语 自身特点语义标注理论,立足于 自然语言处理的语义分析需求,提出的特征结构语义 描述模型。基于语义分析方法建构的标注语料库,是 自然语言处理基础研究和应用技术研究的基础。该书 描述了基于特征结构理论 (FeatureStructure)建构的大规模的汉语语义资源 (semanticresource)的过程,该资 源对于提高语义关系抽取 (特别是事件关系抽取)、自动问答、信息检索、文本蕴涵等系统的性能有积极的意 义。该书对语义分析理论和语言学理论进行了尝试性地探讨,通过特征结构理论积极探求汉语特殊语言现 象背后的语言规律和描述机制 。 一 、 《特征结构及其汉语语义资源建设》的主要内容 全书由前言、六个章节和后记组成,全书内容包括五个部分:研究背景概述、特征结构模型、语义资源建 设、在语言学领域的应用及结论,具体如下: 第一章引论部分,详细地介绍了汉语语义分析方法的研究背景、国内外研究现状分析、研究对象界定、 研究内容等方面。通过该部分,读者对 目前 自然语言处理学界的主流语义标注方法和已完成的语义标注资 源会有一个较全面的了解。 第二章是作者的重点研究成果,提出了 “特征结构模型”的理论 ,主要研究了特征结构模型的界定,特征 结构的特点、形式化表示 以及判定方法 四大部分。特征结构的特点是用特征三元组反映概念关联和关联种 类,特征三元组允许多重关联和交叉关联,允许嵌套和递归。特征结构的形式化表示为特征结构图,是一个 “可递归的无向图”(recursiveundirectedgraph)。特征结构的判定方法是基于提问的方法,研究了各种句式 中提问的条件、提问针对的成分以及特征词在其中的分布等。 这部分是全书的理论精华所在 ,特征结构模型是一种新的汉语语义分析策略,该理论基于概念关联和 关联种类,用特征结构三元组:[实体,特征,特征值]来描述具有语义关联的一组词语 。特征结构允许语义 收稿 日期:2014—03—02 作者简介:姬东鸿 (1966一 ),男,河南驻马店人,武汉大学计算机学院教授 ,博士生导师,主要研究方向:自然语言处理。 86 姬东鸿 :汉语语义标注理论的新

文档评论(0)

月光般思恋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档