基于领域的名词短语语义分析及其实现.docVIP

基于领域的名词短语语义分析及其实现.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于领域的名词短语语义分析及其实现 摘要:将自然语言理解限定在领域范围内,便于自然 语言理解系统的实现,有利于解决智能人机接口、自动建 模等问题。详细地分析了其中的名词短语的语义特点,并 分析了其处理过程。 关键词:自然语言理解;名词短语;语义分析;领域 自然语言理解研宄是当前最热门的研宄课题之一。目 前国内对汉语理解的研宄虽然比较多,但相对成熟的却比 较少。这主要是由于汉语语句经过词法分析、语法分析以 后还存在很多歧义。汉语与印欧语不同,关于成分间的搭 配,其句法制约因素少一些,相应地,语义制约因素更复 杂一些。因而语法分析以后进行详细地语义分析,计算机 就可以更准确地理解汉语了。而又由于自然语言本身的模 糊性和非精确性,以及计算机语言知识的贫乏,使得对语 言的语义分析理解很困难。鉴于目前自然语言理解的需求, 同时为了有效解决这个问题,本文将自然语言理解的范围 限制到某个领域内进行研宄。本文重点介绍汉语中名词短 语的语义分析过程。 1基于领域的自然语言理解特点 基于领域的自然语言理解把自然语言进行颂域划分, 在较小的范围内进行语言处理有其自身的优势: (1 )缩小自然语言理解的研究范围有利于系统研究与实 现。计算机要达到能够象人类一样游刃有余地理解自然语 言,不仅需要将全部的自然语言知识输入进去,而且还需 要将足够的经验输入进去,这将是一个相当大的挑战。将 自然语言限制在领域内理解,其涉及的方面比较窄,词汇 量比较少,语义比较确定,故分词、词法分析就变得相当 简单,语义推理相也对比较简单,歧义处理的复杂性也会 降低。这样系统开发就容易实现。 人们在分析处理复杂事物时,最常用的办法是把复 杂事物进行分解,由局部到全部逐步处理。对自然语言理 解这一庞大的工程来说,把自然语言按不同领域进行划分, 不仅符合人类的思维习惯,而且降低了语言处理的难度。 2名词短语的语义分析 计算机对名词短语的理解主要是对其组成成分间关系 的识别。而在名词短语的组成成分中,名词与名词之间关 系的最为复杂,可以形成定心结构、联合结构等等。同时, 名词间关系的理解又是短语语义结构分析的重点,因此下 面讨论一下名词间的关系。 第一种关系为一般特殊关系,这种关系不仅揭示了事 物之间特有规律的联系,而且还可以简化概念的描述。采 用面向对象中继承的方法,可以使下层概念自动具有上层 概念的可继承的属性,因而也就可以集中考虑下层概念的 特有属性。第二种关系是整体部分关系,又称组装关系,用 于描述概念与其他概念之间的组成关系。通过他可以看出 某个概念是以另外一些概念为其组成部分的。客观世界中, 整体和部分关系广泛存在于事物之间,如:物理上的整体 事物和他的一个部分,如汽车与发动机;团体(组织)与成 员,如班级与学生;空间上的包容关系,如教室与桌椅; 抽象事物的整体与部分,如法律与法律条文;具体事物和 他的某个抽象方面,如人员与人员的身份。第三种为实例 关系。概念间的实例关系也叫类概念的实例化,他是连接 类概念和对象概念的桥梁和纽带,他主要是把类概念的属 性值适当取值而得到的。例如,对于概念“三角形”当其 属性“边”取值为“AB、BC、AC”,顶点取值为“A、B、C” 时,就得到概念“三角形”的实例化概念“三角形ABC”。 3名词短语语义分析的实现 语义分析总流程 名词短语理解的总流程图如图1所示。 句中名词语义识别的实现 简单句中名词识别是分析名词短语的基础,名词所描 述的概念内涵、外延等语义直接影响名词短语的划分及识 别。 本系统对名词语义分析实质上是概念的实例化过程, 实例化就是对概念的属性值进行填充。我们用动态名词及 名词属性模板记录实例概念及其属性。因此,这里只需通 过语义规则来填充动态名词模板和名词属性模板就可完成 概念的实例化,实现对具体概念的理解。 名词短语划分的实现 名词短语的界定一直是理解名词短语的难点。我们认 为组成句子的基底结构是动核结构,任何一个动核结构都 是由动核和动元(动核所联系的强制性语义成分)组成,而充 当动核和动元的正是动词和名词,所以可认为名词与动词 的理解是句子识别的核心。此外,结合汉语名词短语的语 法结构特征,即大多数的名词短语都是以名词结尾,我们 提出先对简单句中的名词短语做模糊划分,将句子分为作 动元的名词块与作动核的动词块两部分。而对名词短语的 进一步准确界定,仍需更多的语义知识才能处理。 名词短语识别的详细流程如图3所示。 名词短语识别的实现 名词短语的识别模块是整个名词短语理解的核心,他不 仅实现名词短语各组成成分及其语义关系的识别,而且通 过语义分析的方法,可进一步界定名词短语。 名词短语识别模块的流程如图4所示。 4结语 把自然语言理解限定在领域范围内,显著降低了语言 理解的难度,有助于自然语言理解系统的开发。本文将

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档