汉语指代问题的多策略解决.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第撕卷 南京大学学报(自然科学) v01.36 UNIVERSITY oFNAN_,ING 计算机专辑 JOI琅NAL C叫栅l龇 2∞0年11月 (N^:】m黜地SC玎珊CES) Nov.2000 汉语指代问题的多策略解决‘ 许敏 邱玉辉 王能忠 f西南师范大学将计算机科学系,重庆,枷715) ■墨指代曲解决对于日益扩丈的自然语言处理范置将取刊实用意义.重视篇章和故摹情节 的理解固然有助于解决类似的二义性目最,但所需的巨大知识库在实际系统中·无论是t立 迁是量终的效率和完鲁性均报难蔫足用户的需要.本文将甘对汉语的特点,以第三^称代词 为代襄.分析汉语篇章中可能出现的各种指代现拳井进行分类.通过语法分析和句子语义平 面的主客舞信息研究.利用G8理论和格框架,本文提出了辫决此娄语义阔囊的多策略方法· 并给出相应算法.从而避免击依藏宠大的知识率.奉算法在实际嗣斌中有着较高的指代准确 聿. 关t词指代,多策略,GB理论·格 O引 在早期的计算语言学研究中.人们的研究重点在单句的结构和意义上.以后逐渐扩 展到句群、段落乃至篇章的理解上.要想完全理解一个篇章所包含信息,除了要理解篇 章中旬子的含义外.还必须理解句子与句子之闻的联系·面对扩大的研究领域,要解决 的一个新问慝就是上下文中指代的模朔性.所谓指代,是指说话者或写作者假定听话者 或垛卖者能自己分折出所指的对象晕什么.因此才用省略的方法写戚简洁的语旬,其中 留有待读者自行分析的不明身份对象,如果让一个自然语言理解系统来模拟这个过程, 则称之为指代分析。指代的使用带来了理解上的困蔗,也增加了句子间关系和分析的复 杂性。而指代的解决对于目益扩大的自然语言处理范围将取到实用意义.研究其解决策 略,对自然语言理解、智能计算机、中文信息处理等都具有切实的作用,其应用前景十 分广阔。 l基本分析 需要回指的第三人称代词的指代主体既可能在本句内,也可能在前文中.通过代词 的分类和管辖语域与成分控制的研究中,我们注意到如果过分依藏语义知识,刚系统机 器实现的可能性会大大降低,而且叩使实现,语料来源也只可能是受限范围的文本·因 ’第一怍者帕介: 许赶,1972年生,博士研究生,主l研究方向为自蒜语言毫照M^s. 为几乎不太可能在计算机上去建立一个庞大有序。并娩包古所有世界知识、语境知识的 知识库,井基于它进行指代分析和认知推理.因此,比较而言,量可行性的方法应量尽 可毖去依靠句子奉身的深层结掬.即一些客观的知识,分析成分与成分之闻的语法关系。 适过分析句法来推测人类交际时一些应■于语义巷一的闻蠢。介于这样的出发点,·提出 的第一个解决麓咯就是语法过滤.通过缩小可能指代主体规模(即数量),限定指代范 圈或捧除一些不可能的候选元来降低算法量终的复杂性.然后再在此基础上进拧分类解 决.文中将给出具体的算法和相应的规则描述。 在t个指代解决的过程中,语法过滤罂发挥着重要的筛选、限定作用.如果其功能 足够强大.将会大大降低整个指代的难度.为了下面射研究作准备.现对“主体”进行 如下定义: 定义1.1主体集合^r舒lm∞辟{名词.名1的名2,名。的名2的名3……) 这里的“名词”可为姓名(如李平)、职务(如校长)、表关系的称谓(如姑姑)、 人称代词.而。名。的名:”、“名。的名2的名,”……这种倡正结构,如厂长的秘书、 “爸爸扮爸爸盼爸爸”在本研究中被视为一个主体.同一偏正结构的主体中出现的 。名。”不能相互指代. 2语法过滤器 2.1反身代词的语法过滤 汉语中反身用法的照应语主要有“ta自己”(当然还有“衄本人”“协自个儿4等) 和。自己”几种。在寻找指代主体的过程中。该照应语芷管辖语域内靛约柬,面照应语 的管辖语壤悬指一个包含中心语、主语和补语.可以体现一切语法功能的量小完整功能 体(印CFc).这一点实际上限定了指代主体的搜索范围.因为照应语(如饵自己)回

文档评论(0)

wuhuaiyu002 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档