汉语语篇理解中元指代消解初步a-软件学报.pdfVIP

汉语语篇理解中元指代消解初步a-软件学报.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉语语篇理解中元指代消解初步a-软件学报

1000-9825/2002/13(04)0732-07 ©2002 Journal of Software 软 件 学 报 Vol.13, No.4 汉语语篇理解中元指代消解初步 张 威, 周昌乐 (浙江大学 信息学院 计算机科学与工程系,浙江 杭州 310027); (浙江大学 人工智能研究所,浙江 杭州 310027) E-mail: hdstsysgn@ 摘要: 指代消解是语篇机器理解中的重要一环.研究发现, 由于表示语篇本身某一部分而非语篇内容的元指代 现象普遍存在,语篇元指代消解也就成为困扰着语篇机器理解实现的困难之一.对语篇中的元指代现象进行了 分析,提出句焦点的概念,并在句焦点集的基础上, 用优先和过滤算法实现了元指代的消解.在使用自然语料的实 验中表明, 句焦点集的作用对于元指代机器消解有重要作用.它丰富了语篇分析和表述理论,对汉语语篇分析理 解中寻找元指代关系,从而完成连贯语篇意义具有重要意义. 关 键 词: 自然语言理解;汉语语篇分析;指代消解;元指代; 句焦点 中图法分类号: TP 18 文献标识码: A 汉语计算机处理在当前信息社会具有广阔的应用前景. 以前的汉语研究注重对词、词组、句子的分析和处 理,对汉语语篇(篇章或话语) 的分析研究较为薄弱.但汉语的机器理解最终要落实到语篇一级的理解上来. 作为语篇衔接与连贯的重要手段之一,指代(anaphora)是指在语篇中用一个指代词回指某个以前说到过的 语言单位.指代词的使用使语篇的表述不显累赘、简明清晰. 同时,指代反映了语篇中各语句之间的语义联系,是 语篇成其为语篇的重要特征.一般来说,指代可以分为代词性指代、名词性指代和零指代 3 种.从意义层次上来 分类,还可分为指代和元指代. 作为自然语言的汉语,普遍存在着语言与元语言混用的现象, 比如“‘焦点’这个词是一个名词”这句中就是 如此.语篇中也存在指代和元指代之分.而所谓元指代是指语篇中存在的这样一种指代,其所替代的对象并非是 语篇表述内容,而是语篇本身某一部分. 比如像“你好这两个字使用频率很高” 、“记住一句话:‘学无止境.’” 、“本 章我们论述了…” 、“上文谈到…”等中的“这两个字” 、“一句话” 、“本章” 、“上文”等等就属于元指代类属.其他 像“说了...,就该说”虽没有显式的指代词,但也同样存在着元指代意味.而对语篇意义理解而言,很明显,只有确实 完成了这些元指代的确认和消解,才真正谈得上整幅语篇意义的理解贯通. 在国外,有关语篇表述和指代消解的研究工作开展得较为普遍,并取得了不少成绩[1~3] .就我们所关心的方 面来看,主要有 Grosz,Sidner,Walker 等人提出、发展并加以完善的指代消解焦点理论.所谓焦点,就是单句当前 注意力所在.一般来说,每句话都有焦点,一段篇章由焦点链组成,焦点链体现了篇章的脉络和结构.Grosz 将焦点 空间设计为局部的语义网,运用到一个会话理解系统中.Sidner 对焦点的确定、转移作了大量研究,结合到 PAL 系统中.Walker,M.A.对Grosz 和Sidner 提出的针对言语中指代消解的Focus Stack 模型进行了修改,根据长时记 忆和短时记忆的类比,加入了代表短时记忆的Cache 模型. 国内,针对汉语语篇,在必须解决人称指代问题时(如汉语的整篇机译),一般都遵循“最近匹配原则”.谌志群 收稿日期: 2000-09-03; 修改日期: 2000-11-20 基金项目: 国家自然科学基金资助项目 作者简介: 张威(1974 -), 男,广东惠阳人,博士生,主要研究领域为计算语言学,软件工程;周昌乐(1959 -), 男, 山东文登人,博士, 教授,博士生导师,主要研究领域为计算语言学,认知逻辑学,神经动力学,人工智能. 张威 等:汉语语篇理解中元指代消解初步 733 对人称指代消解进行了研究,采用“关注焦点”集的计算方法.在此基础上,提出了一种基于“关注焦点”集计算的 人称指代消解算法[4] .至此,还未见有关元指代消解的研究. 本文的工作主要是针对汉语书面语,设计算法找到元指代词所指的对象,并评价该元指代消解实验. 1 语篇表示方法 要进行指代消解,首先我们选择一种方便在计算机中表示语篇的结构的方法.我们使用复杂特征集来进行 语篇中名词、动词、

文档评论(0)

suijiazhuang1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档