- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉语语篇理解中元指代消解初步a-软件学报
1000-9825/2002/13(04)0732-07 ©2002 Journal of Software 软 件 学 报 Vol.13, No.4
汉语语篇理解中元指代消解初步
张 威, 周昌乐
(浙江大学 信息学院 计算机科学与工程系,浙江 杭州 310027);
(浙江大学 人工智能研究所,浙江 杭州 310027)
E-mail: hdstsysgn@
摘要: 指代消解是语篇机器理解中的重要一环.研究发现, 由于表示语篇本身某一部分而非语篇内容的元指代
现象普遍存在,语篇元指代消解也就成为困扰着语篇机器理解实现的困难之一.对语篇中的元指代现象进行了
分析,提出句焦点的概念,并在句焦点集的基础上, 用优先和过滤算法实现了元指代的消解.在使用自然语料的实
验中表明, 句焦点集的作用对于元指代机器消解有重要作用.它丰富了语篇分析和表述理论,对汉语语篇分析理
解中寻找元指代关系,从而完成连贯语篇意义具有重要意义.
关 键 词: 自然语言理解;汉语语篇分析;指代消解;元指代; 句焦点
中图法分类号: TP 18 文献标识码: A
汉语计算机处理在当前信息社会具有广阔的应用前景. 以前的汉语研究注重对词、词组、句子的分析和处
理,对汉语语篇(篇章或话语) 的分析研究较为薄弱.但汉语的机器理解最终要落实到语篇一级的理解上来.
作为语篇衔接与连贯的重要手段之一,指代(anaphora)是指在语篇中用一个指代词回指某个以前说到过的
语言单位.指代词的使用使语篇的表述不显累赘、简明清晰. 同时,指代反映了语篇中各语句之间的语义联系,是
语篇成其为语篇的重要特征.一般来说,指代可以分为代词性指代、名词性指代和零指代 3 种.从意义层次上来
分类,还可分为指代和元指代.
作为自然语言的汉语,普遍存在着语言与元语言混用的现象, 比如“‘焦点’这个词是一个名词”这句中就是
如此.语篇中也存在指代和元指代之分.而所谓元指代是指语篇中存在的这样一种指代,其所替代的对象并非是
语篇表述内容,而是语篇本身某一部分. 比如像“你好这两个字使用频率很高” 、“记住一句话:‘学无止境.’” 、“本
章我们论述了…” 、“上文谈到…”等中的“这两个字” 、“一句话” 、“本章” 、“上文”等等就属于元指代类属.其他
像“说了...,就该说”虽没有显式的指代词,但也同样存在着元指代意味.而对语篇意义理解而言,很明显,只有确实
完成了这些元指代的确认和消解,才真正谈得上整幅语篇意义的理解贯通.
在国外,有关语篇表述和指代消解的研究工作开展得较为普遍,并取得了不少成绩[1~3] .就我们所关心的方
面来看,主要有 Grosz,Sidner,Walker 等人提出、发展并加以完善的指代消解焦点理论.所谓焦点,就是单句当前
注意力所在.一般来说,每句话都有焦点,一段篇章由焦点链组成,焦点链体现了篇章的脉络和结构.Grosz 将焦点
空间设计为局部的语义网,运用到一个会话理解系统中.Sidner 对焦点的确定、转移作了大量研究,结合到 PAL
系统中.Walker,M.A.对Grosz 和Sidner 提出的针对言语中指代消解的Focus Stack 模型进行了修改,根据长时记
忆和短时记忆的类比,加入了代表短时记忆的Cache 模型.
国内,针对汉语语篇,在必须解决人称指代问题时(如汉语的整篇机译),一般都遵循“最近匹配原则”.谌志群
收稿日期: 2000-09-03; 修改日期: 2000-11-20
基金项目: 国家自然科学基金资助项目
作者简介: 张威(1974 -), 男,广东惠阳人,博士生,主要研究领域为计算语言学,软件工程;周昌乐(1959 -), 男, 山东文登人,博士,
教授,博士生导师,主要研究领域为计算语言学,认知逻辑学,神经动力学,人工智能.
张威 等:汉语语篇理解中元指代消解初步 733
对人称指代消解进行了研究,采用“关注焦点”集的计算方法.在此基础上,提出了一种基于“关注焦点”集计算的
人称指代消解算法[4] .至此,还未见有关元指代消解的研究.
本文的工作主要是针对汉语书面语,设计算法找到元指代词所指的对象,并评价该元指代消解实验.
1 语篇表示方法
要进行指代消解,首先我们选择一种方便在计算机中表示语篇的结构的方法.我们使用复杂特征集来进行
语篇中名词、动词、
您可能关注的文档
最近下载
- 降钙素原抗体产品技术要求标准2024年.pdf VIP
- 2013-2022同等学历申硕学位英语真题(含答案).pdf VIP
- 2023年全国职业院校技能大赛食品安全与质量检测题库1-10.docx VIP
- 内部培训刑法知识考试题库大全及答案下载.pdf VIP
- 2025至2030全球及中国车载摄像头模块组件行业项目调研及市场前景预测评估报告.docx
- 2023-2024学年安徽省合肥重点中学九年级(上)第一次月考道德与法治试卷.pdf VIP
- 人教版(2024新版)九年级上册化学全册教案教学设计.docx
- 中国油田分布明细-含分布图.docx VIP
- 6.4 酵母菌子囊孢子的观察(原理讲解).pdf VIP
- AIGC技术在非物质文化遗产设计保护中的应用探索 .pdf VIP
文档评论(0)