- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Zhou GD, Kong F. Learning noun phrase anaphoricity in coreference resolution via label propagation. JOURNAL
OF COMPUTER SCIENCE AND TECHNOLOGY 26(1):34-44 Jan. 2011. DOI 10.1007/s11390-011-1109-8
基于标注传播算法的名词性待消解项识别研究
1.本文的创新点
本文提出了一种基于标注传播算法的全局学习方法用于决定文本中名词性
短语的待消解性信息,以进一步提高指代消解的性能。据我们所知,这是首次系
统深入地将特征向量方法和树核函数方法同时成功应用于待消解项识别,并做了
深入比较分析,最后将之作为一个模块成功应用于指代消解。
2 .实现方法
给定待消解性标注和未标注名词性短语实例,标注传播(LP )算法首先将它
们表示成连接图中的一个个顶点,然后通过加权边将标注信息从任意一个顶点传
播到与它相邻的其它顶点,最后这种传播会达到一个全局平衡状态,从而可以得
到所有待消解性未标注名词性短语实例的标注信息。本文中,LP 算法中的标注
实例包括训练语料中所有的待消解性标注实例,未标注实例包括测试语料中所有
的待消解性未标注实例。同时,本文探索了两种核函数(经向核函数和模糊匹配
卷积树核函数)用于计算两个名词性短语之间的待消解性相似度,用于度量连接
两顶点的加权边的强度。最后,为了减轻标注传播算法中存在的巨大计算负担,
本文探索了利用某些关键实例来代表训练语料中存在的所有标注实例。特别是,
我们把 SVM 训练得到的加权支持向量作为关键实例。基于LP 算法的待消解项
识别的一个主要优点来自LP 算法的全局优化能力,所有未标注测试实例的待消
解性信息可以做到同时确定。另一个优点是LP 算法能有效获取标注实例和未标
注实例中存在的自然聚类结构。
3 .结论及未来待解决的问题
结论:实验表明,本文所提方法对待消解项识别非常有效,并能大大提高指
代消解的性能。与局部学习方法相比,LP 算法能实现全局优化,因此性能要好
得多。同时,实验表明,基于特征向量的待消解项识别对代词的指代消解贡献大,
对定指名词性短语的指代消解没什么影响。与此相比,基于树核函数的待消解项
识别由于能够有效捕获各种结构化信息,特别是本文中采用的模糊匹配卷积树核
函数允许子结构之间的模糊匹配,因此效果更为明显,使得代词和定指名词性短
Zhou GD, Kong F. Learning noun phrase anaphoricity in coreference resolution via label propagation. JOURNAL
OF COMPUTER SCIENCE AND TECHNOLOGY 26(1):34-44 Jan. 2011. DOI 10.1007/s11390-011-1109-8
语的指代消解性能都大大提高了。
未来待解决的问题:本文只是把待消解项识别作为指代消解的一个预处理任
务。这样做的一个缺点是待消解项识别的错误会直接影响到随后的指代消解任
务,而且这种错误是无法恢复的。一个可能的解决方案是实现待消解项识别与指
代消解的联合学习,以更好地利用待消解性信息。另外,本文中探索了两种核函
数(经向核函数和模糊匹配卷积树核函数)用于计算两个名词性短语之间的待消
解性相似度,是不是还有其它更合适的相似度计算方法呢?这些都是有待解决的
问题。
4 .实用价值或应用前景
作为自然语言理解的一个关键问题,待消解项识别及指代消解可广泛应用于
自然语言接口、机器翻译、自动文摘、信息抽取和问题回答。
原创力文档


文档评论(0)