- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
意义群落测定在知网机译系统中的应用
意义群落测定在知网机译系统中的应用
董强,董振东,郝长伶
HowNet Technologies Inc.
Email:{dongqiang, dzd, support}@
摘 要: 本文是《知网机译系统中的语义计算》的姊妹篇。本文提出和讨论了一种与被称为与意义群落相关
的歧义的消除的方法和技术,以及它在机器翻译系统中的应用。该方法和技术被称为意义群落测定(Sense
Colony Testing,SCT)。该方法是基于知网的,是英中双语的。它处理的文本可以是超句的。它可以独立运
行,并作为其他类型的语言处理系统的应用工具。本文概要地说明了意群测定的原理, 介绍了它的组成部
分以及实现方法,以及机器翻译系统应用此工具的适宜时机。在最后一节的讨论中,作者探讨了 SCT 所要涉
及的特征的深度和精细度。
关键词:自然语言处理,知网,机器翻译,意义群落测定,词义消歧,消除歧义
Sense Colony Testing in HowNet MT System
Qiang Dong, Zhendong Dong, Changling Hao
HowNet Technologies Inc.
Email:{dongqiang, dzd, support}@
Abstract: This paper is a companion piece of “Semantic computing in HowNet MT system”. In terms of the
relatedness to syntax, the ambiguity can be roughly divided into two types: syntax-related and non- syntax-related.
The latter is closely associated with the discourse and topics. This paper proposes and discusses an original method
and technique for solving the latter type of ambiguity, which is called sense-colony-related type. The technique is
named Sense Colony Testing, SCT, which is wholly based on HowNet and can be operated bilingually, and can
process text-level discourse. The paper describes SCT’s linguistic principle and technical mechanism, and depicts
the SCT as a tool used in HowNet machine translation, Lastly in the section of discussion the paper demonstrates
the fineness of features that a NLP system have to employ..
Keyword: NLP, HowNet, machine translation, sense colony testing, WSD, disambiguation
1.引言
30 多年前,在研发我们最初的机译系统的时候,就一直为这样一个句子里的一种歧义的
消解而苦恼:“When I got to the bank, I found I didnt bring the fishing rods.”句中的“bank”,
在我们具有基本常识的人们看起来是很容易判定的。想着要带上钓鱼竿去的地方,自然应该
只能是“岸边”,而几乎不可能是“银行”,这是常识。当时研发的机译系统是基于规则的。
如果就
文档评论(0)