- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
機器翻译中基于语法,语义知识库的汉语词义消歧策略
第七届中国人工智能联合学术会议(2002,桂林) Page PAGE 1 of NUMPAGES 11
PAGE
机器翻译中基于语法、语义知识库的汉语词义消歧策略?
? 本项研究得到国家973项目“面向新闻领域的汉英机器翻译系统”(项目号:G1998030507-4)的支持。
王 惠
北京大学计算语言学研究所,北京,100871
摘 要: 词义消歧研究在自然语言处理的许多应用领域中具有重要的理论和实践意义,在机器翻译中更是如此,它直接关系到译文质量的提高。但目前已有的词义消歧系统基本上都面临着消歧知识获取的瓶颈问题。本文认为,要真正有效地提高词义知识库的质量,需要在词类划分基础上,增加词义的语法功能分析和语义搭配限制,综合利用现有的语法、语义资源,提取多义词的每个意义在不同层级上的各种分布特征。以此为基础,本文提出了一种汉英机器翻译系统中基于语法、语义知识库的汉语词义消歧分析算法。初步的实验结果表明,该方法可以高质量地进行汉语名词、动词、形容词的词义消歧。
关键词:词义消歧(WSD) 汉英机器翻译 语法词典 语义词典
A Study of Chinese Word Sense Disambiguation in MT Based on Grammatical Semantic Knowledge-bases
Wang, Hui
(Institute of Computational Linguistics, Peking University, Beijing 100871, China)
Abstract
Word sense disambiguation (WSD) plays an important role in Machine Translation and many other areas of natural language processing. The research on WSD has great theoretical and practical significance. The main work in this paper is to study what kind of knowledge is useful for WSD in system, and establish a multi-level WSD model based on syntagmatic features and semantic information, which can be used to disambiguate word sense in Mandarin Chinese effectively.
The model makes full use of the Grammatical Knowledge-base of Contemporary Chinese as one of its main machine-readable dictionary (MRD), which can provide rich grammatical information for disambiguation such as Chinese lexicon, parts-of-speech (POS) and syntax function. Another resource of the model is the Semantic Dictionary of Contemporary Chinese, which provides a thesaurus and semantic collocation information of 68,000 Chinese words.
The results of this study indicate that the two MRD resources are effective for word sense disambiguation in MT and are likely to be important for general Chinese NLP.
Key words: Word Sense Disambiguation, Chinese-English Machine Translation, Grammatical Knowledge, Semantic Dictionary
1. 引言
由于自然语言中一词多义现象普遍存在,在机器翻译中,要让计算机进行准确的译文选择(translation choice),一个重要的前提条件就是能够在某个特定上下文中,自动排除歧义,确定多义词的词义
您可能关注的文档
- 模塊化防雷器和一体化防雷器的区别.doc
- 模式化教學的利与弊.doc
- 模擬实验15药物对家兔动脉血压的作用.doc
- 模塊术语的提取方法.docx
- 模擬乘法器的应用.docx
- 模擬情境式教学法在社区护理教学的应用初探.doc
- 模式識别在微观岩石图像自动分类中的应用.doc
- 模態与非模态对话框的区别与操作.doc
- 模擬情景教学法在思想道德修养与法律基础课中的应用.doc
- 模擬探究细胞表面积与细胞体积的关系.doc
- 专卖店促销员销售与成交技巧培训课件(34P).pptx
- 红色商务风新员工入职销售技巧知识培训课件(34P).pptx
- 专卖店商场销售员销售与成交技巧培训课件(34P).pptx
- 小区物业保安法律知识培训课件(28P).pptx
- 专卖店销售员轻松成交技巧培训(34P).pptx
- 轻松成交客户新员工入职通用销售技巧知识培训(34P).pptx
- 2024年初级《银行业法律法规与综合能力》考前必刷必练题库500题(含真题、必会题).docx
- 2024年“新安法知多少”知识竞赛题库及答案(最新版).docx
- 2024年30秒毕业生面试工作自我介绍.docx
- 2024年《医务人员礼仪培训》心得体会.docx
文档评论(0)