- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文信息学报基于词类串的汉语句子结构相似度计算方法
中 文 信 息 学 报
第 19 卷 第 1 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol 19 No1
( )
文章编号 :1003 - 0077 2005 01 - 0021 - 09
基于词类串的汉语句子结构相似度计算方法①
王荣波 ,池哲儒
(香港理工大学 电子及资讯工程系 多媒体信号处理中心 ,香港)
摘要 :句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容 。对于基于实例的汉英机器翻译
研究 ,汉语句子相似度衡量的准确性 ,直接影响到最后翻译结果的输出。本文提出了一种汉语句子结构相似
性的计算方法 。该方法比较两个句子的词类信息串 ,进行最优匹配 ,得到一个结构相似性的值 。在小句子集
上的初步实验结果表明 ,该方法可行 ,有效 ,符合人的直观判断 。
关键词 :人工智能 ;机器翻译 ;基于实例机器翻译 ;汉英机器翻译 ;句子相似度衡量 ; 自然语言处理
中图分类号 :TP391 文献标识码 :A
A Similarity Measure Method of Chinese Sentence Structures
WAN G Rongbo ,CHI Zheru
(Center for Multimedia Signal Processing ,Department of Electronic and Information
Engineering ,The Hong Kong Polytechnic University ,Hong Kong , China)
( )
Abstract :Examplebased machine translation EBMT is an important branch of machine translation that has been studied ex
tensively for about twenty years. So far ,some progresses have been gained because of researchers hard work . Sentence simi
larity measure certainly is one of the most important problems addressed in EBMT. For EBMT from Chinese to English ,the
performance of similarity measure of Chinese sentences affects directly final translation result of an input sentence . In this pa
per ,we proposed a similarity measure method of Chinese sentence structures for examplebased Chinese to English machine
translation . In this method ,the algorithm performs the optimal matching between the word type sequences of two compared sen
tences. The preliminary experimental results show that the measure method works well when it is tested on a small dataset .
Key words : artificial intelligence ; mach
您可能关注的文档
- 一种基于特征聚类的特征选择方法-计算机应用研究.pdf
- 一种基于隐私偏好的二次匿名位置隐私保护方法-山东大学学报理学版.pdf
- 一种对数据集稀疏度不敏感的协同推荐新方法-南京大学pasa大数据.pdf
- 一种改进的3g无线网络丢包模型及仿真方法-计算机工程与应用.pdf
- 一种改进的流程图相似度检索算法及实现-计算机应用研究.pdf
- 一种模糊概念相似度的计算方法-东北大学.pdf
- 一种用于科技项目查重的数据整合及描述模型-情报工程.pdf
- 一种离散随机petri网的性能计算和分析方法-东南大学学报.pdf
- 一种新的云存储数据容错存储方式检验方法new-电子与信息学报.pdf
- 一种移动adhoc环境下的lbs位置保护算法的研究-电子设计工程.pdf
文档评论(0)