中文信息学报基于模式分类的汉语时态确定方法研究.pdf

中文信息学报基于模式分类的汉语时态确定方法研究.pdf

中 文  信  息  学  报 第 20 卷 第 1 期   JOURNAL OF CHINESE INFORMATION PROCESSING Vol 20 No1 ( ) 文章编号 :1003 - 0077 2006 01 - 0067 - 09 基于模式分类的汉语时态确定方法研究 林达真 ,李绍滋 ( 厦门大学  计算机科学系 ,福建  厦门 361005) 摘要 :汉语时态是中文信息处理领域的一个难点 。基于规则的处理方法在无时态特征词的句子 ,多时态 特征词的句子处理等方面存在很大问题 。本文从统计的角度 ,提出一种基于模式分类的时态确定方法 ,该方 法综合评价句子中每个词对时态确定所作的贡献 ,能够处理无时态特征词的句子和多时态特征词的句子 ,并 且该方法使用线性判别函数 ,具有对多维数据分析 ,训练与判别速度快的特性 。在开放测试环境下 ,对单句的 汉语时态确定正确率与召回率分别为 798 %和 953 % 。 关键词 :计算机应用 ; 中文信息处理 ;汉语 ;时态 ;特征词 ;线性判别函数 ;感知器准则函数 中图分类号 :TP391    文献标识码 :A A Patternclassif ication Based Solution for the Recognition of Tense of the Chinese Language LIN Dazhen , LI Shaozi (Computer Science Department , Xiamen University , Xiamen , Fuj ian 361005 , China) Abstract :As far as NLP is concerned , the tense of the Chinese language is especially hard to tackle . One of the outstanding characteristics of the Chinese language is that its tense is usually implied rather than obvious. Hence , the Rulebased solu tion is far from suitable for the recognition of tense in situations where tenseinforming words are missing or more than one of such words are present . In this paper , we introduce a patternclassification based solution , which evaluates each single word in terms of its contribution to the recognition of tense for the concerned sentence . This solution proves effective when pro cessing sentences containing none or more than one tenseinforming words. Furthermore , the implementation of linear dis criminating function in this solution leads to its abilities of multidimension

文档评论(0)

1亿VIP精品文档

相关文档