中 文 信 息 学 报
第 20 卷 第 1 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol 20 No1
( )
文章编号 :1003 - 0077 2006 01 - 0067 - 09
基于模式分类的汉语时态确定方法研究
林达真 ,李绍滋
( 厦门大学 计算机科学系 ,福建 厦门 361005)
摘要 :汉语时态是中文信息处理领域的一个难点 。基于规则的处理方法在无时态特征词的句子 ,多时态
特征词的句子处理等方面存在很大问题 。本文从统计的角度 ,提出一种基于模式分类的时态确定方法 ,该方
法综合评价句子中每个词对时态确定所作的贡献 ,能够处理无时态特征词的句子和多时态特征词的句子 ,并
且该方法使用线性判别函数 ,具有对多维数据分析 ,训练与判别速度快的特性 。在开放测试环境下 ,对单句的
汉语时态确定正确率与召回率分别为 798 %和 953 % 。
关键词 :计算机应用 ; 中文信息处理 ;汉语 ;时态 ;特征词 ;线性判别函数 ;感知器准则函数
中图分类号 :TP391 文献标识码 :A
A Patternclassif ication Based Solution for the Recognition of Tense of
the Chinese Language
LIN Dazhen , LI Shaozi
(Computer Science Department , Xiamen University , Xiamen , Fuj ian 361005 , China)
Abstract :As far as NLP is concerned , the tense of the Chinese language is especially hard to tackle . One of the outstanding
characteristics of the Chinese language is that its tense is usually implied rather than obvious. Hence , the Rulebased solu
tion is far from suitable for the recognition of tense in situations where tenseinforming words are missing or more than one of
such words are present . In this paper , we introduce a patternclassification based solution , which evaluates each single word
in terms of its contribution to the recognition of tense for the concerned sentence . This solution proves effective when pro
cessing sentences containing none or more than one tenseinforming words. Furthermore , the implementation of linear dis
criminating function in this solution leads to its abilities of multidimension
您可能关注的文档
最近下载
- 2024年湖南司法警官职业学院单招职业技能测试模拟试题及答案解析.docx VIP
- 士兵职业基本适应性检测试题.doc VIP
- 2026马年卡通特色期末评语(45条).docx
- 2025年度党组织书记全面从严治党述责述廉暨抓基层党建工作述职报告.docx VIP
- 2026年湖南司法警官职业学院单招职业技能考试参考题库有答案解析.docx VIP
- 网络预约出租汽车驾驶员从业资格考试区域科目考题.docx VIP
- 《消防设施操作员基础知识讲义手册》.pdf VIP
- 新能源材料模拟题.doc VIP
- 网络预约出租汽车驾驶员从业资格考试区域科目考题.pdf VIP
- 网络预约出租汽车驾驶员从业资格考试区域科目考题.docx VIP
原创力文档

文档评论(0)