繁简字字形转换中模糊消解的非统计方法+.doc.doc

繁简字字形转换中模糊消解的非统计方法+.doc.doc

繁简字字形转换中模糊消解的非统计方法+.doc

繁简字 字形转换中模糊消解的非统计方法+ ? 冯 霞* 冯霞女士, 北京市 北京师范大学中文信息处理研究所。 + “模糊消解”(disambiguation) 首先是信号学的术语, 用在自然语言处理中, 大致等同于消除岐义。在自然语言处理中,统计学习方法和人工规则方法是两种基本方法。本文提到的四种方法基本上都属于人工规则方法的范畴,本文题目即为突出此点而定。 ? ?   摘 要:简体中文和繁体中文是现代汉语并存的两种书面形式。它们在语音、词汇、语法等方面都有明显差异,给大陆和港澳台地区的交流和沟通造成障碍。繁体中文和简体中文的最大区别在于字形,而繁简字字形转换的难点在于部分简化字与繁体字在字形的不对称对应。本文结合大规模真实语料,主要分析探讨了对繁简字字形转换过程中由于繁简字字形不一一对应造成的模糊现象进行消解的方法。   关键词:繁简转换;不对称繁简??;模糊消解 ?   现代汉语存在两种书面形式:简体中文和繁体中文。港台等地所使用的繁体中文与大陆使用的简体中文在文字、词汇以及语法等方面都呈现出比较明显的差异。繁简并存的现状在一定程度上成了大陆与港澳台地区在信息交流与沟通等方面的一个重要障碍。 ? 1. 中文繁簡转换 与 繁简字字形转换 中文繁简转换应解决的基本问题是由繁体中文与简体中文的区别决定的。繁简中文的区别主要体现在以下四个方面:   (1) 字形:繁体中文使用繁体字形

文档评论(0)

1亿VIP精品文档

相关文档