- 1
- 0
- 约8.42千字
- 约 7页
- 2016-10-17 发布于重庆
- 举报
繁简字字形转换中模糊消解的非统计方法+doc
繁简字 字形转换中模糊消解的非统计方法+
?
冯 霞*
?
?
摘 要:简体中文和繁体中文是现代汉语并存的两种书面形式。它们在语音、词汇、语法等方面都有明显差异,给大陆和港澳台地区的交流和沟通造成障碍。繁体中文和简体中文的最大区别在于字形,而繁简字字形转换的难点在于部分简化字与繁体字在字形的不对称对应。本文结合大规模真实语料,主要分析探讨了对繁简字字形转换过程中由于繁简字字形不一一对应造成的模糊现象进行消解的方法。
关键词:繁简转换;不对称繁简字;模糊消解
?
现代汉语存在两种书面形式:简体中文和繁体中文。港台等地所使用的繁体中文与大陆使用的简体中文在文字、词汇以及语法等方面都呈现出比较明显的差异。繁简并存的现状在一定程度上成了大陆与港澳台地区在信息交流与沟通等方面的一个重要障碍。
?
1. 中文繁簡转换 与 繁简字字形转换
中文繁简转换应解决的基本问题是由繁体中文与简体中文的区别决定的。繁简中文的区别主要体现在以下四个方面:
(1) 字形:繁体中文使用繁体字形,简体中文使用简化字形。
(2) 字符集:繁体中文通常使用 BIG5 编码以及台湾官方发布的 CNS14649;简体中文则通常使用国标码字符集或其扩充版本,国家标准扩展码 (GBK) 等由中国大陆政府正式颁发的字符集。
(3) 词汇:繁体中文与简体中文在词汇方面的差异主要体现于两类词语,一是繁体中文
原创力文档

文档评论(0)