繁简“非对称”字组的自动转译实验.pdfVIP

  • 7
  • 0
  • 约1.32万字
  • 约 10页
  • 2017-08-20 发布于安徽
  • 举报

繁简“非对称”字组的自动转译实验.pdf

繁简“非对称”字组的自动转译实验 李 牧 1.提要 i.1定义: 本文所谓“繁体”,泛指台湾规范字;“简体”泛指大陆规范字。“非 对称”的繁简对应也包括异体关系,笔者刻意不予区分,因为无论它们的 关系如何,其解决的方式一样,须化“非对称”为“一对一”的对应。 I.2样本: 各家得出的“非对称”字组数量有相当差异,其原因除是否包含异体 关系之外,还有就是各人所依据的样本资料不同。笔者是以大陆规范《现 加上为求二者对应而采录的1700多个台湾次常用字,合计样本字数7376字, 共得“非对称”270字组(一简对二繁240组,一简对三个以上繁体字30组)。 字组数量曾依实际情况更新,并用繁简自动对译一一验证无误。 I.3自动转译的实验: 因为“非对称”字组中包括不少异体关系,所以,要解决此项问题, 使两岸文字成为”一对一”的对称,必须彻底解决异体字的分歧,甚至需 要两岸文字规范的统合;但这并非短期内能达到的目标。目前海峡两岸交 往频繁,繁简字的转译全赖计算机自动转换。以短程目标而言,如果自动 对译时没有误译,则即使存在“非对称”字组,也不至于影响文意的正确 传达。基于这个理念,笔者作了全部270字组自动转译的实验(

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档