中文信息处理技术原理与应用(3).pptVIP

  • 19
  • 0
  • 约1.3万字
  • 约 62页
  • 2020-06-09 发布于四川
  • 举报
第三章 汉字字形存储与压缩技术 汉字字形存储与字形码 点阵存储与压缩存储 汉字压缩存储常见方法分类 压缩与还原技术及其重要指标 汉字笔画矢量存储方法 部件组字压缩 汉字子信息块哈夫曼树存储方法 汉字字形轮廓存储方法 黑白段与线性增量存储方法 笔画轮廓压缩存储方法 汉字字形存储与字形码 产生汉字字形的方法有模拟式和数字式两种: 模拟式:如字模板、字模摄像、飞点扫描字模、全息照相等,特点是文字质量高,价格较便宜,缺点是文字读出机构复杂,读取速度低、维护要求高,文字变动困难。 数字式:输出文字一致性好,稳定不变,速度快,文字尺寸变更比较灵活,但存储量大、成本较高。随着中文信息处理技术的发展,模拟式产生文字字形的方法已逐渐淘汰,这里只介绍数字式汉字字形产生和存储的方法。 汉字字形的数字化 由于计算机内部只认0和1这些二进制代码,汉字字形信息要想保存下来,也必须象汉字的键盘码和交换码一样,实现计算机内部的“数字化”。 将汉字写在划分有m行×n列小方格的网格方块中,该方块称为m×n点阵,每个小方格是一个点,有笔画部分是黑点,文字的背景部分是白点,点阵中的黑点就描绘出汉字字形,称为汉字点阵字形。 不同使用领域对汉字质量的要求 整字存储与压缩存储 汉字字形存储按存储方法分为整字存储和压缩存储两大类。 整字存储:把汉字字形点阵信息按字节全部存放在存储器中,需要使用时直接读出,这种存

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档