第四章数字文本与文本处理.pptVIP

  • 13
  • 0
  • 约2.72千字
  • 约 6页
  • 2017-02-23 发布于上海
  • 举报
第四章数字文本与文本处理

第四章 数字文本与文本处理 山东省数字媒体重点实验室 山东经济学院计算机科学与技术学院 山东省数字媒体重点实验室 山东经济学院计算机科学与技术学院 Shan dong Economics University 第一节 字符编码 在计算机中,英文采用ASCII码 英文 文字的编码 中文 1. 汉字的输入编码 数字编码:用数字代表汉字字符,电报码、区位码都属于数字编码 字音编码:指按照汉字的标准化读音,使用拼音作为汉字的编码的方法 字形编码:是指用汉字的形状表示的编码方式。这种编码方式将汉字依笔划、偏旁、部首用数字或字母编码,然后根据其组成方式依次输入 形音编码:将汉字字音与字型相互结合的一种编码方法如全息码就是一种音形编码。 文字的编码 2. 汉字的机内编码 汉字的机内编码是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示。 汉字交换码:指在不同汉字信息处理系统之间进行汉字交换时使用的编码。汉字交换码也称汉字国标码-GB2312 3. 汉字的输出编码 用点阵表示的汉字字形代码,汉字的输出形式 。 汉字区位码:国标字符集构成一个二维平面,它分成94

文档评论(0)

1亿VIP精品文档

相关文档