第2章数制编码与汉字输入法解析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章数制编码与汉字输入法解析

* 7、字符的编码 西文字符的编码 ASCII 码(美国国家标准信息交换码) 扩展ASCII码 unicode编码 汉字编码 输入码 交换码 (国标码) 内部码 字型码 (输出码) * ASCII 码 ASCII码是美国信息交换标准代码。 (American Standard Code for Information Interchange) 包括0~9十个数字,大小写英文字母 及专用符号等95种可打印字符。 Computer的ASCII码 01110000 01100101 7 6 5 4 3 2 1 * 扩展ASCII码 由7位二进制编码构成的ASCII基本字符集只有128个字符,太少了。 在原ASCII码128个符号的基础上,将它的最高位设置为1进行扩展,能够表示的编码范围为11111111,共可表示256个字符和图形符号,称为扩展ASCII码字符集。 扩展ASCII的前128个字符的编码与原ASCII码相同。 * Unicode编码 国际标准化组织在20世纪90年代初期制定的各国文字、符号的统一性编码。该编码采用16位编码体系,可容纳65536个字符编码,这么多的符号几乎能够表达世界上所有书面语言中的不同符号。 Unicode主要想解决多语言的计算,随着国际互联网的迅速发展,不同国家之间的人们进行数据交换的需求越来越大,Unicode因此而成了当今最为重要的交互和显示的通用字符编码标准。 Unicode适用于所有已知的编码,覆盖了美国、欧洲、中东、非洲、印度、亚洲和太平洋的语言,以及古文和专业符号。 * 8、汉字编码 字符代码化(输入码) 机内码 交换码(外部码?内部码) 机内码向字形码转换 显示输出 打印输出 * (1)汉字输入编码方法 数字编码 数字编码就是用数字串代表一个汉字的输入,常用的有国际区位码。如:“中”5448 、 “…”0113 拼音码 拼音码是以汉语读音为基础的输入方法。常用的有智能全拼、微软拼音、紫光拼音、智能狂拼等。 字形编码 字形编码是以汉字的形状确定的编码。常用的有五笔字形、表形码等。 * (2)汉字内部码 汉字内部码是汉字在设备或信息处理系统内部最基本的表达形式,是在设备和信息处理系统内部存储、处理、传输汉字用的代码。 区位码、国标码、机位码的概念见Page 26 几种编码之间的转换关系如下: 汉字的区位码、国标码、内部码三者之间存中如下的转换关系: 国标码 = 区位码+2020H(即把区位码的区号和位号分别加上十进制数32) 内部码 = 国标码+8080H(即把国标码的高位字节和低位字节分别加上十进制数128) 内部码 = 区位码+A0A0(即把区位码的区号与位号分别加上十进制数160) * 把高、低两字节的B6位都设置 为1 ,即加上2020H (3)汉字编码转换 区位码、国标码、机内码的转换过程 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 1 高字节:16 低字节:01 “啊”的区位码,用十六进制表示为:1601 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 这就是“啊”的国标码, 用十六进制表示为:3021 1 0 1 1 0 0 0 0 1 0 1 0 0 0 0 1 把高、低两字节的最高位都设置为1,即加上8080H 这就是“啊”的内部码,用十六进制表示即为:B0A1 * (4)汉字字形码 汉字字形码是表示汉字字形的字模数据,也称字模码,是用点阵表示的汉字字形代码,它是汉字的输出形式。 * (5)汉字库 所有汉字的字形码集中在一起就是字库。 一般的汉字系统只收集了国标码中的6763个汉字,加上682个标点符号及图形符号,共7445个汉字字形码的集合。 不同点阵的字库所占存储空间是不同的,如16×16点阵的字库,每个汉字点32个字节,则整个字库占用7445×32 = 23 840字节,约240KB * 9、字符在计算机中的输入处理过程 说明: 1、图中实线表示字符在计算机中的处理过程 2、虚线表示操作需要CPU的控制下进行 英文字符的输入处理过程 * 汉字在计算机中的输入处理过程 说明: 1、图中实线表示字符在计算机中的处理过程 2、虚线表示操作需要CPU的控制下进行 9、字符在计算机中的输入处理过程 * 2.4 汉字输入法 1、汉字输入法的常用编码方式 按汉字拼音编制输入码 按汉字字形编制输入码 音、形、义相结合编制输入码 2、常见输入法 拼音输入法:如全拼、双拼、清华紫光…… 字形输入法:如表形

文档评论(0)

4477704 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档