袁方全套配套课件大学计算机2-3 字符型数据的表示.pptxVIP

袁方全套配套课件大学计算机2-3 字符型数据的表示.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.3 字符型数据的表示 2.3.1 西文编码 ASCII码: 只用了7位二进制数对美国自己常用的英文字母、数字、运算符、标点符号等进行编码 控制字符是无法打印或在计算机屏幕上显示的。每个控制字符都对应着一个特定的控制功能,如:CR对应回车键(Enter)、BS对应退格键(Backspace)、ESC对应Esc键等。 通常使用一个字节(8个二进制位)表示一个ASCII码字符,规定其最高位为0。 000 001 010 011 100 101 110 111 0000 32个 控制字符 空格 0 @ P ‘ p 0001 ! 1 A Q a q 0010 “ 2 B R b r 0011 # 3 C S c s 0100 $ 4 D T d t 0101 % 5 E U e u 0110 6 F V f v 0111 ` 7 G W g w 1000 ( 8 H X h x 1001 ) 9 I Y i y 1010 * : J Z j z 1011 + ; K [ k { 1100 ,   L \ l | 1101 - = M ] m } 1110 .   N ^ n ~ 1111 / ? O _ o DEL b7b6b5 b4b3b2b1 2.3.1 西文编码 ASCII码: 例:“GOOD!”的ASCII 编码用二进制数表示 用十六进制数表示为: 47H 4FH 4FH 44H 21H 2.3.1 西文编码 扩展ASCII码: 国际标准化组织又将ASCII码字符集扩充为8位代码,即ASCII码的扩充。 ASCII码的字符集可以扩充128个字符,也就是使用8位扩展ASCII码能为256个字符提供编码。 这些扩充字符的编码均为高位为1的8位代码(对应十进制数 128~255 ),称为扩展ASCII 码。 扩展ASCII码所增加的字符包括文字和一些图形符号,如ü、é、┴、Ω、√、▓、▄等。 2.3.2 汉字表示 汉字编码需要解决的问题: 计算机键盘上没有按键直接和汉字对应,不能直接利用单个按键输入汉字,需要输入码(多个按键的组合)来对应汉字。 汉字在计算机内的存储需要机内码来表示,以便存储、处理和传输。 汉字个数多、字形变化复杂,需要对应的字库来存储汉字的各种字形,用于打印或显示汉字。 2.3.2 汉字表示 汉字输入码:利用键盘输入汉字时对汉字的编码,是操作者向计算机输入汉字的手段。 拼音码:以汉语拼音为基础的编码方案 搜狗拼音输入法、QQ拼音输入法 字形码:根据汉字的字形进行编码的方案 五笔字型码 基于音形结合的编码 自然码 2.3.2 汉字表示 汉字机内码: 国标码和机内码 GB2312-1980规定每个汉字编码由两个字节构成,实际共定义了6763个常用汉字和682个符号。 GB18030-2000共收录了27000多个汉字。 GB18030-2005以汉字为主并包含多种我国少数民族文字,收入汉字70000多个。 机内码在国标码的基础上每个字节的最高位由“0”变为“1” 汉字字符集至少要用两个字节进行编码 2.3.2 汉字表示 汉字机内码: Unicode编码与UTF-8 Unicode(统一码、万国码、单一码) 优点: 用4个字节编码 为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换和处理的要求。 不足: 可能带来存储空间的浪费 UTF-8 可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度 2.3.2 汉字表示 汉字字形码:又称汉字字模,用于汉字的显示或打印输出 点阵方式: 存储字符点阵 16×16点阵,24×24点阵、32×32点阵、48×48点阵等 点阵规模越大,字形越清晰美观,所占存储空间也越大。 为了避免数据量过大,点阵方式经常会以牺牲文字质量为代价。但是,对于描述小号汉字点阵方式有明显的优势。 2.3.2 汉字表示 汉字字形码: 矢量方式: 存储数学函数描述的曲线字库,及一系列控制指令。 可产生高质量的汉字输出 明显的缺点是当文字比较小时,表现质量要差一些。

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档