- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 5 章 数字媒体及应用
★ 考核知识要点、重点、难点精解
★ 考点: 1 西文与汉字的编码
1 .西文字符的编码
在计算机中用于表示字符的二进制编码称为字符编码。目前,国际上使用最多、最普遍的字符编码是 ASCII 字符编码。 ASCII 码的全称是“ American Standard Code for Information Interchange ,译为:美国国家信息交换标准字符码。
标准 ASCII 码是 7 位的编码,可以表示 27 = 128 个不同的字符,每个字符都有其不同的 ASCII 码值,它们的编码范围是 0000000B ~1111111B ( 00H ~ 7FH )。并且,这 128 个字符共分为 3 类,分别是:
( l )数字 0 ~ 9 ;
( 2 ) 26 个大写英文字母和 26 个小写英文字母;
( 3 )各种运算符号、标点符号和控制符号等。
其中,数字、大写字母、小写字母都是按照它们的自然顺序进行排列,且小写字母的 ASCII 码值比其相应的大写字母的 ASCII 码值大 32 。例如:大写字母 D 的 ASCII 码值是 68 ,小写字母 d 的 ASCII 码值= 68 + 32 = 100 。
注意 虽然标准 ASCII 码是 7 位的编码,但由于字节是计算机中最基本的存储和处理单位,故一般仍以一个字节来存放一个 ASCII 字符.每个字节中多余出来的一位(最高位 b7 ) ,在计算机内部通常保持为“0”,而在数据传输时和用作奇偶校验位。
扩充 ASCII码是 8 位,每个 ASCII 码字符集分别可以扩充 128 个字符,这些扩充字符的编码均为高位为 1 的 8 位代码(十进制指数 128 ~255 ) ,称为扩展 ASCII码。
2 .汉字的编码
( 1 ) GB2312 - 1980 汉字编码
国标码
为了适应计算机处理汉字信息的需要, 1981 年我国颁布了 《 信息交换用汉字编码字符集 · 基本集 》 ( GB2312 - 80 )。简称国标码,又称汉字交换码。该标准选出 6763 个常用汉字和 682 个非汉字字符,为每个字符规定了标准代码,以便在不同计算机系统中间进行汉字文本的交换。
GB2312 国际字符集由三部分组成。
第一部分是字母、数字和各种符号,包括拉丁文字母、俄文、日文平假名、希腊字母、汉语拼音等共 682 个(统称为 GB2312 图形符号) ;
第二部分为一级常用汉字,共 3755 个,按汉语拼音排列;
第三部分为二级常用字,共 3008 个,因不太常用,所以按偏旁部首排列。
区位码
在国标码中,所有的常用汉字和图形符号组成了一个 94 行 94 列的矩阵。每一行的行号称为“区号”,每一列的列号称为“位号”。区号和位号都由两个十进制数表示,区号编号是 01 ~ 94 ,位号的编号也是 01~94 。由区号和位号组成的四位十进制编码被称为该汉字的“区位码” , 其中区号在前,位号在后,并且每一个区位码对应惟一的汉字,例如:汉字“啊”的区位码是 1601 ,表示汉字“啊”位于 16 区的 01 位。
机内码
区位码中,区号和位号各需要 7 个二进位才能表示。每个汉字的区号和位号分别使用 1 个字节来表示,且都从 33 开始编号( 33 ~126 ) ,字节的最高位规定均为 1 。这种高位均为 1 的双字节( 16 位)汉字编码就称为 GB2312 汉字的“机内码”,又称内码。目前 PC 机中 GB2312 汉字的表示都是这种方式。
注意 (1)GB2312 国际字符集与区位码转换关系为:
将区位码转换成 GB2312 国际字符集的方法如下:
① 将十进制的区号和位号分别转换成十六进制;
② 将转换成十六进制的区号和位号分别加上 20H ;
③ 将分别加上 20H 的区号和位号组合,得到 GB2312 国际字符集。
( 2 ) 汉字内码是由汉字的国标码加上 8080H 形成,即汉字内码=国标码+ 8080H
【 举例 】 汉字“灯”的区位码是 2138 ,求其国标码。
【 分析 】 ① 汉字“灯”的区号是 21 ,位号是 38 ,转换成十六进制分别是 15H 、 26H 。
② 将转换成十六进制的区号和位号分别加上 20H ,得到 15H + 20H = 35H ; 26H + 20H = 46H 。
③ 因此,汉字“灯”的国标码是: 3546H 。
( 2 ) GBK 汉字内码扩充规范
GBK 是我国 1995 年发布的又一个汉字编码标准,全称为 《 汉字内码扩展规范 》 。它一共有 21003 个汉字和 883 个图形符号,与 GB2312 国标汉字字符集及其内码保持兼容,另外收录了繁体字和很多生僻的汉字。
您可能关注的文档
- 第四章存储子系统介绍.doc
- 第四章频域介绍.doc
- 第四章样本与估计全部学案介绍.doc
- 第四章遥感图象判读介绍.doc
- 第四章药品管理介绍.doc
- 第四章因特网的应用介绍.doc
- 第四章注塑模具设计介绍.doc
- 第四章资金成本与资本结构补充练习及介绍.doc
- 第五部分高级理论知识介绍.doc
- 第五单元繁忙的工地线和角)介绍.doc
- 2025年中国锻铁围栏市场调查研究报告.docx
- 2025年中国椭圆型市场调查研究报告.docx
- 2025年中国无蔗糖原味豆浆市场调查研究报告.docx
- 2025-2031年中国泛在电力物联网行业发展运行现状及投资潜力预测报告.docx
- 2025年中国制袋机零件市场调查研究报告.docx
- 2025年中国智能除垢型电子水处理仪市场调查研究报告.docx
- 2025-2031年中国甘肃省乡村旅游行业市场深度研究及投资策略研究报告.docx
- 2025-2031年中国干海产品行业市场发展监测及投资战略规划报告.docx
- 2025年中国全铝图解易拉盖市场调查研究报告.docx
- 2025年中国人造毛皮服装市场调查研究报告.docx
最近下载
- 健康体检基本项目专家共识(2022).pdf
- 2025年南昌大学科学技术学院教师招聘考试笔试备考题库及答案解析.docx VIP
- 2025年南昌大学科学技术学院教师招聘考试笔试模拟试题及答案解析.docx VIP
- 关于《党政机关厉行节约反对浪费条例》题库(附答案).docx VIP
- 新人教版高中化学必修第二册知识点填空02-第六章 化学反应与能量(答案版).pdf VIP
- 关于《厉行节约反对浪费条例》必备知识题库(附答案).pdf
- 3“双减”政策背景下小学语文作业设计策略研究论文开题报告.docx VIP
- 吸收塔顶升方案..doc VIP
- 专题6截长补短模型-【压轴必刷】2023年中考数学压轴大题之经典模型培优案(全国通用)(解析版).pdf VIP
- 企业安全生产主体责任落实课件(课件).ppt VIP
文档评论(0)