电子教案3-1：数制与信息编码.pptVIP

下载本文档

1
0
约5.58千字
约 45页
2016-09-08 发布于湖北
举报
版权申诉

电子教案3-1：数制与信息编码.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

ASCII码表点击表格… 3.5.2 汉字的二进制编码 1．汉字输入码汉字输入编码可归纳为四类：数字编码。如区位码。字音编码。以汉字拼音为基础的编码，如全拼、双拼字形编码。五笔字型输入法音形编码。 2．汉字国标码与区位码（1）汉字国标码 1981年我国颁布了《信息交换用汉字编码字符集－基本集》，简称GB2312-80。包含了6763个汉字和682个图形字符的编码。汉字分为两级：第一级3755个，按汉语拼音字母顺序排列，同音字以笔划顺序为序。第二级3008个，按部首顺序排列。 GB2312-80 GB2312-80为双7位代码结构。为了使控制字符和图形字符互不干扰，规定其中任何一个字节(最高位为0)都不应和34个控制字符的ASCII码相同，于是每一字节的编码在21H~7EH之间。国标码编码把GB2312-80编码表中两个字节编码连接起来，即得到汉字的国标码。例如，“啊”字第一字节编码为30H，第二字节编码为21H 其国际码为3021H。（2）区位码 GB2312-80编码表中有94行94列，行号称为区号，列号称为位号。把区号和位号组合起来就是区位码。如“啊”的区位码为1601，“α”的区位码为0633。注意区号和位号都用两位十进制数表示，不足两位前面补0。 3．汉字机内码汉字机内码是指汉字在计算机内部进行存储和加工处理时所使用的代码。汉字的国标码不能直接作为汉字内码，它会与ASCII码字符相混淆。例如， “中”的国标码是5650H， ASCII码字符串“VP”的内部编码也是5650H 这就产生了二义性。汉字国标码、区位码和内码的转换 4．汉字的输出在计算机内部，只对汉字机内码进行处理，不涉及汉字本身的字形。若要输出汉字处理的结果，则必须把汉字内码还原成汉字字形。一个字符集的所有字符的形状描述信息集合在一起称为该字符集的字形信息库，简称字库。不同的字体（如宋、仿、楷、黑等）有不同的字库。每输出一个汉字，都必须根据内码到字库中找出该汉字的字形描述信息，再送去显示或打印。描述字形的方法描述字符字形的方法主要有两种： (1)点阵字形。由排成方阵(如16×16、24×24、48×48等)的一组二进制数字表示一个字符，1表示对应位置有笔划，0表示对应位置无笔划。 16×16点阵字形常用于屏幕显示，笔画生硬、细节难以区分，打印输出常用24×24、48×48，或更大点阵。点阵的数目越多，笔锋越完整，字迹亦清晰美观。 “英”字的16×16点阵。字形中每一点使用一个二进制位表示，则一个16×16点阵的汉字总共需要16×16/8=32个字节。 (2)轮廓字形该方法用一组直线和曲线来勾画字符（如汉字、字母、符号、数字等）的笔画轮廓，记下构成字符的每一条直线和曲线的数学描述（端点和控制点的坐标）。轮廓字符描述的精度高，字形可任意缩放而不变形，也可按需要任意变化。轮廓字形在输出之前必须通过复杂的处理转换成点阵形式。Windows True Type字库就是该表示法。 5．汉字编码标准集的扩充 1993年国际标准化组织发布了通用多八位编码字符集（Universal Coded Character Set，UCS）的国际标准ISO/IEC 10646-1。该标准规定了全世界现代书面语言文字所使用的全部字符的标准编码，用于世界上各种语言文字、字母符号的数字化表示、存储、传输、交换和处理，真正实现了所有字符在同一字符集内等长编码、同等使用的多文种信息处理。 UCS编码字符集的特点 UCS的总体结构有组、平面、行、字位构成四维编码空间： UCS有00~7FH共128个组每个组有00~FFH共256个平面每个面有00~FFH共256行每行有00~FFH共256个字(位)，每个字位用一个字节表示 UCS的每个字符用4个字节编码，对应每个字符在编码空间的组号、平面号、行号和字位号，称为四八位正则形式，记作UCS-4。 UCS-4提供了极大的编码空间，可安排多达13亿个字符，充分满足世界上多种民族语言文字信息处理的需要。我国的中文编码扩展国家标准我国采用UCS制定了新的中文编码扩展国家标准GB 13000.1-1993，和汉字内码扩展规范GBK-1995。中文Windows 95/98采用的是GBK大字符集，该字符集中收录的汉字多达20902个，比GB字符集的6763个增加了2倍以上。国家标准GB18030-2000《信息交换用汉字编码字符集基本集的扩充》是继GB2312-1980和GB13000-1993之后最重要的汉字编码标准，是我国计算机系统必须遵循的基础性标准之一。 GB18030-2000的特点 GB18030编码空间约为160万码位，目前已编码字符约2.7万 GB