- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
小数的表示 定点数:小数点的位置固定,分为定点纯整数和定点纯小数。 定点纯整数隐含小数点位置固定在数值部分的最后 定点纯小数隐含小数点位置固定在数值部分的最高位与符号位之间。 浮点数:小数点的位置可以浮动,用阶码(整数)和尾数(纯小数)来表示一个实数。 不同的计算机中浮点数的表示方法互不相同。 文本信息的表示 文本是文字信息在计算机中表示的统称,它是基于特定字符集的具有上下文相关性的一个字符流,每个字符均使用二进制编码表示。文本在计算机中的处理包括输入、编辑、存储、传输和显示等过程,每个环节对文本的编码都可能不同,下面介绍几种主要编码方案。 西文字符的编码 西文:由拉丁字母、数字、标点符号及一些特殊符号组成,统称为“字符”(Character)。 美国标准信息交换码 ASCII码:一个字节的编码对应一个字符,最高位一般为0,是7位编码,可表示128个,见书上P14表1.1。 字符集:每一字符各有一个代码,构成代码表。 标准ASCII码 常用字符有128个,编码从0到127。 控制字符:0~31,127;普通字符:95个。 每个字符占一个字节,7位,最高位为0。 字符 范围 十六进制 十进制 空格 20H 32 0~9 30H~39H 48~57 A~Z 41H~5AH 65~90 a~z 61H~7AH 97~122 ASCII码字符编码表表 BCD码 BCD码用4位二进制数表示一位十进制数。 BCD码1000 0110 0010按4位一组转换为十进制数862。 一位BCD码中的4位二进制代码都是有权的,从左到右依次是8,4,2,1。故这种二——十进制编码又称8421BCD码。 1000 0110 0010 2 8 4 1 十进制数和BCD码对照表 十进制 BCD码 十进制 BCD码 0 0000 5 0101 1 0001 6 0110 2 0010 7 0111 3 0011 8 1000 4 0100 9 1001 汉字的编码 汉字在不同的处理阶段有不同的编码。 汉字的输入:输入码 汉字的机内表示:机内码 汉字的输出:字形码(字库 Font) 各种编码之间的关系: 输入码 国标码 机内码 输出码 汉字的编码 汉字字符集与编码 1981年,GB2312-80国家标准,其中有6763个汉字和682个非汉字字符,其字符及编码称为国标码又叫国际交换码。 国标码用两个字节编码一个汉字,每个字节只用低7位,高位都为0。 GB2312字符集的构成: 一级常用汉字3755个,按汉语拼音排列 二级常用汉字3008个,按偏旁部首排列 非汉字字符682个 GB2312构成两维平面(区位码),94*94,行号为区号,列号为位号,各占一个字节,取其7位表示。 例:“大”的区号是20,位号是83,则其区位码为: 2083。01010011 ) 区位码+32=国标码;01110011 汉字的机内码 为避免汉字与西文字符混淆,引入汉字的机内码。 计算机系统中用来表示中文或西文信息的代码称为机内码,简称内码。 ASCII码是一种西文机内码,用一个字节表示,最高位为0。 汉字机内码用连续两个字节表示,每个字节的最高位是1。 例:“大”的区号是20,位号是83,则其机内码为: 11110011 区位码与机内码的转换关系 GB2312-80的内码编码的范围为:A1A1H~FEFEH 汉字区位码与机内码的转换关系为 机内码的高字节=区位码的高字节+A0H 机内码的低字节=区位码的低字节+A0H 其他汉字编码 UCS(通用编码字符集) Unicode编码,长度为16位,ASCII也采用两个字节表示。 GBK:汉字扩展内码规范,与GB2312-80完全兼容。 BIG5:台湾汉字编码规范。420个图形符号,13070个汉字,繁体。 汉字的输入码 汉字输入方法实现的两种途径: 计算机自动识别: 用键盘手工输入。 计算机自动识别方法: 手写笔输入 语音识别输入 扫描识别输入 用键盘手工输入需对汉字进行编码。如区位码、国标码等,它们属于外码。 汉字的输入码 输入编码要求:易学、易记、效率高、重码少、容量大。 输入编码分类: 数字编码(如:区位码、电报码,无重码,难记) 字音编码(如:全拼、双拼、微软拼音、智能ABC简单,但重码多) 字形编码(如:五笔字形、表形码,重码少,规
文档评论(0)