- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机数据与编码
精品文档
精品文档
收集于网络,如有侵权请联系管理员删除
收集于网络,如有侵权请联系管理员删除
精品文档
收集于网络,如有侵权请联系管理员删除
计算机数据与编码
1.6.1 信息和数据
信息是人们对客观世界的认识,即对客观世界的一种反映。
数据是表达现实世界中各种信息的一组可以记录、可以识别的记号或符号。它是信息的载体,是信息的具体表现形式。
数据形式可以是字符、符号、表格、声音、图像等。
数据可以在物理介质上记录或传输,并通过输入设备传送给计算机处理加工。数据的单位分为以下几种:
1) 位(bit)
计算机中最小的数据单位 二进制的一个数位,称为比特位,简称位。
1位二进制只能表示两种状态,即0或1。n位二进制能表示2n种状态
2) 字节(Byte)
相邻8个比特位组成一个字节,用B表示。字节是计算机中用来表示存储容量大小的基本单位。
1B = 8bits
1KB = 210B = 1024B
1MB = 220B = 1024KB
1GB = 230B = 1024MB
1TB = 240B = 1024GB
3) 字(Word)
在计算机中作为一个整体被存取、传送、处理的二进制数位叫做一个字,每个字中二进制位数的长度,称为字长。
用8位字长表示一个整数与用16位字长表示一个整数,其所表示的数的上限和下限是不一样的。
字长所占位数 其所表示的数的范围
8 -128 ~ 127 即:-27 ~ (27 - 1)
16 -32768 ~ 32767 即:-215 ~ (215 - 1)
32 -2147483648 ~ 2147483647 即:-231 ~ (231 - 1)
1.6.2 数字化信息编码
在计算机内部,可用物理器件的高低电平代表二进制的“0”和“1”,另外,脉冲的正负极性,晶体管的导通和截止都可以用来表示二进制的“0”和“1”。由于二进制只有两个状态,数据的传输和处理不容易出错,另外二进制数的记数、加减法运算规则较为简单,可用开关电路实现,且二进制的“0”和“1”正好与逻辑命题的两个值“真”和“假”相对应,为计算机种中实现逻辑运算和逻辑判断提供了便利的条件。所以,在计算机中,广泛采用的是只有“0”和“1”两个基本符号组成的基二码,或称为二进制码。
计算机最重要的功能是处理信息,这些信息包括数值、文字、图形、符号、图象、声音等,所有这些信息都必须经过编码,转换成计算机能够识别和处理的二进制码的形式才能够被存储、传送和加工。
BCD码是二进制编码的十进制数(Binary Coded Decimal)的简写。有四位 BCD码、六位BCD码和扩展的BCD码三种。
表中特殊符号的意义如下:
NUL 空白
SOH 标题开始
STX 正文开始
EXT 正文结束
EOT 传输结束
ENQ 询问
ACK 承认
BEL 告警
BS 退格
HT 横向列表
LF 换行
VT 垂直列表
FF 换页
CR 回车
SO 移位输出
SI 移位输入
SP 空格
DLE 转义
DC1 设备控制1
DC2 设备控制2
DC3 设备控制3
DC4 设备控制4
NAK 否认
SYN 空转同步
ETB 信息组传送结束
CAN 作废
EM 纸尽
SUB 取代
ESC 扩展
FS 文字分隔符
GS 组分隔符
RS 记录分隔符
US 单元分隔符
DEL 删除
(2) 汉字的表示
汉字与英文的主要区别:
1) 英文是拼音文字,汉字是表意文字。英文字母只有26个,汉字多达5万个以上,常用汉字也有6000多个。
2) 汉字的同音字很多,一个音往往会有几个甚至几十个字。
3) 英文排序简单,汉字排序非常复杂,而且与文字本身没有本质联系。
开发一个完善的中文信息处理系统必须解决以下三个主要问题: (1) 汉字输入 (2) 汉字输出 (3) 汉字与西文的兼容性
汉字的编码和表示
1)汉字交换码(国标码) 汉字交换码(国标码)主要用于汉字信息交换。
国标码:以国家标准局1980年颁布的《信息交换用汉字编码字符集"基本集》(代号为GB2312 80)规定的汉字交换码作为国家标准汉字编码。 GB2312 80中共有7445个字符符号: 汉字符号6763个 一级汉字3755个(按汉语拼音字母顺序排列) 二级汉字3008个(按部首笔划顺序排列) 非汉字符号682个 GB2312 80规定,所有的国标码汉字及符号组成一个94 94的方阵。在此方阵中,每一行称为一个"区",每一列称为一个"位"。这个方阵实际上组成一个有94个区(编号由01到94),每个区有94个位(编号由01到94)的汉字字符集。 一个汉字所在的区号和位号的组合就构成了该汉字的"区位码"。其中,高两位为区号,低两位为位号。这样区位码可以唯一地确定某一汉字或字符;反之,任何一个汉字或符号
文档评论(0)