计算机科学技术基础知识.ppt

3.汉字编码   计算机在处理汉字信息时需要对汉字进行编码,由于汉字数量大,字形复杂,同音字多,所以汉字在计算机中的输入、内部处理、存储和输出都使用不同的编码。如汉字输入码、汉字机内码、汉字交换码、汉字字形码以及汉字地址码等   汉字信息处理系统在处理汉字时,不同环节使用不同的编码,并根据不同的处理层次和不同的处理要求,要进行一系列的汉字代码转换。从汉字输入到最终的汉字输出的转换过程如下图所示。 汉字                    汉字   输入设备   输入管理模块  汉字库  输出设备 汉字 输入码 国标码 汉字 机内码 汉字 字形码 (1)汉字输入码   是为方便人工通过输入设备输入汉字而设计的代码。 主要有: 区位码 、智能ABC码 、五笔字型码等。 (2)汉字交换码(又称为国标码)   用于汉字信息处理系统之间或通信系统之间进行信息交换的汉字代码。 我国的国标GB2312-80制定了汉字交换码的标准。规定了信息交换用的6763个汉字和682个非汉字图形字符编码。根据汉字使用频率的高低、构词能力强弱、实际用途的大小划分为两级汉字,一级汉字3755个,二级汉字3008个。一级汉字按拼音顺序排列,同音汉字按笔画顺序排列;二级汉字按部首顺序排列。   国标码字符集中的任何一个汉字或图形符号都用两个7位的二进制数表示,在计算机中用两个字节表示,每个字节的最高位为0,剩余7位为GB2312-80二进制编码。 (3)汉字机内码   是供计算机系统内部进行汉字存储、加工处理、传输统一使用的代码。也称汉字内码。 目前国内应用较广的一种为两字节机内码,俗称变形国标码。即: 这种格式的机内码是将国标码的两个字节的最高位分别置1得到的。其最大优点是机内码表示简单,和交换码之间有明显的对应关系。即:机内码=国标码+8080H (4)汉字字形码   是指汉字字库中存储的汉字字形的数字化信息码,它主要用于汉字输出(打印、显示等)时产生的汉字字形。 有两种显示字形的方法:矢量字符和点阵字符。一个汉字系统所允许使用的全部汉字的汉字字形编码称为“汉字库”,存放于系统的汉字字形库的存储器中。 1 ××××××× 1 ××××××× 在通用汉字系统中,广泛以点阵的方式形成汉字,这时的汉字字形码是汉字点阵字形的代码,以点阵形式组成的汉字字形码,由于点阵规格的不同,又分为16×16、24×24、32×32、48×48,甚至更多点阵的汉字库。 对于16×16的点阵字形,字形码为32个字节(16×16÷8=32)每个汉字占32B,那么16×16点阵汉字字库(包括一、二级汉字6763个)共占230KB左右。 (5)汉字地址码   是指汉字字形码在汉字字库中存放位置的代码,即字形信息的地址。 需要向输出设备输出汉字时,必须通过地址码,才能在汉字库中取到所需的字形码,最终在输出设备上形成可见的汉字字形。 由于汉字字形信息都是按一定顺序连续存放在存储器中。因此,汉字地址码一般是连续有序的,并且与汉字机内码间有着简单的换算关系。 1.3计算机系统    计算机系统由计算机硬件和计算机软件两部分组成。 ◆ 硬件(Computer hardware) 主要由CPU、存储器、输入输出控制系统和各种输入输出设备等功能部件组成。 ◆ 软件(Computer software) 它包括计算机运行所需的各种程序、数据及相关文档资料。 ◆ 裸机 脱离软件的计算机硬件称“裸机” 。 硬件是软件赖以运行的物质基础,软件是人与硬件之间的界面。 操作员(人) 应用软件 支撑软件 系  编译程序 统 …….. 软  件  操作系统 计算机硬件  计算机  软件 计算机系统的层次结构 1.4.1 逻辑代数   计算机之所以具有逻辑处理能力,是由于计算机中使用了实现各种逻辑功能的电路,逻辑代数是进行逻辑电路设计的数学基础。   逻辑代数是1847英国数学家乔治·布尔首先创立的,所以有时又叫布尔代数。 逻辑代数与普通代数有本质的区别,逻辑代数表示的不是数量大小之间的关系,而且逻辑关系,逻辑代数中的0和1,不是数量的0和1,它只代表所要研究问题的两种可能性或两种稳定的物理状态。它是分析和设计逻辑电路的基本数学工具。 1.4 逻辑代数与逻辑电路基础 1.逻辑变量和逻辑函数   逻辑电路具有输入和输出间的逻辑关系,为了对输入和输出间的逻辑关系进行数学表达和演算,所以提出了逻辑变量和逻辑函数两个术语。 一个逻辑电路如下图所示,A,B为

文档评论(0)

1亿VIP精品文档

相关文档