汉字信息的基础知识.pptVIP

  • 0
  • 0
  • 约2.27千字
  • 约 15页
  • 2025-10-21 发布于广东
  • 举报

第1页,共15页,星期日,2025年,2月5日4.1汉字信息的基础知识分为两级。一级汉字3755个,属常用字,按汉字拼音字母顺序排列,二级汉字3008个,属非常用字,按部首排列。GB18030-2000新标准,收录汉字27000多个。汉字机内码:亦称汉字内部码、汉字机内码。计算机内部处理汉字的代码,与字形表示严格一一对应,不允许出现重码。一般用两个字节表示一个汉字的内码。汉字输入码(外码):计算机输入的代码,是代表某种输入方法输入某一个汉字的一组键盘符号。也称输入码。目前最常用的输入方法是拼音法和五笔字型法。同一个汉字的国标码与内部码有一一对应的关系,国标码两字节的最高位都是0,内码就是将这两字节的最高位都变成1,这样,汉字的内码不与英文第2页,共15页,星期日,2025年,2月5日4.1汉字信息的基础知识字符的编码(ASCII码、EBCDIC码等)发生冲突。汉字的二字节内码与国标码之间的关系:十六进制国标码+8080H=十六进制的内码汉字输出码:又称汉字字形码或汉字字形发生器。为了输出汉字,将汉字字形经过点阵的数字化后的一串二进制数称为汉字输出码。第3页,共15页,星期日,2025年,2月5日4.1汉字信息的基础知识4.1.2汉字信息的存储汉字字库:汉字的字形数字化后得到了汉字的字形码,并以二进制文件的形式存储在外存储器上,构成了汉字字库,也称汉字字形库。如UCDOS5.0包括下列汉字字库:HZKPSSTJ、KZKPSKTJ等。汉字字库可分为软字库和硬字库两种。字模:表示产生字形的点阵模式。与字形概念无严格区别。字体:基本字体有宋体、楷体等,由基本字体变化而来的有长体、扁体等,按笔画不同可分为简体、繁体。ASCII码字符也可分为半角字符和全角字符两种字体。汉字字形的数字化表示:将汉字写在同样大小的方块内,可以将该方块看成m行n列的矩阵,第4页,共15页,星期日,2025年,2月5日4.1汉字信息的基础知识简称点阵。该矩阵中共有mxn个点,每个点可以是黑点或白点,黑点组成汉字的笔画,描绘出汉字的字形,称为点阵字型。在计算机中可以用一组二进制数表示一个汉字的点阵,用1表示点阵中的黑点,其余用0表示。一个16x16点阵汉字需2x16=32个字节存储其输出码,一个24x24点阵汉字则需3x24=72个字节。第5页,共15页,星期日,2025年,2月5日4.1汉字信息的基础知识键盘处理程序代码转换程序码表字型检索程序汉字字模库显示驱动程序显示存储器CRT键盘汉字键盘输入码汉字机码内(2字节)汉字字点阵型(32字节)4.1.3汉字的输出微机汉字显示原理图第6页,共15页,星期日,2025年,2月5日4.2汉字输入方法概述4.2.1汉字输入方法键盘输入顺序码:、国标区位码、电报码音码:拼音码形码:五笔字型码音形码:自然码非键盘输入语音输入笔输入扫描识别输入4.2.2汉字字符集国标码字符集(GB2312-80)GBK汉字集第7页,共15页,星期日,2025年,2月5日4.2汉字输入方法概述4.2.2汉字输入法的名词术语和屏幕显示汉字输入法的名词术语码长:指每个汉字对应的编码长度。静态平均码长指汉字编码长度的平均值;动态平均码长指实际输入汉字编码长度的平均值。例:区位码是定长编码,码长为4。词组输入法:将词组如同每个汉字一样看待,将其进行编码,按编码直接输入。重码:指相同编码的汉字或词组多于一个。提示行:位于屏幕的最下面,主要用于显示输入汉字或词组是键入的编码或重码,以及进行系统设置。汉字输入法的屏幕显示半角/全角:半角指一个字符占一个字节的位置;全角是指一个字符占两个字节的位置重码区:用于显示当前已输入编码所对应的重码内容。第8页,共15页,星期日,2025年,2月5日4.2汉字输入方法概述输入中文标点:中文标点符号与键盘按键的对应关系见下表第9页,共15页,星期日,2025年,2月5日4.3Windows95的汉字输入方法4.3.1Windows95的汉字输入功能4.3.2Windows95的汉字输入法输入法的安装选用输入法输入方法的切换中英文切换(右Ctrl+空格)汉字输入方法切换(右Ctrl+Shift)全角/半角切换(Shift+空格)GBK输入法区位码输入法:对每一个汉字都对应一个区位编号,区号在前,位号在后,这就是区位码。国标GB2312-80中规定一级汉字3755个,二级汉字3008个,分布第10页,共15页,星期日,2025年,2月5日4.3Windows95的汉字输入方法

文档评论(0)

1亿VIP精品文档

相关文档