字库知识浅谈.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
字库知识浅谈 汉字有多少呢?从国家标准GB2132到GBK,再到GB18030,标准收录的汉字从6763个增加到现在的27000多个。为了使汉字信息应用于计算机中,通过电脑存贮、传输、显示、打印、照排输出等等,需要将这些汉字数字化,字库就是对汉字及其它字符的数字化。 字库主要涉及的知识有字库格式、编码、字体样式、输入法、制作等 一、字库格式 在字库的应用中,经常会碰到点阵字库、PS字库、TrueType字库这三种说法,这是按照字库的自身格式来说的。 1、点阵格式 点阵格式是以横向扫描线上点阵的黑或者白来记录字形的,满足针式打印机、屏幕显示的要求。点阵字体数据量大,不适于放大,放大之后,字的边缘会出现锯齿现象。 目前点阵字库应用范围比较广,手机、掌上电脑、机顶盒、MP3播放器、卡拉OK点播机、其它专用设备等。 2、TrueType格式 TrueType格式是由Apple公司和Microsoft公司联合开发的一种曲线轮廓字形描述技术。采用直线和二次B样条函数来描述字的笔划轮廓,字形描述灵活方便,数据量小。对于细小的字符,通过专门的提示信息(Hinting)指令集,可以获得非常好的还原结果。 TrueType格式兼容性好,跨Windows和MAC平台;显示效果好,可直接在屏幕上显示输出,在印前工艺中一般作为前端显示字库。TrueType格式还具有所见即所得效果,支持几乎所有的输出设备,可以进行打印、照排输出,不过精度有一定限度。另外TrueType格式支持字体嵌入技术,可以把TrueType字体嵌入到排版文件中,直接用于后端输出。 3、Type1格式 Type1格式由Adobe开发的一种曲线轮廓字形描述技术,使用的PostScript语言,常称为PS格式。采用三次贝塞尔(Bezier)曲线来描述笔划轮廓。PS格式主要用于激光打印机、激光照排机、CTP(计算机直接制版)等高精度输出。PS格式输出质量最好,可以任意缩放,字形清晰、光滑。PS字库一般安装在与打印机或照排机相连的后端设备上。 由于屏幕不是PS设备,使用的都是点阵格式,所以PS字用于屏幕显示时,要转换为相应的点阵字。转换工具为ATM(Adobe Type Manager)即字库管理系统,它能够将Type1轮廓字库在计算机中展开成点阵型数据,同时用于终端显示和非PS打印机输出。 另外在PS格式中,还有一种由Type1演变出来的Type3格式。Type3字库中,字形轮廓数据的格式可以自定,而Type1的字形轮廓数据的格式遵守统一规范。 二、字库编码 字库的编码是字库组织的依据,也是文字处理的基础。不同国家和地区有不同的编码标准,和中文字库有关的常见编码有: GB2312-80、BIG5编码、GBK、ISO10646 / Unicode、GB18030-2000、BIG5、方正748编码,下面简要介绍一下: 1、GB2312-80编码 全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信息处理的国家标准,在大陆及海外使用简体中文的地区使用。使用双字节编码方案。共收录了6763个简体汉字、682个符号,其中一级汉字3755个(按拼音排序),二级汉字3008个(按偏旁排序)。目前的DOS操作系统、Windows操作系统以及Mac OS的中文版都支持GB2312-80编码系统。 2、 BIG5编码 是目前台湾、香港地区普遍使用的一种繁体汉字的编码标准,包括440个符号,一级汉字5401个、二级汉字7652个,共计13063个汉字。 3、GBK编码(Chinese Internal Code Specification) GBK编码的制订于1995年12月完成。它是继GB2312后新的中文编码扩展国家标准。该编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个码位用于补字。简、繁体汉字融于一库,并且GBK编码的汉字完全按拼音排序。Windows95/98/2000简体中文版的字库表层编码采用的就是GBK。GBK编码的汉字共分5部分。其中GBK1和GBK5为符号部分,GBK2即兼容GB2312的部分,GBK3和GBK4为扩展汉字部分。 4、ISO10646 / Unicode编码 国际标准组织于1984年4月成立ISO/IEC工作组,对各国文字、符号进行统一编码的工作,并出台了Unicode编码。Unicode是一种重要的交互和显示的通用字符编码标准,它覆盖了美国、欧洲、中东、非洲、印度、亚洲和太平洋的语言,以及古文和专业符号。Unicode允许交换、处理和显示多语言文本以及公用的专业和数学符号。 Unicode采用16位(即双字节)编码体系。1996年公布的2.0版本中包含符号6811个,汉字20902个,韩文拼音11172个,

文档评论(0)

zhuliyan1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档