- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
字库知识浅谈
汉字有多少呢?从国家标准GB2132到GBK,再到GB18030,标准收录的汉字从6763个增加到现在的27000多个。为了使汉字信息应用于计算机中,通过电脑存贮、传输、显示、打印、照排输出等等,需要将这些汉字数字化,字库就是对汉字及其它字符的数字化。
字库主要涉及的知识有字库格式、编码、字体样式、输入法、制作等
一、字库格式
在字库的应用中,经常会碰到点阵字库、PS字库、TrueType字库这三种说法,这是按照字库的自身格式来说的。
1、点阵格式
点阵格式是以横向扫描线上点阵的黑或者白来记录字形的,满足针式打印机、屏幕显示的要求。点阵字体数据量大,不适于放大,放大之后,字的边缘会出现锯齿现象。
目前点阵字库应用范围比较广,手机、掌上电脑、机顶盒、MP3播放器、卡拉OK点播机、其它专用设备等。
2、TrueType格式
TrueType格式是由Apple公司和Microsoft公司联合开发的一种曲线轮廓字形描述技术。采用直线和二次B样条函数来描述字的笔划轮廓,字形描述灵活方便,数据量小。对于细小的字符,通过专门的提示信息(Hinting)指令集,可以获得非常好的还原结果。
TrueType格式兼容性好,跨Windows和MAC平台;显示效果好,可直接在屏幕上显示输出,在印前工艺中一般作为前端显示字库。TrueType格式还具有所见即所得效果,支持几乎所有的输出设备,可以进行打印、照排输出,不过精度有一定限度。另外TrueType格式支持字体嵌入技术,可以把TrueType字体嵌入到排版文件中,直接用于后端输出。
3、Type1格式
Type1格式由Adobe开发的一种曲线轮廓字形描述技术,使用的PostScript语言,常称为PS格式。采用三次贝塞尔(Bezier)曲线来描述笔划轮廓。PS格式主要用于激光打印机、激光照排机、CTP(计算机直接制版)等高精度输出。PS格式输出质量最好,可以任意缩放,字形清晰、光滑。PS字库一般安装在与打印机或照排机相连的后端设备上。
由于屏幕不是PS设备,使用的都是点阵格式,所以PS字用于屏幕显示时,要转换为相应的点阵字。转换工具为ATM(Adobe Type Manager)即字库管理系统,它能够将Type1轮廓字库在计算机中展开成点阵型数据,同时用于终端显示和非PS打印机输出。
另外在PS格式中,还有一种由Type1演变出来的Type3格式。Type3字库中,字形轮廓数据的格式可以自定,而Type1的字形轮廓数据的格式遵守统一规范。
二、字库编码
字库的编码是字库组织的依据,也是文字处理的基础。不同国家和地区有不同的编码标准,和中文字库有关的常见编码有: GB2312-80、BIG5编码、GBK、ISO10646 / Unicode、GB18030-2000、BIG5、方正748编码,下面简要介绍一下:
1、GB2312-80编码
全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信息处理的国家标准,在大陆及海外使用简体中文的地区使用。使用双字节编码方案。共收录了6763个简体汉字、682个符号,其中一级汉字3755个(按拼音排序),二级汉字3008个(按偏旁排序)。目前的DOS操作系统、Windows操作系统以及Mac OS的中文版都支持GB2312-80编码系统。
2、 BIG5编码
是目前台湾、香港地区普遍使用的一种繁体汉字的编码标准,包括440个符号,一级汉字5401个、二级汉字7652个,共计13063个汉字。
3、GBK编码(Chinese Internal Code Specification)
GBK编码的制订于1995年12月完成。它是继GB2312后新的中文编码扩展国家标准。该编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个码位用于补字。简、繁体汉字融于一库,并且GBK编码的汉字完全按拼音排序。Windows95/98/2000简体中文版的字库表层编码采用的就是GBK。GBK编码的汉字共分5部分。其中GBK1和GBK5为符号部分,GBK2即兼容GB2312的部分,GBK3和GBK4为扩展汉字部分。
4、ISO10646 / Unicode编码
国际标准组织于1984年4月成立ISO/IEC工作组,对各国文字、符号进行统一编码的工作,并出台了Unicode编码。Unicode是一种重要的交互和显示的通用字符编码标准,它覆盖了美国、欧洲、中东、非洲、印度、亚洲和太平洋的语言,以及古文和专业符号。Unicode允许交换、处理和显示多语言文本以及公用的专业和数学符号。
Unicode采用16位(即双字节)编码体系。1996年公布的2.0版本中包含符号6811个,汉字20902个,韩文拼音11172个,
您可能关注的文档
最近下载
- 全自动双面钻电气控制系统设计.doc VIP
- GB-纯电动液压挖掘机 技术要求及编制说明.pdf VIP
- 湖北省襄阳市襄州区2023年数学六年级第二学期期末统考试题含解析.doc VIP
- 2020年公路工程监理工程师考试《道路与桥梁》模拟考核题库258题(含标准答案).pdf VIP
- 人工智能基础(国科技大)中国大学MOOC慕课 章节测验 客观题答案.docx VIP
- 09S302雨水斗选用及安装图集(清晰).pdf
- 乡镇退役军人服务站的工作总结.pptx VIP
- 《气动与液压技术》课件——33电气元件、电磁换向阀.pptx VIP
- 国开 电大计算机应用基础 终结性考试试题及答案.docx VIP
- 基于PLC的烟气脱硫的控制系统设计.docx VIP
文档评论(0)