标准与实践的结合-中国语言文字网.DOC

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
标准与实践的结合-中国语言文字网

ISO/IEC 10646/Unicode 最新进展及其实现 人们经常听到或见到GBK、Unicode、ISO 10646、UCS、CJK等术语,而且各说不一,甚至产生一些误解,影响这一重要国际标准的普及应用。如有些人认为:ISO 10646就是汉字标准,它的特点就是编码的汉字多。这种理解与事实相距甚远。那么这些术语究竟是什么含义?他们之间有什么关系?这些术语所反映的国际标准的内涵是什么?最新进展如何?…… 作为制定国际标准ISO/IEC 10646的参加人之一,我借此篇把该标准的一些基本情况、并以汉字编码区为例就该标准的一些最新进展及其实现作扼要陈述。 基本术语 【ISO/IEC 10646】它是一个国际标准编号,该标准的英文全称为:Information technology - Universal Multiple - Octet Coded Character Set,简称UCS。中文全称为:信息技术--通用多八位编码字符集,亦称大字符集。它是国际标准化组织(ISO)1993年正式颁布的一项重要国际标准,它的宗旨是全球所有文种统一编码。它的2000年版正在印制中,ISO/IEC 10646-1:2000。 【Unicode】 它本身是英文Universal Code的缩略语,顾名思义,就是统一编码。然而,现在这个术语具有双重含义。首先,Unicode是对国际标准ISO/IEC 10646编码的一种称谓;另外,它又是一个企业联盟集团的名称。Unicode集团是由美国的HP、Microsoft、IBM、Apple等几家知名的大型计算机企业所组成的联盟集团,成立该集团的宗旨就是要推进多文种的统一编码,故称Unicode。就内容而言,Unicode和ISO/IEC 10646是一致的,并行的。 【CJK】 它是把中国、日本与韩国的英文称谓的首字母用于ISO/IEC 10646中的中、日、韩统一编码汉字的简称。 ISO/IEC 10646 的体系结构 ISO/IEC 10646的总体结构是一个四维的编码空间,其间采用十六进制全编码。它总体上分为128个三维组(group),每一组包含256个平面(plane),每一个平面包含256行(row),每一行包含256个字位(cell),又称谓“列”。其中group的值范围是从00到7F,plane、row、cell的值范围都是从00到FF全编码。整个编码字符集的每个字符都是由4个八位序列表示,按照组八位、面八位、行八位、列八位的顺序,具体表示如下: Group-octet 组八位 Plane-octet 平面八位 Row-octet 行八位 Cell-octet 字位八位 由此不难算出该标准的可编码空间为:128X256X256X256=32KX64K。 ISO/IEC 10646的体系结构图如下: ISO/IEC 10646体系结构图: Group 7F Plane 00 of 7F Group 01 Group 00 Plane FF of Group 00 Plane 02 of Group 00 Plane 01 of Group 00 Plane 00 of Group 00 三、基本多文种平面的最新状态 ISO/IEC 10646将其第一个平面(00组中的00平面)称作Basic Multilingual Plane(基本多文种平面),简称BMP,并在其上规定了双八位形式,它可以作为双八位编码字符集使用,即:在此平面上仅用行、列两个八位就可以表示一个编码字符,这就使得人们对BMP格外青睐。BMP的最新概貌图如下: 00 A_ZONE 拼音文字编码区 33 34 CJK Unified Ideographs Extension A 4D 4DB5→| 4E CJK Unified Ideographs 9F 9FA5→| A0 YI A4C6→| AB AC Ha

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档