中文域名编码技术要求.pdfVIP

  • 2
  • 0
  • 约3.87万字
  • 约 31页
  • 2023-05-07 发布于河南
  • 举报
中文域名编码技术要求 1 范围 本文件规定了在互联网体系上使用中文域名的编码规范,以及使用中文域名字段的预处理要求,同 时规定了如何使用punycode 进行编码。 本文件适用于各级域名注册管理机构、域名注册服务提供商以及软件厂商开发支持中文域名的应用 或者服务等。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 IETF RFC 1034 域名的概念与应用 IETF RFC 1035 域名的实现与规范 IETF RFC 1122 互联网主机传输层要求 IETF RFC 1123 互联网主机的应用与支持要求 IETF RFC 2234 语法规范的扩展巴科斯范式:ABNF IETF RFC 3454 国际化字符串预处理 IETF RFC 3490 国际化域名与应用 IETF RFC 3491 国际化域名预处理 IETF RFC 3492 一种适用于国际化域名应用的对UNICODE 码的编码方法:Punycode IETF RFC 3743 国际化域名的注册管理指南 IETF RFC 5890 国际化域名定义与框架 UAX15 UNICODE 码标准附录15 UTR21 UNICODE 码技术规范21 3 术语、定义和缩略语 3.1 术语及定义 下列术语和定义适用于本文件。 3.1.1 通用字符编码 UNICODE encoding 根据其位置或码位来识别字符,给每个字符提供的一个唯一的数字。 注:比如说,U+4E96指的是在UNICODE字符集中位于4E96处的字符。本标准的UNICODE字符编码采用了ISO/IEC 10646-1: 2000,UNICODE字符编码的集合称为UNICODE字符集。 3.1.2 分隔符 delimiter 在punycode里用的分隔符是连接符“-”。 1 3.1.3 域名字段 label 域名中由分隔符隔开的几个部分。 例如:对于一个完整的域名“.”,其中 “www”、“cnnic”、“cn”分别是三个域名字段。 3.1.4 中文域名字段 Chinese domain label 含有中文字符的域名字段。 3.1.5 中文域名 Chinese domain name 含有中文域名字段的域名。 3.1.6 码位 code points 字符的数字表现形式。在UNICODE里,UNICODE码位用U+开始的4到6位16进制数表示。码位序列可 以用没有前缀的用..分隔的两位一组的十六进制数表示。 3.1.7 溢出 overflow 计算时超出了最大整数值。 3.1.8 国际化域名码 Punycode 一种编码转换规则。运用这种规则应可实现UNICODE字符编码字符串和LDH字符串的相互转换。 3.1.9 LDH 编码前缀 LDH prefix LDH 即Letter、Digit 和Hyphen 三个英文单词的首字母简写;由两个LDH 字符后跟着两个连字符 (其中字母不区分大小写)进行表示的前缀。用于中文域名的LDH 编码前缀是“xn--”。 3.1.10 操作符div 和mod 执行数学除法。div是除法取商运算,mod是取模运算。Bootstring使用这些操作符来对非负数进行 运算,因此商和余数总是非负的。 3.1.11 存储字符串 stored string 用在协议标识符和名称实体中的字符串。 3.1.12 查询字符串 query string 用于和已保存的标识符相匹配或者相比较的字符串,例如:域名查询中的域名部分。 3.1.13 先分解后合成的归一化形式 NFKC UNICODE 归一化的一种形式,先对字符进行兼容性分解,再对其进行规范合成。 3.1.14 基础字符 basic code points 小范围字符集里的字符,本标准里一般指ASCII 字符集中的字符。 3.1.15

文档评论(0)

1亿VIP精品文档

相关文档