第2章节细则的XML文件.pptVIP

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章节细则的XML文件

第2章 规范的XML文件 本章主要内容 2.1规范性 2.2XML声明 2.3标记 2.4特殊字符 2.5CDATA段 2.6标记的文本数据 2.7属性 2.8注释 2.9名称空间 2.1 规范性 符合W3C制定的基本语法规则的XML文件称为规范的XML文件。 规范的XML文件如果再符合额外的一些约束就称为有效的XML文件。 有效的XML文件 XML文档的结构3部分: XML标头信息(prolog) XML标头信息有三个属性:version、encoding、standalone DTD(Document Type Declare)声明 将XML中的每一个标记与附属在标记上的属性加以定义,明确指出标记与标记间的组成关系、标记内数据的类型与标记数量的多少 文件实例集合(Document Instance Set) 是XML文件中真正数据所存放的位置。 2.2 XML 声明 XML声明以 “?xml” 标识开始、 以“?” 标识结束。 一个最基本的XML声明: ?xml version=“1.0” ? 规范的XML文件应当以XML声明作为文件的第一行 在XML声明前面不能有空白、其他的处理指令或注释。 如果一个XML文件省略XML声明,各种XML解析器将默认该XML文件是有XML声明的,而且XML声明是: ?xml version=1.0 encoding=UTF-8 ? 注:W3C在XML规范中建议每个XML文件都显示地写有XML声明。 2.2.1 version属性 在XML声明中必须包含version属性,指明以下文档遵循哪个版本的XML规范。 该属性必须排在XML声明中其他属性之前。 由于本书的XML版本为1.0,所以在XML声明中出现的版本说明无一例外地都是version=“1.0” 2.2.2 encoding属性 encoding属性规定XML文件采用哪种字符集进行编码,该属性的默认值是“UTF-8” . ?xml version=1.0 encoding=UTF-8 ? 注: encoding属性值不同, XML文件保存时的编码要与之对应。 eg1. ?xml version=1.0 encoding=UTF-8 ? XML文件中,标记的名字以及标记包含文本内容中就可以使用汉字、日文、英文等,XML解析器就会识别标记的名字并正确解析标记中的文本内容。 XML文件必须选择“UTF-8”编码来保存 。 eg2. ?xml version=1.0 encoding=gb2312 ? 如果在编写XML文件时只准备使用ASCII字符和汉字, 可以将encoding属性的值设置为“gb2312”。 XML文件必须使用“ANSI”编码保存 。 encoding属性 XML文档中的字符遵守Unicode标准。 包括UTF-8和UTF-16 在XML规范中列出了很多编码类型,: ASCII字符集编码 UTF-8:压缩的Unicode编码,采用8位编码方式 UTF-16:Unicode编码,采用16位编码方式 GB2312或者GBK:简体中文编码,采用双字节编码。 BIG5:繁体中文编码。 Unicode Transformation Format-8bit,是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三 个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显 示。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。 ? ?GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。 eg. Java应用程序,输出的“你” 的UTF-8编码 2.2.3 standalone属性 在XML声明中可以指定standalone属性的值,说明XML文件是否是完全自包含的。 该属性可以取值“yes”或“no” 该属性的默认值是“no” eg. XML声明指定standalone属性的值为“yes”: §2.3 标记 标记(元素) 标记是XML 文件中的基本数据单位 标记有一个开始标记和结束标记同时存在 创建标记的规则: 一份XML文件中最少有一个标记 一份XML文件只能存在一个顶层(根)标记 标记命名规则: 标记应该以字母、下划线“_” 开头,后面跟字母、数字、句号“.”、冒号、下划线或连字符“-”; 但是中间不能有空格,浏览器将把空格后面的字符识别为属性名称。而且任何标记

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档