- 1、本文档共49页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第9章 XL数据操作接口
第9章 XML数据操作接口 内容提要 可扩展标记语言(eXtensible Markup Language,XML)是目前应用开发领域中的热门技术。 本章主要讲述XML基本概念, XML的三种显示样式:CSS(Cascading Style Sheet,层叠式样式表单)、XSL(Extensible Style Language,扩展的标记语言)和Data Island(数据岛) 如何利用JSP操作XML文件。 XML的概念 XML即可扩展的标记语言,可以定义语义标记,是元标记语言。XML不像超文本标记语言HTML,HTML只能使用规定的标记,对于XML,用户可以定义自己需要的标记。 XML(eXtensible Markup Language)和HTML(Hyper Text Markup Language)师出同门,都是从SGML(Standard Generalized Markup Language)延伸而出的标记语言 XML文档的结构 案例名称:元标记语言 程序名称:9-01.xml ?xml version=1.0 encoding=gb2312? 老师 姓名zhourunfa/姓名 性别male/性别 职业Teacher Peking Univ./职业 /老师 定义基本元素 使用属性 典型的XML文档结构 XML声明 XML声明是以“?xml”开始的,程序9-04.xml的声明为: ?xml version=1.0 encoding=gb2312 standalone=yes? XML声明的作用是告诉浏览器将要处理的文档是XML文件。一个XML文档最好是以一个XML声明作为开始。 之所以说“最好”是因为XML声明在XML文档中是可选内容,可加可不加,但XML标准强烈推荐加入这一行声明。XML声明中可以包含version,encoding和standalone三个属性。 字符和实体引用 字符和实体引用可以向XML文档中引入其他信息,而不需要直接在文档中输入它们。字符和实体引用通常用于以下情况。 (1)字符不能直接出现在文档中,因为它们会被解释为标记。 (2)由于输入设备的限制,字符不能直接输入到文档中。 (3)由于单字节字符的限制,字符不能可靠地经过处理程序。 (4)相同的字符串或文档片断在文档中多次使用。 XML常用的实体引用 使用特殊字符 XML的三种显示格式 显示XML文件常见的有三种方式: 使用CSS样式表 使用XSL样式单 使用XML的数据岛技术 CSS样式表 XSL样式语言 XML数据岛技术 XML的两种语法规则 在XML文档规则方面,目前有两种: W3C的DTD技术 微软公司Scema技术 DTD文档类型定义 为文档类型定义(Document Type Definition),简称DTD。DTD可以包含在XML文档中,也可以独立为一个文件。根据DTD定义的位置,可以分成内部DTD和外部DTD 内部DTD 外部DTD Schema文档规则 字符集概述 常见的字符集包括: ASCII字符集、ISO8859字符集、Unicode字符集合、UCS字符集和常用的中文字符集:GB2312、GBK和Big5 ASCII字符集 ASCII码的全称是American Standard Code for Information Interchange(美国标准信息交换码),它是一种单字节的7位二进制编码。在ASCII码字符集中,每个数字,字母或特殊字符都对应于一个7位二进制数,这个7位二进制数是以一个字节(8位)来表示的(其中最高位为0)。从而定义了书写英语所需要的全部字符以及部分控制字符。 由于ASCII码的最高位为0,因此,在ASCII码字符集中一共定义了128(27)个字符编码,所定义的这些字符的编码都在0-127之间。 ISO 8859字符集 ASCII码在定义之初只是为了表示英语(更严格来说是美式英语),对于象?、?、¥、§、?、ü等其他语言或地区所需要的字符则没有定义其表示方式。 随着计算机应用的扩展,人们对其他字符表示的需求越来越迫切。1987年,国际标准组织ISO(International Organization for Standardization)发布了字符集标准:ISO8859-1字符集。ISO8859-1通常也被叫做Latin-1字符集。Latin-1字符集在ASCII码的基础上增加了对西欧语言的支持。 ISO8859字符集是单字节的8位二进制编码字符集,一共定义了256(28)个字符编码,其中,0-127之间的字符与ASCII码的定义相同,128-255之间的字符则是为了提供对其他语言的支持而对ASCII码进行
文档评论(0)