- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
使用 XSLT 2.0 为内容添加结构和语义
页码,1/ 15
使用 XSLT 2.0 为内容添加结构和语义
非结构化的叙述性内容转换为结构化的、具有丰富特性的 XML
Priscilla Walmsley, 常务董事, Datypic
简介: 当您将现有内容转换为电子书格式、DITA 或其他结构化标准时, 需要推断结构并将该结构添加到您的文档
中。XSLT 2.0 的高级正则表达式和分组功能使其成为用于转换和增强内容的一门优秀语言。当您将非结构化或半结构化
叙述性内容转换为更好地结构化的词汇并查看几个 见场景时,就会发现一些最有用的 XSLT 2.0 特性。
发布日期:2011 年 8 月 23 日
级别: 中级
原创语言:英文
过去,叙述性内容进行了标记,用于表示内容的外观 (例如,字体大小或文本对齐方式),而不是其真实的结构或含
义。这种方法非 适用于图书印刷、办公文档以及许多 Web 页面的内容。一些叙述性内容根本没有进行标记,而是以
纯文本段落形式呈现。
常用缩略语
l CSS:级联样式表
l DITA :达尔文信息类型体系结构
l HTML:超文本标记语言
l XHTML:可扩展 HTML
l XML:可扩展标记语言
l XSLT:可扩展样式表语言转换
随着内容管理、电子发布、高级搜索和查询技术的出现,内容所有者现在已认识到结构化信息的威力,并使用相应的方
式来标记他们的新内容。但是,许多人仍然存留有旧的内容,这些内容是非结构化或半结构化的,或只为了演示目的而
进行标记。
为了令现有内容更 可读性,可为其添加结构,从而使您能够:
l 分别对多个输出设备 (如智能手机、电子书阅读器和替代 Web 浏览器)的内容进行样式化
l 实现与某些种类的文本(比如文档内部或文档之间的引用中的超链接,或用于地址的弹出指示)有关的交互式
行为
l 生成内容的替代表示,如内容表、索引和摘要视图
l 根据内容中的字段提供更受专注的搜索
l 确保整个内容正文 有更一致的格式
l 改进对内容的检验,例如,确定某个法律文档中的文档内部引用是否有效
使用 XSLT 2.0
XSLT 2.0 是一种适应性很强的技术,可用于为叙述性内容添加结构。人们越来越多地使用 XML 或易于转化为 XML 的
格式 (如HTML)来表示叙述性内容。与其他一些用于处理文本的流行脚本语言不同的是,XSLT 完全支持 XML。它理
解 XML 语法、编码和名称空间的许多变体。
XSLT 同样适用于叙述性内容,因为它提供了很好的灵活性。使用模板规则处理输入文档中的各种事件意味着会话可以
页码,2/ 15
是由内容驱动的,而不是严格按照顺序控制。
与专注于 XML 样式化的 XSLT 1.0 不同,XSLT 2.0 提供了一些用于转换内容的高级功能,这些功能可以实现以下操
作:
l 过正则表达式来确定文本中的模式
l 按照值或位置对元素进行分组
l 一个样式表一个文档地多次传递文档
l 将一个文档分割成多个文档,或将多个文档组合成一个文档
要使用 XSLT ,第一步是将内容转换为 XML 形式。大多数文档编辑器和其他内容工 都有 XML 导出功能。根据所使
用的工 ,XML 很可能非 复杂,因此第一步是将 XML 转换为一种简便形式,以便更容易处理它。
如果是从 HTML 进行转换,HTML Tidy (参见 参考资料 中的链接)会将您的 HTML 转换为 XHTML,可以将
XHTML 作为 XSLT 的输入,因为它是一种格式良好的 XML。它还简化了您的文档。
回页首
技巧
本文其余部分将介绍使用 XSLT 2.0 为内容添加结构和语义的技巧,并且特别关注作为输入文档的 XHTML 和
Microsoft Office Word XML,但这些概念适用于任何叙述性输入文档。
您可以在本节中以可下载的 ZIP 文件 (参见 下载)的形式下载所有示例。对于 XSLT 2.0 处理,我建议使用 Saxon
(参见 参考资料 中的链接)。
识别文本模式
识别文本中的特定模式并进行标记 十分有用。URL、电子邮件地址、电话号码、文档间引用以及 wiki 类型的格式化
您可能关注的文档
- AutoCAD图纸转换为XAML文件.pdf
- 全国农村生态环境质量信息共享系统设计与实现.pdf
- JQueryAjax异步处理JSON数据在项目管理系统中的应用_李志秀.pdf
- 国家级试点任务落户杭州市档案局——杭州市电子档案移交与管理试点工作综述.pdf
- 海尔DTA1481型组合电视的绿色包装解决方案.pdf
- Themenliste für das Seminar 1912 ”Neue Techniken der Anfragebearbeitung Datenstrme, konti.pdf
- 基于EtherCAT的工业以太网数据采集系统.kdh.pdf
- OAuth2与shiro集成.pdf
- Officemap安装教程.pdf
- 代码revit二次开发.pdf
最近下载
- TXEEPIA 001-2023 重点行业企业项目碳排放评价技术规范.pdf VIP
- 2025年人教版三年级上册道德与法治全册知识点(新教材).pdf
- 海燕出版社六年度级劳动与技术上册教案.pdf VIP
- TCWEC29-2021水利水电工程清污机制造安装及验收规范(OCR).pdf VIP
- 第8课《回忆鲁迅先生》课件 (共45张ppt) 2025-2026学年统编版语文八年级上册.pptx VIP
- 初中美术折纸教学课件.ppt VIP
- 爱护公物,从我做起 主题班会课件(共30张PPT).pptx VIP
- 第二单元 单元复习课件七年级语文上册.ppt VIP
- 2025年广东高职高考语文试卷及答案.doc VIP
- 小马宝莉英文第四季台词S04E18 Maud Pie.pdf VIP
原创力文档


文档评论(0)