- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于XML技术标准主题图构建与应用
基于XML技术标准的主题图构建及应用
【 摘 要 】 文章主要讨论了xml技术在信息组织领域的某一个方面应用,即xml用于主题图的实现,或称为xtm技术。它是使用xml语法来处理主题图中数据的一种方法。围绕该主题,文章介绍了xtm标准、使用xtm代码或使用集成开发工具这两种方法构建基于xml技术主题图,并列举了国内外使用基于xml技术实现主题图的应用案例。
【 关键词 】 xml;主题图;xtm;信息组织
【 abstract 】 xml being applied to topic maps, a way of information organization, is generally called xtm. in the content, we introduce xtm standard, two ways of using xtm to construct topic maps and some examples of using topic maps based on xml to organize information.
【 keywords 】 xml; topic maps; xtm; information organization
1 引言
21世纪是信息时代,人们对信息的需求越来越多。但是,信息的量大质杂,与人们有限的时间精力、特定的信息需求存在极大的矛盾冲突。因此,对信息进行合理的组织,以方便用户获取信息的需求越来越迫切。数据是信息的载体,对信息的组织实质上是对数据的组织。主题图结构清晰并能够有效地反映数据间关联,因此主题图常被认为是信息组织的理想方法。如今有多种实现主题图的技术方法,如hytm等。但是,上述实现主题图的方法有一个难题:利用主题图组织的数据如何实现跨平台的数据交换?xml是现在流行的internet环境下跨平台的数据组织、数据存储工具,能较好地解决主题图数据跨平台交换的问题,因此,基于xml技术标准构建的主题图(xml topic map、xtm)有着极大的发展空间。
2 xml技术与主题图概述
2.1 xml概述
xml(extensible makeup language,可扩展的标记语言)由万维网联盟(world wide web consortium,w3c)提出,希望能方便internet网络上的数据间交流,方便计算机处理文档内容以及文档结构。xml是一种元标记语言,是一套定义语义标记的规则。
相比较其他元标记语言而言,xml更加灵活。用户可根据处理的文档中的信息内容自定义符合一定规范的标记,从而更有助于用户理解文档内容结构,并方便计算机处理文档结构。但是,xml语法更加严格。因此xml更具有结构化,是处理结构化文档的有力工具。xml规范了格式,使用统一的编码,当所有平台遵守xml的格式规定,也就实现了跨平台,使不同来源、结构化的数据很容易地集成在一起。
简言之,xml允许用户自定义符合一定规范的标记,从而方便计算机处理结构化文档,同时,它能在internet环境下实现跨平台的数据交换。这些特点使xml成为实现主题图的主要技术。
2.2 主题图概述
主题图(topic map)的概念最初是由w3c提出,用来实现索引和辞典构建过程的形式化。主题图是一种用于描述信息资源的知识结构的元数据格式,它可以定位某一知识概念所在的资源位置,也可以表示知识概念间的相互联系。
简单说,主题图就是一种组织、表达信息,或者说数据的方式。现实世界中的事物都是一个对象,一个对象都有着自己的状态(如名字、存在地点)以及行为(与他人发生联系的方式)。这个对象在主题图中的反映就是一组主题,这些主题同样也包含自身状态以及行为,如主题的名称,资源出处,以及它与其他主题间的关联。
因此,一个主题图就是一个由主题、联系、资源组成,主题、联系、资源构成了主题图概念中的三要素。构建主题图的思想是将信息归为二类:主题、资源地址或者相关信息,然后再建立各种信息内容之间的联系,从而实现对信息的组织。
以英语单词abundant为例,可以构建主题图。与abundant相关词汇有abundance、abound、redundant,因此可以共建立四个主题。其中,abundance是abundant的名词形式,abound是abundant的动词形式,redundant与abundant有相同的词根und,以上为他们之间的联系。每一个词存在于某一个例句中,例句为对应资源。
3 基于xml的主题图构建标准xtm
xml是当前处理结构化文档、跨平台的有力工具。利用主题图组织的信息十分具有固定的结构,即有三个元素:t、a、o。因此,xml技术可以较好地描述于主题图的组织的信息。将xml思想运用于主题图的实现
文档评论(0)