- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自标准数据架构设计初探
王权、夏艳波、张彦国、田鹏、唐力伟
自标准数据定义:所谓自标准数据=数据体+数据格式(数据体解释)。
自标准数据也是标准,它是局部自治的标准。其用于描述数据的标准定义语言,是遵循自标准数据描述定义标准的。
在自标准数据体系结构中建议包含:
数据标准定义语言
数据港口
数据泵
数据规则
标准解析引擎
数据港口组件
港口链路
所谓自标准数据体系是指,对自标准数据概念的标准模型。
自标准数据体系实现遵循原则:
Open;整个体系结构中,所有数据体中数据均完全。使得所有数据使用者可方便调用。
自治;自标准数据中,标准是采用自治管理方式。也就是自标准数据中,标准是可以进行变更的,标准变更意味数据同时按照变更后标准提供,是数据提供方对数据进行的描述。
简单标准;自标准数据遵循简单原则,数据定义过程中,数据的标准定义使用简单标注。减少数据使用繁琐度。
集中管理关键;整个体系结构中,仅对各数据来源单位的服务ID信息、自标准数据体、数据缓存周期、数据权限进行管理。其他数据具体业务不进行过度干预。
即插即用;自标准体系中,凡遵守数据描述定义语言标准的自标准数据所有数据供应商接入即可使用。即使数据提供商对数据未进行任何标准定义的私密数据,由使用者自行解决对应数据体。
适配;自标准体系中,数据港口可提供一定的自标准数据适配功能。保障数据体标准变更后,可提供部分自动适配功能。使所有数据使用者避免由于标准变更产生更大的变更活动。
自发展;
数据标准定义语言
数据标准定义语言是由总体平台框架定义的对数据体进行自描述的语言结构。数据标准定义语言应能够尽量对数据进行描述,除了因技术或其他原因计算机无法描述的部分由用户描述,由用户描述的部分应越少越好。
可以考虑xml风格的描述,通过自定义标签的方式实现。技术来说这样的标签数量上不应超过20个。这方面非常期望能参考袁满老师的意见。
其中必须包括广义元数据名称(Title)
标识:Title
定义:分配给资源的名称。
解释:使资源为众所周知的有代表性的正规名称。
创作、制作者(Creator)
标识:Creator
定义:制作资源内容的主要责任实体。
解释:创作、制作者包括个人、组织或机构。
应该是用于标识创作、制作者实体的具有代表性的名称。
主题及关键词(Subject and Keywords)
标识:Subject定义:资源内容的主题。
解释:用以描述资源主要内容的关键词语或分类号码表示的有代表性的主题词。
说明(Description)
标识:Description
定义:有关资源内容的说明。
解释:该说明可以包括但并不限于:摘要,内容目次,内容图示或内容的文字说明。
出版者(Publisher)
标识:Publisher
定义:制作资源有重要作用的责任实体。
解释:如包括个人、组织或机构的出版者。
应是用于标识出版者实体的有代表性的名称。
发行者(Contributor)
标识:Contributor
定义:对资源内容负有发行责任的实体。
解释:发行者包括个人、组织或机构。
应是用于标识发行者实体的有代表性的名称。
时间(Date)
标识:Date
定义:与资源使用期限相关的日期、时间。
解释:资源产生或有效使用的日期、时间。
类型(Type)
标识:Type
定义:资源内容方面的特征或体裁。
解释:类型包括种类、功能、体裁或作品集成级别等描述性术语。推荐从可控词表(如Dublin Core Types[DCT1])中选用有关术语。对于资源物理或数字化方面表示,采用格式项描述。
格式(Format)
标识:Format
定义:资源物理或数字化的特有表示。
解释:格式可包括媒体类型或资源容量。也可用于限定资源显示或操作所需的软件、硬件或其它设备,如容量包括数据所占空间和存在期间。
标识(Identifier)
标识:Identifier
定义:依据有关规定分配给资源的标识性信息。
解释:推荐使用依据格式化标识系统规定的字符或号码标识资源。
如正规标识系统包括统一资源标识(URI),统一资源地址(URL)、数字对象标识(DOI)以及国际标准书号(ISBN)、国际标准刊号(ISSN)等。
来源(Source)
标识:Source
定义:可获取现存资源的有关信息。
解释:可从原资源整体或部分获得现有资源。建议使用正规标识系统确定的字符或号码标引资源来源信息。
语言(Language)
标识:Language
定义:资源知识内容使用的语种。
解释:推荐使用由RFC1766定义的语种代码,它由两位字符(源自ISO639)组成。随后可选用两字符的国家代码(源自ISO 3166)。如en表示英语,fr表示法语。
相关资源(Relat
文档评论(0)