- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字校园建设中元数据管理研究
数字校园建设中元数据管理研究
摘 要:目前高校数字校园进入到系统集成与信息集成阶段,构建一个集成的数据环境是深入集成的基础。本文分析了数据集成过程中所面临的元数据管理问题,为解决这些问题,本文结合西安交通大学数字校园建设的实际,提出了一套元数据管理体系,包括:元数据建模、元数据管理系统和运行保障机制,为数字校园建设的数据集成提供了有力保障。
关键词:数字校园 元数据 元数据管理 数据集成
中图分类号:TP311 文献标识码:A 文章编号:1673-8454(2009)05-0025-02
目前数字校园建设处于系统集成与信息集成的阶段,集成的数据环境需要高效率的元数据管理。[1] 西安交通大学在数字校园建设过程中面临严峻的数据集成问题:由于以前的系统建设缺乏统一的规划,建成了一批孤立的彼此不关联的系统。同时,学校的管理又要和教育部、人事部、科技部、卫生部等管理部门的信息系统相集成,例如完成各种信息统计和填报等工作。学校迫切需要有效地提高与这些外部系统信息交换的自动化程度。而进行数据仓库的建设和数据挖掘分析,元数据的有效管理和共享是必不可少的。本文分析了目前元数据管理面临的一些问题,并提出了一个有效的解决方案。
一、数字校园建设中对元数据管理的迫切需求
在数字校园建设中,开发、运行维护人员关注技术元数据,通过它们掌握数据流动规则,制定数据清洗、粒度策略,建立新的数据抽取、聚合、发布过程,跟踪数据增量运行过程。业务人员关注业务元数据,通过它们掌握数据的全局视图,了解需要数据的位置、意义、关联关系、统计口径,生成需要的报表,展开多维分析、相关分析,辅助数据挖掘过程。[2]
因此元数据必须是可靠的、一致的、最新的,但是在数字校园建设过程中发现,我们能够得到的元数据并不是我们想象的那么完美,很多遗留系统存在着如下问题:
1.元数据的描述缺乏统一的标准,描述的方式多种多样。有的用E-R图,有的用数据字典,而且大多只停留在数据层面,而对系统本身和维护人员的描述基本没有。有的学生开发的系统很不规范,甚至没有元数据描述。
2.各个应用系统自己维护自己的元数据,元数据的管理是封闭的,许多系统的数据字典还只停留在设计阶段,随着系统运行时间的延长,实际的元数据已经和设计时的元数据大相径庭了。
3.有些系统开发和设计人员已经流失,变成了不可维护的“烟囱系统”。[3] 没有人能说清楚系统的元数据,这给系统的集成和改造带来了巨大的麻烦。
4.由于元数据都是各系统分别管理,因此在系统变化的时候也不会通知其他使用该系统资源的相关系统,这样经常会造成其他系统在不知情的情况下发生故障。
为了解决上述问题,保证数字校园数据交换平台的平稳运行,以及数据仓库建设的数据装载能够顺利的进行,有必要建设一个全局的元数据管理系统来规范全校各应用系统的元数据。为了有效地管理元数据,我们设计了一个全局的元数据管理体系:首先建立一个元数据描述的模型,其次建立一套元数据管理的系统,最终通过一套制度来保证全局元数据管理得到实施。
二、元数据建模
为了能更好地做到全局元数据管理,参考《都柏林核心元数据标准》和《中国科学院科学数据库核心元数据标准》,专门制定了《西安交通大学元据标准》,采用XML作为元数据的描述方式。[4] [5] 对于所有新建立的应用系统我们要求其必须提供符合元数据描述标准的元数据。对于旧的系统则通过人工的方式整理出符合标准的元数据,并作为元数据管理系统采集、对比和维护的数据对象。
在模型中根据学校实际情况简化了《都柏林核心元数据标准》中的定义,定义了最核心的基本的元数据的描述方式。例如,图1表示的是对“数据集结构描述”的定义。
有了元数据的描述标准,我们就可以通过元数据记录有关数据的建立、结构以及维护等方面的信息,数据管理者可以通过这些元数据对数据资源进行有效的管理,数据使用者也可据此了解数据资源的背景资料;其次,元数据的使用能够在一定程度上消除数据资源之间的语义独立性和异构性,帮助实现数据资源的整合和交换。
三、元数据管理系统
只有元数据的描述标准是远远不够的,我们还需要建立一套的元数据管理系统来注册、抽取和存储元数据,以及对元数据做版本控制和血统分析,这样才能充分保护和利用元数据,使其发挥更大的价值。
我们设计的元数据管理系统的架构如图2所示。
1.系统把符合元数据标准的系统元数据以XML方式存储在原生数据库中。
2.系统可以通过注册的方式把应用系统的元数据注册进来,一旦基本元数据注册成功,系统就可以主动地抓取应用系统中的元数据到版本库,版本库中的源数据也是以XML方式进行
您可能关注的文档
最近下载
- 年产2万吨特种石墨产能项目环境影响报告书.pdf
- 认可准则(ISOIEC17025)测试卷及答案.docx
- 分布式光伏电站监控与运维方案.docx
- 《交互数字内容设计》课件(共十章——下).pptx VIP
- 《中华民族艺术精华》课件.pptx VIP
- 幼儿园大班绘本《跳舞吧,小雅》 优质课件.ppt VIP
- 2025浙江衢州市柯城区机关事业单位编外人员招聘76人笔试备考试题附答案详解.docx VIP
- 提高护士对抢救药品知晓率PDCA案例.pdf VIP
- 220kV盘龙城输变电工程可行性研究接入系统报告.doc VIP
- 2025年知识竞赛-特钢知识竞赛考试近5年真题集锦(频考类试题)带答案.docx
文档评论(0)