电子机械论文浅谈数据集市技术在高校信息管理中的应用.docVIP

电子机械论文浅谈数据集市技术在高校信息管理中的应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电子机械论文浅谈数据集市技术在高校信息管理中的应用

电子机械论文浅谈数据集市技术在高校信息管理中的应用 “电子机械论文浅谈数据集市技术在高校信息管理中的应用”怎么写呢,请看xx小编为大家整理的范文 电子机械论文浅谈数据集市技术在高校信息管理中的应用 1引言 计算机技术已经在高校教学管理工作中广泛应用,各种类型的信息管理系统在高校各部门都已建立,如学生管理系统、教务管理系统、教师信息系统等等,它们的开发和应用大大提高了工作效率。但是,各类信息资源分散在各个不同的部门,缺乏统一的管理和组织,虽然积累了大量的数据信息,可是功能只是局限于查询等初级的应用,不能实现一些高级应用如:OLAP分析、数据挖掘等。对这些数据信息,巫待一种方法对其进行整合以更大限度的发挥其作用,这种方法就是建立数据仓库。 自顶向下开发数据仓库能最大限度地减少集成问题,是很好的开发方案。然而,数据仓库项目庞大、结构复杂、人力物力投人大、开发周期长,并且很难使整个组织的共同数据模型达到一致,从而缺乏灵活性。所以,高校数据仓库的建设应该采取渐进式、分阶段、分步骤的策略一自底向上首先设计、开发独立的面向一个院、系、部门数据集市,待成功后再建立所有院、系、部门的数据集市,最后集成为数据仓库。这种方式灵活性大、花费又低,并且能快速见效,更适合高校的实际情况。 2数据仓库的建立   对高校数据仓库建立我们设计如下实现步骤(图1): (1)定义一个高层次的整体数据模型,在不同的主题和可能的应用之间,提供全局范围的、一致的、集成的数据视图。无论数据集市提供何种功能,都是数据仓库的组件,要保证数据的组织、格式和架构在整个数据仓库内保持一致。表的设计、更新机制或维度的层次结构如果不一致,可能会使数据无法在整个数据仓库内重新使用,并可能导致由相同的数据生成不一致的报表。 (2)基于上述相同的整体数据模型,并行地实现独立的院、系、部门数据集市和校级部门数据集市。 (3)构造分布式数据集市,通过网络中心服务器集成不同的数据集市。 (4)集成为一个多层数据仓库,这里,多层数据仓库是所有仓库数据的唯一管理者,数据则分布在一些依赖的各院、系、部门数据集市中。 (5)建立C/S模式通过网络中心服务器为广大的教学管理人员、教师、学生提供服务。开发OLAP分析和数据挖掘等高级的应用,为高校教学管理提供决策支持。 3数据集市实例设计 本文以西华师范大学计算机学院为研究对象,利用SQL Server 2000及Analysis Services构造了一个面向院、系、部门的数据集市。   3.1数据集市模型的设计 在决策分析时,需要从多个方面来分析一个主题,这就要求数据集市以多维数据集的方式来组织数据,以简化OLAP分析,提高查询性能。本文采用了雪花模型一将星型模型的维表进行分解,分解成多个具有层次关系的维表,建立多维数据集。分解维表的过程也就是对维表进一步标准化的过程。雪花模型是标准化的维表,粒度较低,增加了应用程序的灵活性,易于实现动态SQL生成,便于以后进行数据挖掘等高级应用(图2)。 3.2建立数据准备区 数据准备区是数据中间存储区,在这里从数据源中析取数据,将数据转换为常用格式,检查一致性和引用完整性,并装人数据集市数据库。使用独立于数据源的数据准备区将原始数据同数据集市数据隔离开,可以提高管理数据集市的效率,保护数据集市的完整性,并且不影响数据集市执行支持客户端访问等主要功能。本文为数据准备区创建单独的数据库,包含创建数据表、视图、索引,还包含从源数据系统中析取数据的进程,如数据转换服务(DTS)包,以及关系数据库中常用的其它元素。   3.3清理和转换数据 对于构建数据集市或OLAP分析、数据挖掘等高级应用,都需要数据的正确性、一致性、完整性。而现有数据存在很多的问题,如:滥用缩写词、惯用语、数据输入错误、重复记录、丢失值等等。所以数据必须进行清理及格式化,并转换为数据集市架构。本文把数据驻留在数据准备区完成清理和转换,并且验证数据的一致性,将数据转换成常用格式以及合并代理键。在实际转换中很多的数据需要执行手工操作协调数据的不一致或解决二义性文本字段输人项。每次需要手工操作时,要试着确定一种方法来消除在以后的数据转换操作中的手工步骤。这样能够修改源数据系统以消除起因,或者能建立自动化进程将未解决的数据留待以后手工异常处理,从而,大批的数据就可以装人数据集

文档评论(0)

专注于电脑软件的下载与安装,各种疑难问题的解决,office办公软件的咨询,文档格式转换,音视频下载等等,欢迎各位咨询!

1亿VIP精品文档

相关文档