2014涂兆文.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
学号: 200810165132 成绩:________ 武汉科技大学城市学院 课程论文 院 系 信息工程学部 专 业 信息系统与信息管理 年级 班 08级 (1)班 课程名称 数据仓库与数据挖掘 论文题目 维度建模技术研究及其 在高校教育数据仓库中的应用 姓 名 涂兆文 指导教师 杨 艳 霞 2011年 11月20日 课程论文评分表 学号: 200810165132 姓名: 涂兆文 评分标准: 1、字数要求:000字以上。 2、评分标准:100分 主要分为:论文结构50分;语言组织20分;创新10分;使用价值20分。 (1)论文结构:50分 ????A.论文层次分明,内容组织有序:40~50分; ????B.论文层次一般,内容组织一般:30~39分; ????C.论文层次不合理,内容组织不合理:30分以下。 (2)语言组织:20分 A.语言简练,通顺。16~20分; B.语言一般,基本通顺。12~15分; C.语言不通顺,有错字。11分以下。 (3)创新:????10分 A.论文具有前瞻性,有较多的创新见解:8~10分; B.论文具有前瞻性,有少数的创新见解:4~7分; C.论文没有前瞻性,无创新:0~3分。 (4)使用价值:20分 A.论文有较高的使用价值,能够解决实际问题;16~20分; B.论文使用价值一般,有一定的参考价值;8~15分; C.论文没有使用价值:0~7分。 论文结构 语言组织 创新 使用价值 维度建模技术研究及其在高校教育数据仓库中的应用 摘要 数据仓库技术在为企业科学地提高决策支持水平,提高企业信息质量和企业的应变能力等方面具有重要的意义。在竞争日益激烈的现代化教育管理体系中,引入数据仓库技术可以辅助高校管理者进行决策分析,提高学校的竞争力。从数据集市开始,由小而大,由易至难,逐步扩充与完善,最终建成一个企业级的数据仓库,这是当前我国教育数据仓库建设的可行策略。 关键词 高校教育管理,数据仓库,维度建模,OLAP,招生管理 1维度建模技术研究及其在高校教育数据仓库总体框架 1.1面向“招生”主题 数据仓库是面向主题的,在证券投资分析系统中,我们主要针对“招生”这一主题进行一些分析。主题中包含的信息一般来说比较全面,而原有的数据库中的个股信息只侧重于某些方面,因此,有必要把关于个股的各种信息综合在“个股”这一主题中,其中包括: ①招生年度; ②成绩; ③基本情况; ④专业计划. 1.2 高校教育数据仓库系统的框架结构 图l-1给出了基于数据仓库的投资分析系统的体系结构,该系统基于数据仓库、知识库、模型库和方法库“四库”之上,主要利用联机分析处理和数据挖掘技术对个股特征和发展趋势进行分析。数据仓库对内、外部数据源中的事务级数据进行提取、转换,重新组成面向全局的数据视图,为高校招生决策分析提供数据存储和组织的基础。数据挖掘以数据仓库中的大量数据为基础,利用特定的算法完成特定的挖掘任务,用于发现隐藏在数据库中的知识,并以这些知识模式为基础自动做出预测。数据挖掘中发现的新知识可以直接用于指导联机分析(OLAP)的分析处理,而数据挖掘和联机分析处理得出的新知识也可以立即补充到系统的知识库中。 2 数据提取、转换和加载 数据提取、转换和加载是数据仓库构建过程中比较复杂的一个环节,该过程主要完成如下工作:数据提取—— 是指从源数据中提取出所需要的数据,并去除不同源数据中数据的不一致性;数据转换—— 是指将提取出来的数据转换为所需的结构和数据类型;数据加载—— 把转换了的数据加载到数据仓库中。数据提取的具体实现,主要考虑数据源的不同而采取不同的方式。根据数据源的不同,一般可分成相同数据库数据源、不同数据库数据源、非数据库数据源的数据提取。 由于本系统的数据源是高等院校历年的招生数据,数据来源单一,数据量不大,以年度为单位进行数据刷新,属于小型数据仓库范畴,主要是为招生决策提供多维分析、决策支持的,所以本系统的预期用户是院校的招生管理机构。针对本系统采用微软SOL Server 2000及其相关工具作为系统开发平台和工具。 3 数据挖掘 经过以上过程,我们可以看出加载后的数据仓库不仅包含高校招生的大量反映其招生状况和招生前景的信息,同时也包含高校招生数据。在此基础上,利用数据挖掘技术,可使投资者从中提炼出各种有用的信息为招生决策服务,增加预期的可靠性和确定性,从而提高高校自身的招生人数的过程。具体来讲,数

文档评论(0)

KhcFqXrwEu + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档