- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国高等教育学会教育信息化分会第九次学术年会论文集 ·415·
r I
ServeAnai SServi
基于SOL ys ces的招生
数据分析
刘实,刘杉,郭俊芳,沙仁高娃,郝晓琴,岳鹏飞
(内蒙古大学计算机学院,呼和浩特,010021)
摘要:信息系统在招生T作中已经大量应用,过程中积累的数据蕴涵+.r大量有价值的知识和规律。本文以某高校2007
Server
和2008两年招生数据为例,介绍了如何使用SOL AnalysisServices建.讧招生数据仓库,使用数据透视表工具
进行数据分析与表现,发现数据背后隐藏的信息,最终科学的指导下一年度招生工作。
Services
关键词:数据挖掘;数据仓库;招生;OLAP=Analysis
1引言
随着教育信息化在中国快速发展,各地高校和各级招生主管部门在招生过程中产生的数据越来越
多,如何从这些海量的杂乱无章的数据中找到有意义的信息,是摆在招生单位信息处理人员面前的棘
手问题。高校往往想从各个年度、不同专业、各地区等多个角度了解现有的招生数据,更想通过发掘
它们之间的关系来预测未来的趋势,以至于对今后招生和其他日常工作提供可以信赖的决策支持。利
用简单实用的数据挖掘工具对数据进行有效的管理,对其进行深入挖掘的需求就愈加显得迫切。
2数据挖掘及其相关技术
2.1数据挖掘技术
数据挖掘是从大量的数据中提取或“挖掘”其隐含的知识,也就是“从数据中挖掘知识”。数据挖掘
是一类深层次的数据分析。数据挖掘,也叫数据开采、数据采掘,就是按照既定的业务目标从海量数
据中提取可以解释为知识的规则或模式,包括关联规则、特征规则等。
2.2数据仓库及联机分析处理0LAP
数据仓库是一个面向主题的、集成的、非易失的、随时间变化的用来支持管理中决策的数据集合。
联机分析处理(OLAP)是以海量数据为基础的复杂分析技术。OLAP使用的逻辑数据模型为多维数据
模型。常用的OU心多维分析操作有上钻、下钻、切片、切块、旋转等。
2.3SOLServer2000Anal i SServi
ys COS下的多维数据建模技术
ServerTM2000
Microsoft@SQLAnalysis
能。AnalysisServices可以通过使用远程分区在多台分析服务器问分散多维数据集数据,来创建分布式
分区多维数据集,在中央分析服务器上管理分布式分区多维数据集。支持钻取的客户端应用程序允许
最终用户选择多维数据集单元,并且从该单元的源数据检索结果集。Analysis
Manager提供友好的用户接口,方便操作。多维数据建模技术可以构建多种模型,其中以星形模式和
雪花模型最为典型。在星形模式中,事实表居中,多个维表呈辐射状分布于其四周;并与事实表连接。
雪花模式是对星形模式维表的进一步层次化,将某些维表扩展成事实表,这样既可以应付不同级别用
户的查询,又可以将源数据通过层次问的联系向上综合,提高了查询功能。
Server
3基于SOL AnaIysiSServices招生数据仓库的建立
3.1数据的抽取,整理和转换
数据抽取的关键是按统~的语义建立源数据与目标数据之间的映射,这种映射既可以是一对一的
关系,也可以是多对多的复杂关系。在数据载入前,要对招生数据进行清理。这其中包括:
(1)统一招生专业。由于每个招生年度里,高校的招生计划难免会发生变化,专业代码、专业名
中国商等教育学会教育信息化分会第^状学术年会论史集
称和性质等一些基本属性在不同的年度里都会有所不周。为了统一标准必须儆到将这些不同的数据统
一起来。一种办法是根据招生专业的专业名称统一不同的专业代码.另一种方法是通过国家标准的专
业码来实现专业的统一。以上两种方法可以结合使用,通过有效的组织SQL语言可以批量统一不同年
度的专业。
(2)专业标准他过程。要把全国
文档评论(0)