- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于数据仓库的毕业生就业预测系统设计和实现.pdf
第二十四卷第三期 楚雄师范学院学报 V01.24No.3
2009年3月 JoURNAL0FCHUXIONGNORMALUNIVERS兀’Y Mat.2009
基于数据仓库的毕业生就业预测系统设计和实现
王俊洁m 王俊鑫3黄青松3
(1.昆明理工大学信息工程与自动化学院,云南昆明650051;
2.楚雄师范学院计算机科学系,云南楚雄675000;
3.楚雄师范学院经济信息管理及计算机应用系,云南楚雄675000)
摘要:文中以某高校毕业生就业信息为数据依据。从应用的角度,研究提出简单高效的数据
仓库设计与实现方案。对来自不同的数据源、不同格式的数据,进行抽取、清理、集成、转换、加
载,完成毕业生就业数据仓库的建立。
关键词-数据仓库;OLAP;毕业生;就业预测
中图分类号:TP391
众所周知,OLAP分析的基础是数据立方,要构建数据立方必须先建立数据仓库,数据
仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。数据仓库用于
支持决策,面向分析型数据处理,它不同于现有的操作型数据库;同时,数据仓库是对多
个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数
据仓库中的数据一般不再修改。因此数据仓库的构建是一个复杂而精细的过程。数据仓库
是基于数据库的,实体关系的设计是基于数据库设计而设计的。
1确定分析主题
分析主题为数据仓库的建立定制了一个数据范围,确定了关注的数据内容及分析的目
标,毕业生就业预测关注的分析主题主要有单位需求分析、专业需求分析、毕业生情况分
析三大主题。
(1)单位需求分析:各单位根据自身的单位性质和单位情况不一对毕业生的需求也有
所不同,如何正确有效的把握各单位的需求情况,以便提供给毕业生准确的单位招工信息,
提高就业率,是该需求分析力图做到的目标。
(2)专业需求分析:每年不同专业的就业情况可以直接反映出社会和各单位对各专业
人才的需求情况以及当前专业的设置是否合理的问题。通过对专业需求的情况分析可以进
一步明确学校的办学方向并合理的设置专业。
(3)毕业生情况分析:由于高校毕业生来自全省乃至全国各地,对毕业生的总体情况
进行分析可以充分把握毕业生就业的价值倾向和各相关因素对毕业生就业的影响关系。为
收稿日期:2008一12—23
作者简介:王俊洁(1976一),女,河北邯郸人,昆明理工大学信息工程与自动化学院在读
硕士,楚雄师范学院计算机科学系讲师,主要研究方向:数据仓库和数据挖掘。
·20·
楚雄师范学院学报2009年第3期
万方数据
王俊洁王俊鑫黄青松:基于数据仓库的毕业生就业预测系统设计和实现
学院对毕业生进行就业提供有意义的指导。
2毕业生就业预测数据仓库建模
数据仓库主要是满足分析的需要,将来自各种数据源的数据存储到数据仓库中,数据
围绕分析主题来组织的,并且对数据查询的要求比较高,数据存储量非常大。数据仓库建
模采用自上而下的三级建模方式,即概念建模、逻辑建模、物理建模.现在比较流行的建
模方式是以E—R图方法为主的概念建模方式,以星型建模方法和雪花建模方法为主的逻辑
建模方式,以3NF和星型建模方式为主的物理建模。
2.1 逻辑建模
逻辑建模是数据仓库实施中的重要一环,因为它能直接反映出业务部门的需求,同时
对系统的物理实施有着重要的指导作用。逻辑建模是对概念模型设计的细化,逻辑模型就
是要把不同主题和维的信息映射到数据仓库中的具体的表中。星型模型是比较适合数据仓
库逻辑模型设计的一种。主要有星型模型和雪花模型两种模型:
(1)星型模型
星型模型是一种由一点向外辐射的建模范例,中间有一个单一对象沿半径向外连接到
多个对象,星型模型中心的对象称为“事实表”,与之相连的对象称为“维表”。它支持以
商务决策者的观点定义数据实体,满足面向主题数据仓库设计的需要。
星型模式包括两种类型的表:事实数据表(事实表)和维度表。一个简
文档评论(0)