- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库论文数据挖掘论文:基于数据仓库模型在研究生招生管理中的应用研究
数据仓库论文数据挖掘论文:基于数据仓库模型在研究生招生管理中的应用研究
摘 要:随着招生方式的多元化、自主化以及报考研究生人数的年年增长,导师如何在众多的考生中招录合适本专业发展的考生,以便能够为国家培养出优秀的人才,除了他的入学成绩、必要的复试环节、导师多年来的工作经验等这些重要因素外,还需要对考生各方面的情况进行综合测评,包括考生毕业院校、生源地、年龄。本文的目的是开发出一套合理的模型,全面推进研究生招生工作的信息化进程。本文以某学校研究生招生办公室2004年至2010年的招生、入学、选课、选课成绩数据为例,从应用的角度,以数据仓库技术为基础,利用数据挖掘进行知识发现。
数据挖掘; 招生决策
一、有关研究生招生管理的相关研究
目前在教育领域诸如高校招生生源决策、学生成绩分析、教学质量评测等方面对数据仓库及数据挖掘的应用都有相应研究,其它省份招生管理部门也进行了建立招生考试数据仓库的探索。
而研究生招生与普通高校招生还不完全一样,不仅要分析考生的入学成绩,而且还要分析面试成绩,不仅要考虑考生的生源地,还要考虑考生的本科毕业院校,所以不能在简单基础上重新进行需求分析和系统设计,利用数据仓库和数据挖掘开发研究生招生考试决策支持系统是很有必要的。
本文的研究内容从技术方面分析,建立招生决策数据仓库,确定了挖掘系统的主题,进行维度的设计划分,把各种不同的源数据进行抽取、转换与加载后导入数据库,形成了数据仓库。
使用聚类分析和决策树方法设计开发了数据挖掘的系统模型,对数据仓库中的数据进行了知识挖掘,找到有价值的信息,然后使用这些信息进行预测,希望能够预测出考生的研究方向。
从业务流程方面分析,目前研究生招生环节主要分为初试和面试,只有初试分数达到分数线标准的才具有面试资格,目前大部分学校的复试比例 1:1.2,复试一般采用面试加考试的方式。同时考生的成绩一般和入学后的选课成绩有一定的联系,本文研究内容之一便是根据考生的入学成绩预测出其入学后的选课成绩,从而预测该学生在本专业以后的发展前景。
本文的研究意义在于研究生招生是选拔高层次专门人才和拔尖创新人才的重要途径,按照党的十七大提出的建设人力资源强国和创新型国家的要求,深入贯彻落实科学发展观,全面提高研究生选拔质量。
结合各专业特点,研究提出科学、合理的招生工作内容体系和标准,体现研究生导师在研究生招生工作中的权利和责任;进一步完善工作方法,规范工作程序。
提高生源质量已经成为招生管理部门以及导师面临的重要问题。需要开发出一套合理的模型,为招生管理部门提供依据,为导师提供参考,同时也为考生在复试进行专业选择时作为指导。
二、基于数据仓库的研究生招生管理的研究方法
本文实现的招生管理挖掘系统综合了以前诸多部门的各种不同的系统,是一个系统的融合,这样做不仅使得管理操作统一、界面相同,更重要的是使得各项不同的数据能够保存在一个数据仓库系统中,共用相同的数据结构,以便更加方便地利用数据挖掘算法进行分析。
同时本文采用的决策树和聚类分析挖掘算法是最常使用的挖掘算法,它们高效、简单,能够快速地得出知识信息,并且能够以清楚简单易于理解的方式显示给用户。
最后,系统以一个简单的界面提供给使用者,使用者可以采用两种方法进行验证和查询。如果是大量的考生信息,可以采用把考生信息保存在文件中,然后系统将对文件中的每个人的信息进行计算和分析,并把分析结果保存在特定的地方。如果是少量的考生信息,系统提供了输入界面,对学生进行分析。如图1所示。
8个不同的立方体,然后进行etl处理开发,形成数据仓库。
最后,系统通过门户集成发布到内网上,以方便多人能够同时进行工作,提高工作效率,并且可随时随地进行查询。
数据仓库主要是满足决策分析的需要,将来自各种数据源的数据存储到数据仓库中,数据围绕决策主题来组织的,并且对数据查询的要求比较高,数据存储量非常大。数据仓库建模采用自上而下的三级建模方式,即概念建模、逻辑建模、物理建模。现在比较流行的建模方式是以信息打包方法为主的概念建模方式,以星型建模方法和雪花建模方法为主的逻辑建模方式,以3nf和星型建模方式为主的物理建模。
excel、access,复杂的如db2,oracle,sqlserver等,这些都是异构数据,数据仓库的构建需要充分考虑到这些原始数据的不同。
excel和sqlserver格式的。
(extracting),排除数据中的数据缺陷,完成一系列转换(transforming)、汇总,最后将数据加载到数据仓库(loading)。如图2所示。
本文分别使用聚类分析和决策树方法设计开发了数据挖掘的系统模型,对数据仓库中的数据进行了知识挖掘,找到有价值的信息,然后使用这些信息进行预测,希望能够预测出考生的成绩。
首先使用sqlserver management s
您可能关注的文档
- 再审程序启动有限性与当事人自治理念的悖反与统一-司法制度论文_96060.doc
- 关于设置中医院的可行性报告.doc
- 其仙 - 注射用乳糖酸阿奇霉素说明书.doc
- 农业部远洋渔业企业资格和项目年审登记表.doc
- 农村初中论文物理教学论文优化结构论文:农村初中物理教学的反思.doc
- 农村小学教师职业倦怠现状调查与对策研究.doc
- 内河客船特殊培训试题库(06版).doc.doc
- 冠心病论文围手术期论文:冠心病介入治疗的围手术期护理.doc
- 凡·高自画像的美学分析-美术论文.doc
- 农村集体经济论文 农村经济发展论文.doc
- 2025年中国航空工业集团公司西安航空工业计算所招聘正式启动笔试参考题库附带答案详解.docx
- 2025辽宁省锦城石化中层管理岗位招聘19人笔试参考题库附带答案详解.docx
- 2025西藏金龙矿业有限公司招聘20人笔试参考题库附带答案详解.docx
- 2025年中远海运博鳌有限公司东屿岛旅游度假区社会公开招聘71人笔试参考题库附带答案详解.docx
- 2025江西南昌市西湖区妇幼保健院面向社会公开招聘托育中心保安员1人笔试参考题库附带答案详解.docx
- 2025重庆嘉寓房屋租赁有限责任公司员工招聘7人笔试参考题库附带答案详解.docx
- 2025软件与数据智能军团招聘软件测试等岗位58人笔试参考题库附带答案详解.docx
- 2025江西中交信通网络科技有限公司司机岗招聘笔试参考题库附带答案详解.docx
- 2025河南资本集团“方舟”第三批招聘41人笔试参考题库附带答案详解.docx
- 2025年国检集团全国校园招聘笔试参考题库附带答案详解.docx
最近下载
- 物业公司转租停车位会计账务处理.pdf VIP
- 重症医学科工作制度.pdf VIP
- 清廉金融文化课件.pptx VIP
- 《阿甘正传》对白中英文对照.pdf VIP
- T∕CACM 1021.145-2018 中药材商品规格等级 天花粉.docx VIP
- 汽车运用与维修专业课程教学文件.doc VIP
- 后勤品管圈-医院品管圈(QCC)活动成果报告书范本.pdf
- 移动通信(第六版)教程配套课件完整版电子教案.pptx
- TCACM1021.36—2018中药材商品规格等级芡实.docx VIP
- IEEE Std 3006.8-2018 工业和商业电力系统所用设备可靠性数据分析的推荐实施规程.pdf VIP
文档评论(0)