数据挖掘课程设计.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
枣 庄 学 院 信息科学与工程学院课程设计任务书 题目: 数据挖掘在期末成绩评估中的应用 小组成员: 赵尊强、 桂文学 成员学号: 201212110136、 201212110106 专业班级: 计算机科学与技术、2012级本1班 课 程: 数据挖掘 指导教师: 迟庆云 职称: 副教授 完成时间: 2015年 5 月2015年 6 月 枣庄学院信息科学与工程学院制 2015年5 月20日 开发小组成员分工及职责 赵尊强:设计规划、文献搜集 桂文学:挖掘资料、数据整合 课程设计任务书及成绩评定 课程设计的任务和具体要求 任务: 1. 确定挖掘主题和方法:根据挖掘的主题和目标,确定合适的挖掘方法。? 2. 数据选择和预处理:根据所收集数据,填充缺失值,平滑噪声数据,消除异常值,解决数据不一致等问题。? 3.挖掘方法实现:规划挖掘过程,界面设计,挖掘方法实现。?4.挖掘数据:对预处理后的数据进行挖掘? 4. 模式的可视化表达与解释:根据应用领域的信息和知识需求,以直观有效的形式,如图表等显示数据挖掘出的模式,用特定领域的知识加以解释,使得用户能够理解和接受。? 要求:.撰写出符合要求的软件项目综合实践报告。 指导教师签字: 迟庆云 日期: 指导教师评语 成绩:____________ 指导教师签字: 日期: 课程设计所需软件、硬件等 硬件环境:Iterl(R) Core(TM)2 Duo CPU,主频2.31GHz;内存3G; 硬盘320G以上;1024×768 软件环境: Delphi ,SQL Server2008 ,WEKA 课程设计进度计划 起至日期 工作内容 备注 5月01日—06日 5月07日—20日 6月05日—08日 6月09日—18日 搜集资料 课程设计分析 系统设计、测试设计 写报告书 参考文献、资料索引 序号 文献、资料名称 编著者 出版单位 [1]Jamie MacLennan,ZhaoHui Tang,Bogdan Crivat 著.数据挖掘原理与应用(第2版)——SQL Server 2008数据库.北京:清华大学出版社. [2]王丽珍、周丽华、陈红梅、肖清,数据仓库与数据挖掘原来及应用,北京:科学出版社 [3] 张兴会 数据仓库与数据挖掘技术 清华大学出版社 目录 TOC \o 1-3 \h \z \u 1概述 6 1.1应用背景和问题的提出 6 1.2设计内容的介绍 6 2数据仓库设计 6 2.1概念模型设计 6 2.2逻辑模型设计 7 2.3物理模型设计 7 2.4 OLAP前端展示设计 9 3数据挖掘分析 9 3.1 期末成绩评估系统应用挖掘概述 9 3.2数据挖掘实验 10 3.2.1实验环境 10 3.2.2数据准备及预处理 10 3.2.3 实验内容 (输入数据集,选择算法,输出结果,比较分析) 12 3.2.4 算法选择 15 4小结 18 1概述 1.1应用背景和问题的提出 在大学生活中,我们大学生在某种程度上还是比较重视自己的课程成绩的。而有一个期末最终成绩的评估系统,无疑对同学们而言是很有用的。在这个系统中,只需输入你估计的平时成绩以及表现和期末考试的得分,就可以预测出最终的成绩。而这个课程成绩的组成以及得出是怎么样的呢。这个最终的得分是受到什么影响呢?本论文就以上问题进行了探讨和挖掘。 1.2设计内容的介绍 本课程设计主要是探讨和研究在老师给定成绩时考虑的因素,以及这些因素所占的比例。数据仓库为一份记录着600个同学的得分情况的数据,数据挖掘则采用决策树探究出影响结婚年龄的因素。 2数据仓库设计 2.1概念模型设计 数据仓库里面有一个实体,也就是成绩score。成绩的决定因素有performance也就平时表现情况,即根据其在课堂上的活跃程度以及认真听课的情况来给的分,还有averscore就是同学平时的作业得分以及平时测试或者期中测试的平均成绩,以及期末考试的成绩lasttest。 score score lasttest performance averscore 2.2逻辑模型设计 本数据仓库只有一个表,逻辑模型设计如下: 2.3物理模型设计 在数据仓库的物理设计中,主要解决数据的存储结构、数据的索引策略、数据

文档评论(0)

smashing + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档