网站大量收购独家精品文档,联系QQ:2885784924

08数据万挖掘课程设计报告模板.doc

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
08数据万挖掘课程设计报告模板

河南科技大学 课 程 设 计 说 明 书 课程名称 __ 软件项目综合实践 __ 题 目 _超市商品销售数据挖掘系统_ 院 系 _ 国际教育学院 班 级 _____计科081_____ 学生姓名 ______刘宁宁_____ 指导教师 _孙士保、白秀玲、赵海霞、杨春蕾_ 日 期 _ 2011.8.29~2011.9.9 _ 软件项目综合实践任务书 软件项目综合实践题目 超市商品销售数据挖掘系统 姓名 刘宁宁 学号 08125020115 专业班级 计科081 组长 卢瑞娟 同组成员 刘宁宁 指导教师 孙士保 白秀玲 赵海霞 杨春蕾 软件综合实践目的 通过使学生数据库技术将理论与实际相结合完成一个小型的设计与实现在此基础上强化学生的实践意识提高其实际动手能力和创新能力 软件综合实践环境 硬件:装有windows操作系统的计算机 软件:SQL Server 2005 及Microsoft Visual Studio。 软件综合实践任务和要求 任务:1.进行超市商品销售数据挖掘系统的数据管理、数据采集、数据预处理、数据挖掘、解释评估等步骤的设计;2.实现超市商品销售数据挖掘系统的数据预处理、关联规则、解释评估及导出数据功能。 要求:1.功能满足需求说明、界面友好、保证一定性能要求。2.撰写出符合要求的软件项目综合实践报告。 参考 文献 [1] 萨师煊,王珊. 数据库系统概论. 高等教育出版社 2006-5 第五版 [2] Margarent H.Dunham. 数据挖掘教程 时 间 进 度 安 排 序号 起止日期 工 作 内 容 1 2011年8月29日 讲授数据挖掘概念及其算法,学生分组 2 2011年8月30日 数据预处理,根据给定的数据库的数据形成挖掘处理所需要的数据格式 3 2011年8月31日----9月5日 算法设计 4 2011年9月6日 界面设计:参数设置,阈值设定;结果显示 5 2011年9月7日 程序组装调试 6 2011年9月8日 形成文档内容及格式撰写要求,讲授文档撰写方法,撰写软件综合实践报告 7 2011年9月9日 上交软件综合实践报告 附:超市商品销售数据挖掘系统需求说明 一、关联规则算法 要求挖掘出超市商品销售之间的关联,如哪些商品往往会一起购买。 1.数据管理。对数据库中的数据进行管理和维护工作。 2.数据采集。从数据库中采集数据,形成事务集合。要求至少要有100条事务。 如:事务1:牙膏、牙刷、 牛奶、饼干 事务2:牛奶,面包,手套 即顾客一次购买的商品名称。 3. 数据预处理。将采集到的数据转换为可进行数据挖掘的形式。 如事务:牙膏、牙刷、 牛奶、饼干。可转换为:1,2,3,4 4.数据挖掘。采用关联规则中的Apriori算法对超市销售事务集合进行数据挖掘。挖掘出的结果形如:牛奶==面包 支持度2%,置信度 30%,或牛奶、面包==牙刷 支持度0.5%,置信度 1% 5.结果显示与解释评估。把挖掘出的结果以一种直观的方式显示出来,并对挖掘出的结果进行评价。 如上述第一例,可解释为:包含牛奶和面包的交易数与总交易数之比为2%,包含牛奶和面包的交易数与包含牛奶的交易数之比为30%。 二、决策树方法 要求挖掘出各类商品的销售额和利润之间的关联。 1. 数据采集。从数据库中采集数据,形成事务集合。要求至少要有100条事务。 数据集形式 序号 食品类(销售额) 洗化类(销售额) 服装类(销售额) 书籍类(销售额) 家电类(销售额) 利润(销售额) 1 136 965 4562 126 4569 高 2 564 458 6932 891 687 中 3 296 126 565 432 126 低 … 其中每条数据为一天的销售情况,利润为决策属性,其余为条件属性,数字表示该类商品的销售额。 2. 数据预处理。将采集到的数据转换为可进行数据挖掘的形式。 如:销售额100 可转换为1, 100销售额1000 可转换为2… 利润 高 可转换为1,中 可转换为2,低 可转换为3 3.数据挖掘。采用决策树对商品销售集合进行数据挖掘,形成决策树,并形成分类。决策树略。分类规则形如:家电类5000,100洗化类1000 ==利润 高 4.结果显示与解释评估。把挖掘出的结果以一种直观的方式显示出来,并对挖掘出的结果进行评价。 附:学生成绩数据挖掘系统需求说明 一、关联规则算法 要求挖掘出学生各门功课成绩间的关联,如什么课程成绩好会导致另外课程成绩较好。 1.数据管理。对数据库中的数据进行管理和维护工作。 2.数据采集。从数据库中采集数据,形成事务集合。 事

文档评论(0)

shenlan118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档