数据仓库与数据挖掘实验报告 -.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
洛阳师范学院2006届本科生毕业设计 论文题目 PAGE II PAGE 1 《数据挖掘》大作业 院(系)名称:信 息 技 术 学 院 专 业 年 级:11级网络工程(物联网方向) 学 号:111124092 学 生 姓 名:朱 玉 PAGE 2 PAGE 1 目 录 TOC \o 1-4 \h \z \u 23428 目 录 I 21292 第1章 数据仓库和数据挖掘简介 1 14166 1.1数据简介 1 1955 1.2数据挖掘技术 1 17870 第2章 创建数据仓库 2 19916 2.1 数据 2 16196 2.1.1 数据属性结构 2 4587 2.1.2 数据库的相关处理 3 24970 2.1.3 实验的开发平台 3 31654 2.2 数据库的结构模块简介 3 24603 第3章 数据挖掘过程 3 29007 3.1 关联规则 3 15652 3.1.1关联规则挖掘过程图解 3 27075 3.1.2决策树挖掘过程图解 24 4283 3.1.3聚类分析挖掘过程图解 26 20486 3.2 数据集挖掘结果 28 8539 3.2.1超市交易关联规则的挖掘结果 28 3888 3.2.2影响小学生自控能力调查数据集决策树的挖掘结果 31 26723 3.2.3影响小学生自控能力因素调查数据集聚类分析的挖掘结果 33 23586 第四章 数据仓库和数据挖掘总结 38 3218 4.1关联规则总结 38 31534 4.2决策树总结 38 1734 4.3聚类分析总结 40 PAGE 1 第1章 数据仓库和数据挖掘简介 1.1数据简介 我的数据集是由两个不同的数据库组成,因为做关联规则的时候,影响小学生自控能力的因素分析调查分析数据库,不具备关联规则一对多的条件,因此,我用了课本上的的超市交易数据集。所以做关联规则的超市数据集,在这里我就不多介绍了。 做决策树,聚类分析所用的数据集影响小学生自控能力的因素分析调查分析数据库主要父母文化程度,家庭经济状况,教师要求,民族,年纪,年龄,师生关系,是否单亲,是否是独生子女,兴趣,性别,姓名,学号,性格,自控能力属性组成。此表是用来调查影响小学生自控能力的因素有哪些。此数据集做决策树的目的是,可以根据小学生的基本情况大致了解他的自控能力。此数据集做聚类分析,可以从中挖掘出小学生基本情况的分类。 1.2数据挖掘技术 关联规则、决策树、聚类分析。 第2章 创建数据仓库 2.1 数据 2.1.1 数据属性结构 如表2-1、2-2所示。 表2-1 超市数据交易表 表2-2 影响小学生自控能力的因素分析调查表 2.1.2 数据库的相关处理 1.创建数据库 2.数据集导入 3.设置主键 4.创建数据库关系图 2.1.3 实验的开发平台 1.实验设备:PC 2.主要开发软件:SQL Sever 2005 3.辅助软件:Office 2.2 数据库的结构模块简介 本数据库有两个数据集组成,超市交易数据集和影响小学生自控能力的因素分析调查表两个数据集。超市交易中有ID和Items两个属性;影响小学生自控能力的因素分析调查表数据集中有年级、学号、姓名、年龄、性别、民族、是否单亲、是否独生子女、父母文化程度、家庭经济状况、是否为班委、教师要求、师生关系、兴趣、性格、自控能力等属性。 第3章 数据挖掘过程 3.1 关联规则 3.1.1关联规则挖掘过程图解 1.商业智能项目创建过程图解 2.数据源的创建过程图解 3.数据源视图创建过程图解 4.数据集挖掘结构创建过程图解 5.设置算法参数 6.处理挖掘结构过程图解 3.1.2决策树挖掘过程图解 决策树的挖掘过程与关联规则基本上相同,但有些是不同的,因此,我把不同过程的图解在下面给出。 1.创建挖掘结构过程中挖掘数据所用的列的选项 2.算法参数设置 3.1.3聚类分析挖掘过程图解 聚类分析的挖掘过成与决策树、关联规则也基本上相同,因此,我把不同过程的图解和决策树一样也在下面给出。 1.挖掘数据集时所用到的属性 2.算法参数设置 3.2 数据集挖掘结果 3.2.1超市交易关联规则的挖掘结果 1.项集 2.钻取 3.规则 4.依赖关系网络 3.2.2影响小学生自控能力调查数据集决策树的挖掘结果 1.决策树 2.依赖关系网络 3.2.3影响小学生自控能力因素调查数据集聚类分析的挖掘结果 1.分类关系图 2.分类剖面图 3.分类特征 4.分类对比 第四章 数据仓库和数据挖掘总结 4.1关联规则总结 从超

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档