- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘实验报告超市商品销售分析及数据挖掘
通信与信息工程学院
课程设计说明书
课 程 名 称: 数据仓库与数据挖掘课程设计
题 目: 超市商品销售分析及数据挖掘
专 业 /班级: 电子商务(理)
组 长:
学 号:
组 员/学 号:
开 始 时 间: 2011 年 12 月 29 日
完 成 时 间: 2012 年 01 月 3 日
目录
1.绪论 1
1.1项目背景 1
1.2提出问题 1
2.数据仓库与数据集市的概念介绍 1
2.1数据仓库介绍 1
2.2数据集市介绍 2
3.数据仓库 3
3.1数据仓库的设计 3
3.1.1数据仓库的概念模型设计 4
3.1.2数据仓库的逻辑模型设计 5
3.2 数据仓库的建立 5
3.2.1数据仓库数据集成 5
3.2.2建立维表 8
4.OLAP操作 10
5.数据预处理 12
5.1描述性数据汇总 12
5.2数据清理与变换 13
6.数据挖掘操作 13
6.1关联规则挖掘 13
6.2 分类和预测 17
6.3决策树的建立 18
6.4聚类分析 22
7.总结 25
8.任务分配 26
数据挖掘实验报告
绪论
1.1项目背景
在商业领域中使用计算机科学与技术是当今商业的发展方向,而数据挖掘是商业领域与计算机领域的乔梁。在超市的经营中,借由陈列的手法,将商品有魅力的展现在顾客的眼前, 方便购买、节约空间、美化购物环境激发顾客的购买欲等各种重要作用。数据仓库,英文名称为Data Warehouse,可简写为DW或DWH
数据仓库
3.1数据仓库的设计
3.1.1数据库的概念模型
3.1.2数据仓库的模型
数据仓库的模型主要包括数据仓库的星型模型图,我们创建了四个维表和一个事实表。四个维表为:item维表,time维表,branch维表,location维表。事实表为:sales事实表。其中,
3.2数据仓库的建立
3.2.1数据仓库数据集成
我们小组粗略的统计了超市一年的销售记录,并建立了数据库。其
....
当然,这只是最初的表,后面还要进行数据清理与转换,对其进一步改进,以便于数据挖掘。
3.2.2建立维表
item维表
branch维表
location维表
sales事实表
4.OLAP操作
按时间上卷:
切块:
按片查询:
整个数据立方体:
5.数据预处理
5.1描述性数据汇总
【saleID】S*:销售号(笔数)
【customerID】C*:顾客编号
【productID】P*:购买的商品号
【timeID】T*:时间号(月)
5.2数据清理与变换
数据清理:(1)初始表格在前面已经给出,每笔交易中购买的商品不止一
....
数据变换:对不同的数据类型做不同的变换。比如男女分别用1,0表示;高中档商品用1,0表示;收入统一除以10000。
6.数据挖掘操作
6.1关联规则挖掘
6.1.1频繁一项集筛选
I1支持度的代码及结果为:
输出结果为:24
其他一项候选集同理
6.1.2、频繁二项集筛选
频繁二项集候选集为(I1,I18),(I1,I2),(I1,,I3),(I1,I4),(I1,I5),(I1,I7),
(I18,I2),(I18,I3),(I18,I4),(I18,I5),(I18,I7),
(I2,I3),(I2,I4),(I2,I5),(I2,I7),
(I3,I4),(I3,I4),(I3,I5),(I3,I7),
(I4,I5),(I4,I7),
(I5,I7)
(I1,I18)的支持度代码和结果为:
输出结果为:15
I3和I18支持度的代码和结果为:
输出结果为:14
I1和I3支持度的代码和结果为:
输出结果为:18
同理可得:
6.1.3、频繁三项集筛选
频繁三项集候选集为:(I1,I3,I18)
(I1,I3,I18)的支持度代码和结果为:
输出结果为:13
综上可得I1、I3和I18的支持度和置信度为:
由上可知:1.顾客习惯一起购买商品I1,I3,I18,即牛奶面包和电视机
2.所以超市可以将牛奶面包电视机摆放在一起
6.2分类和预测
预测的结果可以用关联规则的结果和OLAP的结果来说明。预测结果如下:
1.根据OL
您可能关注的文档
最近下载
- 《指向高中生物核心素养的大单元教学设计研究》课题研究方案.doc
- Unit 4 What can you do Part C Story time(课件)-人教PEP版英语五年级上册.pptx VIP
- 学生会权益部部门招新.pptx VIP
- 《22G101三维彩色立体图集》.pdf VIP
- 一种快速测定萤石中氟化钙含量的方法.pdf VIP
- 人教版六年级数学上册同步辅导讲义教师版.doc
- 2025高中英语外刊时文阅读 巴黎奥运会之全红婵和潜水介绍 课件.pptx
- 植物生理学-扬州大学-中国大学MOOC慕课答案.pdf
- 三论我国发展注气提高采收率技术-李士伦.ppt
- 人教版六年级数学上册同步辅导讲义.doc
文档评论(0)