数据挖掘实验报告超市商品销售分析及数据挖掘.doc

数据挖掘实验报告超市商品销售分析及数据挖掘.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘实验报告超市商品销售分析及数据挖掘

通信与信息工程学院 课程设计说明书 课 程 名 称: 数据仓库与数据挖掘课程设计 题 目: 超市商品销售分析及数据挖掘 专 业 /班级: 电子商务(理) 组 长: 学 号: 组 员/学 号: 开 始 时 间: 2011 年 12 月 29 日 完 成 时 间: 2012 年 01 月 3 日 目录 1.绪论 1 1.1项目背景 1 1.2提出问题 1 2.数据仓库与数据集市的概念介绍 1 2.1数据仓库介绍 1 2.2数据集市介绍 2 3.数据仓库 3 3.1数据仓库的设计 3 3.1.1数据仓库的概念模型设计 4 3.1.2数据仓库的逻辑模型设计 5 3.2 数据仓库的建立 5 3.2.1数据仓库数据集成 5 3.2.2建立维表 8 4.OLAP操作 10 5.数据预处理 12 5.1描述性数据汇总 12 5.2数据清理与变换 13 6.数据挖掘操作 13 6.1关联规则挖掘 13 6.2 分类和预测 17 6.3决策树的建立 18 6.4聚类分析 22 7.总结 25 8.任务分配 26 数据挖掘实验报告 绪论 1.1项目背景 在商业领域中使用计算机科学与技术是当今商业的发展方向,而数据挖掘是商业领域与计算机领域的乔梁。在超市的经营中,借由陈列的手法,将商品有魅力的展现在顾客的眼前, 方便购买、节约空间、美化购物环境激发顾客的购买欲等各种重要作用。数据仓库,英文名称为Data Warehouse,可简写为DW或DWH 数据仓库 3.1数据仓库的设计 3.1.1数据库的概念模型 3.1.2数据仓库的模型 数据仓库的模型主要包括数据仓库的星型模型图,我们创建了四个维表和一个事实表。四个维表为:item维表,time维表,branch维表,location维表。事实表为:sales事实表。其中, 3.2数据仓库的建立 3.2.1数据仓库数据集成 我们小组粗略的统计了超市一年的销售记录,并建立了数据库。其 .... 当然,这只是最初的表,后面还要进行数据清理与转换,对其进一步改进,以便于数据挖掘。 3.2.2建立维表 item维表 branch维表 location维表 sales事实表 4.OLAP操作 按时间上卷: 切块: 按片查询: 整个数据立方体: 5.数据预处理 5.1描述性数据汇总 【saleID】S*:销售号(笔数) 【customerID】C*:顾客编号 【productID】P*:购买的商品号 【timeID】T*:时间号(月) 5.2数据清理与变换 数据清理:(1)初始表格在前面已经给出,每笔交易中购买的商品不止一 .... 数据变换:对不同的数据类型做不同的变换。比如男女分别用1,0表示;高中档商品用1,0表示;收入统一除以10000。 6.数据挖掘操作 6.1关联规则挖掘 6.1.1频繁一项集筛选 I1支持度的代码及结果为: 输出结果为:24 其他一项候选集同理 6.1.2、频繁二项集筛选 频繁二项集候选集为(I1,I18),(I1,I2),(I1,,I3),(I1,I4),(I1,I5),(I1,I7), (I18,I2),(I18,I3),(I18,I4),(I18,I5),(I18,I7), (I2,I3),(I2,I4),(I2,I5),(I2,I7), (I3,I4),(I3,I4),(I3,I5),(I3,I7), (I4,I5),(I4,I7), (I5,I7) (I1,I18)的支持度代码和结果为: 输出结果为:15 I3和I18支持度的代码和结果为: 输出结果为:14 I1和I3支持度的代码和结果为: 输出结果为:18 同理可得: 6.1.3、频繁三项集筛选 频繁三项集候选集为:(I1,I3,I18) (I1,I3,I18)的支持度代码和结果为: 输出结果为:13 综上可得I1、I3和I18的支持度和置信度为: 由上可知:1.顾客习惯一起购买商品I1,I3,I18,即牛奶面包和电视机 2.所以超市可以将牛奶面包电视机摆放在一起 6.2分类和预测 预测的结果可以用关联规则的结果和OLAP的结果来说明。预测结果如下: 1.根据OL

文档评论(0)

zhanghc + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档