数据分析和挖掘实验报告.docVIP

  • 326
  • 0
  • 约8.18千字
  • 约 21页
  • 2016-11-09 发布于安徽
  • 举报
数据分析与挖掘实验报告 对顾客的统计信息与他们是否购买自行车的相关性分析 情景假设:某体育用品商店拥有大量的固定客户,该商店经理在一次活动中收集到了客户的统计信息,希望找出顾客的人口统计信息与他们是否购买自行车的相关性。 问题:决定客户是否可能购买自行车的相关因素:是否已婚?性别?收入?拥有的子女数目?受教育程度?职业?是否为业主?拥有的汽车数目?交通距离?地区?年龄? 使用数据挖掘技术就可以完成这个任务。以下着重用分析关键影响因素工具和预测计算器工具来对这些统计信息进行分析预测。 实验和分析的过程如下。 首先安装和设置好Excel 2007的Table Analysis Tools插件,然后就可以开始使用数据挖掘技术来解决以上所涉及到的问题了。 收集到的统计信息如下(截图为部分数据)。 分析关键影响因素: 分析关键影响因素会过滤掉较弱的影响因素,只考虑较强的影响因素。它会分析表中所有列与某个目标列之间的相关性,并生成一个报表,标识出对目标有重要影响的列,并详细解释这个影响有多大。 “Purchased Bike”的关键因素影响因素报表分析: 选择“分析”功能区上的第一个按钮“分析关键影响因素”,打开“分析关键影响因素”对话框,然后选择目标列,如下图所示: 选择了目标后,就单击“运行”按钮。

文档评论(0)

1亿VIP精品文档

相关文档