数据挖掘自行车.docxVIP

  • 5
  • 0
  • 约6.52千字
  • 约 12页
  • 2021-04-21 发布于山东
  • 举报
v1.0 可编辑可修改 自行车购买预测 随着社会的发展 , 越来越多的人趋于购买私家车, 但又由于油价越来越贵 , 交通越来越拥 挤。更多的人倾向于购买既省钱又环保的自行车。 本报告针对给出的案例, 运用 EXCEL中的 数据挖掘工具分析影响人们购买自行车的各个因素:如有没有私家车,有没有家庭,收入, 所受的教育等。 一. 预测的目的 同过对自行车购买的预测, 可以有效的解决自行车生产商对于其市场的定位, 适合的人 群,以及客户的购买能力有一个很好地把握。 可以帮助其更好的出售产品, 如同“啤酒与尿 布”一样,可以提高企业的收益率。其次,通过预测,可以改善企业的产业结构,使其更加 符合市场的需求。 提高企业的竞争力。 对于从企业——顾客这整条价值链的提升有很大的帮 助。 二.问题的分解 对于案例中的数据中影响人们购买自行车的各个因素单个进行分析,找出最大的影响因素。 对于各个因素建立一个数据模型,预测实例购买自行车的可能性。 对所建立的模型进行测试。 用所建立的模型进行预测。 三.关键技术及工具 聚类分析 决策树模型 EXCEL的数据挖掘工具 神经网络模型 准确性图表 分类矩阵 Microsoft SQL 2008 , Microsoft EXCEL2007 ,SQL2005 数据挖掘外接程序 四.数据挖掘与预测 随着信息技术的高速发展, 人们积累的数据量急剧增长, 如何从海量的数据中提取有用 1 v1.0 可编辑可修改 的知识成为当务之急。 数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术。 其 主要任务是关联分析、分类、预测时序模式和偏差分析等。 数据初步处理 :将数据分为两个部分一为 分析数据(定型数据与测试数据) ,二为 预测数据 神经网络模型 由于所要分析的各个因素存在大量的非线性的关系, 对于案例中最后的预测数据我们可能从 中找到合适的线性关系来得出结构,而运用神经网络模型可以解决这类非线性的关系。 它的构筑理念是受到生物 (人或其他动物) 神经网络功能的运作启发而产生的。 人工神经网 络通常是通过一个基于数学统计学类型的学习方法( Learning Method )得以优化,所以人 工神经网络也是数学统计学方法的一种实际应用。神经网络可以有 MP模型和 ANN模型。其 中 ANN模型又分为前馈型网络和反馈型网络。 首先我们利用数据挖掘工具中的建模工具——分类。将已经统计好的数据运用随机抽样 的方法分为定型数据和测试数据。 定性数据用来建立数据模型, 测试数据用来测试模型的准 确性。(定型数据 492 条,测试数据 212 条) (1)定型数据 定型数据是指用来建立模型的数据,这些数据是从原始数据中随机抽选出来的。 我们运用建模工具——神经网络,利用定型数据以 Purchased Bike 为预测值,其他为输入 值得到我们所需要的模型。 2 v1.0 可编辑可修改 可以看出决策变量 Purchased Bike 有两个属性值,其给预测带来了很大的方便,上图 我们可以看出其的概率分布是从高到低的, 这种效果有助于我们找出其中的关键因素, 摒弃 其中对预测结果影响小的因素。 其次神经网络模型也具体给出了在定型数据中具体的买或不 买自行车的具体数字方面我们统计。 (2)测试数据。 测试数据是指用来测试模型可行度与可信度的数据,这些数据是从原始数据中随机抽选 出来的。 我们利用已经得到的定型数据的模型,用测试数据运用两种工具进行准确性校验。 准确性图表如下图: 3 v1.0 可编辑可修改 可以看出红色的线代表定型数据,蓝色的线代表随机的推测。该图表的 X 轴表示用于比较 预测的测试数据集的百分比。给图表的 Y 轴表示预测为指定状态的值的百分比。 有此图可以看出此数据模型提升 %。 分类矩阵如下如图: 可以看出原定型数据的模型准确率 %,错误率 %,可以看出所建立的模型的准确度超过 4 v1.0 可编辑可修改 50%。同时上图也具体给出了买车,与不买车的正确的概率。 由于以上的定型数据和测试数据都是从统计的数据中随机抽取的, 所以其所建立的模型的客 观性及准确性无法有较大的保证。因此我又对以上的步骤重复几次。 (3)对未知数据的预测。 根据以上得出的比较准确的定型数据的模型, 我们可以利用关联分析模型或决策树模 型中得到的主要因素作为输入值, 通过添加多个因素对未知数据进行预测。 这样预测的结果 比较准确,可信度高。 (4)单个因素对于是否够买自行车的影响 运用神经网络得出的模型通过改变因素如 Cars 可以看出随着拥有的私家车的数量的 提高, 人们越来越不趋于购买自行车。 其次, 看以看出一个家庭拥有的孩子数越多越不会购 买自行车,收入越高也越趋于不买自行车如下图:左边为 Cars 为 1,右边为 Car

文档评论(0)

1亿VIP精品文档

相关文档