- 5
- 0
- 约6.52千字
- 约 12页
- 2021-04-21 发布于山东
- 举报
v1.0 可编辑可修改
自行车购买预测
随着社会的发展 , 越来越多的人趋于购买私家车, 但又由于油价越来越贵 , 交通越来越拥
挤。更多的人倾向于购买既省钱又环保的自行车。 本报告针对给出的案例, 运用 EXCEL中的
数据挖掘工具分析影响人们购买自行车的各个因素:如有没有私家车,有没有家庭,收入,
所受的教育等。
一. 预测的目的
同过对自行车购买的预测, 可以有效的解决自行车生产商对于其市场的定位, 适合的人
群,以及客户的购买能力有一个很好地把握。 可以帮助其更好的出售产品, 如同“啤酒与尿
布”一样,可以提高企业的收益率。其次,通过预测,可以改善企业的产业结构,使其更加
符合市场的需求。 提高企业的竞争力。 对于从企业——顾客这整条价值链的提升有很大的帮
助。
二.问题的分解
对于案例中的数据中影响人们购买自行车的各个因素单个进行分析,找出最大的影响因素。
对于各个因素建立一个数据模型,预测实例购买自行车的可能性。
对所建立的模型进行测试。
用所建立的模型进行预测。
三.关键技术及工具
聚类分析
决策树模型
EXCEL的数据挖掘工具 神经网络模型
准确性图表
分类矩阵
Microsoft SQL 2008 , Microsoft EXCEL2007 ,SQL2005 数据挖掘外接程序
四.数据挖掘与预测
随着信息技术的高速发展, 人们积累的数据量急剧增长, 如何从海量的数据中提取有用
1
v1.0 可编辑可修改
的知识成为当务之急。 数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术。 其
主要任务是关联分析、分类、预测时序模式和偏差分析等。
数据初步处理 :将数据分为两个部分一为 分析数据(定型数据与测试数据) ,二为 预测数据
神经网络模型
由于所要分析的各个因素存在大量的非线性的关系, 对于案例中最后的预测数据我们可能从
中找到合适的线性关系来得出结构,而运用神经网络模型可以解决这类非线性的关系。
它的构筑理念是受到生物 (人或其他动物) 神经网络功能的运作启发而产生的。 人工神经网
络通常是通过一个基于数学统计学类型的学习方法( Learning Method )得以优化,所以人
工神经网络也是数学统计学方法的一种实际应用。神经网络可以有 MP模型和 ANN模型。其
中 ANN模型又分为前馈型网络和反馈型网络。
首先我们利用数据挖掘工具中的建模工具——分类。将已经统计好的数据运用随机抽样
的方法分为定型数据和测试数据。 定性数据用来建立数据模型, 测试数据用来测试模型的准
确性。(定型数据 492 条,测试数据 212 条)
(1)定型数据
定型数据是指用来建立模型的数据,这些数据是从原始数据中随机抽选出来的。
我们运用建模工具——神经网络,利用定型数据以 Purchased Bike 为预测值,其他为输入
值得到我们所需要的模型。
2
v1.0 可编辑可修改
可以看出决策变量 Purchased Bike 有两个属性值,其给预测带来了很大的方便,上图
我们可以看出其的概率分布是从高到低的, 这种效果有助于我们找出其中的关键因素, 摒弃
其中对预测结果影响小的因素。 其次神经网络模型也具体给出了在定型数据中具体的买或不
买自行车的具体数字方面我们统计。
(2)测试数据。
测试数据是指用来测试模型可行度与可信度的数据,这些数据是从原始数据中随机抽选
出来的。
我们利用已经得到的定型数据的模型,用测试数据运用两种工具进行准确性校验。
准确性图表如下图:
3
v1.0 可编辑可修改
可以看出红色的线代表定型数据,蓝色的线代表随机的推测。该图表的 X 轴表示用于比较
预测的测试数据集的百分比。给图表的 Y 轴表示预测为指定状态的值的百分比。
有此图可以看出此数据模型提升 %。
分类矩阵如下如图:
可以看出原定型数据的模型准确率 %,错误率 %,可以看出所建立的模型的准确度超过
4
v1.0 可编辑可修改
50%。同时上图也具体给出了买车,与不买车的正确的概率。
由于以上的定型数据和测试数据都是从统计的数据中随机抽取的, 所以其所建立的模型的客
观性及准确性无法有较大的保证。因此我又对以上的步骤重复几次。
(3)对未知数据的预测。
根据以上得出的比较准确的定型数据的模型, 我们可以利用关联分析模型或决策树模
型中得到的主要因素作为输入值, 通过添加多个因素对未知数据进行预测。 这样预测的结果
比较准确,可信度高。
(4)单个因素对于是否够买自行车的影响
运用神经网络得出的模型通过改变因素如 Cars 可以看出随着拥有的私家车的数量的
提高, 人们越来越不趋于购买自行车。 其次, 看以看出一个家庭拥有的孩子数越多越不会购
买自行车,收入越高也越趋于不买自行车如下图:左边为 Cars 为 1,右边为 Car
原创力文档

文档评论(0)