商务智能 上机实验报告 运用商务智能理论对民航客户仿真数据进行分析.docVIP

商务智能 上机实验报告 运用商务智能理论对民航客户仿真数据进行分析.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商务智能 上机实验报告 运用商务智能理论对民航客户仿真数据进行分析.doc

(商务智能)实验报告 班级 学号 姓名 成绩 实验名称 商务智能 2 实验地点 607 实验时间 2015-6-1 实验目的: 民航客户仿真数据挖掘实践 运用商务智能理论进行分析 实验内容: 数据清洗 数据集成 数据转换 数据选择 数据挖掘 模式评估 知识呈现 实验要求: (1)实验内容中每个步骤采用SPSS中的一项或多项功能; (2)记录整个实验过程; (3)记录实验中出现的问题及解决方法; (4)记录实验结论和体会。 实验准备 PC机、SPSS, 注:SPSS安装在“综合实验系统”实验平台 实验过程: 在Spss11.5中导入“航空公司商务智能分析数据”xls格式的 数据清洗 : 将数据中的age列按照降序排列,由此观察航空公司客户的年龄分布情况 结果:以age列按降序排列:由此可以看出客户会员中年龄最大的有92,最小的有9岁,还有57人没有登记年龄信息。 (2)双重排序 :将数据以在gender列的基础上按FLIGHT_COUNT的条件进行排序,由此观察性别与飞行次数的关系 结果:男士中飞行次数最多的有168次,最少的有2次;女士中最多的有174次,最少的有2次。还有一人没有登记性别信息。 (3)删除多余空白数据 使用Data-select cases里的if condition is satisfied条件将会员卡号0的数筛选出来,同时删除不满足条件的数 结果:有意义的数据都在上面,空白数据被删除。 2、数据选择:选择积分次数0的数据,删除不满足条件的。用Data-select cases下的if condition is satisfied 结果:exchange小于0的都没了,只剩大于0的数据 3、数据转换:在EXCHANGE_COUNT5条件下将EXPENSE_SUM_YR_1和EXPENSE_SUM_YR_2两列求和,即计算在积分兑换次数5的条件下,第一年和第二年的总票价之和为多少并填在新增列sum中。使用Tansform—computeinclude下的 if case satisfies condition。 结果:多了一列sum,积分兑换次数5的数据进行了求和 再进行数据清理,使用双重排序:再sum的基础上进行兑换次数排序 结果: 4、数据集成:由于排序后的两列相隔较远,所以再将文件另存一份,进行数据横向集成,将exchange列置于sum列后,便于观察 结果: 再进行change列和sum列双重排序 结果:当兑换次数=6时,两年票价合计最小数为972,最大为132613; 当兑换次数=7时,两年票价合计最小数为7811,最大为159283; 当兑换次数=8时,两年票价合计最小数为10401,最大为132292; 当兑换次数=9时,两年票价合计最小数为20603,最大为164198; 。。。 数据挖掘:进行数据选择,为模式评估作铺垫,研究sum列 模式评估:系统进行数据分析 系统的初始选择中值972和186954 迭代了三次 得到通过k-means方法得到的最后结果:46661.9和128012 知识呈现:将数据以图形(柱状图、饼图等)的形式展现出来 (1)分析飞行公里数 结果:飞行公里数集中在8-20之间 (2)Graphs-ple(饼状图) 分析change数 结果:以v5列的数据进行饼图展示 实验总结: 实际应用时有不少问题,一个原因是我的分析能力太若,开始并知道需要分析什么,没有目标,另一个原因在我确定分析目标时,却让我花了不少时间在对数据挖掘的数据清洗、数据集成、数据转换、数据选择、数据挖掘、模式评估这几个步骤里,可是在知识呈现里出现了问题,又由于时间有限我只好将数据简单的进行知识呈现分析。所以可能知识呈现里的数据并不一定准确。 我的这次分析主要得出以下结论: 1、以age列按降序排列:由此可以看出客户会员中年龄最大的有92,最小的有9岁,还有57人没有登记年龄信息。 2、男士中飞行次数最多的有168次,最少的有2次;女士中最多的有174次,最少的有2次。还有一人没有登记性别信息。 3、当兑换次数=6时,两年票价合计最小数为972,最大为132613; 当兑换次数=7时,两年票价合计最小数为7811,最大为159283; 当兑换次数=8时,两年票价合计最小数为10401,最大为132292; 当兑换次数=9时,两年票价合计最小数为20603,最大为164198; 。。。 可以为决策者提供以下决策方案: 相比较而言,女士飞行次数较多,可以做活动,例如“三八妇女节”为女士进行打折活动,增加客源。 基于积分兑换活动,随着兑换次数增多,票价花费会增多。所以可以降低兑换标准,增加兑换次数,吸引客户多多兑换,从而多多购票。

文档评论(0)

zhangningclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档