- 10
- 0
- 约1.81千字
- 约 12页
- 2021-10-09 发布于辽宁
- 举报
PAGE
PAGE 2
数据挖掘实验报告
专业:会计学
一、实验目的
1、学习和了解数据挖掘的基础知识,学会使用SPSS Clementine11.1 软件进行数据挖掘分析。
2、使用软件利用多项Logistic回归对电信业客户数据进行分析,找出电信服务使用模式和客户个人特征之间的关系,为单个预期客户定制服务使用模式。
3、掌握数据挖掘过程的一般流程。
二、实验环境
系统环境:Windows 7
软件环境:SPSS Clementine11.1
软件简介:作为一个数据挖掘平台, Clementine结合商业技术可以快速建立预测性模型,进而应用到商业活动中,帮助人们改进决策过程。强大的数据挖掘功能和显著的投资回报率使得Clementine在业界久负盛誉。同那些仅仅着重于模型的外在表现而忽略了数据挖掘在整个业务流程中的应用价值的其它数据挖掘工具相比, Clementine其功能强大的数据挖掘算法,使数据挖掘贯穿业务流程的始终,在缩短投资回报周期的同时极大提高了投资回报率。
三、实验数据
本实验所采用的数据是电信客户资料记录,名为telco.sav的数据。该数据包含11个字段,1000条记录。这些字段是:region(地区)、age(年龄)、marital(婚姻状况)、address(地址)、income(收入)、ed(教育程度)、employ(行业)、retire(退休)、gender(性别)、reside(居住地)和custcat(客户类别),其中客户类别中1代表基本服务,2代表电子服务,3代表附加服务,4代表全套服务。
四、实验步骤与分析过程
1、从数据源中选择“SPSS文件”拖入工作框,如图1,然后编辑附加数据。如图2。
图1
图2
2、添加“类型”节点(如图3),并对节点进行编辑,如图4,将值为0和1的变量设为标志字段,但是性别设为集合字段,将客户类别字段的方向设置为输出,其他字段的方向都设为输入。
图3
图4
3、添加过滤节点(如图5),并对其进行编辑,选取所需要的字段:region、age、marital、address、income、ed、employ、retire、gender、reside、custcat,将其他字段过滤掉(如图6)。
图5
图6
4、添加Logistic 节点进行建模(如图7),并对节点进行编辑,如图8、9、10,
图7
图8
图9
图10
5、执行当前流(如图11),该模型custcat就会添加到右边的模型选项板中(如图12)。
图11
图12
6、浏览生成的模型,结果如图13、14、15、16、17、18所示。
图13说明1基本服务为参照类,结果包括3个回归方程:
logP2P1
logP3P1
logP4P1
其中P1、P2、P3、P4分别表示选择基本服务、电子服务、附加服务、全套服务的概率,logP2P1表示选择电子服务概率与选择基本服务概率之比的自然对数。从方程中可以看出,选择电子服务概率与选择基本服务概率之比的自然对数、选择附加服务概率与选择基本服务概率之比的自然对数、选择全套服务概率与选择基本服务概率之比的自然对数都与address(地址)、employ(行业
图13
图14
图15
图14和15是各个字段的统计变量,总共有1000组数据。
图16
图16中的显著水平都小于0.05,说明四个变量与因变量的线性关系是显著的,因此模型可用。
图17
图17中似然比检验的显著水平小于0.05,说明模型的拟合优度较好。
图18
图18是模型的错判矩阵,说明对实际使用基本服务的客户的预测的正确率是45.9%,对实际使用电子服务的客户的预测的正确率是4.6%,对实际使用附加服务的客户的预测的正确率是47.3%,对实际使用全套服务的客户的预测的正确率是56.8%,模型总的预测正确率为39.9%。说明模型在识别全套服务客户时表现优异,而在识别电子服务客户时表现很差。如果想提高预测电子服务中客户的准确性,可能需要再找到一个预测变量来识别此类客户。如果电信对识别电子服务中的客户并不关心,那么该模型的准确性足以满足需求。这种情况可能是,电子服务仅是一种为吸引顾客而出售且获利微薄的产品。如果投资的最高回报来自于落在附加服务或全套服务中的客户,则该模型能够提供所需的信息。
您可能关注的文档
- 尿路感染病人的护理.ppt
- 某培训中心管理制度.ppt
- 理赔原理及实务.ppt
- 酒店英语课程介绍.ppt
- 颈部疾病病人的护理.ppt
- 金匮要略总结.ppt
- 绩效计划知识.ppt
- 脊柱手术感染.ppt
- 激素释放讲解.ppt
- 公共部门绩效管理.ppt
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
最近下载
- 时速160公里动力集中动车组动力车(177页).pptx VIP
- 全国李氏家族字辈.pdf VIP
- 2025储能场站运营的价值定位、运营模式和收益示例-202508v3.pdf VIP
- 小学科学《斜面》优质课件.docx VIP
- 串联型感应加热电源的自动负载匹配技术.pdf VIP
- 2025年新课标《义务教育数学课程标准(2022年版)》测试题及答案.docx VIP
- 老年人谵妄中西医结合诊疗专家共识.pdf VIP
- 膨胀土基坑复合土钉墙试验研究.pdf VIP
- 2021年江苏省无锡市天一高级中学高二物理下学期期末试卷含解析.docx VIP
- 《贵州省公路工程施工监理电子招标文件示范文本(试行)》2025.docx VIP
原创力文档

文档评论(0)