2022年MathorCup大数据竞赛优秀论文-6.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

队伍编号MCB2201818

赛道B

北京移动用户体验影响因素研究

摘要

针对问题一,题目要求我们研究出语音业务和上网业务客户满意度的主要因素,

并将各因素对客户打分影响程度进行量化分析。首先对所给数据进行预处理,因为个

别缺省值过多的指标的数据缺失占比达到70%以上,所以将这些指标丢弃。其次对部分

缺省值非常少的指标数据直接丢弃。根据附件五的字段说明,再根据指标的数据特征,

将部分具有共性的指标进行整合。再者,我们利用stata软件创建虚拟变量,将对定性

的指标编码采用one-hot编码,用于多元线性回归模型;同时我们也采用Labelencoding

的方法将某些定性的指标编码为自定义的数字标签完成量化编码,将离散的指标数据

转化为连续的指标数据处理并用于Lasso回归模型。我们对于问题一的进一步求解建立

了多元线性回归模型和Lasso回归模型。在多元线性回归模型中,我们首先进行了指标

和客户满意度打分的相关性的分析,得到了相关系数矩阵图,发现部分指标与客户满

意度具有较强的相关性,于是建立多元线性回归模型。其次因为发现多个指标具有多

重共线性问题,因此采用逐步回归法进行变量选择,最终得到“最优”多元线性回归

模型。在Lasso回归模型中,运用Lasso回归进行变量选择,检验经过筛选处理后变量的

显著性,最终确定对满意度打分有显著影响的因素。然后对两个模型的结果综合筛选

分析整合,最终得到语音整体满意度得分等8个指标的主要影响因素和对应权重分布。

针对问题二,题目要求我们根据问题一的分析分别建立客户语音业务、上网业务

客户打分的相关影响因素的数学模型,且根据附件进行预测并说明预测的合理性。首

先,我们根据问题一的结果分析,对附件3、4进行类似的数据预处理,其次基于问题

一筛选后得到的语音整体满意度等八个指标的所有的主要影响因素,再分别建立对客

户语音业务和上网业务客户打分的影响因素随机森林模型。再者,根据随机森林模型

和附件3、4的相关数据进行预测。最终我们对其测试集的数据进行RMS均方根误差分

析和精度大小分析来验证预测的合理性。

关键词:数据预处理、多元线性回归模型、Lasso回归模型、逐步回归法、随机森林模

型、RMS均方根误差分析和精度大小分析

目录

目录2

一、问题重述1

1.1问题背景1

1.2问题重述1

二、问题分析1

2.1问题一的分析1

2.2问题二的分析2

三、模型假设与符号说明3

3.1模型假设3

3.2符号说明3

四、问题一的求解3

4.1数据预处理3

4.1.1附件一的数据预处理3

4.1.2附件二的数据预处理5

4.2多元线性回归模型和Lasso回归模型的建立和求解6

4.2.1逐步回归模型6

4.2.2相关性分析7

4.2.3初步建立多元线性回归模型9

4.2.4Lasso回归模型12

4.2.5结果分析整合13

五、问题二的求解20

5.1数据预处理20

5.1.1附件三的数据预处理20

5.1.2附件四的数据预处理21

5.2随机森林模型的建立和求解22

5.2.1建立随机森林模型22

5.2.3模型求解24

六、模型的评价26

6.1模型的评价26

6.1.1模型的优点26

6.1.2模型的缺点27

七、参考文献27

附录28

问题一的代码30

问题二的代码38

一、问题重述

1.1问题背景

移动通信技术飞速发展,给人们带来了极大便利,人们也越来越离不开移动通信

技术带来的各种便捷。各个移动运营商,越来越重视客户的网络使用体验,从而进一

步提升网络服务质量。客户满意度是客户对运营商产品服务的满意程度,反映了客户

期望与实际感知的产品服务之间的差异。在信息快速发展的今天,客户满意度成为各

大运营商市场运

您可能关注的文档

文档评论(0)

数学建模-赛道做 + 关注
实名认证
服务提供商

各类数学建模竞赛-文档,及优秀论文分享

1亿VIP精品文档

相关文档