- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
队伍编号MCB2202628
赛道B
基于机器学习的北京移动用户满意度分析
摘要
本文基于北京移动用户数据进行用户满意度分析,主要研究两方面的问题,一是量
化分析用户满意度影响因素的重要性,寻找重要影响因素;二是在考虑变量重要性基础
上建立预测模型,对用户满意度评分进行预测。
文章主要包含三大部分。第一部分主要为数据预处理和探索性分析,首先对数据进
行变量筛选和剔除、缺失值和异常值处理、类别变量编码等,在尽量不损失信息的前提
下简化特征;其次,在此基础上进行数据探索性分析,通过统计用户评分分布情况以及
相关性分析等初步探究数据特征。
第二部分为影响因素重要性量化分析,采用随机森林进行特征重要性评估。结果显
示,对语音业务四个方面打分而言,最重要的前三个变量均为:GPRS总流量(11%)、
前三个月MOU(10%)、当月ARPU(10%);而同一变量对上网数据四个方面打分
GPRSGB
影响程度略有不同,但从总体来看,重要变量为:年龄、当月资源使用量()、
当月MOU,重要性均6%。在此基础上,我们对重要性排序靠前的部分变量进行了深
入分析,通过直方图直观对比不同评分下该变量的分布情况,并基于此对北京移动公司
提出建议。
第三部分为用户满意度预测,首先进行特征选取,对于语音业务数据在考虑变量重
要性的基础上,仅将预处理后的附件1和附件3共同含有的变量作为模型学习的特征,
对上网业务数据做相同的处理;其次,针对两个数据集共8个方面的评分分别构建预测
模型,选取决策树、随机森林、Light-GBM三个机器学习模型,采用10折交叉验证法
划分训练集和测试集,并通过网格搜索寻找最优参数,基于附件1和附件2数据训练模
型并测试模型性能;最后,考虑满意度评分为定比数据,以MSE为模型评价指标,选
取最优模型进行附件2和附件4的预测,并输出结果文件。
本文最后,综合所有分析结果,对北京移动公司就如何提升用户满意度提出部分建
议,竭力提升北京移动的用户满意度,让企业在5G时代下争取到更多市场份额。
关键词:用户分析;机器学习;满意度预测;网格搜索寻优
目录
第一章问题重述1
1.1问题背景1
1.2研究问题1
第二章问题分析2
2.1针对问题一的分析2
2.2针对问题二的分析2
第三章数据探索性分析3
3.1数据预处理3
3.1.1变量的筛选与剔除3
3.1.2缺失值、异常值处理4
3.1.3类别变量编码5
3.1.4小结5
3.2用户满意度评分分布情况6
3.3变量相关性分析8
第四章用户分析之满意度影响因素分析13
4.1特征选择方法简介——随机森林13
4.2语音业务满意度影响因素分析14
4.2.1变量重要性量化分析14
4.2.2部分重要变量分析15
4.3上网业务满意度影响因素分析17
4.3.1变量重要性量化分析17
4.3.2部分重要变量分析18
第五章用户分析之满意度预测21
5.1分类方法简介21
5.1.1决策树21
5.1.2随机森林21
5.1.3Light-GBM22
5.1.4交叉验证22
5.1.5网格搜索23
5.2建立预测模型23
5.3结果分析与模型评价24
5.3.1评价指标24
5.3.2模型评价和结果展示24
5.3.3结果的比较性分析25
第六章建议27
参考文献29
附录30
您可能关注的文档
- 数据概览_台风编号_经度_纬度.docx
- 聚类分析_(台风编号-台风中文名称-台风英文名称-台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风强度-台风等级-风速-气压-移动方向-移动速度).docx
- 数据概览_经度_纬度_台风等级.docx
- extra_tree回归_(台风起始时间-台风结束时间-当前台风时间-经度-气压-移动速度-纬度-降水量)_(风速).docx
- gbdt回归_(台风起始时间-台风结束时间-经度-当前台风时间-台风等级-气压-纬度-移动速度-降水量)_(风速).docx
- xgboost回归_(台风起始时间-台风结束时间-当前台风时间-台风强度-经度-气压-降水量-移动速度-纬度)_(风速).docx
- 决策树回归_(经度-台风起始时间-台风结束时间-纬度-当前台风时间-气压-移动速度-降水量-台风强度)_(风速).docx
- extra_tree回归_(台风起始时间-台风结束时间-当前台风时间-经度-气压-风速-移动速度-纬度)_(降水量).docx
- gbdt回归_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-风速-气压-移动速度)_(降水量).docx
- xgboost回归_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-风速-气压-移动速度)_(降水量).docx
- 主题课程整理大班上.doc
- 2026人教版小学语文三年级上册期末综合试卷3套(打印版含答案解析).docx
- 2026人教版小学语文四年级下册期末综合试卷3套(打印版含答案解析).docx
- 2026人教版小学二年级上册数学期末综合试卷精选3套(含答案解析).docx
- 2026人教版小学语文四年级上册期末综合试卷3套(含答案解析).docx
- 2026人教版小学二年级下册数学期末综合试卷3套(打印版含答案解析).docx
- 2026年地理信息行业年终总结汇报PPT.pptx
- 板块四第二十一单元封建时代的欧洲和亚洲 中考历史一轮复习.pptx
- 中考历史一轮复习:板块四第二十单元古代亚、非、欧文明+课件.pptx
- 第二次工业革命和近代科学文化中考历史一轮复习.pptx
原创力文档


文档评论(0)