融合AI模型在移网用户满意度.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

融合AI模型在移网用户满意度

预测中的应用研究

0引言

随着移网用户数量不断增长,提升用户满意度水平对运营商高质量发展具有重要意义。本文基于O域信令数据、B域用户出账数据、用户感知数据,再结合移网用户的投诉数据与打分数据,其中投诉数据中主要关注移网网络质量、套餐资费、服务质量等维度,打分数据是通过发放调查问卷的方式收集用户整体满意度评价打分,打分机制是10分制,从1分至10分,分别表示不满意至满意的程度,基于上述5类数据,分析

——————————

收稿日期:2022-06-28

各个分数段的用户数分布及特征,搭建分类加回归的融合AI模型,对全网用户进行满意度打分预测,将预测打分清单提供给网络部,支撑网络部进行差异化重保,高效提升移网用户满意度水平。

1背景、数据集和标准模型

背景

近年来,随着移动网络的迅猛发展尤其是5G网络的发展,以及中国联通、中国移动、中国电信3家运营商竞争格局的改变,移动网络用户对上网速度、网络感知、套餐资费等提出了更高要求,如何更好地进行客户服务工作对运营商来说是一个新的挑战。目前,

各运营商均提出了一些预测用户满意度的方法,常见的方法有通过客服部收集的历史用户评分,对低分用户进行回访维系;或者通过分析用户的基础信息(年龄、性别、行为偏好等)和用户的行为数据(用户的感知数据、历史记录等),对用户进行大数据画像,指导运营商对低分用户群进行重点保障。本文提出了一种基于融合机器学习模型来预测用户打分的方法,该方法基于用户的信令数据、感知数据、投诉数据、CES满意度打分数据等海量数据,利用大数据对用户满意度进行分析,再结合机器学习回归与分类融合模型对用户满意度进行预测,不仅预测准确率高,且实时性较强,通过每天或每周对用户进行预测,然后将预测打分数据清单输出给客服部进行及时干预维系,从而精准提升移网用户的满意度。

数据集

本文用户满意度预测模型使用的数据集是某省5G用户满意度的打分。打分为10分制,分数越高代表满意度越高。该数据集除了打分数据外,还包含了脱敏的用户基础数据(年龄、性别、常住地、入网时间等)、用户的投诉数据(投诉分类、渠道等)以及用户的感知数据(流量、时长、时延、下载业务次数、卡顿数、掉线次数等)。最终的数据集有172个特征。数据集中共有约37000条打分数据,平均分为8.04分,方差为11.21,具体的分数分布如图1所示。

123456 7 8910

图1打分分数用户分布

从图1可以发现,10分和1分的打分成绩占了数据总量的83%。其余分数(除了10分、8分、5分和1分)的数据量都非常少,占比均不到4%。由此可以看出这个数据集非常不均衡,这会降低模型的预测准确性。

1.3标准模型及结果

本文建立了线性回归模型作为标准模型,对数据

集进行诸如缺失值填充、对类别变量进行独热编码,降维等一系列操作后建模,最终得到的模型在测试集上的平均绝对误差为2.6。虽然平均绝对误差在可以接受的范围内,但观察预测出的数据本身还是暴露出了一些问题,如图2所示。

70

60

百分比

百分比/%

40

30

20

10

0

1 2 3 4 5 6 7 8 9 10

分数

图2预测打分用户占比

由图2可以看出,大部分的预测结果集中在6~9分,只有极少数的预测结果为1、3、4或10分,这与实际打分结果的分布完全不符。造成这种结果的原因是模型在尝试缩小平均误差时会将预测结果尽可能地靠近训练集的平均打分。因此预测结果中占比最多的自然是数据集打分的平均数。这样的预测结果会在实际的生产环境中给一线人员造成困惑,所以需要提出一些新的方法解决这个问题。

2模型融合

为解决上述问题,本文采用模型融合的方法。其大致思路是,首先建立分类模型,从数据集中单独分出10分和1分用户,再通过回归模型预测剩余用户的分数,具体的过程如下。

2.1建立分类模型

为解决数据分布不均衡问题,本文通过分类模型将以上打分为10分和1分的用户提取出来。本文针对10分和1分建立了模型A和模型B2个分类模型。

模型A的任务是选出数据集中的10分用户,为训

练模型A,首先将打分数据映射到0和1上。其中打分

为10分的用户标记为1,其他用户标记为0,通过在修

改后的数据集上训练分类模型,得到一个可以用来提

取满意度打分为10分的分类器。与之相对的,模型B的任

文档评论(0)

新思想与新技术 + 关注
实名认证
文档贡献者

新思想与新技术

1亿VIP精品文档

相关文档