- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
职场新人手机用户识别及分类模型
摘要
本文讨论了一类大样本多指标特定用户识别问题。首先,我们选择职场新人
这一用户群体,创造性地提出了基于因子分析法的综合评价模型。我们结合权威
文献资料定性分析职场新人用户群体在用户资料,如性别、年龄、终端价格、套
餐档次等指标上的特征,再将用户资料表中的各个变量转换成反映这些特征强弱
程度的形式,使用因子分析减少原始变量数量,并构建以方差贡献率为权值对各
公因子进行线性加权的综合分析评价函数,得到每个用户的职场新人特征符合度
变量。以不同年龄段为单位,按职场新人特征符合度从高到低识别出不同教育背
景的职场新人用户5913 名。
其次,我们使用二阶聚类算法(TwoStep Cluster Analysis )对数据预处理后
的样本进行聚类分析,通过前述的职场新人群体特征分析,找出用户特征最接近
职场新人的聚类,从而识别出样本中的职场新人用户。该方法从样本中识别出职
场新人4616 名。
最后,我们将两种方法得到的识别结果进行对比,并将识别出的职场新人用
户特征如性别比例与权威机构的统计资料进行对比,发现结果较为相近,表明本
文提出的模型是有效的,能够解决职场新人手机用户识别问题。
此外,本文还提出了模型的改进方法以及商业化应用方案。
关键词:职场新人 手机用户 识别 因子分析 聚类分析 综合评价模型
一、问题重述
随着移动通信、互联网业务的迅速发展,手机已经从生活奢侈品变成了生活
日用品,是人们日常生活中不可缺少的一部分。人们随时随地使用手机打电话、
发短信、上网,而用户的这些行为以及其个人基本信息均在运营商中有所记录。
为了便于针对不同用户推出合适的产品和服务,我们需要精准地识别用户类型。
职场新人,通常指处于毕业前的实习阶段或刚毕业离开校园(专科或专科以
上)工作不到1 年的年轻群体。他们虽然收入不高,但暂时也没有太多压力,经
常追求新鲜事物、乐于且敢于消费。他们有着各自的职业追求,是社会的潜在精
英,将成为运营商未来的高端用户。职场新人正处于人生的十字路口,在各方面
即将进入全面转型。
附件的三张表是某城市( 以下称为本城市或该城市)某运营商( 以下称为本运
营商或本网) 的手机公众用户数据,其中:
用户资料表:本城市本运营商2012 年2 月时在网的所有手机公众用户的个
人基本信息、终端信息、套餐情况、费用情况等数据;
通话清单表:记录了上述手机号码在2 月份每天的通话情况,包括主叫、被
叫以及市话、长途和漫游通话;
短信清单表:记录了上述手机号码在2 月份每天的短信发送和接收情况。
1. 根据附表中的数据,识别该城市的职场新人;
2. 对于手机信息不详的职场新人,请估算其终端大致的价格范围;
3. 对于职业类型不详的职场新人,请预测其职业类型;
4. 请识别职场新人的教育背景,如重点院校、非重点院校、专科本科、硕博等;
二、问题分析
2.1 问题初步分析
职场新人手机用户识别及分类是一类大样本多指标的统计分析问题。本问题
需要实现如下两个目标:
1. 从全部用户中识别出职场新人用户。
2. 对缺失数据进行预测。
数据中并未给出任何已确定为职场新人的个案,也就是说没有训练样本,故
不便直接采用BP 神经网络等机器学习方法来进行数据挖掘。因此我们使用多元
统计分析方法,常用的方法有关联分析、主成分分析、因子分析、聚类分析、判
别分析等。
2.2 解决方案设计
因为题给数据中并未给出任何已确定为职场新人的个案,所以需要我们自己
寻找职场新人用户的特征,独立提出评价职场新人用户符合度的方法,制定有效
的判别标准。
目前,国内外提出的综合评价方法有十几种之多,但总体上可归为两大类:
即主观赋权评价法和客观赋权评价法。然而,人们在对某一经济现象进行评价时,
如果只使用一种评价方法,由于每种方法考虑问题的侧重点不同,所选的方法不
同,就有可能导致评价结果的不同,对问题仅采用一种方法进行评价无疑具有一
定的片面性。
故本文在分析职场新人用户的特征的基础上,提出综合分析法、聚类分析法
两种不同的模型,分别识别出职场新人用户。通过两个模型的求解结果互相印证,
并将识别出的职场新人用户特征如性别比例与权威机构的统计资料进行对比,从
原创力文档


文档评论(0)