- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
职场新人识别
B题:职场新人识别
职场新人识别
摘要
本文以层次分析方法为基础,解决了职场新人识别和职场新人教育背景的识别以及预测数据不全的职场新人职业类型的问题,并对…作了…分析,以…方法检验了模型的准确性和方法的可靠性。
对于问题(1),为了识别该城市的职场新人,首先筛选出15至30岁的手机用户群体,再在这些群体中选择,消费金额,流量费,市话费,长话费,通话费,短信费,上网流量,上网时长9个因素为主要影响因素,控制各个影响因素合适的标准得到190个职场新人,让这190个职场新人作为判断综合评分范围。再利用主成分分析法得到主成分F与各原始变量X的线性组合关系,建立了主成分分析方法的数学模型,同时计算各个主成分的贡献率和累加贡献率,得到主成分的关系表达式。然后计算190个职场新人的综合得分和所有手机用户的综合得分,如果属于职场新人的得处分处在得分区间就可以得到该城市的职场新人。对成分分析模型进行了求解,得到的结果是一共有7058职场新人,结合附件4的区号,可以知道该结果比较符合安徽省合肥市实际的就业情况,误差较小。
对于问题(2),基于筛选出的职场新人,这些职场新人中,有一部分的职场新人信息不详,为了补全这些信息不详的职场新人,我们建立了BP神经网络模型, 利用训练网络来预测这些信息,并对BP神经网络模型进行了求解,由于神经网络模型的不稳定性, 多次运行程序进行训练就可以得到这些手机价格的稳定值。
对于问题(3),由于问题已经筛选出了职场新人,并且这些职场新人的职业类型有50类,对于其他职业信息不详的手机用户,我们不考虑这些手机用户属于其他职业,采用距离判别分析模型,将这些职业作为总体,各个职业类型不详的手机用户作为样本,计算各个样本与总体之间的马氏距离,将马氏距离最小的与总体归为一类,就可以预测出这些职业信息不详的职场新人的职业类型。
对于问题(4),为了确定该城市职场新人的教育背景,在问题一筛选出来的所有职场新人的基础上,我们将所有的职场新人分为硕博生,本科生,专科生,以及专科以下四类人,建立距离判别模型,再通过SPSS得到4类聚类中心,计算每一类偏离聚类中心的距离,偏离聚类中心越小的手机用户其学历越高,即偏离聚类中心最远的为专科及以下学历。
关键词:主成分分析法,BP神经网络模型,聚类分析法,马氏距离,SPSS因子分析法。
一.问题重述
职场新人,通常指处于毕业前的实习阶段或刚毕业离开校园(专科或专科以上)工作不到1年的年轻群体。他们虽然收入不高,但暂时也没有太多压力,经常追求新鲜事物、乐于且敢于消费。他们有着各自的职业追求,是社会的潜在精英,将成为运营商未来的高端用户。职场新人正处于人生的十字路口,在各方面即将进入全面转型。
根据以上数据,请建立数据模型并解决以下问题:
根据附表中的数据,识别该城市的职场新人;
对于手机信息不详的职场新人,请估算其终端大致的价格范围;
对于职业类型不详的职场新人,请预测其职业类型;
请识别职场新人的教育背景,如重点院校、非重点院校、专科本科、硕博等;
二.问题分析
问题一主要研究该城市职场新人的识别问题,首先用Excel筛选出15至30岁大约10万个手机用户年轻群体,由于问题可能的影响因素较多,我们只考虑套餐档次,消费等9个主要影响因素,然后根据实际情况确定职场新人的标准,筛选出理想的职场新人,最后用主成分分析法得到各个主要影响因素的贡献率,利用所有手机用户年轻群体的综合得分就可以筛选得到该城市的职场新人。
问题二主要研究信息不详的职场新人的终端大致价格范围,利用BP神经网络模型对这些影响因素多次进行训练得到稳定的价格值。
问题三主要研究信息不祥的职场新人的职业类型,将职场新人分为27类职业,在这里我们假定职业信息不详的人只属于这27类职业,不存在属于其他职业的情况,采用距离判别法,这些手机用户离哪个职业最近就可以得到信息不全的人属于哪一个职业。
问题四主要研究职场新人的教育背景问题,正常情况下,重点院校对学历要求较高,因此我们考虑硕士以上学历的为重点院校的。我们将所有职场新人分为硕博生,本科生,专科生,专科以下四类职场新人,再用聚类分析法将每一类的聚类中心偏离初始聚类中心的大小进行分类,离聚类中心越近,该职场新人的学历越高,反之越低。
三.模型的假设
1.假设这些手机用户在这个月中没有更换手机号。
2.假设这些手机用户使用手机行为在很常一段时间内没有异常。
3.假设该城市的职场新人年龄范围为15至30岁。
4.假设附表所给数据真实可靠。
文档评论(0)