- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
HR分析的7个数据集
HR数据集是罕见的发现,我将列出7个在线可用的最佳HR数
据集,我还会列出数据中的挑战,这可以是潜在的分析或需要在数据中
寻找的东西。
我们强烈主张使用数据和统计数据作为达到目的的手段。在分析
中,我们希望使用数据和统计数据为解决业务问题做出贡献。分析和统
计本身并不是目的——除非你想学习如何使用它。
01
工作缺勤
这个庞大的人力资源数据集专注于员工缺勤。
数据集包含员工编号和姓名、性别、城市、职务、部门、位置、业
务单位、部门、年龄、服务时间和缺勤小时数。
这个数据集结构整齐,这意味着每个员工都有一行,并且该缺勤被
视为每个员工的年度缺勤总时数。
潜在的有趣分析
该数据集适用于识别组织中的缺勤情况,此外,年龄和服务年限也
可能与缺勤有关。该数据集还可以用作练习集,以使用决策树或线性模
型预测缺席。
挑战
这个数据集非常简单。它很大,但仍可在SPSS或Excel等软件
中进行管理。在进行分析之前,你可能必须将许多名义变量编码为数值,
但除此之外,数据本身并没有太大的挑战。
02
工作缺勤预测因素
该HR数据集侧重于缺勤。每行代表一定数量的缺勤——这意味
着一名员工可以有多行。
有关员工的信息包括子女数量、工作量、与工作的距离、交通费用、
教育、身高、体重、BMI和旷工时间(以小时为单位)。其他信息包
括季节、缺席月份、缺席日期和星期几。
潜在的有趣分析
此数据集可以帮助你找到缺席的预测因素。潜在的分析可能是查看
BMI与缺勤、季节、工作负荷、与工作的距离以及数据集中的其他因
素之间是否存在关联。
挑战
该数据集的挑战主要在于构建数据,一个员工有多个记录。这些需
要在分析之前结合起来,该数据集还使你能够进行纵向研究。
03
人力资源数据集
下一个数据集实际上是一个包含五个不同的较小数据表的集合。该
数据集包含一个core_datasheet、一个HR数据集、一个生产人员数
据集、一个招聘成本数据集和一个工资表。
挑战
其他挑战包括寻找生产人员表现不佳的预测因素(使用其他数据
表)。次优绩效有多个因变量,包括绩效评级、每日错误率和90天
投诉。通过将其链接回类似于更一般的HRIS信息的数据集,你可以
部署决策树和线性回归模型来预测性能。
数据表还包含有关活动或终止状态的数据,允许你预测终止,并将
其与其他数据表中包含的所有其他数据相关联。
这可能意味着主要的挑战是信息的丰富性。从你提出的特定研究问
题开始,然后开始使用数据来回答它——否则你将迷失在所有数据中。
04
IBMHRAnalytics员工流失和绩效
这个数据集在人员分析领域是众所周知的。当IBM创建使你能够
练习损耗建模的数据集时,你需要注意。
数据集包含年龄、性别、工作满意度、环境满意度、教育领域、工
作角色、收入、加班、加薪百分比、任期、培训时间、当前角色的年数、
关系状态等数据。
通过这些变量,IBM创建了一个相当完整的概览,其中包含平均
HRIS的数据以及完整的参与度调查。因此,该数据集非常适合预测营
业额,或者只是找出留下或离开的组之间的差异。
挑战
该数据集开启了许多可能的分析。最有趣的方法之一可能是使用决
策树或逻辑回归找到预测变量。或者,你可以使用更简单的单向方差分
析或卡方检验来找出离开和留下的组之间在工作满意度以及他
文档评论(0)