借助数据挖掘软件开展技能等级信息核查.docVIP

借助数据挖掘软件开展技能等级信息核查.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
借助数据挖掘软件开展技能等级信息核查.doc

借助数据挖掘软件开展技能等级信息核查   摘 要:由于各种原因,ERP系统中员工技能等级信息缺失、错误较多。借助数据挖掘软件开展技能等级信息核查,借助CRISP-DM标准的六个数据挖掘环节(业务理解、数据理解、数据准备、建模、评估、部署)进行数据挖掘,依据原劳动和社会保障部印发的《职业技能鉴定考务管理编码方案》中对职业资格证书编码的规定,对证书编码进行逻辑校验。最后,对核查过程中发现的不符合要求(不完整、不准确)的技能等级信息记录进行标识,进行重点核查,进而大大减轻工作量、提高准确程度。   关键词:数据挖掘 信息核查 计算机技术 软件   中图分类号:TP311 文献标识码:A 文章编号:1672-3791(2015)05(b)-0030-02   为提高ERP系统中人员技能等级信息的完整性和准确性,我们借助数据挖掘软件开展ERP技能等级信息数据核查。在核查过程中,我们借助Clementine软件,大大提高了工作效率。   Clementine是SPSS公司开发的一款著名且非常实用的数据挖掘软件,它提供了可视化、功能强大且易用的数据挖掘平台,将聚类、决策树、神经网络、关联规则等一系列数据处理程序或技术整合成相互独立的模块,并集成在可视化图形界面中。用户在建立数据挖掘模型过程中只需把不同类型、功能各异的节点按照一定的顺序连接在一起即可,简单易用。由于不需要编程就可以完成数据挖掘模型的建立工作,用户可以将更多的精力集中在拟具体解决的业务问题上,而不是工具软件的使用上。   Clementine数据挖掘流程完全支持CRISP-DM标准。CRISP-DM将一个数据挖掘生命周期分成六个阶段:业务理解、数据理解、数据准备、建模、评估、部署。   下面,我们按照CRISP-DM标准,逐步开展技能等级信息核查。先通过Clementine选出有疑问的记录,对具体有疑问的证书信息,再与证书颁发机构发布信息逐一核对。   1 业务理解   开展技能等级信息核查,主要是对ERP系统维护的技能等级信息完整性、准确性进行核查。其中:⑴完整性:主要就所维护的技能等级信息中技能鉴定工种名称、工种编码、资格等级、证书编号、批准单位、批准日期等6个信息项是否完整就行判断;⑵准确性:主要依据原劳动和社会保障部印发的《职业技能鉴定考务管理编码方案》中对职业资格证书编码的规定,对2001年以后取得的证书编码进行证书核发年份、鉴定机构、证书类别(等级)、证书编号是否重复等逻辑校验;⑶在准确性判断的基础上,对个别证书通过与鉴定机构确认,进一步确定其准确性。核查过程中度不符合要求(不完整、不准确)的技能等级信息记录进行标识,要求证书持有人提供佐证材料进行确认。为便于业务理解,我们对技能等级信息核查流程进行了梳理。详见图2   2 数据理解   从ERP系统中导出的人员技能等级信息项有:人员号、人事子范围、姓名、开始日期、结束日期、申报年度、技能鉴定工种名称、工种代码、资格等级、证书编号、批准单位、批准日期、取得方式、是否最高技能等级等字段信息,筛选出技能鉴定工种名称、工种编码、资格等级、证书编号、批准单位、批准日期、申报年度等7个信息项进行完整性判断,再对证书核发年份、鉴定机构、证书类别(等级)等进行证书编码规则校验。   3 数据准备   在获得人员技能等级有关信息数据后,过滤掉人员号、人事子范围、姓名、开始日期、结束日期、申报年度、取得方式、是否最高技能等级等字段信息,筛选出技能鉴定工种名称、工种编码、资格等级、证书编号、批准单位、批准日期、申报年度等7个信息项。为便于比较,需将技能等级字段、证号等字符型字段信息转换为整数型,同时增加用于保存“是否特有工种”、“证号是否重复”、“结论”等用于保存判断结果字段,并初始化为空字符。   4 建模   根据技能等级信息核查流程,我们建立了Clementine流文件。   在主流程中,我们使用了两个超级节点,分别进行证书编号是否重复判断、批准单位是否准确判断。在“证书编号是否重复判断”流程中:首先将字符型字段“证书编号”转换为整数型字段“新证号”,对“新证号”进行升序排序,判断前后两个记录的“新证号”是否相等(相减是否为零),相等的则在“结论”字段标注“证号重复”;接着再对“新证号”进行降序排序,同样如果前后两个记录的“新证号”相等,也在“结论”字段相应标注“证号重复”。   在“批准单位是否准确”判断流程中,首先选择字段“批准单位”为空的记录,在“结论”字段标注“批准单位为空”;接着,依次选取“批准单位”为“电力行业职业技能鉴定指导中心”(以下简称行业指导中心)、“福建省职业技能鉴定指导中心”(以下简称省指导中心)、“福建省电力行业职业技能鉴定中心”(以下简称鉴定中心)的记录,进行证

文档评论(0)

jingpinwedang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档