基于Python的随机森林算法在电网企业人力资源审计中的应用研究.docxVIP

基于Python的随机森林算法在电网企业人力资源审计中的应用研究.docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

?

?

基于Python的随机森林算法在电网企业人力资源审计中的应用研究

?

?

贺雅蔡真捷

[摘要]大数据的运用不仅改变了电网企业的发展和管理模式,也给内部审计带来了前所未有的机遇与挑战。本文介绍了在审计大数据的背景下,基于Python的随机森林算法在电网企业人力资源审计中的应用方法,进一步提高内部审计管理的科学化水平,以提升内部审计的工作质量和效率。

[关键词]人力资源审计??随机森林算法??Python

一、引言

電网企业作为关系国民经济命脉和国家能源安全的骨干企业,有力地支撑着国家能源体系。在社会经济和科学技术不断发展,政策环境不断变化,电力体制改革不断深化的大背景下,以国家电网公司为代表的电网企业提出了要建设运营好坚强智能电网和泛在电力物联网的目标,即要充分运用移动互联网、人工智能等现代信息技术,实现电力系统各环节万物互联、人机交互的智慧服务系统。这标志着电网企业的大数据时代已经到来,“电网+大数据”的发展模式,成为电网企业应对建设泛在电力物联网这一新需求的唯一出路。电网企业在生产、经营过程中会接触并产生海量数据,利用合适的工具对这些数据进行挖掘和分析,一方面可以帮助电网企业适应电力市场的发展,另一方面也可帮助电网企业规范内部管理,进一步提升管理质量和效果。而如何将上述海量、散落且无序的数据剥离、整理、归类、分析,以便找到数据间的规律和联系,进而发现审计线索,发挥大数据全面覆盖的优势,是内部审计人员目前亟待解决的课题,现以电网企业人力资源审计为例来作一研究。

二、审计数据采集

基于大数据的审计方式不同于传统方式,主要的数据获取方式是通过各类信息平台或系统主动、实时地获取被审计单位的业务数据。这种方式相对于被动地依靠被审计单位提供审计数据,再利用其他证据进行核实的传统方式而言,数据的真实性、完整性、实时性和审计工作效率等均得到明显提升。

(一)数据来源

在对电网企业实施人力资源审计时,需要获取的数据按照来源可分为内部数据和外部数据。内部数据是指从电网企业自建的系统中获取的数据及被审计单位提供的数据。外部数据是指从外部机构如银行、政府、客户等渠道获取的数据。按照数据类别可分为结构化数据和非结构化数据,结构化数据主要指能够用数据或同一结构表示的数据,如数字、符号等,而各类文档、图片、影像,如被审计单位的人事任免文件、活动通知、各部门自行编制的登记资料等则称为非结构化数据。在实施电网企业人力资源审计时,获取的有效数据中内部数据及非结构化数据占比较高,审计人员需要利用合适的数据处理工具如Excel、Oracle数据库等将数据进行清洗、转化后再进一步利用。

(二)数据获取方式

实施电网企业人力资源专项审计时,审计人员需要获取的数据主要有人资、财务、工会、后勤等专业的业务数据和管理数据。主要获取方式有:直接复制数据;通过中间文件采集数据;通过开放式数据互联方式采集数据;通过专用模板采集数据;通过互联网采集数据。实际工作中,使用较多的是直接复制数据和通过开放式数据互联方式采集数据这两种方法。

审计数据来源日益丰富化、数据类型愈发多元化、获取方式逐渐多样化促使审计人员不断提升信息化审计能力,在追求数据的完整性、使用数据的高效性上下功夫,同时也在推动审计与信息通信等其他学科的融合。

三、随机森林算法的应用

决策树(DecisionTrees)算法是一种根据归纳原理从数据集中抽取规则并构建树状预测模型的机器学习方法。随机森林(RandomForest)算法最早由美国统计学家LeoBreiman和AdeleCulter在2001年提出,通过自助重复采样,从原始训练样本集中重复随机抽取k个样本生成新的训练样本集合,然后根据自主样本集生成k个决策树组成随机森林,是一种以决策树为基学习器的集成学习方法,包含了多个决策树的分类器,输出结果是由每一个决策树投票或者平均得到,即将投票次数最多的类别或输出结果平均值指定为最终的输出结果。

该算法解决了单个决策树泛化能力弱的缺点,较其他算法而言具有预测结果更准确、运行简单高效、可处理大量多类型数据、训练速度快、可平衡误差等优点。将随机森林算法应用到电网企业内部审计工作中,可用于对已知的审计数据进行整合分析,也可用于审计预测。这不仅可以发挥审计大数据全覆盖的优势,还可以提高审计效率、降低审计风险。将随机森林算法应用于电网企业人力资源审计中,主要有以下几个步骤:

步骤一:明确审计内容

电网企业人力资源审计主要包括人力资源基础管理、管理决策、干部管理、用工管理、人工成本管理、教育培训管理、绩效管理、历史遗留问题整改情况8个方面的内容。在运用随机森林算法进行数据挖掘之前,应根据审计需要,首先需明确此次审计疑点预测的主题内容,即具体需要核查的问题,如:虚列教育培训经费、主业和集体企业相互承担工资

文档评论(0)

天马 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档