- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
大数据挖掘技术在电力审计风险防范中的应用研究
?
?
黄松尚颖马薇吴婷婷
[摘要]本文创新运用人工智能领域先进技术聚类分析算法,以工程结余物资风险分析为切入点,利用业务全流程数据制定评价指标标准,计算物资库龄和项目流转数,从而筛选出工程结余物资存量,总体评估审计风险,进而实现审计风险防范。
[关键词]大数据??数据挖掘??结余物资??风险防范
一、大数据挖掘技术在审计中的应用
发掘型分析是处理大数据最好的方法之一,是从大数据中寻找隐含数据规律和模式、预测将来趋势和行为的一种数据分析模式,数据挖掘技术是实现发掘型分析的有效手段。数据挖掘技术的核心是数据挖掘算法,该算法往往能找到数据中的非线性关系和因果关系,不同算法应用于不同场景。目前,基于大数据挖掘算法的大数据审计在财政、金融、电信、保险等具有海量数据的行业具有极强的生命力和效能,并逐步在财政审计、工程审计、民生专项资金和社保资金审计等方面扮演重要角色。
(一)主要数据挖掘算法介绍
作为最主要的数据挖掘算法之一,聚类分析法是将所有数据对象划分成各个子集(簇)的过程,目的是使同一簇中的对象尽量相似,不同簇中的对象差别较大。聚类算法属于无监督学习方法,因为所拥有的数据对象没有提供类型标签信息,因此只能通过观察学习,而非示例学习,聚类可发现数据内在的性质和规律,为进一步进行数据分析提供基础。主要的聚类分析方法包括划分方法、层次方法、基于密度的方法、基于网格的方法。
(二)数据挖掘过程
一般来说,数据的挖掘过程包含三个阶段:数据准备及数据预处理、数据挖掘模型的构建、模型的运用及评估。
1.数据准备及数据预处理。将审计问题转化为数据挖掘问题后,需确定与此问题相关的数据源,并将不同数据源中的数据集中到一起,形成原始审计数据。数据预处理阶段,需对数据准备得到的不完整、有“噪声”、不太理想的原始数据进行预处理,主要过程有数据清理、数据集成、数据规约和数据变换。
2.数据挖掘模型的构建。针对审计任务及转换后的数据类型,选择合适的数据挖掘技术,然后再从相应的算法库中选择适当的算法或综合运用多种算法建立数据挖掘模型。建模的過程是一个反复的过程,需通过修改模型参数并根据不同评估方法比较哪个模型对当前的分析最有效。
3.模型的运用及评估。是将经过处理的面向分析的数据输入模型并输出分析结果的过程。在设置好模型参数后,该过程可由计算机自动完成。模型的评估是指对使用该模型完成审计任务的质量作出评价,衡量模型的适用性。
(三)大数据审计开展情况
1.全业务数据中心建设。2017年底,国家电网北京市电力公司(以下简称公司)结合自身信息化发展需求和已有各专业领域信息系统建设成果数据资源,建成全业务数据中心,面向全业务范围、全数据类型、全时间维度数据提供统一的存储、管理与服务,完成企业全量业务数据汇集、数据分析统一服务的工作目标,实现业务高度融合、数据充分共享。全业务统一数据中心数据分析域如图1所示。2018年在前期工作的基础上,进一步开展夯实基础、数据扩充接入和资源在线纳管等工作,进一步规范数据存储和使用,更好地服务于大数据分析应用。截至2019年3月,共完成22套二级部署系统的接入,一级部署系统数据按需接入,业务数据接入总量达13.5TB。其中,结构化数据接入表2.2万张,数据总量5.1TB;采集量测数据共涉及7,796,798个设备,数据总量3.1T;非结构化数据总量5.3T。完成15套业务系统数据按照分系统数据仓库模型的规范化存储,为今后开展大数据分析应用奠定了基础。
2.数字化审计平台建设。基于全业务数据中心大数据资源,公司于2018年启动数字化审计平台建设,打破原有专业系统间壁垒,应用全业务数据中心的海量数据资源,对数据字段进行分析清洗,以营销、财务、工程、物资重要业务领域审计需求为依托构建智能审计模型、展示审计结果,并对存在的疑点信息、资料明细进行具体业务数据的穿透查询。通过图形化看板直观展现在线智能审计相关工作成果,使审计问题和成果可视化,帮助管理决策层快速准确掌握持续审计工作情况,为管理决策提供数据支撑。数字化审计平台如图2所示。
二、大数据挖掘算法在电力审计风险防范中的例证
为贯彻落实中央推广清洁取暖、助力生态环境保护的重要政策精神,过去五年公司投入上百亿资金大力推动配电网改造、煤改电等民生工程项目的实施。内部审计为保障公司重大项目安全稳定落地,全程对重大民生项目资金开展相关审计。通过分析重大民生项目的资金构成,发现近50%的资金用于购置物资并产生大量结余,资金风险隐患巨大。基于此,内部审计将工程物资的全流程风险防范作为民生项目的审计重点。
(一)关注工程物资管理风险
公司物资管理部门的常规物资管理全流程如图3所示。在物资采购及配送阶段,物资需求、采购、配送等环节
您可能关注的文档
- 环境艺术设计专业的博与专.docx
- 建筑钢结构设计的安全问题思考.docx
- 大学生自我概念对消费行为的影响研究.docx
- 变频器控制原理图的设计.docx
- 公路桥梁沥青路面的病害防治1.docx
- 基于STM32单片机的家用智能立体种植系统设计.docx
- 2025年筑工程劳务员必备试题集锦及答案详解年度考核精.pdf
- 2025年筑工程质量检测员技能测试卷及解答.pdf
- 古代战争100题口诀歌讲义.pdf
- 广东省广州市2024-2025学年上学期初中地理八年级开学模拟试题(含答案).pdf
- 2025届重庆市高考模拟试卷及答案.pdf
- 2025年眼科职称考评学习资料汇编.pdf
- 2024年二建《机电工程》考前25页纸.pdf
- 第四单元 新民主主义革命的开始(学生版) 2024-2025学年八年级历史上学期期中考点大串讲(统编版)(学生专用).pdf
- 第一单元 中国开始沦为半殖民地半封建社会(学生版) 2024-2025学年八年级历史上学期期中考点大串讲(统编版)(学生专用).pdf
- 第一单元 中国开始沦为半殖民地半封建社会(教师版) 2024-2025学年八年级历史上学期期中考点大串讲(统编版)(学生专用).pdf
- 2025年软件评估师资格考试重点解析与真题演练.pdf
- 2025年秘书职位招聘:书面考核题库设计.pdf
- 2025年造价工程师计价科目真题汇编及详解.pdf
- 2025年算机网络规划设计师模拟试题及解析.pdf
文档评论(0)