多维数据聚类技术在电子政务审计分层抽样中应用探究.docVIP

多维数据聚类技术在电子政务审计分层抽样中应用探究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多维数据聚类技术在电子政务审计分层抽样中应用探究

多维数据聚类技术在电子政务审计分层抽样中应用探究 多维数据聚类技术在电子政务审计分层抽样中的应用研究 目前,与高速、集中的投资相对应的是,各级政府的电子政务建设和运营大多“各自为战”,对于部门间信息结构的相关性和共享性、优化本部门的管理结构缺乏必要的考虑,忽视电子政务建设中的投资风险和电子政务系统运行中的管理风险,缺乏规范的风险管理机制,从而造成巨大的损失和浪费。因此,在电子政务信息系统风险客观存在的情况下,进行风险审计和控制就显得尤为重要。各地的电子政务系统数量众多,信息量也在剧增,传统的计算机审计技术难以满足发掘这些信息的需求,因此需要有一种新的数据分析技术处理大量数据,从中抽取有价值的潜在信息。而数据挖掘是一个从海量数据中分析出潜在有用的、先前未知的和最终可理解的知识的过程。由此可见,将数据挖掘技术应用到电子政务信息系统审计中,不仅能减轻审计人员的负担,而且能够大幅度提高审计的质量和效率。  一、聚类技术及其对电子政务审计的意义  (一)聚类与聚类算法  聚类是一个将数据集划分为若干个子集的过程,并使得同一集合内的数据对象具有较高的相似度,而不同集合中的数据对象则是不相似的,相似或不相似的度量是基于数据对象描述属性的取值来确定的,通常就是利用各个聚类间的距离进行描述。聚类分析的基本指导思想是最大程度地实现类中对象相似度最大,类间对象相似度最小。聚类与分类不同,在分类模型中,存在样本数据,这些数据的类标号是已知的,分类的目的是从训练样本集中提取出分类的规则,用于对其他类标号未知的对象进行类标识。在聚类中,预先不知道目标数据的有关类的信息,需要以某种度量为标准将所有的数据对象划分到各个簇中。因此,聚类分析又被称为无监督的学习。  聚类算法的目的就是获得能够反映N维空间中这些样本点的最本质的“类”的性质。聚类分析算法取决于数据的类型、聚类的目的和应用。随着相关技术的深入研究,聚类方法受到越来越多的重视,大量高效的算法陆续出现。其中基于划分方法是一种简单实用的聚类方法,基本思想是:给定一个包含n个数据对象或元组的数据集,构建数据的c个划分,每个划分表示一个簇,且cle;n。通常会采用一个划分准则,即相似度函数,以便划分在同一个簇中的对象是“相似的”,在不同簇中的对象是“相异的”。典型的算法有K-means、K-medoids等,这些算法有的对脏数据敏感,有的虽不敏感,但计算量大,只适用于小规模数据量。  (二)聚类技术对电子政务审计的意义  利用聚类分析,既可以将具有相似特征的数据集中到一起,同时又可以发现区别于常规数据的孤立点,这对审计工作具有极其重要的意义。利用聚类产生的“类”可以作为分层抽样的依据,而聚类中检测出的孤立点可以看作审计线索的特征表现。  1.有助于提高抽样审计的效率。面对电子政务中被审计单位海量的财务或业务数据,在抽样审计时如果相关数据的代表性比较差,即便是审计经验丰富的审计专家通过传统的审计抽样方法,也很难降低抽取样本的数量,导致样本规模太大,审计成本太高,也就失去了审计抽样意义。聚类技术作为一种先进的信息技术,能够帮助审计人员在较短的时间里筛选出原先并不明显的代表性样本,增强样本的代表性,把审计人员从繁重的一些程序化的审计工作中解放出来,把更多的时间与精力放到原始凭证审核、专业判断与其他创造性的工作中去,使审计质量与效率显著提高。  2.有助于发现审计线索。在常规审计中,被审数据的孤立点往往是审计人员依靠职业敏感来发现其中的异常情况。而面对海量的电子数据,审计人员“有限的”的经验和知识,限于部分财务数据的静态单机版审计辅助软件,无法从全局分析,不能有效发现舞弊。利用聚类技术可以发现异常审计数据或异常发生频率等,从中提取一定数量具有代表性的数据进行详细审计,从而帮助审计人员确定审计重点,发现有可能隐藏的违规行为。  3.有助于降低审计风险。由于电子政务项目的内容涉及工商、税务、海关、土地监管等多个不同的领域,被审计对象行业跨度大,各单位情况千差万别,如果审计人员只是凭借自己的主观判断和实际经验进行抽样审计,很有可能造成样本之外有重大错漏,无法发现和揭示企业内部发生的、对财务报表真实性和公允性有重大影响的舞弊行为和技术性错误。抽样审计的这种客观局限性是造成审计风险的重要原因。而聚类技术则可以排除人为因素而通过自动的方式来发现数据中新的、隐藏的或不可预见的模式。在审计实际运用过程当中,将聚类技术与其他技术结合使用,可以达到去粗取精的效果,从而提高所取得的审计数据的质量,有效地降低审计风险。  二、基于主次属性划分的多维数据聚类算法  目前审计分层抽样模块的研究与开发还处于起步阶段,在国内的审计软件中,大部分的分层抽样模块是通过传统的统计学抽样算法来实现的,但是这些方法如果遇到大数据量或者“脏数据”时,分层的效果

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档