- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机辅助审计原理及应用(第二版) @ 清华大学出版社 * 第5章 审计数据预处理 本章学习目标 理解审计数据预处理的重要性 理解数据质量、审计数据质量问题;掌握审计数据预处理的意义以及审计数据预处理的内容 结合应用实例熟悉审计数据预处理的基本方法 理解审计数据预处理阶段数据验证的重要性、熟悉审计数据预处理阶段数据验证的内容和方法 了解其它一些数据预处理方法 概述 审计数据预处理理论分析 审计数据预处理应用实例 审计数据预处理阶段的数据验证 其它数据预处理方法介绍 本章主要内容 数据质量 单数据源数据质量问题 多数据源集成时数据质量问题 审计数据质量实例 审计数据预处理的意义 审计数据预处理的内容 审计数据预处理理论分析 什么是数据质量呢? 数据质量问题并不仅仅是指数据错误。有的文献把数据质量定义为数据的一致性(consistency)、正确性(correctness)、完整性(completeness)和最小性(minimality)这4个指标在信息系统中得到满足的程度,有的文献则把“适合使用”作为衡量数据质量的初步标准。 数据质量 准确性(Accuracy) 准确性是指数据源中实际数据值与假定正确数据值的一致程度; 完整性(Completeness) 完整性是指数据源中需要数值的字段中无值缺失的程度; 一致性(Consistency) 一致性是指数据源中数据对一组约束的满足程度; 唯一性(Uniqueness) 唯一性是指数据源中记录以及编码是否唯一; 适时性(Timeliness) 适时性是指在所要求的或指定的时间提供一个或多个数据项的程度; 有效性(Validity) 有效性是指维护的数据足够严格以满足分类准则的接受要求。 数据质量的评价指标 重复的数据 不完整的数据 不正确的数据 无法理解的数据值 不一致的数据 可能存在的数据质量问题 数据质量问题分类 单数据源数据质量问题 单数据源数据质量问题 当多个数据源集成时,发生在单数据源中的这些问题会更加严重。这是因为每个数据源都是为了特定应用,单独开发、部署和维护的,这就很大程度上导致数据管理系统、数据模型、模式设计和实际数据的不同。每个数据源都可能含有脏数据,多数据源中的数据可能会出现不同表示、重复、冲突等现象。 在模式级,模式设计的主要问题是命名冲突和结构冲突。命名冲突主要表现为不同的对象可能使用同一个命名,而同一对象可能使用不同的命名;结构冲突存在很多种不同的情况,一般是指在不同数据源中同一对象有不同表示,如不同的组成结构、不同的数据类型、不同的完整性约束等。 多数据源集成时数据质量问题 除了模式级的冲突,很多冲突仅出现在实例级上,即数据冲突。由于不同数据源中数据的表示可能会不同,单数据源中的所有问题都可能会出现,比如重复的记录、冲突的记录等。此外,在整个数据源中,尽管有时不同的数据源中有相同的字段名和类型,仍可能存在不同的数值表示,如对性别的描述,一个数据源中可能用“0/1”来描述,另一个数据源中可能会用“F/M”来描述,或者对一些数值的不同表示,如一个数据源中度量单位制可能用美元,另一个数据源中可能会用欧元。此外,不同数据源中的信息可能表示在不同的聚集级别上,如一个数据源中信息可能指的是每种产品的销售量,而另一个数据源中信息可能指的是每组产品的销售量。 多数据源集成时数据质量问题 审计数据质量实例----不完整数据 审计数据质量实例----不完整数据 审计数据质量实例----不一致的数据 审计数据质量实例----不正确的数据 审计数据质量实例----重复的数据 为下一步的审计数据分析提供准备 帮助发现隐含的审计线索 降低审计风险 审计数据预处理的意义 数据转换 数据清理 审计数据预处理的内容 数据预处理的内容 数据预处理应用实例----采用Access 名称转换 数据预处理应用实例----采用Access 空值处理 数据预处理应用实例----采用AO 借助生成数据中间表 数据预处理应用实例----采用AO 采用AO中的常规数据整理功能 审计数据预处理阶段数据验证的重要性 在审计数据预处理过程中,审计人员会将原始电子数据中表名、字段名、记录值代码以及表表关联的经济含义明确标识出来,这需要进行大量的查询、替换修改、插入数据、删除数据等操作;另外,要对电子数据进行修改错误值、替换空值、消除冗余数据、保证数据值落入定义域等数据操作,以提高数据质量,为下一步的审计数据分析做好准备。在审计数据预处理过程中可能存在以下问题: (1)目标数据模式设计不合理。 (2)审计数据预处理方法不当。 (3)审计数据预处理工具使用不合适。 (4)审计数据预处理过程不规范,没有日志记录。 根据以上分析,每一步预处理工作都有可能影响到数据的完整性和正确性,所以在
您可能关注的文档
- 审计的重要性.ppt
- 审计的组织形式.ppt
- 审计底稿中的勾稽关系.ppt
- 审计服务对象.ppt
- 审计概念与审计特点、审计分类.ppt
- 审计工作底稿的编制与计算.ppt
- 审计规范研究方法.ppt
- 审计和审计调查概述.ppt
- 审计活动三要素与关系.ppt
- 审计基础理论与技术.ppt
- 养老评估师中级行为面试题库及案例分析.docx
- 面试培训督导时考察其课程理解能力的题目.docx
- 税务专员面试中关于增值税政策的常见问题解答.docx
- 2025宁波市医疗保障局局属事业单位宁波市医疗保障基金管理中心招聘事业编制工作人员1人备考试题附答案.docx
- 2025咸宁市汉口银行咸宁嘉鱼支行招聘笔试历年题库附答案解析.docx
- 2025北京人才发展战略研究院招录笔试备考题库附答案.docx
- 2025四川成都市龙泉驿区青台山中学校秋季教师招聘22人笔试试题附答案解析.docx
- 2025台州市银龄讲学计划教师招募13人笔试参考试题附答案解析.docx
- 2025中国铁建公开招聘42人笔试题库附答案.docx
- 2025中智咨询研究院社会招聘笔试参考题库附答案.docx
最近下载
- 最新历年医院临床医生招聘考试测试题及答案.docx VIP
- T∕CASEI T102-2015 曳引驱动电梯制动能力快捷检测方法 .pdf
- DeepSeek+DeepResearch:让科研像聊天一样简单(完整版).pdf VIP
- 审计学推荐案例10个.docx VIP
- 刑法案例分析.docx VIP
- 中国儿童睡眠指南.docx
- 青春健康初级师资笔试试题及答案.doc VIP
- 战略品牌管理全球版·原书第4版凯勒习题及答案.docx VIP
- 一种新型振动润麦着水机.pdf VIP
- Unit 6 Useful numbers A Talk&learn 课件-三年级上册英语(2024).pptx VIP
原创力文档


文档评论(0)