网站大量收购独家精品文档,联系QQ:2885784924

BCP技术在计算机审计中应用.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
BCP技术在计算机审计中应用

BCP技术在计算机审计中应用在计算机审计的数据准备阶段,首先需要从被审计单位数据库抽取数据,转换加工,然后才能加载到审计数据库使用。在被审计单位数据库与审计数据库之间无法直接连接,或者受异构数据库格式不兼容的影响丢失数据甚至出错的情况下,就需要使用第三方的文件存储作为过渡,通用的过渡载体是文本格式文件。目前,可视化的数据库文本加载工具主要有DTS、SSIS等,还不能针对指定目录批量加载数据,而手工对文本文件逐个进行加载,不仅处理效率低下,而且增加了数据质量风险。为了弥补这方面的不足,笔者引入BCP工具。BCP是大容量复制程序的简称,是Sybase和Microsoft的数据库管理系统附带工具,专用于数据库表一级数据高效快速地复制,适用于数据库文件与文本文件格式之间批量转换,在DOS命令提示符下执行。在计算机审计中,最常见的用途就是把大量的文本数据通过BCP批量导入到Microsof SQL Server空表中。 一、BCP的语法简要范例 Microsoft SQL Server帮助文件中介绍了一个文本数据导入的范例: bcp “Northwind.Jane Doe.Jane’s Orders” out “Jane’s Orders.txt” -c -q -U “Jane Doe” -P “go dba” 其含义是把Norhwind数据库下Jane Doe所拥有的Jane’s Orders表导出到本目录下的Jane’s Orders.txt文件内,使用于符型格式输出,登陆数据库的权限是Jane Doe用户,登陆密码是godba,由于引号内含有空格,所以使用“-q”参数,其他使用默认的字段间逗号分隔,行间回车换行分隔。 而我们在实际工作中,经常会碰到逗号或者回车换行出现在某字段内,比如审批意见等字段甚至还会偶然遇到“|”竖线,另外繁体字和半个字符等数据也会引起文本文件导入的错误,超过了范例的使用范围,这就需要对BCP的参数详细了解,完整的BCP语法如下: Bcp{[[database_name.][schema].]{table_name|view_name}|”query”} Bcp{in|out|queryout|format}data_fle Bcp[-m max_errors][-f format_fie][-x][-e err_fie] Bcp[-F first_row][-L last_row][-b batch_sie] Bcp[-n][-c][-N][-w][-V(70|80|90)] Bcp[-q][-C{ACP|OEM|RAW|code_page}] [-tfeld_term] Bcp[-r row_term][-i input_fle][-o output_fle] [-a packet_size] Bcp[-S server_name[\instance_name]][-U login_id] [P password] Bcp[-T][-v][-R][-k][-E][-h”hint[,…n]”] 根据Transact-SQL语法关系图的规则,大括号中的部分是必选项,中括号内是可选项,”|”是并列关系其中选一的意思。在这些参数中,计算机审计需要掌握的有十个,分别是:-m-e-b-c-t-r-o-S-U-P。 二、实际工作中遇到的问题 由于字段格式不兼容等原因,经常会导致被审计单位数据库某表格无法正常装入审计数据库,如我们在最近一次审计数据准备阶段就遇到了这种问题。我们取得了被审计单位导出的文本格式数据,发现中间某些字段有乱码导致无法正常装入审计数据库,样本如下表。我们仔细研究了表格数据存放的格式,发现出现乱码的字段是出现在“意见1”、“意见2”、“意见3”和“意见4”,了解其字段含义得知一个超长文本的中文字符串格式意见书被切割为四份,每个包含250个字符,如果意见书中有半角字符出现,那么在第250位字符切割的时候就会把最后一位中文字符切割为两半,这就是从被审计单位数据库中导出的文本文件出现乱码的原因。原因找到了,假设采用通常的字段对应字段导入方式,那么在处理到第250位是半个中文字符的时候会自动与紧接着的分隔符结合形成新的字符串,这样字段的对应关系就被打乱了。 三、解决方案 我们分为两个阶段完成,第一阶段是被审计单位数据库表一级数据BCP导出文本的过程,第二阶段是把文本文件装入到审计数据库的过程,介绍的重点放在第二阶段。 第一阶段:建立被审计单位数据库导出文本的脚本。 第一步,建立一个视图V_ALCHECKADV把原表的四个字段通过位运算连接起来,参照脚本如下

文档评论(0)

linsspace + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档