TDM系统中数据导入功能的设计和实现.doc

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
TDM系统中数据导入功能的设计和实现

TDM系统中数据导入功能的设计和实现1 背景   进入到21世纪以来,我国的TDM(试验数据管理)技术领域展现出蓬勃的生机,越来越多的行业和单位开始关注该技术和相关的解决方案,如航空、航天、兵器、船舶、汽车等。TDM系统正在成为企业提高试验管理水平、缩短科研周期、降低科研经费的重要手段。   作为一个综合数字化管理平台,TDM系统涉及很多复杂的功能和技术,而数据导入功能就是其中之一。   试验数据导入功能就是从各种格式的海量试验数据文件中快速提取目标数据、再转换清洗后装载到数据库中。   目前试验数据管理的需求状况决定了数据导入功能的重要性。   (1)试验数据格式多变   目前国际和国内的试验数据采集设备多种多样,并且还没有形成统一的标准,而且许多客户单位也大量采用非标设备,于是采集的试验数据格式也就多种多样。这对TDM系统的导入功能带来了很多的挑战。   (2)试验数据量很大   试验作为产品研发生命周期的重要工作,其地位日渐增强,试验产生的数据量也呈几何数量级增长。TDM系统的导入性能也就成为一个关键指标。      2 数据导入功能特点   同许多ETL工具一样,TDM系统的导入功能包括extract(抽取)、transfer(转换)、clean(清洗)和load(装载)等几个步骤。   但是,试验数据管理的特殊需求决定了它又具有自身的特点。除了前面提到的数据格式多样、数据量大之外,单位保密要求对于产品架构设计产生了很大的影响。   许多单位,尤其是国防单位,都有严格的保密制度。在信息化系统的部署方面,普通用户计算机一般是不允许直接访问数据库的,只有指定的服务器才有权限直接访问数据库。这就决定了传统的C/S两层结构不能适应客户需求,B/S三层结构则成为必须的选择。      3 三层结构解决方案   我们把系统分为三层结构:用户层、应用层和数据层,如图1所示。其中用户层为数据导入客户端工具;应用层为基于J2EE平台的应用服务器和FTP服务器,J2EE服务器提供Web Service,包括Web Service和Java Beans等J2EE组件;FTP服务器提供对上传文件的管理功能,并提供多线程的文件上载到数据层的功能。数据层包括数据库服务器,其中数据库服务器中包含系统的元数据库、业务数据库和相关的后台进程。在用户层中,数据导入工具通过Web Service接口与系统应用层提供的Web Service进行交互,建立相应的映射规则,同时数据导入工具对用户导入的非结构化数据文件进行抽取和转换,解析成格式化、结构化的文本文件,并把导入的数据规则及映射关系等信息保存下来,然后通过FTP把转化后的文件上传到应用层,同时通过Web Service接口把数据校验及关联映射信息传到应用层。   在系统应用层中,Web Service根据用户层的请求信息在内部调用相应的Java Bean组件,Java Bean组件通过访问数据库服务器,对数据库服务器中的元数据库、后台进程和业务数据库进行操作。在三层结构的数据导入工具中采用应用层主要是为了保证系统的灵活性和数据的安全性,用户层不能直接访问数据库,用户层对数据的操作都要通过应用层才能访问到数据层。应用层提供FTP服务器的功能主要是为了提高数据文件上传的速度,也可以采用Socket编程的方式实现文件的上传,同时FTP服务器提供文件下载功能,当客户端的数据文件上传完成后可以系统自动把相应的文件下载到数据层的数据库服务器上。   在数据层中,元数据库、业务数据库和后台进程通过应用层Java Bean组件被访问,当应用层的数据文件接收成功后,通过Oracle数据库的特性,采用建立外部表的方式对数据文件进行“导入”,然后对导入外部表的数据进行校验和处理,并返回数据导入的提示信息通过应用层到数据导入工具,然后再把外部表中的数据导入到实际表中。      4 数据库技术提升导入性能   为了提高数据导入的性能,我们考虑数据导入方案采用先导入临时表然后进行校验、最后再导入到真实表的方式.因为临时表中无索引、数据量少,因此能显著提高数据导入速度和性能。数据导入临时表后,通过数据库的功能实现对临时表中的数据进行校验和清除,同时产生数据导入日志信息,先导入后校验的方式可以进一步提高数据导入的速度。数据导入的最后一步才是把临时表中的数据导入到真实表中,为了提高性能,可以在晚间数据库访问少的时候系统自动实现数据从临时表导入到真实表,同时清空临时表中数据。   结合Oracle数据库系统提供的特性,可以利用建立外部表的方法来实现临时表的功能,Oracle数据库可以把一个普通的文本格式文件看作是Oracle数据库的外部表,外部表可以像普通表一样进行select操作,可以建视图

文档评论(0)

小教资源库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档