- 1、本文档共64页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
PAGE24
摘要
摘要
随着信息管理系统的应用的增多,企业的业务系统中产生了越来越多的数据孤岛。怎样把数据孤岛利用起来,于是就产生了ETL概念。ETL指的是数据抽取、数据转换和数据加载,他们在构建数据仓库过程中占到了极其重要的地位。在如今社会中,信息在企业中的地位日趋重要,是企业进行科学的管理以及决策分析的基础。目前,大部门企业在构建业务系统和办公自动化系统中花费了大量的时间和资金,用来记录业务处理的各类数据。在普遍情况中,企业的数据量每2年左右就会翻倍增长,数据中隐藏着大量的商业价值,但是往往企业所能运用的仅仅只占总量的4%左右。企业并没有将这些数据资源加以最大化地利用,从而浪费了更多的资金以及时间,更在制定商业决策时候失去了先机。于是,企业如何运用技术手段,将这些业务数据更好加以利用,已成为提高企业竞争力的瓶颈。
本文以国内某企业为研究背景,根据公司决策层的需求,分析和设计了适合公司决策支持的数据仓库物理结构和逻辑模型,并对数据抽取、转换、装载(ETL)和数据清洗等技术进行了具体地应用实践,设计并实现了可满足决策分析所需的数据仓库及其相关的ETL工具。本论文的主要研究内容和成果概述如下:
首先,在调研该企业的组织机构、业务系统和企业管理流程的基础上,分析和设计了适合该公企业实际需要的数据仓库的五大模块,即财务模块、供应链模块、成本模块、生产制造模块和人力资源模块。采用星型和雪花模型结合的方式,设计了五大模块的逻辑和物理模型。根据企业具体情况,在操作数据存储(ODS)下创建了数据仓库。
其次,设计了一个ETL工具以解决半结构化数据的抽取。运用DOM对象对数据源进行分析,从企业实际出发设计的ETL工具,能够将企业财务软件导出的XML格式数据加载到数据仓库中,也解决了商用的ETL工具无法对XML文档进行直接抽取、加载的弊端,解决了企业数据分析的实际困难。
最后,设计了基于结构化数据的ETL工具。在该企业实际运行的业务系统中,基于ORACLE和SQLSERVER的结构化数据占了大多数,基于结构化数据的ETL工具,给用户开放了自行设计清洗函数接口,解决了商用ETL工具清洗函数的不可扩展问题。另外,并且在元数据中保存了数据提取的SQL脚本,降低了同种SQL多次执行时重编译的时间开销。
关键词:ETL,ERP,数据仓库,XML,ODS
Abstract
Abstract
III
II
Abstract
Withtheincreasingapplicationoftheinformationmanagementsystem,enterprisesinthebusinesssystemhashadmoreandmoredataisland.Howtousethesedataisland,thiscreatedtheconceptofETL.ETLisadataextraction(Extract),dataconversion(Transform)anddataloading(Loading),istobuildadatawarehouseisextremelyimportantpart.Intodayssociety,informationistheimportantresourceofenterprise,istheenterprisewithscientificmanagement,decisionanalysisbased.Atpresent,mostcompaniesspendalotoftimeandmoneytobuildonlinetransactionprocessingmanagementsystemandofficeautomationsystem,usedtostorethetransactionrelateddata.Accordingtostatistics,theamountofdataevery2to3yearstimewillgrowexponentially,thesedatacontainsahugecommercialvalue,andenterpriseconcernoftenonlyaccountsforthetotalamountofdatafrom2%to4%.Therefore,theenterprisestillnotmaximizetheuseofexistingdat
您可能关注的文档
- EasyShopping运动商城的设计与实现 .docx
- 装载机工作机构优化设计、运动仿真.doc
- 基于单片机的空气质量检测仪的设计与实现.doc
- P2P环境下的内容分发机制研究.doc
- 初探5G+VR技术的沉浸性游戏在温馨励志少儿绘本中的情绪表达.docx
- 基于WPF的快速原型工具的设计及实现-宋子骏.doc
- 基于Python的电影票房信息数据的爬取及分析.doc
- 一种基于STM32的智能门锁系统的设计.docx
- 新型无人机操纵电子飞控系统.docx
- 基于php移动的手机商城管理系统的设计.docx
- 2025年九江理工职业学院高职单招职业技能测验历年参考题库频考版含答案解析.docx
- 2025年乌海职业技术学院高职单招数学历年(2016-2024)频考点试题含答案解析.docx
- 2025年九江职业大学高职单招职业适应性测试近5年常考版参考题库含答案解析.docx
- 2025年九江理工职业学院高职单招高职单招英语2016-2024历年频考点试题含答案解析.docx
- 2025年九江职业大学高职单招高职单招英语2016-2024历年频考点试题含答案解析.docx
- 2025年九江理工职业学院高职单招职业适应性测试近5年常考版参考题库含答案解析.docx
- 2025年九江职业技术学院高职单招职业适应性测试近5年常考版参考题库含答案解析.docx
- 2025年产品买卖合同常用版(四篇) .pdf
- 2025年乌兰察布职业学院高职单招职业适应性测试近5年常考版参考题库含答案解析.docx
- 2025年产业园区建设调研报告 .pdf
文档评论(0)