ECAS数据仓库中数据集成的相关问题.pdf

ECAS数据仓库中数据集成的相关问题.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ECAS数据仓库中数据集成的相关问题.pdf

计算机应用研究 2002年 ECAS数据仓库中数据集成的相关问题 王智超1,王炎初1,杨静1,樊莉萍1,戴坚2,周庆安2 (1.南京大学计算机软件新技术国家重点实验室,江苏南京210093;2.宝山钢铁股份有限公司能 源部,上海201900) 摘要:数据仓库越来越广泛地应用于企业决策分析,从传统的操作型数据库集成数据是创建数据仓库 必不可少的一步。结合宝钢能源部能源分析及成夺分析系统(Eo蟾)数据仓库,介绍了建立数据仓库时从 不同的数据源抽取数据、清洗数据的相关问题。 关键词:数据仓库;数据集成;数据抽取;数据清洗 12 中图法分类号:1811 文献标识码:A 文章编号:1001.3695(2002)11伽34—02 in ECASDataWarehouse RelationalProbleⅡ峙of tlle Da诅hte加ty Yan—chu‘,YANG Ji矗,删ou wANc丑1i.ch帅1,wANG J1耐.FANu_pi耐,DAI Qi时舒 r,帖,神g£赫琊计,‘~口耐昭』打u210093,(舳u;2脚蝻Ⅻ椰删 ¨s蝌P№£Ⅱ60删吖加’m州∞甲Ⅱ盯s萨一%im如F ‰hn抽n&skdo町”删啪删,鼬龇井耐201900.(舳Ⅵ1 Ah扛砸:rhe dahware}肼lse运rmwused ill dec画册makiIlgand删dysls t0 tedmolo鼎0f beiIlg widelye呲erpfi昌e ItⅢiIldi咿rbable da蛔h皓est。bllildada切warehoI耻.T托5 mt。殍a姆da纽丘咖喇60n出哟Ⅱ删lal hD巾d赶er即t 0f tI-eEI■SdatawareIlouse. dala data “LHcti|塔andc1蚰n血g H,LIrces“tIl怔“哪IebIlilding wor出:Datawa啤hlse:Lna E]【h钟don;D出Cleal试Ilg Key I【l忙鲥ty;n日ta 实丧和维表的形式组织,由Syl,aseAdapnve%ner管理; 1 引言 传统的数据库系统多为一些单独的、分散的数据 库,小可避免地存在数据碎片昶J数据不一致性问题。数 据仓库技术应运而生.较&r地解决了上述问题。数据仓 访问;9672是内部数据源,其数据以文本文件(Txl)的形 『辛是-个面向主题的、集成的、不可型新的且随时间4; 式传输到本地;本地原有的数据源包括Fox‰,dBa*等: 断变化的数据集合.数据仓库中的数据必须是于挣的、 系统数据流图如网2所示。 f确的,且数据表示是统一的,但数据仓库的数据通常 来自多个数据源.每个数据源有4:同的数据模刚,不同 的数据格式:所以,首先要从各个数据源抽取数据,而后 对数据进行清洗、汇总,将数据装人数据仓库。这些过 囱国匝固o’ 程部需要元数据的支持,女H图I所示。元数据是对数据 图2EcAs数据流图 源和数据终点(数据仓库)的数据的详细描述。该描述 包含埘数据类型、数据格式和每一个数据域的具体说 21本地数据源 明,同时指出了原始数据源中数据元素和数据仓库中数 一矛蔷

您可能关注的文档

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档