- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
non-volatile数据的非易失性数据仓库的非易失性是指数据仓库的数据不进行更新处理,而是一旦数据进入数据仓库以后,就会保持一个相当长的时间。原因是数据仓库中数据大多表示过去某一时刻的数据,主要用于查询、分析,不像业务系统中的数据库那样,要经常进行修改、添加,除非数据仓库中的数据是错误的。数据源是数据仓库的数据来源,它是多种OLTP系统及外部文件,一个数据仓库往往可以含多个数据源,这些数据源可以有多种不同数据结构类型,可以有桌面式数据库如Access,也可以是对象关系数据库、面向对象数据库.同时,数据源也可以包括各种数据文件如Excel、Word以及基于WWW的HTML、XML等文件形式。数据源一般可以分布于网络的各个结点,通过网络中的数据接口与数据仓库相互连接。数据源它的主要工作是为数据仓库提供统一的数据并按阶段及时更新这些数据。2数据后端处理:数据源中数据经提取、清洗、转换最终成为数据仓库所需的数据。1数据后端处理2017一个完整的后端处理包括下面5个方面012018数据提取022019数据清洗032020数据转换042021数据加载052022数据刷新06数据后端处理
数据仓库与数据挖掘
日常生活的问题:人们在日常生活中经常会遇到这样的情况:超市的经营者希望将经常被同时购买的商品放在一起,以增加销售;保险公司想知道购买保险的客户一般具有哪些特征;医学研究人员希望从已有的成千上万份病历中找出患某种疾病的病人的共同特征,从而为治愈这种疾病提供一些帮助;企业面临的问题经过多年的计算机应用和市场积累,许多企业保存了大量原始数据和各种业务数据,它是企业生产经营活动的真实记录,由于缺乏集中存储和管理,这些数据不能为本企业加以利用,不能进行有效的统计、分析及评估,无法将这些数据转换成企业有用的信息自动的数据收集工具和成熟的数据库技术导致巨大的数据存储在文件系统、数据库和其它的信息库中。01我们会淹死在数据中,但却为信息、知识所饿!02数据爆炸:如何使企业或组织在激烈的市场竞争中保持对客户的吸引力?01如何预先发现和避免企业运作过程中不易察觉的商业风险?02如何在堆积如山的企业交易数据中发现具有商业价值的闪光点?03面临的问题事物处理需求A分析处理需求B不同层次的信息处理需求事务处理需求(OLTP)不同的事务处理子系统采购子系统:订单、订单细则、供应商销售子系统:顾客、销售库存子系统:出库领料单、进料入库单、库存台帐人事子系统:员工、部门各种事务处理需求一笔订购、一笔销售、一次进料、一次出料要求强调多用户并发环境,数据的一致性、完整性某种商品今年的销售情况与以往相比,有怎样的变化?每年的第一季度商品销售在各类商品上的分布情况怎样?今年销售量下降的因素(时间、地区、商品、销售部门)01多个子系统中的数据(数据集成)历史数据汇总、综合的数据要求02分析处理需求(OLAP)随着数据库技术的应用普及和发展,人们不再仅仅满足于一般的业务处理,而对系统提出了更高的要求:提供决策支持数据库系统能够很好的用于事务处理,但它对分析处理的支持一直不能令人满意。特别是当以业务处理为主的联机事务处理(OLTP)应用和以分析处理为主的决策支持系统(DSS)应用共存于一个数据库系统时,就会产生许多问题(混乱现象)。例如,事务处理应用一般需要的是当前数据,主要考虑较短的响应时间;而分析处理应用需要是历史的、综合的、集成的数据,它的分析处理过程可能持续几个小时,从而消耗大量的系统资源。数据库数据仓库人们逐渐认识到直接用事务处理环境来支持DSS是行不通的。要提高分析和决策的有效性,分析型处理及其数据必须与操作型处理及其数据分离(不能都在一个数据库环境中)。必须把分析型数据从事务处理环境中提取出来,按照DSS处理的需要进行重新组织,建立单独的分析处理环境。数据仓库技术正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。数据仓库是一种面向主题的数据管理技术,它提供集成化的、历史的数据管理功能,支持综合性的数据分析,特别是战略分析。数据仓库构成了DSS和DBMS的技术基础,它必将推动DSS研究的全面发展和方法的实用性化。12数据仓库的定义通俗的解释人们专门为业务的统计分析建立一个数据中心,它的数据可以从联机的事务处理系统、异构的外部数据源、脱机的历史业务数据中得到;它是一个联机的系统,专门为分析统计和决策支持应用服务,通过它可满足决策支持和联机分析应用所要求的一切。这个数据中心就叫作数据仓库。1数据仓库的特征2数据仓库的体系结构特
您可能关注的文档
最近下载
- 河南省洛阳涧西区2022—2023学年七年级下学期期中考试语文试卷.docx VIP
- 2024年全国高考数学真题分类(函数与导数)汇编(附答案).pdf
- 奥维互动地图在线路勘测中地应用.docx
- 河南省洛阳市涧西区2023-2024学年七年级下学期期中考试语文试卷(含答案).pdf VIP
- 中国盐业集团有限公司招聘笔试题库2022.pdf
- 2023年福建考评员考试答案.docx VIP
- 英语中考短语大全.doc VIP
- 2024《企业盈利能力分析的国内外文献综述》2400字.docx VIP
- 蓝碳生态系统碳汇计量监测技术规程.pdf VIP
- 2025年开封文化艺术职业学院单招职业适应性测试题库及答案一套.docx VIP
文档评论(0)