- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库课程报告
数据仓库与应用课程报告专 业:空间信息与数字技术 班 级:学 号:姓名:指导老师:日期:2015年1月23 数据仓库的定义?数据仓库是为支持决策管理建立的,是面向主题、集成的、稳定的、随时间变化的数据集合。从数据仓库的定义可以看出数据仓库中数据的特点:(1)数据的存储是面向主题的:在操作型系统中,数据集合是以单独的应用程序为中心专门组织存放的,数据是面向应用程序事务的,而数据仓库中数据的是按商业主题存放的,商业主题会随着企业的不同而不同。(2)数据是集成的:数据仓库的数据是来源于不同的操作型系统,其中文件布局、编码表示方式、命名习惯和度量单位等都有可能不同,还有一些企业除了从操作系统获取内部数据,外部系统数据也是很重要的。所以,在将不同来源的数据存入数据仓库中之前,必须把这些不同的数据元素标准化,对数据进行清洗、转换等集成操作。(3)数据的时间特性:操作型系统存储的数据一般包含当前值,反映的是当前信息,而数据仓库中是供分析和决策使用的,决策者必须根据数据趋势进行决策,这不但需要当前数据,也需要历史数据。所以,数据仓库的目的决定了它包含当前数据之外,也必须包含历史数据。数据仓库中的数据结构都包含时间特性对于设计阶段和实现阶段都具有重要意义。(4)数据的稳定性:操作型系统的数据是实时更新的,数据仓库中的数据在载入之后几乎不会再更新,只要是查询分析使用。另外,数据仓库中数据粒度与操作型系统中的数据粒度也不一样,在操作型系统中数据存储通常数据非常详细,但是数据仓库中是按不同的粒度层次来存放数据的。数据仓库-数据挖掘的有效平台。实时数据仓库的技术基础和研究现状数据仓库最基础的技术基础是数据库技术。数据仓库系列技术,主要支撑技术有以下一些:数据库技术、ETL技术、OLAP技术、元数据管理技术、前台展现技术、报表技术、挖掘技术、仿真优化技术。这些支撑技术结合各行业业务后,可以生产各式各样的应用。当然这些技术中,重点突出了在数据仓库方面的特征,而忽略了计算机技术的一些特征。比如:OLAP技术,那么就需要计算机存储技术、压缩技术、分区技术、加解密技术、图形化技术等等,这里就不再单独列示。实时数据仓库的研究现状:数据仓库技术在我国的发展很快。很多不同的行业如电信、银行、金融、保险、制造、零售等都建立了自己的数据仓库,其中最具代表性的当属“中国移动”和“中国联通”两家最大的中国电信运营商所构建的“经营分析系统”。当然,数据仓库的风险很大,这主要是因为数据仓库是面向分析的,所以把握住业务需求是成功实施数据仓库项目的前提。如果不能满足业务需求,数据仓库的技术实现再完美也没有意义;其次,必须从技术上保证数据可以高效而准确地从业务系统中获取,能够有效地对数据仓库中庞大的数据进行管理,以及针对企业不同层次的人员提供对数据灵活而有效的访问。另外,数据仓库牵扯到多个部门,多个系统,如何有效获取高层领导的支持,协调各方资源,有效地进行项目管理也是影响数据仓库项目成败的关键。??? 只有处理好这些关键问题,才能保证数据仓库的成功实施,并在日后的扩展中不断完善发展。也只有这样,才能正真为企业带来可观的回报。什么是OLTP、OLAP?它们的区别有哪些?OLTP联机事务处理,就是我们通常所说的关系型数据库,记录了实时的增删改查数据。OLAP联机分析处理,是数据仓库的核心,是对OLTP的历史数据进行加工,分析处理,用于处理商业智能,决策支持等重要的决策信息。区别:用户和系统的面向性: OLTP是面向顾客的,用于事务和查询处理。OLAP是面向市场的,用于数据分析。数据内容: OLTP系统管理当前数据。OLAP系统管理大量历史数据,提供汇总和聚集机制。数据库设计: OLTP采用实体-联系ER模型和面向应用的数据库设计。 OLAP采用星型或雪花模型和面向主题的数据库设计。视图: OLTP主要关注一个企业或部门内部的当前数据,不涉及历史数据或不同组织的数据 OLAP则相反。访问模式: OLTP系统的访问主要由短的原子事务组成.这种系统需要并行和恢复机制。OLAP系统的访问大部分是只读操作。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。6、任务单位OLTP简短的事务? OLAP复杂的查询。7、访问数据量OLTP数十个? OLAP数百万个。8、用户数OLTP数千个? OLAP数百个。9、数据库规模OLTP100M~数GB ? OLAP100GB~数TB。10、设计优先性OLTP高性能、高可用性? OLAP高灵活性、端点用户自治。11、度量OLTP事务吞吐量? OLAP查询吞吐量、响应时间。OLAP有哪些操作?OL
文档评论(0)