现代数据库技术复习大纲.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
现代数据库技术复习大纲

现代数据库技术复习大纲 名词解释 数据仓库、基于Web的数据仓库、OLAP、数据挖掘、模式和知识、可信计算基、强制访问控制MAC、对象请求代理、OMG组织 数据仓库: 数据仓库就是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集。 在数据仓库的基础上有两类分析工具,一类是做分析型工作的OLAP,另一类是做预测型工作的数据挖掘。 基于Web的数据仓库:将Web技术与数据仓库相结合,既能弥补单纯数据仓库的缺陷,又将能有效地扩展数据仓库的应用范围。而把它们应用于大规模制定生产模式,不仅能满足大规模定制生产模式下快速灵活实现产品多样化与定制化的要求,也将最大程度地集成Web技术与数据仓库的优势。 OLAP: OLAP专门为数据分析操作提供分析数据模型和直接提供分析数据。 OLAP是一种数据分析技术,能完成基于某种数据存储结构的数据分析功能,并具有快速性、可分析性、多维性、信息性等特点。 数据挖掘:数据挖掘就是对数据库中蕴涵的、未知的、非平凡的、有潜在应用价值的模式(规则)的提取。 模式和知识: 模式(pattern):用高级语言表示的表达一定逻辑含义的信息。 知识(discovered knowledge):满足用户兴趣度和置信度的模式。 可信计算基:TCB计算机系统内保护装置的总体,包括硬件、软件和负责执行安全策略的组合体。 强制访问控制(MAC):计算机信息系统TCB对所有主体及其所控制的客体实施强制访问控制。 敏感标记:表示主/客体安全级别并描述客体数据敏感性的一组信息。 TCB把敏感标记作为强制访问控制决策的依据。(同下) 对象请求代理(ORB):ORB负责接受客户端的请求并寻找该对象的实现,激活对象实现部分以接受该访问请求,并发送该请求所需的数据。客户端的调用接口完全独立于该对象的物理位置、所使用的实现语言和该对象的任何调用特征。 OMG组织 :OMG组织采用的是一个抽象的对象模型,强调对对象的概念化描述及其组织,而不涉及到具体细节。 简述数据仓库的四大特色。 1面向主题 : 数据仓库是面向分析、决策人员的主观要求的。数据仓库中的主题有时会因用户主观要求的变化而变化。 2、集成的 需要对来自多个数据源的数据进行集成,这样的集成并不是从其他数据源中直接得到数据,而是要经过统一与综合。 统一:消除不一致的现象 综合:对原有数据进行综合和计算 数据在从操作型环境向数据仓库环境转移的同时进行集成。 3、不可更新的 数据仓库中的数据主要供企业决策分析之用,执行的主要是查询操作,一般情况下不执行修改操作。但这也不等于数据仓库中的数据不需要更新操作。在需要进行新的分析决策时,可能需要进行更新操作,而数据仓库中一些过时的数据也可以通过删除操作丢掉。 4、随时间不断变化 数据仓库中的数据要随时间的变化而不断变化。这种变化表现在三个方面: 不断增加新的数据内容 不断删除旧的数据内容 更新与时间有关的综合数据 简述数据仓库的设计原则和设计步骤。 设计原则: 1、面向主题的原则 数据仓库的组织设计必须以用户决策的需求来确定,即以用户决策的主观需求确定设计目标。 2、原型法原则 采用原型化方法来进行数据仓库的开发是比较合适的,即从构建系统的基本框架着手,不断丰富与完善系统。 数据仓库的设计是一个逐步求精的过程,用户的需求是在设计过程中不断细化明确的。 3、数据驱动原则 数据仓库的数据必须是从已有的数据源中抽取出来,是已存在的数据或对已经存在的数据进行加工处理而获得。 数据仓库的设计是一个循环反复的过程,在每一个循环中大致可分为以下几个步骤: 1、概念模型的设计 概念模型设计所要完成的工作是: a. 确定系统边界 要做的决策有哪些? 决策者感兴趣的是什么问题? 这些问题需要什么样的信息? 要得到这些信息需要哪些信息源? b. 确定主要的主题 确定系统所包含的主题,然后对每个主题的内容进行较明确的描述,包括: 确定主题及其属性信息:描述每个属性的取值情况,固定不变、半固定还是经常变化。  确定主题的公共码键 主题间的关系:主体间的关系及其属性 设计好上述三个方面的内容后,就可以形成一张E-R图,表示数据仓库的概念模型。 c. OLAP设计 根据用户的分析处理要求,设计系统所采用的OLAP数据模型。 2、逻辑模型的设计 本阶段的任务是对每个当前要装载的主要的逻辑实现进行定义,并将相关内容纪录在数据仓库的元数据中,包括: 适当的粒度划分 合理的数据分割策略 适当的表划分 定义合适的数据来源 3、物理模型设计 该阶段的任务是确定数据仓库中数据的存

文档评论(0)

xjj2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档