- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据库发展趋势与新技术
1.有关联机分析处理(OLAP)与联机事务处理(OLTP)的正确描述是 (1) 。
A.OLAP面向操作人员,OLTP面向决策人员
B.OLAP使用历史性的数据,OLTP使用当前数据
C.OLAP经常对数据进行插入、删除等操作,而OLTP仅对数据进行汇总和分析
D.OLAP不会从已有数据中发掘新的信息,而OLTP可以
[答案]
(1)B
[分析]
联机分析处理(OLAP)与联机事务处理(OLTP)的主要区别如下。
(1)所面向的用户和系统:OLTP面向客户,OLAP面向市场。
(2)数据内容:OLTP管理当前数据,OLAP管理大量历史数据。
(3)数据库设计:OLTP采用E-R模型和面向应用的数据库设计,OLAP采用星型模式或雪花模式和面向主题的数据库设计。
(4)视图:OLTP主要关注企业内部当前数据,OLAP常跨企业,由多个数据源集成。
(5)访问模式:OLTP的访问主要由原子事务组成,需要并发控制和恢复机制, OLAP的访问大部分都是只读操作。
2.下面描述正确的是 (2) 。
A.数据仓库是从数据库中导入大量的数据,并对结构和存储进行组织以提高查询效率
B.使用数据仓库的目的在于对已有数据进行高速的汇总和统计
C.数据挖掘是采用适当的算法,从数据仓库的海量数据中提取潜在的信息和知识
D.OLAP技术为提高处理效率,必须绕过DBMS直接对物理数据进行读取和写入
[答案]
(2)C
[分析]
按照W. H. Inmon这位数据仓库权威的说法,“数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程”。这个简短而又全面的定义指出了表明数据仓库主要特征的四个关键词:面向主题的、集成的、时变的、非易失的,将数据仓库与其他数据存储系统(如关系数据库系统、事务处理系统和文件系统)区别开来。建立数据仓库的目的主要为了支持管理决策,数据仓库的重点与要求就是能够准确、安全、可靠地从数据库中取出数据,经过加工转换成有规律信息之后,再供管理人员进行分析使用。
数据挖掘是指应用一系列技术从大型数据库或数据仓库中提取人们感兴趣的信息和知识,这些知识或信息是隐含的,事先未知而潜在有用的,提取的知识表示为概念、规则、规律、模式等形式。
3.数据仓库通过数据转移从多个数据源中提取数据,为了解决不同数据源格式上的不统一,需要进行 (3) 操作。
A.简单转移 B.清洗 C.集成 D.聚集和概括
[答案]
(3)B
[分析]
构建数据仓库的重要一环就是用户从数据源抽取山所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
4.不常用做数据挖掘的方法是 (4) 。
A.人工神经网络 B.规则推导 C.遗传算法 D.穷举法
[答案]
(4)D
[分析]
数据挖掘是一类深层次的数据分析。常见和应用最广泛的数据挖掘方法如下。
(1)决策树
决策树方法是指利用信息论中的互信息(信息增益)寻找数据库中具有最大信息量的属性字段,建立决策树的一个结点,再根据该属性字段的不同取值建立树的分支;在每个分支子集中重复建立树的下层结点和分支的过程。国际上最早的、也是最有影响的决策树方法是Quiulan研究的ID3方法。
(2)神经网络
神经网络方法是指模拟人脑神经元结构,完成类似统计学中的判别、回归、聚类等功能,神经网络是一种非线性的模型,主要有三种神经网络模型:前馈式网络、反馈式网络和自组织网络。人工神经网络最大的长处是可以自动地从数据中学习,形成知识,这些知识有些是我们过去未曾发现的,因此它具有较强的创新性。神经网络的知识体现在网络连接的权值上,神经网络的学习主要表现在神经网络权值的逐步计算上。
(3)遗传算法
遗传算法是模拟生物进化过程的算法,它由三个基本过程组成:繁殖(选择)、交叉(重组)、变异(突变)。采用遗传算法可以产生优良的后代,经过若干代的遗传,将得到满足要求的后代,即问题得解。
(4)关联规则挖掘算法
关联规则是描述数据之间存在关系的规则,形式为“A1A2…An…B1B2…Bn”。一般分为两个步骤:求出大数据项集;用大数据项集产生关联规则。
除了上述的常用方法外,还有粗集方法、模糊集合方法、Bayesian Belief Netords、最邻近算法(k-nearest ne
文档评论(0)