数据挖掘考试复习资料.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
8、了在被接收之前,信号传输过程中损失的信息量, 8、 了在被接收之前, 信号传输过程中损失的信息量, 又被称为信息炳。信息 数据挖掘考试复习资料 一、名词解释 1、 数据仓库:面向主题的、集成的、非易失的、是随时间变化的数据集合,用 来支持管理决策。 2、 聚类:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称 为聚类 3、 3、 未知的和口 J能有用的模式或知识 4、 人工神经网络:人工神经网络是一种应用类似于大脑神经突触联接的结构进 行信息处理的数学模型。在工程与学术界也常直接简称为神经网络或类神经 网络。 5、文本挖掘:文本数据挖掘(Text Mining)是指从文本数据中抽取有价值的 信息和知识的计算机处理技术 6 OLAP又称联机分析处理,是使分析人员、管理人员或执行人员能够从多种角度对 从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业为 特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解 的一类软件技术。 定义1: OLAP是针对特定问题的联机数据访问和分析。通过对信息(维数 据)的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人 员对数据进行深入地观察。 定义2: OLAF是使分析人员、管理人员或执行人员能够从多种角度对从原 始数据中转化出来的、能够真正为用户所理解的、并真实反映企业“维”特性的信 息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技 术。) 7、 概念描述:就是对目标类对象的内涵进行描述,并概括这类对象的有关特 征。特征化:提供给定数据汇集的简洁汇总 比较:提供两个或多个数据汇集的比较描述 信息嫡:在信息论中,炳被用来衡量一个随机变量出现的期望值。它代表 嫡也称信源嫡、平均自信息量。 二、简答题 1、 数据仓库和传统数据库的区别和联系是什么? 区别:数据仓库和数据库是不同的概念 数据仓库是一个综合的解决方案,而数据库只是一个现成的产品。数据仓库需 要一个功能十分强大的数据库引擎来驱动,它更偏向于工程。数据仓库系统和传统 数据库系统相比,不同点表现在以下几方面。 对比内容 数据库 数据仓库 数据内容 历史的、存椚的、归纳的*计椁的 数据 数据冃标 呦丨;寸业务操作程丿沢駆绘处母 繭向生休域、官理决策井 数据特性 动态变化、按宁段更新 診奁不離直播见新只星定时谣 加 数据结构 岛度紿狗化、殳朵S山和撩作计 算 简单、埋合分析 使用频率 1布 到低 数据访问呈 每个事务只访问少量记录 右的务町能嚟的轲大吊记录 对相应时问的要求 也秒丸单位计母 以种、分钟、捷至小时为讨就单 位 (2) 联系:数据库是数据管 理技术,是计算机科学的重要分支,其应用己从一般管理扩大到计算机辅助设计、 人工智能以及科技计算等领域 ?数据仓库是一个面向 主题的、集成的、相对穏定的、反映历史变化的数据集合 ,用于支持管理决策, 是 20世纪末到21世纪初数据库市场的一个新的增长点?数据仓库的数据常常来自于多 个数据源,存放模式一致,数据一般驻留在单个站点,数据仓库中的数据已经清 理、变换、集成于装载,并定期刷新,数据仓库中的数据是海量的,数据仓库所要 研究和解决的问题就是从数据库中的获取信息? 数据仓库的出现,并不是要取代数据库。冃前,大部分数据仓库还是用关系数据 库管理系统来管理的。可以说,数据库、数据仓库相辅相成、各有千秋。 2、 数据挖掘的主要功能是什么? 数据挖掘的冃标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能。 自动预测趋势和行为一一数据挖掘自动在大型数据库中进行分类和预测、 寻找 预测性信息,自动地提出描述重要数据类的模型或预测未来的数据趋势。 关联分析一一数据关联是数据库中存在的一类重要的可被发现的知识,若两个或 两个以上变量的取值之间存在某种规律性,就称为关联。 聚类一一聚类就是按一定的规则将数据划分为合理的集合,即将对象分组为多个 类或簇,使得在同一个簇中的对象之间具有较高的相似度,而在不同簇中的对象差别很 大。 概念描述一一就是对目标类对象的内涵进行描述,并概括这类对 象的有关 特征。 偏差检测一一数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有 意义。 3、 简述0LAF在多维数据模型中的几个基本操作? 切片:在多维数组的某一维上选定一维成员的动作成为切片。 切块:在多维数组的某一维上选定某一区间的维成员的动作。 旋转:旋转既是改变一个报告或者页面的维方向 IIII钻取。钻取处理是使用户在数据仓库的多层数据中,能够通过导航信息而 获得 更多的细节性数据,钻取一般是指向下钻取。 II II 4、 数据挖掘的步骤包括哪些? ①理解数据和数据的来源 ②获取相关知识与技术③整合与检查数据 ①理解数据和数据的来源

文档评论(0)

文档查询,农业合作 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体土默特左旗农特农机经销部
IP属地广西
统一社会信用代码/组织机构代码
92150121MA0R6LAH4P

1亿VIP精品文档

相关文档