数据仓库与数挖掘技术.ppt

  1. 1、本文档共95页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与数挖掘技术

5.5 数据挖掘中常见的一些问题 商业用户提出的问题 技术问题 数据挖掘应用问题 实施数据挖掘项目考虑的问题 数据挖掘对社会的影响―—有关隐私问题 5.6 事先无法预测的有价值知识 1)其他候选结果:我们除了想要知道模型将会预测出什么结果之外,可能还会对其他候选预测结果也产生兴趣。 2)获选边际率:人们对预测结果非常感兴趣的一点是最终预测结果与其他候选结果之间的差距有多大。 3)预测:我们对预测过程可能想要知道的另一件事情就是模型为什么会得到这样的预测结果。 4.1.1智能代理 智能代理(Agent)是一种在计算机网络上无疲劳工作执行重复性、可预料任务的,为人们建立知识的软件包。 智能代理具有长期性、半自动化、参与活动,且具有适应性。 1.智能代理定义 Agent的设计是用来完成某类任务的,能在一定环境中自主发挥作用、有生命周期的计算实体。Agent 是一种抽象实体,它能作用于自身和环境,并能对环境做出反映,具有知识、目标和能力。 2.多Agent与移动Agent 多Agent是由多个可执行网络计算的Agent组成的集合,能对问题求解,能随环境改变而自动修改自己的行为,并能通过网络与其他Agent进行通信、交换、合作,协同完成求解同一问题的分布式智能系统。 移动Agent是Agent 与Internet技术相结合的产物,它可以自主地在网络上从一台主机移动到另一台主机,根据用户指定的任务进行自动检索、收据和过滤信息,代表用户进行商务活动。 3.建造Agent的方法 4.1.2 群体智能 1.蚁群算法 2.多Agent分布式的市场营销知识获取结构 多Agent分布式市场营销知识获取结构 4.1.3 小波分析 小波变换是一种信号处理技术,它将一个信号分解为不同频率的子波段。在实际工程中,有用信号通常表现为低频信号或是一些比较平稳的信号,而噪声(离群)则通常表现为高频信号。 4.1.4 分形技术分析 分形理论(fractal theory)的创始人Mandelbrot在20世纪60年代就应用自相似性和标度不变性,对棉花价格进行了研究。 称集F是分形的,是具备如下典型的性质: 1)F具有精细的结构,即有任意小比例的不规则的细节; 2)F是如此的不规则以至于无论它的整体和局部都不能用微积分或传统的几何语言来描述; 3)F通常有某种自相似或自仿射的性质,可能是近似的,也可能是统计近似意义上的; 4)一般地F有“分形维数”(以某种定义),通常严格大于它的拓扑维数; 5)在大多令人感兴趣情形下,F以非常简单的方法,可能由迭代给出定义; 6)F通常有“自然”的外貌。 4.2.1联机分析OLAP的基本术语 定义1 OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。通过对信息(维数据)的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。 定义2 OLAP(联机分析处理) 是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的,并对真实反映企业数据特性的信息进行快速、一致、交互地存取,从而获得对数据更深入了解的一类软件技术 (OLAP委员会的定义)。 OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。 4.2.2 OLAP体系结构和处理的特性 4.2.3 OLAP多维数据结构与OLAP的分类 1.OLAP多维数据结构 2.OLAP的分类 4.2.4 OLAP的多维数据分析方法 1.切片(slice) 2.切块(Dice) 3.旋转(turning)/转轴(pivot) 4.钻取(drill) 4.2.5 OLAP评价准则 准则1 OLAP模型必须提供多维概念视图。 准则2 透明性准则。 准则3 存取能力准则。 准则4 稳定的报表性能。 准则5 客户/服务器体系结构。 准则6 维的等同性准则。 准则7 动态的稀疏矩阵处理准则。 准则8 多用户支持能力准则。 准则9 非受限的跨维操作。 准则10 直观的数据操纵。 准则11 灵活的报表生成。 准则12 非受限维与聚集层次。 4.2.6 OLAP的发展与流行的OLAP工具选择 1.OLAP的发展 2.流行的OLAP工具选择 1)Hyperion Essbase: 2)Oracle Express 3)IBM DB2 OLAP Server 4)Sybase Power dimension 5)Informix Metacube 4.3.1 粗糙集理论的基本概念和理论基础 知识、划分与等价关系 信息表、不可分辨关系和基本集 粗糙集的下、上近似及边界区 4.3.2 粗糙集在信息分析中

文档评论(0)

138****7331 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档