- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与数据挖掘技术PPT
4.1.1智能代理 智能代理(Agent)是一种在计算机网络上无疲劳工作执行重复性、可预料任务的,为人们建立知识的软件包。 智能代理具有长期性、半自动化、参与活动,且具有适应性。 1.智能代理定义 Agent的设计是用来完成某类任务的,能在一定环境中自主发挥作用、有生命周期的计算实体。Agent 是一种抽象实体,它能作用于自身和环境,并能对环境做出反映,具有知识、目标和能力。 2.多Agent与移动Agent 多Agent是由多个可执行网络计算的Agent组成的集合,能对问题求解,能随环境改变而自动修改自己的行为,并能通过网络与其他Agent进行通信、交换、合作,协同完成求解同一问题的分布式智能系统。 移动Agent是Agent 与Internet技术相结合的产物,它可以自主地在网络上从一台主机移动到另一台主机,根据用户指定的任务进行自动检索、收据和过滤信息,代表用户进行商务活动。 3.建造Agent的方法 4.1.2 群体智能 1.蚁群算法 2.多Agent分布式的市场营销知识获取结构 多Agent分布式市场营销知识获取结构 4.1.3 小波分析 小波变换是一种信号处理技术,它将一个信号分解为不同频率的子波段。在实际工程中,有用信号通常表现为低频信号或是一些比较平稳的信号,而噪声(离群)则通常表现为高频信号。 4.1.4 分形技术分析 分形理论(fractal theory)的创始人Mandelbrot在20世纪60年代就应用自相似性和标度不变性,对棉花价格进行了研究。 称集F是分形的,是具备如下典型的性质: 1)F具有精细的结构,即有任意小比例的不规则的细节; 2)F是如此的不规则以至于无论它的整体和局部都不能用微积分或传统的几何语言来描述; 3)F通常有某种自相似或自仿射的性质,可能是近似的,也可能是统计近似意义上的; 4)一般地F有“分形维数”(以某种定义),通常严格大于它的拓扑维数; 5)在大多令人感兴趣情形下,F以非常简单的方法,可能由迭代给出定义; 6)F通常有“自然”的外貌。 1.4.4 数据挖掘在贝斯出口公司的应用 贝斯出口公司是英国最大的啤酒出口商。该公司选择了IBM的智能挖掘器作为其数据挖掘的商务解决方案。 1.4.5 数据挖掘如何预测信用卡欺诈 对于这一问题可以有下列3种解决的途径: 1)使用查询工具从关系数据库中以适当的格式抽取所需要的信息。采用Brio,Businee Objects及Congnos等公司开发的工具将很容易构造出模型。由于用这种方法需要将数据下载到客户端计算机中,所以能够从数据仓库中创建视图来表示将要挖掘的虚拟数据。 2)通过从关系数据仓库中抽取记录数据,这将会受到一定的限制。 3)通过构造SQL语句以适当格式得到所需的数据。 1.4.6 数据挖掘在证券行业的应用 关于股票预测,市场上有许多采用数据挖掘技术对股票进行预测的软件。如NETPROPHET是神经网络应用公司开发的一个股票预测应用软件,它采用了神经网络技术,将输出的结果用两条曲线分别表示实际股票值和预测股票值。 第二章 数据仓库的分析 2.1 影响数据仓库成功的因素 2.2 数据仓库的生命周期 2.3 数据仓库的基本体系结构 2.4 数据仓库的逻辑结构 2.1 影响数据仓库成功的因素 特征 操作(事务处理)需要 数据仓库(DSS)需要 易变性 动态 静态 通用性 当前的 历史的 时间维 暗指 “现在”明确的,可见的 粒度 原始的,详细的 详细的和可导出的汇总 更新 连续的,随机的 定期的,计划的 任务 可重复的 不可预期的 灵活性 低 高 性能 要求高性能 通常可接受低性能 决策支持系统与事务之间在数据库要求上的差异 影响数据仓库成功的因素 2.2.1 数据仓库计划与准备阶段 1.用户需求分析 2.可行性研究 3.用户的认可 4.建设数据仓库的协调与阻力分析 5.开发项目计划制定 6.创建数据仓库所使用的关键资源 数据仓库的生命周期 2.2.2 数据仓库的其他阶段 1)系统分析 2)系统设计(整体设计与详细设计) 3)系统测试 2.3 数据仓库的基本体系结构 客户应用,是供用户访问查询,并以直观方式展示分析结果; 数据仓库,是存储不同程度的数据和元数据; 集成器,是将从运作数据库中提取的数据经过转换、计算、综合等操作,集成到数据仓库中; 监视器,是负责感知数据源发生的变化,并按需求提取数据; 数据源,是为DW提供最底层的运作数据库系统及外部数据。 2.4.1 数据仓库中的粒度 2.4.2 数据仓库中的数据分割 数据分割的常用标准:按时间、商业行业、地理位置、组织单位等。这些标准都是由开发人员来选择,且还要选择是在应用层上进行分割,还是在系统层上进行分割。在系统层进行分割在一定程度
文档评论(0)