数据挖掘管理系统规范说明课程介绍.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
11111111111111111111111111111 数据挖掘管理系统规范说明 现状简介 强度挖掘(Intension Mining) I-MIN过程模型(Process Model) I-MIN系统的功能组件(Functional Components) 强度挖掘算子(Operators) I-MIN系统的三层体系结构(Architecture) 小结 现状简介 传统的KDD过程模型(CRISP-DM模型) 现状简介 当前的数据挖掘系统和数据挖掘工具包要求使用者必须是数据挖掘专家 非专业用户需要与数据挖掘专家密切配合才能保证获得理想的数据挖掘结果 用户使用极为不方便 强度挖掘(Intension Mining) 挖掘目标以知识发现模式(Knowledge Discovery Schema)的形式存储 强度挖掘模式包含了一般挖掘需求(Generic mining requirements)的规格说明 强度挖掘是基于增量式挖掘概念的,增量数据库按固定的时间间隔进行自动处理 处理过程由数据预挖掘组成,主要包括初步分析和聚集(Aggregation) 强度挖掘主要由计划阶段(Planning phase),累积阶段(Accumulation phase)和挖掘阶段(Mining phase)三个阶段组成 强度挖掘(Intension Mining) 计划阶段 知识发现模式(Knowledge Discovery Schema, KDS)的创建 编译知识发现模式得到对应的元数据和数据结构 强度挖掘(Intension Mining) 累积阶段 通过元数据对增量数据库进行预挖掘,得到浓缩知识(Knowledge Concentrate, KC) 浓缩知识作为最终知识的中间表示形式,以浓缩知识窗口的形式为进一步的数据挖掘服务 强度挖掘(Intension Mining) 挖掘阶段 用户提交数据挖掘查询或执行数据挖掘应用程序 挖掘算法对浓缩知识进行处理,得到用户最终所需的知识 强度挖掘(Intension Mining) 重要特征 将KDD看作一个连续的过程,以固定的时间间隔对增量数据库进行周期性累积产生浓缩知识 浓缩知识窗口是知识更新和知识共享的基础 I-MIN过程模型(Process Model) I-MIN模型 基于强度挖掘概念的以用户为中心的KDD过程模型 支持对KDD过程的交互式探索和试验 向下兼容传统的KDD过程模型 处理步骤分别标记为IM1, IM2, ……, IM6 I-MIN过程模型(Process Model) I-MIN过程模型(Process Model) IM1 对应于强度挖掘中的计划阶段 确定挖掘目标 以知识发现模式的形式表示挖掘目标 编译知识发现模式得到元数据 I-MIN过程模型(Process Model) IM2 对应于积累阶段 是一个复合过程 IM2a, IM2b, IM2c分别对应于传统KDD过程的数据选择、数据清洗和数据转换 IM2d负责对预挖掘数据进行分析和聚集 不需人工干预而以固定的时间间隔自动执行 输出浓缩知识(KC) I-MIN过程模型(Process Model) IM3 标志着挖掘阶段的开始 用户提交挖掘查询或自己开发的应用程序 在IM2中得到的浓缩知识在本步骤可以共享 I-MIN过程模型(Process Model) IM4 真正的数据挖掘步骤 知识发现模式中指定的数据挖掘算法被激活 用户期望的知识是从浓缩知识中挖掘出来 I-MIN过程模型(Process Model) IM5对应于知识表示 IM6对应于知识解释/实施 I-MIN系统的功能组件 实现I-MIN模型需要为累积、挖掘、试验和跟踪开发相应的组件 不同类型的知识对应的组件是不同的 每个组件实现I-MIN模型的一个步骤或一个功能 I-MIN系统的功能组件 I-MIN系统的功能组件 实现I-MIN模型需要5种组件: ?TM(KA), FaccTM(KA), FminTM(KA), FexpTM(KA), FmonTM(KA) K为使用算法A发现的知识类型 ?TM为合并算子,用于指定数据库子集 FaccTM为累积组件 FminTM为挖掘组件 FexpTM为试验组件 FmonTM为跟踪组件 I-MIN系统的功能组件 累积组件 对数据进行初步分析和局部聚集,实现IM2d 由系统自动激活 为增量数据库构建浓缩知识窗口 对最终用户而言是透明的 I-MIN系统的功能组件 合并组件 用户可以动态指定挖掘的数据目标子集 通过指定需要的时间间隔来达到合并的目的 固定周期内的浓缩知识需要合并产生一个合并的大窗口 I-MIN系统的功能组件 挖掘组件 由实际的挖掘算法组成 用户提交挖掘查询或应用程序时激活 一个算法根据参数的不同可能对应多个

文档评论(0)

武神赵子龙 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档