* * * * * * * * * * * 数据挖掘软件的发展 第二代软件 SAS Enterprise Miner * * 数据挖掘软件的发展 第三代数据挖掘软件 特点 和预言模型系统之间能够无缝的集成,使得由数据挖掘软件产生的模型的变化能够及时反映到预言模型系统中 由数据挖掘软件产生的预言模型能够自动地被操作型系统吸收,从而与操作型系统中的预言模型相联合提供决策支持的功能 能够挖掘网络环境下(Internet/Extranet)的分布式和高度异质的数据,并且能够有效地和操作型系统集成 缺陷 不能支持移动环境 * * 数据挖掘软件的发展 第三代软件 SPSS Clementine 以PMML的格式提供与预言模型系统的接口 * * 数据挖掘软件的发展 第四代数据挖掘软件 特点 目前移动计算越发显得重要,将数据挖掘和移动计算相结合是当前的一个研究领域。 第四代软件能够挖掘嵌入式系统、移动系统、和普适计算(ubiquitous)计算设备产生的各种类型的数据 第四代数据挖掘原型或商业系统尚未见报导,PKDD2001上Kargupta发表了一篇在移动环境下挖掘决策树的论文,Kargupta是马里兰巴尔的摩州立大学(University of Maryland Baltimore County)正在研制的CAREER数据挖掘项目的负责人,该项目研究期限是2001年4月到2006年4月,目的是开发挖掘分布式和普适计算(Ubiquitous)设备的第四代数据挖掘系统。 * Thank you! * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 高级人工智能 知识发现 * * 知识发现 概述 知识发现的任务 数据仓库 知识发现工具 * * 知识发现 知识发现是指从数据集中抽取和精炼新的模式。 范围非常广泛:经济、工业、农业、军事、社会 数据的形态多样化:数字、符号、图形、图像、声音 数据组织各不相同:结构化、半结构化和非结构 发现的知识可以表示成各种形式 规则、科学规律、方程或概念网。 * * 数据库知识发现 目前, 关系型数据库技术成熟、应用广泛。因此, 数据库知识发现(Knowledge Discovery in Databases KDD)的研究非常活跃。 该术语于1989年出现,Fayyad定义为“KDD是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程” * * 不同的术语名称 知识发现是一门来自不同领域的研究者关注的交叉性学科,因此导致了很多不同的术语名称。 知识发现:人工智能和机器学习界。 数据挖掘(data mining): 统计界、数据分析、数据库和管理信息系统界 知识抽取 (information extraction)、 信息发现 (information discovery)、 智能数据分析 (intelligent data analysis)、 探索式数据分析 (exploratory data analysis) 信息收获 (information harvesting) 数据考古 (data archeology) * * * * 知识发现的任务 数据总结: 对数据进行总结与概括。传统的最简单的数据总结方法是计算出数据库的各个字段上的求和值、平均值、方差值等统计值,或者用直方图、饼状图等图形方式表示。 分类: 根据分类模型对数据集合分类。分类属于有导师学习,一般需要有一个训练样本数据集作为输入。 聚类: 根据数据的不同特征,将其划分为不同的类。无导师学习 * * 知识发现的任务 相关性分析: 发现特征之间或数据之间的相互依赖关系 关联规则 偏差分析: 基本思想是寻找观察结果与参照量之间的有意义的差别。通过发现异常, 可以引起人们对特殊情况的加倍注意。 建模: 构造描述一种活动或状态的数学模型 * * 知识发现的方法 统计方法: 传统方法: 回归分析、判别分析、聚类分析、探索性分析 模糊集(fuzzy set) Zadeh 1965 支持向量机(Support Vector Machine) Vapnik 90年代初 粗糙集(Rough Set) Pawlak 80年代初 * * 知识发现的方法 机器学习: 规则归纳:AQ算法 决策树:ID3、C4.5 范例推理:CBR 遗传算法:GA 贝叶斯信念网络 * * 知识发现的方法 神经计算: 神经网络是指一类新的计算模型,它是模仿人脑神经网络的结构和某些工作机制而建立的一种计算模型。常用的模型: Hop
您可能关注的文档
- 发票开具规范性培训.ppt
- 发性骨髓瘤治疗观念与治疗模式的研究进展.ppt
- 发展HEMS运营过程中人的因素的考虑.pptx
- 發展行銷策略與計畫.ppt
- 廢水處理技術概論.ppt
- 廢酸再利用技術與實務.ppt
- 翻译本科专业教学质量国家标准解读与实施.ppt
- 翻译硕士专业学位的设置与教学.ppt
- 翻转课堂——让微课焕发生命魅力.ppt
- 反馈控制系统及其稳定性.ppt
- 25-26学年政治(部编版)选择性必修第二册课件:第1单元 周清1 民法中的人身权及财产权.pptx
- 25-26学年政治(部编版)选择性必修第二册课件:1.4.1 权利保障 于法有据.pptx
- 2025北京丰台区高二(上)期中地理(A卷)含答案.docx
- 2025北京三帆中学初三(上)开学考英语试题含答案.docx
- 2025北京一零一中初三9月月考语文试题含答案.docx
- 2025北京海淀区初三(上)期中道法试题含答案.docx
- 2025北京丰台区高一(上)期中政治(A卷)含答案.docx
- 25-26学年政治统编版必修4课件:3.3 唯物辩证法的实质与核心.pptx
- 25-26学年政治统编版必修4课件:7.2 正确认识中华传统文化.pptx
- 湖北省部分高中2026届高三上学期二模联考 历史试卷.docx
最近下载
- 部编版道德与法治一年级下册第8课《大家来合作》精美课件.pptx VIP
- 银行国际业务基础知识.pdf VIP
- 《恒压频比控制下交流异步电机调速系统仿真》.docx VIP
- 矿山生态保护修复验收规范.pdf VIP
- 浙江省杭州市西湖区2024-2025学年九年级上学期数学期末试卷(含答案).docx VIP
- 山东省济南市历城区2023-2024学年五年级上学期期末数学试卷(含答案).docx VIP
- 城市景观规划设计外文文献翻译 .pdf VIP
- PEP人教版小学英语三年级上册期末测试卷(一)(答案+听力材料).doc VIP
- 小升初英语试卷及答案.pdf VIP
- 安全知识 培训.docx VIP
原创力文档

文档评论(0)