数据挖掘和知识发现-课程.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
天气 温度 湿度 风况 运动 晴 85 85 无 不适合 晴 80 90 有 不适合 多云 83 78 无 适合 有雨 70 96 无 适合 有雨 68 80 无 适合 有雨 65 70 有 不适合 多云 64 65 有 适合 晴 72 95 无 不适合 晴 69 70 无 适合 有雨 75 80 无 适合 晴 75 70 有 适合 多云 72 90 有 适合 多云 81 75 无 适合 有雨 71 80 有 不适合 决策树的例子2 天气? overcast 湿度? 风况? =70 70 无 有 天晴 有雨 适合 不适合 不适合 适合 适合 多云 通过数据挖掘的方法能大大压缩数据库的元组和字段项,最后得到浓缩数据,称为知识基 它是原数据库的精华,很容易转换成规则知识 类型 身高 头发 HR附 第 一 类 人 矮 金色 蓝色 高 红色 蓝色 高 金色 蓝色 矮 金色 灰色 第 二 类 人 高 金色 黑色 矮 黑色 蓝色 高 黑色 蓝色 高 黑色 灰色 矮 金色 黑色 类型 头发 眼睛 第一类人 金色 蓝色 红色 蓝色 金色 灰色 第二类人 金色 黑色 黑色 蓝色 黑色 灰色 知识基(浓缩数据) 神经网络方法经过对训练样本的学习后,所得到的知识是网络连接权值和结点的阈值 一般表示为矩阵和向量 神经网络结构和权值 在大量实验数据(数值) 中蕴涵着一定的规律性,通过公式发现算法,可以找出各种变量间的相互关系,用公式表示 可以得到开普勒 第三定律: d3/p2=25 ? 水里 金星 地球 火星 木星 土星 周期P/d 88 225 365 687 4343.5 10767.5 距离d/Gm 58 108 149 228 778 1430 太阳系行星运动数据中包含行星运动周期(旋转一周所需时间,d),以及它与太阳的距离(围绕太阳旋转的椭圆轨道的长半轴,Gm) 案例是指经历过的一次完整事件 案例是解决新问题的一种知识 基于案例的推理 (CBR, Case Based Reasoning) 在案例库中搜索相似的案例,通过对旧案例的修改来解决新问题。 案例知识一般表示为三元组: 问题描述:对求解问题及周围环境特征的描述; 解描述:对问题求解方案的描述; 效果描述:描述解决方案的结果情况,是成功还是失败 根据挖掘的数据库类型分类 根据挖掘的知识类型分类 根据应用分类 根据所用的方法和技术分类 关联 时序 聚类 分类 偏差检测 预测分析 根据挖掘的数据库类型分类 根据挖掘的知识类型分类 根据应用分类 根据所用的方法和技术分类 金融行业的数据挖掘 电信行业的数据挖掘 保险行业的数据挖掘 医药行业的数据挖掘 税务部门的数据挖掘 根据挖掘的数据库类型分类 根据挖掘的知识类型分类 根据应用分类 根据所用的方法和技术分类 归纳学习法 仿生物技术法 公式发现法 统计分析法 模糊数学法 可视技术法 归纳学习法 仿生物技术法 公式发现法 统计分析法 模糊数学法 可视技术法 归纳学习是符号学习中研究得最为广泛得一种方法。给定关于某个概念的一系列已知的正例和反例,其任务是从中归纳出一个通用的概念描述 归纳学习能够获得新的概念,创立新的规则,发现新的理论 它的一般操作是泛化(generalization)和特化(specialization) 泛化用来扩展一假设的语义信息,以使其能够包含更多的正例,应用于更多的情况 特化是泛化的相反的操作,用于限制概念描述的应用范围 归纳学习法 仿生物技术法 公式发现法 统计分析法 模糊数学法 可视技术法 神经网络方法类 遗传算法类 所谓人工神经网络(Artificial Neural network)是指利用工程技术手段模拟人脑神经网络的结构和功能的一种技术系统。它是一种大规模并行的非线性动力学系统,简称为神经网络 人脑是由大量的神经元通过及其丰富和完善的联接而形成的一个灵活多变的、错综复杂的神经网络 神经元结构图 树突 轴突 突触 人工神经元结构模型图 w1 w2 wn ? ? ui Yi x1 x2 xn f 人工神经元:又称为处理单元、节点或短期记忆 xi : 神经元的输入 wi : 突触连接强度即权值 ui : 神经元的内部状态 : 阈值 Yi : 神经元的输出, 规定神经元在一定输入的作用下,超过某一阈值,神经元才兴奋,才能引起输出是一简单非线性激活又称为神经元的功能函数 神经网络方法类 遗传算法类 遗传算法是模拟生物进化过程的算法:分别由繁殖(选

文档评论(0)

kbook + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档