2019年第9章客户信息的整合与运用.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2019年第9章客户信息的整合与运用

3.数据挖掘的未来发展方向 与专家系统结合的数据挖掘 网络数据挖掘 数据挖掘的时序性 对非结构化数据的挖掘 引入新的数据挖掘算法 补充内容:数据挖掘的主要功能 分类 企业可以按照客户的行为对他们进行分类,以便使特定的产品和服务能够被提供给更加有价值的客户群(即最佳客户) 族群/聚类 将具有相似特点的客户分成几个族群(市场细分) 联系/关系 探寻产品或行为间的联系是否存在以及联系的强度,以便能够基于相关产品做出决策 方式或次序 客户的购买行为的方式或次序 补充内容:典型数据挖掘系统的结构 9.3.2 数据挖掘的基本任务 1.自动预测趋势和行为 2.关联分析 若两个或多个变量的取值之间存在某种规律性,就称为关联 关联可分为简单关联、时序关联和因果关联等多种类型 关联分析的目的是找出数据库中隐藏的关联网 3.聚类分析 数据库中的记录可被划分为一系列有意义的子集,即聚类 4.概念描述 是对某类对象的内涵进行描述,并概括这类对象的有关特征 5.偏差检测 基本方法是寻找观测结果与参照值之间有意义的差别 9.3.3 数据挖掘的技术与算法简介 1.数据挖掘的集合论技术 粗糙集技术 是一种处理含糊和不精确数学问题的新型数学工具 粗糙集将知识定义为不可精确区分的关系的一个族集,这就使知识有了明确的数学含义,易于进行数学分析 概念树技术 一个数据库中的不同数据都拥有许多的不同属性,根据这些属性可以对数据进行分类,然后对每个属性进行概念提升 中国 江苏 台湾 其他省份 淡水 基隆 …… 南京 苏州 …… …… …… 图9-3 籍贯概念树 籍贯概念树 2.数据挖掘中的仿生物技术 神经网络技术(Neutral Network) 模拟了人脑神经元结构,可以为解决复杂程度高的问题提供一个比较简便的方法 神经网络基本结构是:输入层、输出层、隐含层 1 输入层 隐含层 输出层 图9-4 简单的人工神经网络结构图 2 3 6 4 5 生物进化 遗传算法 适者生存 在算法停止时,获得最优解 个体 解 染色体 解的编码(字符串、向量等) 基因 解中每个分量的特征(如数值) 适应度 适应性函数值 种群 根据适应度函数值进取的一组解 杂交 通过变换两个解的对应分量产生新的解的过程 变异 通过变换一个解得某些分量产生一个新解的过程 表9-3 遗传算法与生物进化的比较 遗传算法 遗传算法主要借助生物进化中的“适者生存”的概念,模仿生物进化中的遗传繁殖机制,对优化问题解空间的每一个个体进行编码,然后对编码后的优化问题解空间进行组合划分,并通过迭代从中寻找含有最优解和较优解的组合 3.统计分析方法 相关分析和回归分析:相关分析是用相关系数来度量变量间相关程度的数量关系,回归分析研究是变量间的因果关系 差异分析:从样本统计量的值得出的差异来确定总体参数之间是否存在差异(假设检验),典型的方法是方差分析,即通过分析实验数据中不同来源的变异对总体变异的贡献大小,确定实验中的可控因素(自变量)是否对实验结果(因变量)有重要的影响 因子分析:是把多个可直接观测的变量转化为少数几个不相关的总和指标的多远统计分析方法,在医学、心理学和经济学与管理学等科学领域得到十分广泛的应用 聚类分析:是根据事物本身的特征研究个体分类的方法,是直接比较样本中事物之间的性质的一种方法,把性质相近的归为一类,将性质差别比较大的分为不同的类 判别分析:根据表明事物特点的变量值和他们所属的类求出判别函数,再根据判别函数对未知所属类别的事物进行分类的一种分析方法 4.关联规则算法 关联规则是描述数据库中数据项之间存在潜在关系的规则,形式为“A1∧ A2 ∧··· ∧ Am B1∧ B2 ∧··· ∧ Bn”,其Ai(i=1,2,···,m), Bj(j=1,2,···,n)是数据库中的数据项 数据项之间的关联就是根据一个事务中某些项的出现,可推导出另一些项在同类事务中也出现 关联分析的目的是找出数据库中隐藏的关联 关联规则算法分为两个步骤 求支持度大于用户指定的最小支持的数据项集,即大数据项集,对于语义约束的规则,仅求得满足约束的大数据项集 利用大数据项集产生关联规则,关联规则是挖掘算法的核心 逻辑 数据库 被选择 的数据 预处理 后的数 据 被转换 的数据 被抽取 的信息 被同化 的知识 选择 预处理 转换 挖掘 分析和 简化 图9-6 数据挖掘流程图 9.3.4 数据挖掘的流程——技术视角 从逻辑数据库开始,经过选择流程获得被选择的数据,然后对这些数据进行预处理,从而得到经过预处理的数据库 在此基础上,再对新生成的数据进行某种转换,并利用所获取的新数据进行挖掘,提出其中有用信息,再加以分析和同化,最终形成经过同化的知识,为企业决策提供支持 9.3.5

文档评论(0)

duyingjie1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档