数据挖掘与智能决策技术简介.pptVIP

下载本文档

16
0
约7.05千字
约 56页
2015-08-03 发布于贵州
举报
版权申诉

数据挖掘与智能决策技术简介.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

根据加薪百分比、工作时长、法定节假日、及医疗保险三个属性来判断一个企业的福利状况(good或bad)。对象关系网络网络分析强弱路径自我小群体缺失角色网络分析神经网络线性回归 Logistics回归多层神经网络细胞繁殖 3.2.2.6 神经网络算法人工神经网（Artificial Neural Network，ANN）是20世纪80年代后期迅速发展起来的人工智能技术，它对噪声数据具有很高的承受能力，对未经训练的数据具有分类模拟的能力，因此在网站信息、生物信息和基因以及文本的数据挖掘等领域得到了越来越广泛的应用。在多种ANN模型中，反向传播（Back Propagation，BP）网络是应用最广的一种。神经元通过非线性函数n维的输入向量 x 被映射为变量 y mk - f weighted sum Input vector x output y Activation function weight vector w ? w0 w1 wn x0 x1 xn 神经网络的组成输出节点输入节点隐层节点输入矢量输入矢量: xi wij 基本的BP网络由输入层、输出层和隐层组成。神经网络的拓扑结构神经网络训练之前，需要设计网络拓扑结构。设计网络拓扑的关键是，确定隐层的神经元个数及各神经元初始权值和阈值（偏差）。理论上讲，隐层的神经元数越多，逼近越精确。但实际上，隐层神经元数不宜过多；否则会极大加长训练时间，并造成网络容错能力下降。经训练后的神经网络若其准确性不能被接受，则必须重新进行拓扑设计或改用不同的初始权值和阈值（偏差）。神经网络的训练训练的终止条件获得一组权重值，使得训练集中几乎所有样本都分类正确训练步骤利用随机值对权值进行初始化将训练样本逐一地输入给神经网络，进行训练对于每个神经元将其所有的输入值进行线性求和计算得到总的输入利用激励函数计算其输出值计算误差修正网络权值和阈值（偏差） BP神经网络 BP神经网络通过迭代处理一组训练样本，将各样本的网络预测与实际已知类标号进行比较实现学习训练，反向修改网络的权值，使得网络预测与实际类之间的误差平方最小。BP神经网络按照最优训练准则反复迭代，确定并不断调整神经网络结构，通过迭代修改，当误差收敛时学习过程终止。因此，具有分类准确、收敛性好、动态性好和鲁棒性强等优点。 BP神经网络存在的问题收敛速度问题 BP分类器最大的弱点是其训练速度非常缓慢，难以收敛。尤其是当网络的训练达到一定程度后，收敛更为缓慢。局部极小点问题 BP算法采用的是梯度下降法，对一个复杂的网络而言，其误差曲面是一个高维空间中的曲面，其中分布着许多局部极小点，一旦陷入了局部极小点则算法很难逃离出来。 BP神经网络存在的问题网络瘫痪问题在训练过程中，权值可能变得很大，这会使神经元的网络输入变得更大，从而使得其激励函数的一阶导函数在此点上的取值很小。此时的训练步长会变得非常小，最终导致网络停止收敛，这种现象即是所谓的网络瘫痪现象。关联规则挖掘实例通过发现顾客放入其购物篮中不同商品之间的联系，分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买，这种关联的发现可以帮助零售商制定营销策略。例如，在同一次购物中，如果顾客购买牛奶的同时，也购买面包（和什么类型的面包）的可能性有多大？这种信息可以引导销售，可以帮助零售商有选择地经销和安排货架。例如，将牛奶和面包尽可能放近一些，可以进一步刺激一次去商店同时购买这些商品。关联规则挖掘实例购物篮关联分析实例图 3.3.1 基本概念 Customer buys diaper Customer buys both Customer buys beer “啤酒与尿布”的关联规则 For rule A ? C support = support({A ?C}) = 50% confidence = support({A ?C})/support({A}) = 66.6% For C ? A (50%, 100%) The Apriori principle: Any subset of a frequent itemset must be frequent Min. support 50% Min. confidence 50% 关联挖掘实例 3.5 数据挖掘的可视化以可视化的方式展示数据挖掘获取的相关知识。例如：－散点图和盒图 (ob