第7章分类与预测数据挖掘：概念与技术知识 1.ppt

下载文档 降价啦

19
0
约1.31万字
约 116页
2018-05-29 发布于天津
举报
版权申诉
保障服务

第7章分类与预测数据挖掘：概念与技术知识 1.ppt

1、本文档共116页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

例如，假设训练样本s的描述属性值与类别属性值分别为{1, 0, 1}与1，前馈神经网络NT如下图所示，NT中每条有向加权边的权值、每个隐藏层与输出层单元的偏置如表7.3所示，学习率为0.9。写出输入s训练NT的过程。一个前馈神经网络NT NT中边的权值、单元的偏置 x1 x2 x3 w14 w15 w24 w25 w34 w35 w46 w56 θ4 θ5 θ6 1 0 1 0.2 －0.3 0.4 0.1 －0.5 0.2 －0.3 －0.2 －0.4 0.2 0.1 wij和θj是随机产生的，l＝0.9 隐藏层与输出层中单元的输入、输出单元j 输入netj 输出Oj 4 0.2*1+0.4*0+(－0.5)*1+(－0.4)=－0.7 1/(1+e－(－0.7))=0.332 5 (－0.3)*1+0.1*0+(0.2)*1+0.2=0.1 1/(1+e－0..1)=0.525 6 (－0.3) *0.332+(－0.2)*0.525+0.1=－0.105 1/(1+e－(－0.105))=0.474 隐藏层与输出层中单元的Err 单元j Errj 6 0.474*(1－0.474)*(1－0.474)=0.1311 5 0.525*(1－0.525)*(0.1311*(－0.2))=－0.0065 4 0.332*(1－0.332)*(0.1311*(－0.3))=－0.0087 Errk=Ok(1- Ok)( Tk - Ok) NT中边的新权重、单元的新偏置 w46 －0.3+0.9*0.1311*0.332=－0.261 w56 －0.2+0.9*0.1311*0.525=－0.138 w14 0.2+0.9*(－0.0087)*1=0.192 w15 －0.3+0.9*(－0.0065)*1=－0.306 w24 0.4+0.9*(－0.0087)*0=0.4 w25 0.1+0.9*(－0.0065)*0=0.1 w34 －0.5+0.9*(－0.0087)*1=－0.508 w35 0.2+0.9*(－0.0065)*1=－0.194 θ6 0.1+0.9*0.1311=0.218 θ5 0.2+0.9*(－0.0065)=0.194 θ4 －0.4+0.9*(－0.0087)=－0.408 wij= wij+l·ErrjOi θj=θj+l·Errj 这里只有一个训练样本，只示例了学习过程中的一次迭代过程。在实际应用中，训练样本多，迭代次数多，这样得到的结果好。激活函数的选取很重要：收敛收敛速度 7.3.3 神经网络分类学习结束后，神经网络得到一组固定的权值及偏置。新样本到来后，将其描述属性值送入输入层各单元，从输入层到输出层正向传播，计算输出层各单元的值{O1, O2, …, On}，令r=max(O1, O2, …, On)，则第r个输出层单元所代表的类别就是该样本所属的类别。例如，在上例中，只有一个输出层单元，表示只有两个类别（A类、B类）。神经网络学习结束后，表7.6中的各权值和偏置都固定。将一个新样本X=（x1, x2, x3）送入输入层后可以计算出O6，若O6≈1，则表示X应属于A类；若O6≈0，则表示X应属于B类；若O6≈0.5，则拒绝分类。 7.4 贝叶斯分类 1. 贝叶斯公式式中，p(x)、p(y)为随机变量X=x、Y=y的概率；p(x|y)为已知Y=y时，X=x的条件概率；p(y|x)为已知X=x时，Y=y的条件概率。 7.4.1 贝叶斯分类概述根据贝叶斯公式，可以得到贝叶斯分类公式：式中，p(a1, …, am)为m个描述属性A1=a1, …, Am=am的联合概率；p(c)为类别属性C=c的概率，也称为类别c的先验概率；p(a1, …, am|c)为已知C=c时，A1=a1, …, Am=am的条件概率，也称为类条件概率；p(c|a1, …, am)为已知A1=a1, …, Am=am时，C=c的条件概率，也称为类别c的后验概率。贝叶斯分类的分类阶段就是给定新样本的描述属性值a1,…,am，根据上述公式，计算各个类别的后验概率，后验概率最大的类别就是新样本的类别属性值，即新样本的类别为：综合上述两式，得到新样本的类别为：贝叶斯分类的学习阶段就是根据训练样本，计算各个类别的先验概率、各个类条件概率。例如，训练样本如下表：年龄收入学生信誉购买计算机 ≤30 高否中是 ≤30 高否优否 31..40 高否中是 ≥41 中否中是 ≥41 低是中是 ≥41 低是

您可能关注的文档

文档评论（0）

yuzongxu123 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第7章分类与预测数据挖掘：概念与技术知识 1.ppt