第7章分类与预测1 数据挖掘：概念与技术知识 .ppt

下载文档 降价啦

36
0
约1.19万字
约 116页
2018-05-29 发布于天津
举报
版权申诉
保障服务

第7章分类与预测1 数据挖掘：概念与技术知识 .ppt

1、本文档共116页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

（2.1.1）for 隐藏层与输出层中每个单元j //从第一个隐藏层开始向前传播输入（2.1.2）for 输出层中每个单元k Errk=Ok(1- Ok)( Tk - Ok) （2.1.3）for 隐藏层中每个单元j //从最后一个隐藏层开始向后传播误差（2.1.4）for NT中每条有向加权边的权值wij wij= wij+l·ErrjOi （2.1.5）for 隐藏层与输出层中每个单元的偏置θj θj=θj+l·Errj 误差后向传播算法要求输入层单元的输入是连续值，并对连续值进行规格化以便提高训练的效率与质量。如果训练样本的描述属性是离散属性，则需要对其编码，编码方法有两种： 1）p值离散属性：可以采用p位编码。假设p值离散属性的可能取值为a1, a2,…,ap，当某训练样本的该属性值为a1时，则编码为1,0,…,0；当某训练样本的该属性值为a2时，则编码为0,1,…,0；依次类推。 2）二值离散属性：除采用2位编码外还可以采用1位编码。当编码为1时表示一个属性值；当编码为0时表示另一个属性值。例7.6 假设训练样本s的描述属性值与类别属性值分别为{1, 0, 1}与1，前馈神经网络NT如图7.8所示，NT中每条有向加权边的权值、每个隐藏层与输出层单元的偏置如表7.3所示，学习率为0.9。写出输入s训练NT的过程。图7.8 前馈神经网络NT 表7.3 NT中边的权值、单元的偏置 x1 x2 x3 w14 w15 w24 w25 w34 w35 w46 w56 θ4 θ5 θ6 1 0 1 0.2 －0.3 0.4 0.1 －0.5 0.2 －0.3 －0.2 －0.4 0.2 0.1 wij和θj是随机产生的，l＝0.9 表7.4 隐藏层与输出层中单元的输入、输出单元j 输入netj 输出Oj 4 0.2*1+0.4*0+(－0.5)*1+(－0.4)=－0.7 1/(1+e－(－0.7))=0.332 5 (－0.3)*1+0.1*0+(0.2)*1+0.2=0.1 1/(1+e－0..1)=0.525 6 (－0.3) *0.332+(－0.2)*0.525+0.1=－0.105 1/(1+e－(－0.105))=0.474 表7.5 隐藏层与输出层中单元的Err 单元j Errj 6 0.474*(1－0.474)*(1－0.474)=0.1311 5 0.525*(1－0.525)*(0.1311*(－0.2))=－0.0065 4 0.332*(1－0.332)*(0.1311*(－0.3))=－0.0087 Errk=Ok(1- Ok)( Tk - Ok) 表7.6 NT中边的新权重、单元的新偏置 w46 －0.3+0.9*0.1311*0.332=－0.261 w56 －0.2+0.9*0.1311*0.525=－0.138 w14 0.2+0.9*(－0.0087)*1=0.192 w15 －0.3+0.9*(－0.0065)*1=－0.306 w24 0.4+0.9*(－0.0087)*0=0.4 w25 0.1+0.9*(－0.0065)*0=0.1 w34 －0.5+0.9*(－0.0087)*1=－0.508 w35 0.2+0.9*(－0.0065)*1=－0.194 θ6 0.1+0.9*0.1311=0.218 θ5 0.2+0.9*(－0.0065)=0.194 θ4 －0.4+0.9*(－0.0087)=－0.408 wij= wij+l·ErrjOi θj=θj+l·Errj 7.3.3 神经网络分类学习结束后，神经网络得到一组固定的权值及偏置。新样本到来后，将其描述属性值送入输入层各单元，从输入层到输出层正向传播，计算输出层各单元的值{O1, O2, …, On}，令r=max(O1, O2, …, On)，则第r个输出层单元所代表的类别就是该样本所属的类别。例如，在例7.6中，只有一个输出层单元，表示只有两个类别（A类、B类）。神经网络学习结束后，表7.6中的各权值和偏置都固定。将一个新样本X=（x1, x2, x3）送入输入层后可以计算出O6，若O6≈1，则表示X应属于A类；若O6≈0，则表示X应属于B类；若O6≈0.5，则拒绝分类。 7.4 贝叶斯分类 1. 贝叶斯公式式中，p(x)、p(y)为随机变量X=x、Y=y的概率；p(x|y)为

您可能关注的文档

文档评论（0）

yuzongxu123 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第7章分类与预测1 数据挖掘：概念与技术知识 .ppt