- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘的一种新颖算法
文章对神经网络的数据挖掘方法进行了详细的研究, 包括数 据挖掘的工作流程、 神经网络的基本概念和结构、 实现的关键技 术以及神经网络的应用,验证了算法的有效性和高效率性。
数据挖掘技术是一个年轻且充满希望的研究领域, 商业利益 的强大驱动力将会不停地促进它的发展. 每年都有新的数据挖掘 方法和模型问世,人们对它的研究正日益广泛和深入。
神经网络技术近来在各领域得到广泛应用 , 它通过对训练集 的反复学习获取知识 , 具有直观性、并行性和抗噪性。数据挖掘 就是从大型数据库的数据中提取人们感兴趣的知识, 这些知识是 隐含的,提取知识表示为概念、规则、规律、模式等形式。在数 据挖掘过程中, 人们并不知道要发现的知识, 而由计算机对原始 材料进行分析, 将那些人们不曾拥有的知识发掘出来, 这是一个 知识发现的过程。即将 KDD中进行知识学习的阶段成为数据挖 掘。
神经网络的概念和结构
人工神经网络由大量的处理单元 (人工神经单元、 处理元件、 电子元件、光电元件 ) 经广泛互连而成的人工网络,用来模拟神 经系统的结构功能。 在构造人工神经网络时, 首先应该考虑的问 题是如何构造神经元。 在对生物神经元的结构、 特性进行深入研 究的基础上,心理学家麦克洛奇和数理逻辑学家皮滋于 1943 年 首先提出了一个简化的神经元模型, 称为M-P模型,如图2所示:
在图 1 中,圆表示神经元的细胞体; 表示外部输入,对应 于生物神经元的树突, 为兴奋性突触连接, 为抑制性突触连接; 表示神经元兴奋的阀值; 表示输出,它对应于生物神经元的轴 突。M-P模型确实在结构及其功能上反映了生物神经元的特征。 但是,M-P模型对抑制性输入赋予了 否决权,只有当不存在抑 制性输入,且兴奋性输入的总和超过阀值时,神经元才会兴奋。
在M-P模型的基础上,根据需要又发展了其他一些模型, 目前常
用的模型如图 3 所示。在图 2 中 为该神经元的输入, 为该神经 元分别与各输入之间的连接强度,称为连接权重; 为该神经元 的阀值; 为外部输入的控制信号,它可以用来调整神经元的连 接权值,使神经元保持在某一状态; 为神经元的输出。由此结 构可以看出, 神经元一般是一个具有多个输入但只有一个输出的 非线性器件。
神经网络的模型 网络模型是人工神经网络研究的一个重要方面, 目前已经成 为开发出了多种不同的模型 。BP模型是一种用于前向多层神经
网络的反传学习算法。
BP 网络结构
BP算法用于多层网络结构。网络中不仅有输入结点、输出 结点,而且有一层或多层隐节点,如图 3:
BP 网络结构算法
BP算法的学习过程是由正向传播与反向传播组成的。正向 传播用于网络计算, 对某一输入求出它的输出; 反向传播用于逐 层传递误差,修改连接权值,使网络能进行正确计算。一旦网络 经过训练用于求解现实问题, 则就只需正向传播, 不需要再进行 反向传播。具体算法:
⑴ 从训练样例集中取一样例,把输入信息输入到网络中。
⑵ 由网络分别计算各层节点的输出。
⑶ 计算网络的实际输出与期望输出的误差。
⑷ 从输出层反向计算到第一个隐层,按一定原则向减小误 差方向调整网络的各个连接权值。
⑸ 对训练样例集中的每一个样例重复以上步骤,直到对整 个训练样例集误差达到要求时为止。
神经网络的应用
图 4 是一个预测贷款拖欠情况的神经元网络图。 圆圈表示节 点,圆圈之间的连线表示连接。 神经元网络从左边的节点获得预 测属性值,对于这些值进行计算后,在最右边的节点产生新值, 最右节点的值表示神经元网络模型做出的预测。 在这里, 神经网 络把年龄和收入作为输入的预测属性, 预测一个人是否会拖欠银 行贷款。进行预测中,神经元网络从输入节点获得预测属性的值, 这些值称为节点的值。 节点与连接中存储的值相乘, 得到的值在 最右节点相加, 再进行指定的阈值运算, 得到的数值就是预测值。
如果得的值是零, 则认为这条记录的信用风险较低 (无拖欠情况 发生);如果得到的值为 1,就认为这条记录的信用风险较高 (很 可能拖欠贷款)。
对图 4 的计算进行标准化,得到如图 5 的结果。年龄 47被 标准化到 0.0 和 1.0 之间,变成 0.47 ,而收入值被标准化为 0.65 , 这时,神经网络做出的预测是,收入为 6500 元,年龄为 47 岁的 顾客是否会拖欠贷款,连接权值分别为 0.7 和 0.1 ,节点值与连 接权值相乘后得到的结果为 0.39 。经过训练后的网络用输出 1.0 表示拖欠,输出 0.0 表示不拖欠。这里得到的输出值 0.39 更接 近于 0.0 ,因此对这条记录做出的预测是不拖欠的。
4. 结束语
数据挖掘只是一个工具 , 不是万能的。数据挖掘的成功 , 要求 对期望解决问题的领
您可能关注的文档
最近下载
- 想象与真实:网络玄幻小说《诡秘之主》的空间叙事研究.pdf VIP
- GB 1499.2-2024 钢筋混凝土用钢 第2部分:热轧带肋钢筋.pdf VIP
- 2024~2025学年10月山东青岛城阳区青岛实验高中高一上学期月考数学试卷(详解版).pdf VIP
- 《中国重症肌无力诊断和治疗指南(2025版)》解读PPT课件.pptx VIP
- 国庆双节小区物业安全温馨提示.doc VIP
- 《强制性条文实施计划》.docx VIP
- 长春易加科技-数字化互联化智能工厂解决方案.pdf VIP
- 23CJ87-1 采光、通风、消防排烟天窗(一)参考图集.docx VIP
- 车辆GPS动态监控管理制度完整.doc VIP
- 2-2《TIPS操作手册(公共代码管理子系统)》.pdf
文档评论(0)