- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘中涉及计算方法及作用研究
数据挖掘中涉及的计算方法及作用研究
摘 要: 随着计算机软件和硬件的不断发展,数据存储量以惊人的速度向前发展着,但是大量的未经过加工的数据难以直接产生效益,所以就需要智能的数据分析工具来处理这些大量的数据,数据挖掘技术就是从数据库中发现知识的过程,并且数据挖掘技术在许多学科中都得到运用,有着很好的发展前景,首先分析数据挖掘中所涉及到的模糊逻辑、神经网络、神经――模糊、遗传算法、粗糙集和混合方法等软计算方法,然后指出数据挖掘在各个领域中的作用。
关键词: 数据挖掘;软计算;模糊逻辑;遗传算法;神经网络
中图分类号:G252 文献标识码:A 文章编号:1671-7597(2011)1210094-01
1 数据挖掘中的软计算方法
1.1 模糊逻辑软计算方法。模糊逻辑软计算方法是数据挖掘中应用最早以及最广泛的软计算方法,可以这样说,模糊逻辑是软计算方法出现??前提。在数据挖掘领域内,模糊集技术占据着重要的地位,多数数据浏览方法都是基于模糊集理论来实现的。随着计算机技术的大力发展,目前模糊集被归类为数据挖掘中的另一种功能方法。
1)聚类:聚类是将具有抽象对象的集合进行分组,把类似的对象组成多个类。数据挖掘就是从庞大的数据库中找出对用户有用或者是用户感兴趣的知识。模糊集能强有力地搜索数据中的语气词汇,对它感兴趣的结构有助于定性和半定性数据的依赖度的发现以及阻止搜到无用的知识。模糊聚类算法真是由此发展出来的。它是通过兴趣度来获得有用信息的,当在处理一些不精确的数据时,它可以利用消减不符合要求的属性,以便更有效地发现有用的信息。
2)关联规则:协作规则描述的是数据不同属性之间的相互关系,也是数据挖掘中重要的一点。其中,布尔关联规则描述的是关联的属性是否在二维特征,概化关联规则考虑的是属性之间分层关系,量化关联规则描述的是离散化的属性之间的关联。由于模糊概念表示的规则更贴近于人的思维,所以,模糊技术在数据挖掘技术中发展的速度非常快。
3)数据概化:数据概化是将可理解的信息来表达数据库中最重要的部分,以供客户使用。语言概化是使用自然和可理解的词汇,首先需要用户制定概化兴趣度,然后系统从数据库中的记录来计算每个概化的有效性,最后选择最合适的语言概化。
1.2 神经网络软计算方法。由于先前神经网络的黑箱问题,它被认为在数据挖掘中并不适用。它虽不能获取有用信息,但是却很适合用于进行解释。它在数据挖掘中的主要作用体现在规则提取和自组织性上。
1)规则提取:规则提取算法是将训练过的神经网络与数据节点进行连接,其中隐藏的输出单元会自动地获取规则,然后合并,得到更多可理解的规则集。
2)自组织性:自组织性就是获得组织性和档案文件。
1.3 神经――模糊软计算方法。神经――模糊软计算方法就是把神经网络和模糊两种方法进行结合,建立了具有更强大功能的智能决策系统。通过神经网络可以获取更多的自然规则,通过模糊可以推论完整或部分信息,为用户找到具有关键决策的未知输入量。
1.4 遗传算法。遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法。遗传算法中主要包括了参数编码、初始群体的设定、适应度函数的设计、遗传操作设计以及控制参数设定五个基本要素。遗传算法具有很强的可调节性、鲁棒性和自适应性,主要用于搜集大空间集,它在解决多峰值、非线性以及全局优化等复杂度高的问题具有非常独特的优势。
1.5 粗糙集软计算方法。粗糙集理论是一种处理不确定问题的新型数学工具。它是基于给定训练数据内部的等价类建立起来的。在现实世界的数据中,常常存在一些属性不能区分的类,这种类就可以用粗糙集来近似定义。它能有效分析不精确、不确定以及不完整的信息,还能处理庞大的数据库和对冗余信息进行消除。
1.6 混合算法。混合算法就是将软计算的主要算法进行综合,混合算法在并行性、容错、自适应性和不定性管理方面可以产生更好的系统。混合系统把自动化自适应性系统变成现实。当把模糊系统、神经网络和遗传算法进行有机结合时,可以得到充分体现合理有效的认识系统的新产品。当把粗糙集、神经网络和模糊逻辑进行有机结合时,可以得到数据挖掘系统。
2 数据挖掘的作用
2.1 数据挖掘在金融业中的作用。在金融领域,数据量是非常庞大的。如银行、证券公司等交易数据都是非常巨大的。因此,可以利用数据挖掘来分析客户的信誉,防止信用卡欺诈行为的发生。典型的金融分析领域有投资评估和股票交易市场的预测。
2.2 数据挖掘在商业上的作用。在商业领域,尤其是零售业,数据挖掘的作用显得更加重要。由于MIS和码技术的普遍使用,有大量的有利于购买情况的数据,并且数据量以惊人的速度在激增。那么经营管理人员可以利用数据挖掘技术来作出正确的决策,有助于提
文档评论(0)