- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
弱关联冗余环境下挖掘算法研究
弱关联冗余环境下挖掘算法研究
摘 要:在弱关联冗余环境下,开展的挖掘算法应用需要考虑关联属性,本文主要从模糊神经元网络学习算法与弱关联规则模型,建立两方面内容展开探讨,整理出算法应用所产生的数据信息,对大数据环境挖掘算法进行深入研究,为网络环境性信息处理任务的高效开展,建立一个稳定基础环境。
关键词:弱关联;冗余环境;挖掘算法
中图分类号: TP3-0 文献标识码:A
Abstract:In the week correlation redundant environment,the correlation attributes need to be taken into consideration in the application of mining algorithm.On the basis of the fuzzy neural network learning algorithm and the weak correlation rule model,the paper discusses the two aspects,sorts out the data generated through the algorithm,further studies the mining algorithm of big data environmental information,and establishes a stable fundamental environment in order to efficient process the network environment information.
Keywords:weak correlation;redundant environment;mining algorithm
1 引言(Introduction)
本文主要从模糊神经元网络学习算法与弱关联规则模型建立两方面内容展开探讨,整理出算法应用所产生的数据信息,对大数据环境挖掘算法进行深入研究,为网络环境性信息处理任务高效开展建立一个稳定基础环境。本文提出了一种基于弱聚类算法的云计算环境下海量数据中弱关联挖掘方法,针对弱关联冗余环境进行,通过数据的描述特征对数据特征进行分解,依据数据特征,对全部数据进行融合。基于关联决策概率将云计算环境下海量数据进行有效划分,完成所有数据特征关联概率的计算,通过弱聚类方法对属性元素进行分类,将数量型元素转换成类别型,通过弱化关联规则方法,对经聚类处理后的数据进行挖掘。
2 弱关联冗余环境下的挖掘算法综述(Summarize
on mining algorithm in weak correlation
redundant environment)
2.1 模糊学习算法
模糊神经学习算法是当前数据挖掘的主流技术,采用弱关联思想设计原则中,系统之间关联会尽可能减少,模拟学习算法应用后系统运算速度提升有明显帮助。弱关联环境下对信息数据处理使用效率都有极高的要求,如果不能解决所遇到的问题,在建立系统管理控制环境期间,应用模糊数据运算分析学习方法,能够帮助节省大量数??运算所用时间,并在最终的控制计划山模糊学习算法中模拟神经元原理,能够根据弱关联环境下的系统联系选择运输,基于云计算环境下不断学习数据更新,达到记忆效果。模糊学习运算能够实现同步数据挖掘,减少数据分析中不必要的时间。建立在弱关联环境中的各项学习控制计划中,通过分析运算控制方法,最终问题解决能力也不会因此受到影响。模糊学习算法是针对系统运行中控制能力提升进行的,弱关联冗余系统部分在控制运算中通过学习算法可以将不必要的部分选择删除,节省挖掘算法运行所用时间。模糊学习算法中会涉及隐藏数据,模拟神经元来快速判断这部分信息[1]。
2.2 挖掘算法中的决策树算法
应用该种算法,需要选择属性用信息增益变化数据子集,建立符合运行模式的信息获取环境,从而实现对信息传输数据决策范围判断,也就是熵的变化值,而C4.5用的是信息增益率,也就是多了个率嘛。一般来说,率就是用来取平衡用的,就像方差起的作用差不多,比如有两个跑步的人,一个起点是100m/s的人、其1s后为110m/s;另一个人起速是1m/s、其1s后为11m/s。在这里,其克服了用信息增益选择属性时偏向选择取值多的属性的不足。在树构造过程中进行剪枝,我在构造决策树的时候好讨厌那些挂着几个元素的节点。对于这种节点,干脆不考虑最好,不然很容易导致overfitting。对非离散数据都能处理,这个其实就是一个个式,看对于连续型的值在哪里分裂好。也就是把连续性的数据转化为离散的值进行处理。能够对不完整数据进行
文档评论(0)