- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类分析方法在网格技术中的应用
摘要:建立在网格基础上的数据挖掘结合了网格技术的优点,能够对各种信息载体中分布的海量信息进行高效的处理、分析和挖掘。本文分析了网格技术与聚类分析方法的特点,使用基于网格方法的数据分析方法将空间划分为由(超)矩形网格单元组成的网格,然后在网格单元上进行聚类分析,以达到更加深入的进行数据挖掘分析之目的。
关键词:数据挖掘;网格技术;聚类分析
中图分类号:TP311 文献标识码:A文章编号:1007-9599 (2011) 17-0000-01
Cluster Analysis Method Application of Grid Technology
Ma Dongmei
(Xinjiang Tianshan Vocational and Technical College,Urumqi830017,China)
Abstract:In the grid based on data mining combines the advantages of grid technology to various information carriers in the distribution of vast amounts of information for efficient processing, analysis and mining.This paper analyzes the grid and cluster analysis of the characteristics,the use of grid-based methods of data analysis methods will be ground into space(hyper)rectangular grid consisting of grid cells,then the cluster analysis of grid cells in order to achieve a more in-depth analysis of the data mining purposes.
Keywords:Data mining;Grid;Cluster analysis
一、引言
随着信息技术的飞速发展,人们对计算机信息处理的要求越来越高,同时处理、传输、储存各种信息的数据量也越来越庞大。如何进一步增强计算机信息系统的处理能力,从海量的数据中提取有益的资源,便成为人们不断追求的目标。网格技术和数据挖掘技术的发展,为解决此问题提供了一种有效的办法。网格是一个集成的资源环境,它能够充分吸纳各种资源,并将它们转化成一种随处可得的、可靠的、标准的、经济的能力。这些资源包括计算资源、网络通信资源、数据资料、仪器设备、知识等各种各样的资源。网格计算就是基于网格的问题求解。数据挖掘就是从大量的数据中发现或挖掘知识,而网格上含有丰富的数据,是数据挖掘的理想目标。基于网格的数据挖掘就是建立在数据网格的基础设施和相关技术的基础上,在广域分布的海量数据和计算资源的环境中发现数据模式,获取新的科学知识和规律。
二、基于网格的数据挖掘
网格计算技术是解决复杂海量科学数据的访问存储组织和管理的一种有效技术,是广域分布的异构虚拟组织间实现协同资源共享、多领域的科学和工程的问题求解。建立在网格基础上的数据挖掘结合网格计算的思想及其技术的优点,能够对广域分布的海量数据进行高效的处理、分析和挖掘,将给信息分析处理的效率带来极大的促进。(一)网格数据挖掘过程:数据的处理,数据的分析与挖掘,模式的评价。(二)网格数据挖掘的特点:超强的计算能力;具有分布性和动态性;具有高性能的I/O负载平衡能力;高效的数据存储服务、传输服务和复制管理。(三)聚类分析在网格计算中的实现方法。
三、网格聚类过程划分
基于网格聚类算法的第一步是划分网格结构,按搜索子空间的策略不同,主要有基于由底向上网格划分方法的算法和基于自顶向下网格划分方法的算法。由底向上划分方法只需对数据集进行一次线性扫描以及较高的簇的描述精度,算法的效率与维度密切相关。自顶向下划分方法能够自动根据数据的分布对空间进行划分,可以快速将大型高维数据集中的簇分隔开,数据空间维度对网格计算的影响较小。可以看出,两类方法适用于不同的问题。前者适于处理高维数据集,后者能有效处理存取代价较大的超大型数据集与动态数据。
四、基于网格的聚类过程分析
基于网格的聚类算法的基本过程是,首先将数据空间W划分为网格单元,将数据对象集O映射到网格单元中,并计算每个单元的密度。根据用户输入的密度阈值Min Pts判断每个网格单元是否为高密度单元,由邻近的稠密
您可能关注的文档
最近下载
- 中国移动河北省分公司校园招聘考试试题及详解-笔试真题.pdf VIP
- 2023年下半年教师资格考试真题及答案-301小学《综合素质》.docx
- 章市场营销组织与控制.pptx VIP
- 艺术导论智慧树知到答案章节测试2023年山东农业工程学院.pdf VIP
- 轴承检查方法.doc VIP
- 8.2 化学品的合理使用(教学设计)-2024-2025学年高一下学期化学人教版(2019)必修第二册.docx VIP
- 提高儿科雾化吸入规范率PPT(内容完整版).pptx VIP
- 提升住院患者雾化吸入治疗的规范率PDCA.pptx VIP
- 艺术导论知到智慧树期末考试答案题库2024年秋山东农业工程学院.docx VIP
- 化学丨河南省2025届高三下学期5月考前适应性大联考试卷及答案.pdf
文档评论(0)