MapReduce框架下基于R―树的K―近邻连接算法设计.docVIP

下载本文档

11
0
约2.6千字
约 5页
2016-09-07 发布于北京
举报
版权申诉

MapReduce框架下基于R―树的K―近邻连接算法设计.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

MapReduce框架下基于R―树的K―近邻连接算法设计.doc

MapReduce框架下基于R―树的K―近邻连接算法设计　　摘要：计算机技术的发展，使得算法的统计被逐步的处理出来，大规模的数据处理必须被目前阶段的算法所满足，这使得MapReduce框架下基于R-树的K-近邻连接算法被逐步应用。在MapReduce框架下，通过抽象提取的方式，能够有效地使得R-树的算法能够很好地被K-的临近算法所使用。本文就主要对MapReduce框架下基于R-树的K-近邻连接算法的设计进行了分析。　　关键词：MapReduce R-树云计算 K-近邻连接　　中图分类号：TP311 文献标识码：A 文章编号：1007-9416（2015）07-0000-00 　　在云计算模式下，能够很好的对空间数据的激增做出较好的应对与处理。MapReduce是一种集群式的能够处理大规模数据的分布式编程模型，在其应用领域有广阔的发展空间。在其处理核心数据与对数据文本进行划分的过程中，能够有效的服务与目前阶段的大型市场。　　1 MapReduce框架下R-树索引快速构建的算法　　1.1含义　　在MapReduce框架下做到对空间进行定义，以实现在不同空间上的叠加与使用，这需要尽可能地减少各个分区之间的重叠。在算法的操作与使用上，可以通过几个步骤来划分分区，利用采样技术确定空间函数的划分范围，计算机的对象分为两个方面，通过对分队对象的排列方式进行改进，可以使得R-树的索引方式有不同的变化。　　1.2 对IPSS模式进行计算　　对IPSS模式进行计算，这需要对空间模式的实际框架进行具体的演练。可以通过输入数据库的形式，使得每一个阶段内的操作范围能够达到一定的试用值。空间对象的分配与划分都是具有一定意义的，每一个划分都是独立的。在R-树的算法之中，使得数据的采集与使用构建在算法之中，对每个空间范围内的操作依次进行，可以使map函数在读取的对象上，能够使操作的过程变得更加简单。在索引构建之中，依次进行操作，这对实际范围内的引用是相当有利的。在空间数据范围内对每一个分区生成一颗R-子树索引，在索引过程中，这能使索引的生成方法得到一定的研究。如果对构建子树索引的空间范围有恒定的值，则算法之间的规范作用就能够有效地避免knnj查询中由于子树集的使用而产生的一系列问题。　　1.3算法　　在实际算法当中，有很多的问题需要对实际的空间框架进行一定意义。在构建的过程中，采用基于范围内限定的索引生成，能够使得空间的范围大于限定的范围，算法1能够自动将子树集进行索引，并产生有效的空间算法的生成框架。　　2 MapReduce框架下基于R-树的KNNJ查询　　2.1扩展框架剪枝策略　　首先，要对knnj的算法进行描述，这是由于空间算法的不稳定性，在介绍knn查询的过程之中，需要实际利用knn算法之间的结构，对实际中的问题进行了解；其次，通过参与knnj数据的算法研究可以发现，其算法模式具有稳定的可操作性，在实际研究中，能够发现对数状的生成与需要，进而使得生成的空间给临近的两个数据点之间进行连接，这就使得可操作的范围变得更加可以利用，并使得其不断的从最近的临近点去查找范围；最后，对于邻近空间的定义与使用，能够使得查询的范围得到高效的处理，并且有效地使得数据操作的空间能够对大数据的分析进行一定的操作与评估。　　2.2基于R-树的knnj查询　　基于R-树的Knnj查询，其实际的查询意义就是通过把对最基本的查询事项进行较为深入的分析，使得查询算法能够在较为合理的空间之内进行处理。这可以有效的操作于算法的空间之中。当列表算法的变量用于存储实际的索引对象与需要的时候，列表的变量发生改变，这将使得就近的空间操作与处理程序能够用于存储K近邻的查询结果。当初始化完成的时候，应该对空间操作的变量进行处理。对从H列表变量中可使用的H值，应该有一个较好的操作空间，以保证对距离测试之间的最佳情况。如果从列表变量H中提取出一个值，这将使得空间的操作范围能够有效地利用。对从H中提取出的元素，通过对索引点的操作或者是对对象结点的操作，能够有效地处理好相关的规范流程，并使得有关的算法能够在合理的范围内加以应用。　　3 设计结果分析　　3.1设计结果　　对K-的算法效果进行测试与对固定的N值的算法进行测试，能够有效地使N只对测试效果产生一定的影响。在实际测试之中，如果N-值的变化能够有效的对递增空间产生一定的改变。这就使得算法的可执行性产生不同的影响，并呈现一种有规律的线性增长，这给测试结果带来的是较为实际的影响。在实际的算法之中能够通过改变计算的节点，有效地控制好时间的递增，这就使得算法更加地稳定。　　3.2数据的规模性增长　　数据的规模性增长主要表现为，在实际的操作中，如果有具体问题的，可以从