- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网易视频云hadoop中空间数据的存储(二)
网易视频云:Hadoop中空间数据的存储(二)在前一节中,我们讲解了空间数据在Hadoop中的存储,通过将块进行可视化来分析了下Hadoop在存储空间数据的缺陷,可能远远不止这一点。今天,网易视频云就基于比较完善成熟的SpatialHadoop平台做一下同样的实验,来看下在SpatialHadoop平台中如何体现空间数据的特性。SpatialHadoop平台是由美国明尼苏达大学计算机系(提到这个大家是不是很熟悉,曾经的mapserver)Mokbel教授所带团队研发,目前平台持续更新中。接着上一节。 实验准备:1、数据集:全国县级行政单元(约148MB)2、实验环境:SpatialHadoop2.3数据都是一样的。在SpatialHadoop中,数据被分为了四部分。这里我们先不去纠结为什么分为四部分。在下一节的空间索引中我会具体介绍。我们直接看下数据被切分后的结果。这里的结果少几个字段,被我删掉了,忘记保留原本了,会在下一节中体现。这里我们可以看到四个多边形,这是四个块的外包矩形,后面还有四个块的大小,包含多边形个数等要素,一看就知道是索引,下节来看下吧。别的就不说了,直接可视化每一个块,看下数据是不是都归拢好了,是不是我们期待的每个快最好是相邻的多边形。我们首先来看下有没有出现同一条记录被物理切分的现象。这里你可以看到已经完全闭合的一个多边形了。是和Hadoop中不一样的,那么这里存储的多边形是不是在空间上保持了相邻呢,我们直接可视化。\Part-00000中数据的可视化结果:? Part-00001中数据的可视化结果:????? Part-00002中数据的可视化结果:??? ? Part-00003中数据的可视化结果:这里又忘记不要填充颜色了,就这样吧。总之在每一个块中没有发现空白的地方就代表了这个是相邻的多边形被物理分割的时候放在了一起。这样就有利于进行空间操作。我们来看下数据对整个区域的划分情况。
文档评论(0)