- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
增量精炼的GIS交互查询的空间连接技术.
摘要:
越来越多的新兴网络数据库应用程序处理大型地标数据集。然而,通过空间查询探索这些大型数据集十分耗费时间和资源。互动空间查询的需要出现在多项领域上,例如地理信息系统(GIS)进行有效的决策支持。在本文中,我们提出一个新的GIS互动空间查询处理技术。我们提出一系列的增量精炼空间连接算法,到目前为止可以用来报告增量精炼运行集合查询同时显示元数据集采样的实际查询结果。我们的目标是最小化时间直到通过置信区间(congfidence interval)衡量查询结果对于用户来说是可接受的精确的估计。我们的方法能够让更多的交互式数据探索和分析。在关系数据库中相似的已做了工作,据我们所知,这是第一次在GIS中使用这个方法。我们通过大量的实验性能比较,调查和评估不同的抽样方法。基于真实和综合数据的实验显示当使用完全R—树连接时,一个数量级(order of magnitude)响应时间改善和最后获取的结果有关。我们也显示了不同索引结构对我们算法的性能影响通过使用三种有名的抽样方法。
关键字:
交互式查询,抽样,估计,置信区间,空间连接,窗口查询,R-树,人口比例,GIS
1.介绍
在很多领域和应用程序中使用GIS来探索大型地标数据集,为了获取直觉知识和洞察存储的信息。在GIS中为了不同的目的经常使用数据分析,比如,科学搜索和决策支持。这个数据分析与集合查询有直接关系比如空间连接。集合查询要求存取大容量的数据集并且经常计算精确的数字查询结果。然而,计算精确的大数据集的查询结果会耗费很多时间由于完整的数据集大小和空间的地理相关数据比例。GIS和空间数据集提供了一些算法用来计算精确的空间数据的查询结果,其中一些算法对于探索大型空间数据集在时间上是不允许。
在一些GIS应用程序中查询响应时间是挑剔的,因此,在合理的短时间内获取近似的查询结果远远比花费很长时间评估精确的结果要重要的多。比如,预先警告系统如洪水和火灾探测系统需要尽快的获取查询结果。这些系统将对是否疏散危险中的人们做出及时的决定。因为,它们需要在在查询数据处理的早期阶段检测出异常情况。在合理的错误范围内获取一个快速的查询结果比花费很长时间得到精确的结果更好。
图表1的例子显示了我们实验中使用的部分真实数据集的,这个实验是美国的煤矿资源,其参杂了地球化学松散的沉淀物(geochemical unconsolidated sediments)。这个查询结果对分析如湖泊和河流这些沉淀物如何影响煤矿资源如盐石是很有帮助的。假设一些数据集需要相互关联,获取二个数据集的交集的准确数量要花费数天。一个近似的结果是足够的并且避免浪费计算时间,因此允许更有效率的数据挖掘。我们的目标就是加速GIS数据的挖掘处理同时提供一个估计结果的统计置信(statistical confidence)。
在这篇文章中,对于GIS的空间连接我们提出一个新的交互查询处理技术,它将返回有界置信区间内的最终结果的增量精细运行估计 ,同时展示相连接的数据集的部分结果,一个近似的结果,界于say bounded by 5% of the exact answer with 95% probability (confidence level)。这个近似结果通过使用数据集的子集计算所用时间是计算精确结果所用时间的十分之一。同时,目前用户能够看到真实的连接索引。
为了使系统更加具有交互性,用户可以停止查询结果是当结果是足够好或者指定想得到的精度。在传统的GIS中,空间查询以模块化的形式生成,用户必须控制查询处理(query processing)。用户只能提交他们的查询,等待很长时间看不到任何结果直到最后一个结果返回。交互式查询处理(Interactive query processing)方式能够为更有效率的数据挖掘和更有效率的决策支持提供灵活的方法。这个方法允许快速的获取查询结果是否有用的消息,因此能够更改查询处理或者相应的停止它。由于GIS查询主要用来获取大型数据集和他们之间的联系,这个交互式查询处理技术对GIS最终用户(GIS end users)更加具有吸引力。用户经常希望形象化查询结果,在交互模式下实现将大大增加了GIS的实用性。
有时仅仅一个集合查询结果(aggregate query result)价值是足够的,我们的目的是最小化需求的时间提供部分结果以及任一想得到的集合价值的一个有界置信区间估计。如果获取一个精确的结果的查询仅仅需要30s相比较而言使用我们方法获取一个估计值需要5s,这个方法是无意义的。另一方面,如果我们花费15min计算一个置信区间的有界估计与花费3h计算一个精确结果相对比,我们的方法是很有吸引力的。当我们处理的GIS数据是字节或者系统大小时这种情景是可能的。因此,一些GIS应用程序会从我们的方法中获
您可能关注的文档
- 增值税学习心得..docx
- 增值税发票查询平台(增值税发票取消认证后主要操作流程)..doc
- 增值税法重点难点..doc
- 增值税的定义..doc
- 增值税管理现状及分析..doc
- 增值税相关业务知识整理(新变化部分未涉及)..doc
- 增值税纳税评估疑点分析方法..doc
- 增值税小规模纳税人网上申报操作流程..doc
- 墙体计算实例..doc
- 墙和楼地层构造设计任务书--6.10..doc
- Unit 6 Get Close to Nauture Lesson 22 -课件-2025-2026学年度北京版英语四年级上册.pptx
- Unit 7 Be Together Lesson 23 -课件-2025-2026学年度北京版英语四年级上册.pptx
- 2025食品饮料行业AI转型白皮书-2025食品饮料行业数智化转型领先实践.pdf
- Unit 7 Be Together Lesson 24 -课件-2025-2026学年度北京版英语四年级上册.pptx
- Unit 7 Be Together Lesson 25 -课件-2025-2026学年度北京版英语四年级上册.pptx
- Unit 7 Be Together Lesson 26 -课件-2025-2026学年度北京版英语四年级上册.pptx
- 2025年广州体育职业技术学院单招职业倾向性考试题库完美版.docx
- 软件公司员工考勤异常处理.doc
- 2025年土地登记代理人之土地登记相关法律知识题库500道及完整答案【有一套】.docx
- 2025年四平职业大学单招职业适应性考试题库含答案.docx
文档评论(0)