空间数据集成与自动更新关键技术.pptxVIP

下载本文档

8
0
约5.58千字
约 56页
2019-05-12 发布于湖北
举报
版权申诉

空间数据集成与自动更新关键技术.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

;主要内容;地理空间数据库的建设与更新, 是国家空间数据基础设施建设的重要组成部分, 其质量和现势性直接影响一切应用系统分析和决策的结果。数据更新仍然存在许多不足: 数据源存在不一致、不完整和不准确性的问题; 更新的智能化程度不高; 更新过程对多种数据源整合、利用程度不高; 整个更新过程缺乏系统科学的过程控制。;数据库更新的基本过程：（1）更新数据库和目标数据库之间执行模式匹配操作,发现其间语义相同或相互的模式元素——要素类,并显式地声明彼此之间的映射关系以确定哪些类型的数据可以用于目标数据库的更新。（2）确定对应要素属性之间的关系。（3）实例关系匹配。（4）利用更新实体的信息更新目标实体。;;模式匹配指从两个数据库模式中确定语义相关的模式要素类,并声明其具体映射关系的过程。模式匹配是更新传播的基础性操作,它所取得的匹配结果可被用于指导和简化其他处理操作,保证基础地理数据库中的变化信息被充分准确地提取和集成。;（1）基于实例的模式匹配方法如果两个要数类中存在共同的实体, 这两个要素类就可以认为是相关的, 然后通过对比分析共同实体的属性值, 可进一步确定相关的属性。为了提高执行效率, 本文采用抽样统计方式发现两个要素类之间的共同实体。;二、模式匹配;（1）基于实例的模式匹配方法共同实体的识别在目标数据库要素类中随机抽取一个空间实体(ecn ), 并生成其缓冲区(brn); 在更新数据库要素类中查询完全被brn包含的候选实体集合(EM)。根据一定规则，判断EM 中是否存在一个实体(emi )与ecn是同一实体。如此循环, 直到超过预定的采用样本总量。;二、模式匹配;（1）基于实例的模式匹配方法采用式(1)来定量地计算两个要素类的相似性: SF (F1 ,F2)= N2/N1 F1 为客户数据库中的要素类; F2 为主数据库中的要素类; N1 为进行实体识别时在F1中所选的样本总量; N2为进行实体识别时在F2中能发现的对应实体总数。;（2）基于概念语义的要素类匹配方法概念匹配方法：概念信息量法、语义距离法、基于属性的语义相似度及混合式语义相似度等方法。语义距离法基本假设如下：两概念的语义距离越大，其相似度越低，反之相似度越高。;（2）基于概念语义的要素类匹配方法 ;（2）基于概念语义的要素类匹配方法基于语义距离的通名语义相似度算法中，影响语义的主要因子有：概念深度，概念密度，关系类型，关联强度和概念属性等。;（2）基于概念语义的要素类匹配方法 1）概念深度指概念节点与根节点的最短路径中包括的边数。以“IS-A”关系建立的本体概念树中，每一概念是其上位概念的细化，越到下层，概念所指的对象越具体，内涵越丰富。同等语义距离下，两个概念节点的深度越大，相似度越高，反之越低；相反，同等语义距离下二者概念层次差越小，二者语义相似度越高，反之相似度越低。;（2）基于概念语义的要素类匹配方法 1）概念深度概念深度对语义相似度影响因子的计算如式(5)，且满足。;（2）基于概念语义的要素类匹配方法 2）概念密度本体层次中，局部区域概念密度越大，说明该区域概念细化程度越大，该处概念分类越具体，在其他因素相同的条件下，直接概念子节点间的语义相似度就越高。;（2）基于概念语义的要素类匹配方法 3）关系强度本体中概念通过各种关系联系在一起，不同关系类型对概念语义相似度的影响也有所不同。如上下位的“同义关系”所表征的语义相似度应大于“整体-部分”关系所表征的语义相似度。;（3）基于概念语义的要素类匹配方法 4）改进的语义相似度算法 α、β、γ、δ为调节因子，且满足α+β+γ+δ=1。由于语义距离在相似度计算中占主导地位，其他因子起辅助作用，所以α的权重相对较大，而β、γ、δ的权重相对较小。;属性匹配是数据更新的基础，用于确定更新数据中的哪些字段可以用来目标数据字段更新。为了更全面地识别出相关的属性, 将参与匹配的属性概括为数值型和字符型两种基本类型。;（1）数值型属性采用相关分析方法,计算两个数值型属性的统计相关系数,然后取其绝对值作为两个属性的相似值。设有不同数据库的属性项X和Y,其对应的数据实例分别为(x1,x2,...,xn)和(y1,y2,...,yn),两者之间的相似性: X,Y分别为实例(x1,x2,...,xn)和(y1,y2,...,yn)的平均值。如rXY越大,说明两个属性X和Y的相似性越大。 ;（2）字符型属性相似性采用基于编辑距离的算法来计算字符型属性之间的相似性。编辑距离是指将一个字符串变为另一个字符串所需要的最小编辑操作次数。设有两个来自不同数据库的字符型属性项S和T,其对应的数据实例分别为(s1,s2,...,sn)和(t1,t2