模式匹配的映射表示.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式匹配的映射表示 目前,数据集成和模型管理已成为数据库学术界的研究热点。数据集成和模型管理的核心是不同结构模式的适应。模式匹配是异构模式之间数据集成和管理的最基本的问题, 两个模式匹配的结果可以用模式映射来表示。现在, 很多大学和公司都在从事与模式匹配和模型管理的研究, 然而目前大部分研究还只是集中在如何发现和找到模式的元素匹配对, 而没有给出映射本身的形式化定义和表达。大部分的研究使用简单的关系模型来存储元素的匹配对, 这样的映射表达缺乏足够的语义表现力和处理能力。 在文献中, 模式的映射被定义为一种模型, 这种模型由映射元素以及元素的简单对应关系构成, 文献中赋予映射模型两个“射”, 用来表示映射元素与要匹配模式的元素之间的关系。然而, 这种模型无法表达元素之间的复杂的逻辑关系, 无法表达两个元素的数据对应关系等。文献中同样缺乏对映射的有效表达。 文献第一次系统地讨论映射的定义和表达式, 作者借用一个帮助模型 (Helper Model) , 基于不同元素之间的公式而形式化地定义了映射的框架, 并详细地讨论了映射的语义和性质。利用查询回答能力 (Query Answerability) 、映射推理 (Mapping Inference) 、映射合成 (Mapping Composition) 等表征映射的能力和强弱, 映射应该具有的性质也在文中得到了详细的讨论。然而, 作者并没有讨论表达式和公式可能的形式, 而且, 帮助模型的选择和形式也没有给出说明。 在复杂的匹配情况下, 如何建立有效的表达式是非常关键的, 在文献中, 基于普通的关系代数, 作者给出了几个扩展的操作符。但是, 这些操作符有的实际上无法具体定义, 还有一些匹配的情况也没有考虑。 基于以上分析, 这里首先在第一节中分析了匹配的几个复杂但是必须考虑的结果, 讨论了模式匹配中可能的复杂匹配关系。在第二节中给出了一个映射框架的定义, 该框架充分考虑了模式匹配的复杂情况和异构模式间的差异, 基本可以适应目前的映射表达要求。利用定义好的框架, 第三节讨论了在数据集成上如何应用映射框架。在第四节中进行了总结并说明了将来可能的研究方向和问题。 1 映射关联关系 大部分模式匹配的算法使用关系, 即简单的元素响应对来表示不同模式之间的映射 (Mapping) 关系, 这样的表达方法使得很多复杂的匹配关系无法得到有效的表达, 对数据集成、模式合并、映射的重用以及合成等带来很大的不便。下面是一些无法使用简单的元素响应对来表示的模式匹配关系: 1.1 条件匹配 所谓条件匹配, 即不同模式之间的元素是在一定的条件下匹配的。 1.2 一些匹配 部分匹配是指源模式中的元素的部分和目标模式中的元素匹配。 1.3 有多个元素的匹配情况 在很多情况下, 由于不同的设计者可能对元素有不同理解以及应用场合不同, 造成了一个模式中定义了一些元素, 而目标模式的一个元素的值是这些元素的枚举选择。例如图1中学生的英语4、6级通过情况, 模式1采用了两个元素来表示, 而模式2则用一个元素来列举不同的等级。这样的匹配是非常难用简单的元素响应对来表示的。 图1表示一个元素对值的匹配情况, 模式S1的grade 4和grade 6是两个布尔型元素, 表示学生的大学英语4、6级是否通过。模式S2则使用了字符串型元素grade来表示英语的通过级别。这样对应元素在类型和值之间的差异导致了在映射时需要根据它们的值进行转化, 即将S1元素的布尔型的值转化为模式2的元素grade的值, 表示英语的等级。例如, 设S1的grade6为“TRUE”, 则对应的S2的元素grade的值为“grade6”。 1.4 映射模型的建立 不同的模式可能采用不同的计量单位, 或者总体和部分的需求不同, 在不同的模式中可能采用不同的度量单位, 所以元素的匹配经常需要经过计算才能进行。例如, 单价和数量可能是源模式的两个元素, 而目标模式中可能只有一个总价, 这样, 需要计算单价和数量的积, 才能和目标模式的总价匹配, 这种匹配也是难以用简单的元素响应对来表达的。 非匹配元素的保持也是一个非常重要的性质。在很多情况下, 希望可以重用以前的匹配结果, 因为重用可以提高匹配的精度。然而, 如果某一个元素在目标模式中找不到对应的元素, 在简单的元素响应对的表示方法下, 没有匹配的元素将被去掉。这样, 在重用匹配结果时, 没有匹配的元素的信息无法重用。所以有必要保留非匹配的元素, 如果两个匹配正好可以弥补各自的非匹配的情况, 则两个元素可以再次利用。 图2描述了一个比较复杂的映射。图2包含两个模式, 即客户和商店的模式, 其中S1是关系模型, S2采用了半结构化的XML模式。 这个映射包含8个映射元素, me1~me8分别对应了模式S1和S2的不

文档评论(0)

xcwwwwws + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档