基于部分函数依赖的结构匹配方法.docVIP

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于部分函数依赖的结构匹配方法

基于部分函数依赖的结构匹配方法 李国徽1) 杜小坤1) 杜建强2) 1)(华中科技大学计算机学院 武汉430074) 2)(江西中医学院计算学院 南昌 330006) 摘要 模式匹配是模式集成、数据仓库、电子商务以及语义查询等领域中的一个难点。它主要利用元素自身信息(如元素名、数据类型等信息)、数据实例信息(模式中的数据)和结构信息(模式元素相互关联的关系)来挖掘元素语义以获得正确的映射关系。本文介绍了一种将数据实例信息与结构信息相结合来辅助匹配的新方法。本方法首先根据模式对应的数据实例信息来计算模式元素间的部分函数依赖度(模式结构信息),然后根据部分函数依赖关系建立模式元素间的依赖图(图3),再根据元素依赖图计算元素间的结构相似度,最后得到模式元素间的映射关系。由于利用了更多的结构信息辅助匹配,所以本方法在性能上要优于其它仅使用完全函数依赖结构信息进行匹配的方法。实验表明本方法在查准率、查全率以及全面性等各个指标上都优于已有的其它方法(图8、图9)。 关键字 模式匹配,部分函数依赖,结构匹配 中图法分类号 TP311.131 1引言 模式匹配是模式间的一个二元操作,它以源模式和目标模式为输入,以两个模式中元素(在关系型数据库中对应于关系的属性)间的映射关系为输出。随着数据库应用的日趋广泛,模式匹配在越来越多的应用领域中发挥着重要作用,如:模式集成、数据仓库、电子商务、语义WEB和P2P数据库等领域。目前的模式匹配工作大都是由操作人员手工进行,这就要求操作人员必须对数据库的模式结构以及每个模式元素的语义都很熟悉,这是一个枯燥、费时且容易出错的工作。随着数据库技术的不断发展,数据库模式逐渐增大。数据库中有数百个关系、数千个属性都是比较常见的,而且它们由不同的设计人员设计,这就使得全面了解数据库的模式结构变得愈加困难,甚至是一个不太可能完成的任务,因此需要一种自动的模式匹配方法来代替费力、费时且容易出错的手工匹配。目前,这方面的研究成果已经相当丰富[1,2,3,4,5,6,7,8],它们分别利用模式中不同类型的信息来挖掘模式元素的语义,然后进行元素匹配。目前利用的信息主要有如下三种类型: 元素自身信息:元素自身信息(元素名,数据类型等)是模式中最基本的信息,是元素语义最直观的反映。早期对模式匹配的研究[2,6,7,9]大多是基于元素自身信息。 数据实例信息:数据实例信息是模式描述的对象,所以也能够准确的反映元素语义,但是从大量的数据实例中提取准确的元素语义是一个很困难的过程。[10]是这方面的研究成果。 结构信息:模式中元素间的关联关系构成了模式的结构信息,结构信息能够有效地辅助匹配,但缺点是模式中定义的结构信息不够丰富(例如在关系型数据库中只存在元素间的主、外键关系)。目前这方面的研究成果主要有[11,12]。 目前模式匹配的研究中利用的结构信息主要是模式元素间的主、外键关系,它们由设计者在模式设计阶段指定。但主、外键关系并不能全面地反映出模式中元素间的关联关系,因为设计者在设计模式结构时为了满足关系数据库严格的规范化定义,会省略某些关联关系或对其进行修正。如例1所示: 例1:表1是某公司进销存管理系统数据库对供应商信息进行管理的一个关系,它包括供应商编号、名称、地址、电话、联系人、备注等信息。 表1 供应商信息表 ManufaID (PK) CompanyName Address Telephone LinkMan SupType Remark A02001 南京通用电器有限公司 南京苜蓿园大街128号 025黄甘 监控系统 210007 A02002 深圳市新安锦辉电子厂 深圳市宝安44区4号楼 0755毛维金 电子器件 518101 A02003 深圳市宝安区新安金海牛电子厂 深圳市宝安44区4号楼 0755梁鹭 电子器件 518101 A03001 慈溪市华威电子有限公司 慈溪市桥头镇工业区 0574毛维金 电子器件 315317 A03002 桂林市兴华探测器有限公司 桂林市施家园路31-2号 0773-5825656 石伟 安检门 541004 …… …… …… …… …… …… …… 从上表可以看出,关系以供应商编号(ManufaID)作为主键,因此属性ManufaID能够函数决定其它属性。除此之外,我们不能够发现其它的结构信息(元素间的关联),但通过与该关系的设计人员沟通,我们发现它的各个属性间还存在着如下一些关联关系: 当某供应商不与其它供应商重名时,知道供应商名称就能够知道该供应商的其它信息(事实上某公司的供应商中名字相同的非常少,所以“供应商名称决定供应商的其它信息”对绝大多数

文档评论(0)

liudao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档