面向语义异构的信息集成系统查询处理方案-北京工业大学学报.pdfVIP

面向语义异构的信息集成系统查询处理方案-北京工业大学学报.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向语义异构的信息集成系统查询处理方案-北京工业大学学报

第33卷第8期 北京工业大学学报 V01.33No.8 0F UNIVERSITYoFTECHNOLOGY 2007年8月 JoURNALBEIJING Aug.2007 面向语义异构的信息集成系统查询处理方案 方丽英,王 普,闫健卓 (北京工业大学电子信息与控制工程学院,北京 100022) 摘要:本体被用来解决信息集成系统中的模式语义异构.为了解决信息集成系统中的数值型语义异构问题, 在查询处理机制中分步骤的处理该类异构.查询请求语义分析和全局查询阶段处理同形异义和异形同义情况、 子查询本地化模块处理计量单位不同所造成的影响、冗余处理阶段根据策略处理有冗余结果集中内存在错误数 据所造成的冲突.这3个阶段共同完成查询,可以解决数值型语义异构问题. 关键词:集成;语义;信息检索;本体;信息集成 中图分类号:TP311.13 文献标识码:A 信息集成中存在着平台异构、结构异构、语义异构3个不同的异构层次.在信息语义异构的研究方 面,利用基于词典…的方法,或通过使用描述语义能力比较强的函数数据模型[2]来构建异构数据库的概 and 体论的引入,给语义异构的解决提供了新的思路[8].Bernstein Levy等意识到了信息集成系统应该根 据自身的结构特点,重新思考查询处理机制[9Jo】.孟小峰等也认为信息集成系统中的查询处理和优化是 今后数据库研究领域的主流发展趋势之一【11|.除了理论上对查询处理机制的思考,查询的智能化、个性 化需求也在工程实践中凸现出来.而信息集成系统对语义异构的屏蔽程度,将直接影响查询的输出结果, 进而影响信息真正共享的程度.在查询机制中,考虑部分本体不能解决的语义异构问题,是可行的. 1语义异构的分类 相对于信息集成中的平台异构、结构异构,本文中的语义异构泛指不同数据源对概念的表达不一致、 冲突/差异的情形.语义异构分为概念或模式型和数值型语义异构2类[12|.概念模式型语义异构包括:表 一表异构,属性一属性异构,值一属性异构,值一表异构,属性一表异构[8].数值型语义异构包括:同一概念同 一属性的同一个数据,具有不同的数据表达形式;以相同形式表达的数据,可以对应到不同概念含义上(下 称I型);同一记录(以关系数据库为例)的同一概念同一属性的数据,可能因为录入等错误造成的其数据 值在不同数据源之间彼此存在矛盾(Ⅱ型);同一概念某数值类型的属性,在多个异构数据源中存储时,计 量单位不同(Ⅲ型).计量单位的换算又分为两种:a.计量单位之间换算关系固定,例如“千米”和“米”.b.计 量单位之间换算关系是时变的,例如“美元”与“人民币元”的实时兑换汇率. 在信息集成中利用本体对概念的表示能力,进行语义详细度的比较及处理[12|,能基本解决概念或模 式层语义异构.数据清洗是一项费时的工作,对各信息源影响较大,而且信息集成系统的扩展性受到制 约.因此,将数值型的语义异构,放在查询阶段处理. 2信息集成系统中的查询处理方案 DL/Fun中的类公理,从 本体的引入适合解决信息集成系统中各数据源中的模式异构.如利用0WL 与数据源建立映射的角度解决模式异构.数值型异构将无法解决.因此,设计在信息集成系统构建过程 收稿日期:2006—06—01. 作者简介:方丽英(1977一),女,北京人,博士生 万方数据 北京工业大学学报 2007年 中,利用本体技术解决模式或概念型语义异构;而数值型的语义异构,通过查询处理机制来解决.面向语 义异构的信息集成系统和查询处理方案模型如图1所示.其中,双箭头代表查询处理过程中需要读取并 利用的外部信息. 图1 面向语义异

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档