- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于规则关系数据库到本体转换方法
基于规则关系数据库到本体转换方法
摘要:提出了一种新的全自动的关系数据库到本体的转换方法,通过分析关系模式的主键、属性、引用关系、完整性约束和部分数据来创建本体,尽量保持了关系数据库的信息,并在构建的过程中对信息进行初步的集成和分类。系统实践证明,该方法可自动进行关系模式和数据到本体的等价转换,而且完成了对关系数据库中部分语义信息的辅助挖掘。
关键词:数据集成;关系模式;本体;框架逻辑;资源描述框架
中图分类号:TP311文献标志码:A
文章编号:1001-3695(2008)03-0767-04
0引言
计算机网络的迅速发展推动了信息化和全球化的进程。企业与企业之间、企业各部门之间的信息交换越来越频繁。由于地理位置的分布性和所采用技术的多样性,直接导致了数据源的异构性,数据模式和数据表示的差异给数据集成造成了很大困难。传统的数据集成基于关系模式,只考虑了数据的语法信息,这在很大程度上影响了数据集成的准确性。
知识表示中的重要支撑工具是本体(ontology)[1]。本体是概念化的、明确的规范说明[2]。其中,概念化是指抽象出客观世界中一些相关概念而得到模型,其表示的含义独立于具体的环境状态;明确是指所使用的概念及使用这些概念的约束都有明确的定义;规范是指使用标准的、独立于系统的形式化描述。作为一种概念的显式表达方式,本体能够以一个概念集的形式表示任何信息及它们之间的关系。
基于本体的数据集成主要借助于本体来描述数据源信息,通过定义共享词汇集来揭示数据源模式的语义及其他的语义信息。与基于关系模式的数据集成相比较,它可以进一步丰富数据模式的语义表达能力,有效处理各种语义冲突。如何将关系模式映射到本体并尽量保持数据库的语义信息是基于本体数据集成的重要组成部分。
1相关工作
在深度数据集成和逆向工程[3]的研究等方面,对于显式定义和抽取数据库模型的语义信息已经作了不少研究,但是只有少部分方法把本体作为目标。其中,Irina Astrova提出的方法[4]与本文提出的方法最为相似。它提出了一套模式映射规则,对关系进行分类,通过分析主键、属性和数据发掘关系之间的联系,将关系模式映射到本体,然后将关系数据映射到本体实例。但是如果是海量数据时,该方法在分析所有属性上的数据之间的全等、包含、交叉和分离是非常困难的。相对于Irina Astrova提出的方法,Stojanovic等人提出的方法[5]考虑了主/外键上数据全等和包含两种情况,但没有数据交叉和分离的情况;此外该方法是半自动化的,在确定概念继承层次时需要更多的用户交互。Kashyap给出的方案[6]需要大量的用户交互,进行语义注释,降低了系统自动化程度;此外该方案也没有建立公理系统,公理系统可以更深层次地描述本体实例间的关系。Dogan和Islamaj提出了一种全自动的模式和数据的转换方法[7],把关系映射成概念、属性映射成对应概念的谓词、关系的元组映射成本体实例,但是没有考虑信息集成和继承层次,因此创建的本体更像一个关系型的本体。在国内,任保锋等人在关系数据库到本体的映射方面也作了一定的研究[8]。
本文提出了一种新的全自动的关系数据库到本体的转换方法。通过分析关系模式的主键、属性、引用关系、完整性约束和引用关联的关系中主键上数据的全等和包含关系来创建本体,给出了一组框架逻辑[9]描述的关系模式到本体概念和层次的映射规则,基于这种转换,将关系数据迁移到本体示例。相对于已有的转换方法,该方法在最大限度地保持关系模式的完整性的同时,转换和迁移过程无须人工参与,基于规则保证了转换过程的自动化。
2基本数据模型
关系数据库的底层模型是关系模式,它是当前数据库领域最重要的数据模式,有着广泛的应用。本文扩展了通常的关系模式的形式定义。一个关系模式包括:
a)关系的有限集合R;
b)属性的有限集合A;
c)基本数据类型集合T;
d)获取关系属性的函数attr:R→2??A,给出特定关系的属性集合;
e)获取关系主键的函数key:R→2??A,说明哪些属性是关系的主键。因此对于r∈R,key(r)??attr(r);
f)获取属性数据类型的函数type:A→T给出每个属性的数据类型;
g)引入函数data:2A→V,V为值的集合,函数给出属性组的取值集合。
另外关系还具有完整性约束特征,这包括:
a)实体完整性。例如主属性不能取空值、default、not null、unique等。
b)参照完整性。约束关系间的引用关系。
c)用户定义完整性。例如某个属性的取值在0~5等。
由于本体的静态属性,本文只对
原创力文档


文档评论(0)