基于多策略异构数据库知识获取分析与实现.docVIP

基于多策略异构数据库知识获取分析与实现.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多策略异构数据库知识获取分析与实现

基于多策略异构数据库知识获取分析与实现   摘要:为对异构数据库中的大量孤立、没有语义描述的数据进行自动归类及本体建模,实现异构数据库数据的知识获取,提出了一个基于本体与Web服务的异构数据库知识获取框架,给出了通过Web服务包装异构数据库的访问机制,设计出贝叶斯分类器并应用该分类器对获取的异构数据自动映射到相关的本体。该方法能够通过贝叶斯分类器自动对异构数据归类,实现了异构数据库的交互知识获取。   ?す丶?词:本体;Web服务;异构数据获取;贝叶斯分类器   ?ぶ型挤掷嗪牛?TP391文献标志码:A   文章编号:1001-3695(2007)05-0200-04      0引 言??      随着数据库技术的快速发展以及数据库管理系统的广泛应用,人们不得不面对如下问题:①数据库中积累的数据越来越多,数据爆炸但知识贫乏;②知识获取的局限性目前主要体现在知识获取仍停留在人的手工劳动阶段[1];③存在各种异构,如平台的差异、编程语言的差异、数据格式的差异等,形成了“信息孤岛”现象,制约了数据共享[2];④数据库中的数据缺乏语义描述。??   为能够对异构数据库中的数据进行高层次的分析,以更好地利用这些数据、发现数据中存在的关系和规则,必须挖掘隐藏在数据背后的知识。目前,大部分的解决方案主要是利用XML及其相关技术完成异构数据库的互相转换工作以及利用Web服务技术集成异构数据库。但在实际运作过程中,采用上述方案处理异构数据库时也存在一些问题,即没有实现异构数据库资源中异构、分布式、多元化数据的自动获取和从数据到知识库的知识单元的转换。本文提出一种基于本体和Web服务并结合贝叶斯分类器实现异构数据库数据向知识单元转换的知识获取方案:用Web服务的动态性、松散耦合和非绑定性来解决数据库的异构性,并同时保证异构数据库的各个组成部分具有自身的自治性、完整性和安全性控制;利用本体建模工具在语义和知识层次上描述信息系统的概念模型,描述概念及概念之间的关系以及通过概念之间的关系来描述概念的语义[3];结合贝叶斯分类器将获取到的异构数据库数据归类到相关的本体,对获取的异构数据库资源进行语义上的刻画与描述,从而实现向知识单元的转换,使异构信息在语义上实现机器可理解。异构数据在本体的协助下,易于发现数据之间的关系和规则,便于语义检索和推理检索,从而挖掘出隐藏在数据后的知识。??      1相关技术及解决思路??      目前企事业机构中已经存在大量异构数据库,要通过扩展对数据库模式和记录的描述来加强知识的获取。首先要构建领域本体。由于领域本体提供了一系列的语义结构,借助一种机器学习手段将数据库中的数据模式和实体归类到相应的领域本体类,将领域本体所体现的概念模式映射到数据模式,领域本体有相应的实体完整性约束,被定义的模式可认为具有知识表示的能力;对分布式异构数据库系统,采用Web服务技术封装来屏蔽各种异构性;采用一个学习机制使得系统自动或交互地抽取知识。本文使用贝叶斯统计原理来产生分类规则并诱导分类。一个分类规则预测一个样本应该归于哪个类。异构数据库知识获取的主要流程如图1所示。??   (1)数据获取??   由位于不同地点、不同平台或不同数据库系统之上的Web服务采用公共数据模型对局部共享数据进行封装,隐藏了内部结构,并统一以XML格式提供一致的对外公共访问接口,屏蔽了不同数据库系统的数据源位置、模式和访问方法等异构信息,即获取异构数据库的数据对用户和调用该服务的系统而言是透明的。??   (2)特征建立??   在实际使用贝叶斯模型进行分类决策前需要进行特征建立。贝叶斯分类器的分类决策即在特征空间中运用统计方法把待识别对象归为特定类型。其核心技术是在样本训练集基础上确定一个判决规则,使按这种规则对被识别对象进行分类,所造成的错误识别率最小或引起的损失最小。??   (3)贝叶斯分类??   基于小子样的贝叶斯在理论上为解决数据分类提供了理论途径。贝叶斯分类的目标是通过机器学习功能将异构数据库中的记录按数据模式及记录的属性值归类到预先定义的领域本体类别,形成知识库的知识节点。??      2系统框架及模块介绍??      框架的执行流程是由异构模式数据收集器调用相关的包装器(Web服务接口)收集异构数据源数据模式信息;由贝叶斯分类器训练,对该记录进行模式及属性特征分析,在领域本体和分类器的帮助下实现归类,作为知识节点存入知识库中,实现知识获取。其框架如图2所示。??   该框架的模块功能描述如下(从下至上描述):??   (1)数据库。具体负责异构数据资源的存储,包括Oracle、MySQL、SQL Server等关系/对象数据库等。其与知识管理层之间通过统一的包装器(Web服务服务

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档