- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于CBR数据同步故障诊断系统
基于CBR数据同步故障诊断系统
摘要: 对数据同步过程中操作规范和故障处理作研究,报告数据库故障诊断的现状,提出基于CBR(Case-Based Reasoning)的一种调优算法。该算法具备机器学习能力,兼顾不同语言和表达顺序的影响,解决本领域案例匹配和案例聚类问题,并在此基础上完成原形系统的开发。
关键词: 相似度算法;故障诊断;案例推理;案例匹配
中图分类号:TP3文献标识码:A文章编号:1671-7597(2011)0110057-02
0 引言
数据库是现代商业信息系统的核心软件之一,其故障诊断效率将直接决定整个系统的可用时间。数据库软件与上、下游软件紧密关联,因此增添了故障排除的难度。
现有诊断系统或方法具有以下几点局限性:不是所有的数据库厂商都提供故障诊断系统,并且即使提供该类系统也存在响应慢、搜索方式死板、垃圾信息过多、排序不合理等问题。
因此,有必要探索一种在数据库故障诊断领域实现案例快速匹配,定时案例聚类的技术方案,并在此基础上形成一套完整的诊断系统雏形,最后通过不断完善提高该诊断系统的实用性。
1 数据同步故障推理检测模型
基于规则的推理方式RBR(rule based Reasoning),此过程是一种通过反复搜索制定规则并执行规则,最终得到问题求解的过程。
基于案例的推理(Case-Based Reasoning,简称CBR),是一种问题求解的人工智能方法,其通过搜索和匹配案例库中的类似案例,从而求解当前问题。Schank和Abelson在1977年所作的认知科学的研究被认为是案例推理理论的起源。[1]
CBR故障诊断方法的核心是使用之前或者外来的求解经验来处理现今遇到的问题,并且为新的故障诊断提供参考和依据,有助于提高处理速度。主要包括案例表示、案例检索、案例聚类、新增案例等主要步骤。如图1。
图1CBR故障诊断的工作流程
数据理解其中的关系就成为信息,信息理解其中的模型成为知识,知识理解其中的原理成为智慧。[2]所以可以这样理解,案例本身的描述就是数据,案例中的问题求解是信息,而一组案例聚类后对一类问题完整的解决就是知识,从知识中分析其原理就是智能。因此CBR中存放的是案例和知识两部分。
1.1 案例表示方法设计和案例库整理
1)表示方法设计
基于案例的推理首先要研究,如何把一个过去解决的问题转化为案例的形式,并且能在数据库中存储为由几个字段所组成的一条记录。使用如下形式描述:
{案例编号,案例的详细信息,案例属性1,案例属性2……}
对于数值型的特征值往往有界上(下)型,正态分布这样的方法计算相似度。
对于字符型的相似度计算,一般有确定的方法。下面专门分两个段落介绍。
2)案例库整理
知识的发现和归纳过程可以进一步提高效率;是此系统的后续补充和改进。需要指出,案例聚类可以通过现有的手段完成,但是案例内容的有效合并仍然需要通过人工提炼。
1.2 案例信息分类和描述方法设计
为了提高系统的扩展性,并在其他故障诊断中同样发挥作用,需要增加案例的分类属性。信息分类普遍采用树形结构,一个案例只能属于一个分类。本设计参照UNIX常用的用户组分类方式,一个案例同时拥有一个或多个组属性。
1.3 案例全文搜索模型
全文搜索的功能是案例匹配最简洁的方式。
1)ORACLE全文搜索介绍
ORACLETEXT完成全文搜索的主要过程:ORACLETEXT需要为可检索的数据项建立索引,用户才能够通过搜索查找内容,索引进程是根据通道建模的,在此通道中,原始数据经一系列的转变后,将其核心关键字加到索引中。[3]
2)全文搜索创建过程
① 确定数据库的ORACLETEXT功能包是否安装;② 创建一个全文搜索;③ 设置相关属性。创建基于多列的全文搜索索引。因为不断会有新的案例输入,所以要按照输入的频率和对性能的影响,设置合理的时间间隔,定期更新索引,优化索引。
1.4 相似案例发现及合并
1)文本的相似度算法
常用的方法有:Levenshtein Distance算法,余弦相似度算法,相同字符数占比算法等。[4]
混合相似度算法:将两种或者两种以上的算法组合使用,并设置相应的权值。此方法能协调不同相似度算法在不同领域的优势,方便动态调整权值。
首先将相似性算法分为两类,相似性与计算结果成正比的归为SI,相似性与计算结果成反比的归为DI。C1,C2两案例的混合相似度用以下公式表示:
其中SI,DI由以下公式决定:
2)对汉字和英文单词区分计算
英文字符的多少对结果的影响可能会非常大,因此
您可能关注的文档
最近下载
- (高清版)-B-T 3565.5-2022 自行车安全要求 第5部分:车把试验方法.pdf VIP
- 工程保险合同纠纷裁判指引_记录.docx VIP
- 福建省房屋建筑和市政基础设施工程质量监督抽查抽测规定试行.doc VIP
- 《自然语言处理技术及应用》课程标准.pdf VIP
- 宗教的文化专题——道教.ppt VIP
- (最新)知识考核旅行社计调三级真题精选附答案(答案在末尾).docx
- 临床常见病的中西医诊疗与康复新进展题库答案-2025年华医网继续教育答案.docx VIP
- (正式版)D-L∕T 266-2023 接地装置冲击特性参数测试导则.docx VIP
- (正式版)D-L∕T 266-2012 接地装置冲击特性参数测试导则.docx VIP
- ABB XT2-XT4 电子脱扣器 Ekip Dip LSI-LSIG 手册(中文).pdf
原创力文档


文档评论(0)