XML数据智能管理若干关键技术地研究.pdf

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
摘要 随着海量XML数据的涌现与传递,XML已成为互联网上信息表示和 数据交换的一个重要标准,继而产生了对XML数据管理的需求,如何有 效地表示、查询与挖掘这些XML数据已经成为当前XML数据管理领域 遇到的一个重要挑战。 针对目前XML数据管理研究现状中存在的问题与不足,本文研究了 XML数据模型、群体智能、模式识别、神经网络、数据挖掘与智能计算 清洗、查询、数据挖掘等新的智能管理方法,同时探讨了XML重构的有 效途径等问题。 本文围绕XML数据的查询与数据挖掘等智能管理问题展开研究,研 究内容和取得的成果主要体现在以下四方面: 1.XML数据管理框架一XPDM的建立 现有的XML数据模型存在着四个问题影响了XML数据的有效管理, 即:(1)数据的异构:给多数据源集成带来许多困难,影响了信息查询的有 效性;(2)数据的非一致性:由于数据约束的不完整性,常导致数据前后不 一致,影响数据查询的准确性;(3)多数据源之间数据依赖关系的不确定性: 影响数据之间的归并与查询;(4)语义标准的规范:由于XML正处于发展 之中,许多规范还不完善,往往导致了查询语句的繁琐与混乱。 针对以上问题,本文提出了一种以XML键构建的向量空间模型为基 础、利用概率理论进行操作的海量XML数据管理框架一xPDM。该框架 1.0和XPath2.0数据模型XDM进行语义规范新扩充及 通过对XQuery XML数据矢量转换,较好地解决了以上四个问题。 2.数据智能清洗与查询策略 为了解决XML文档中的“脏数据”问题,通过引入XML键组合及 XML向量模型,利用贝叶斯学习方法与马尔可夫链概率转移策略建立XML 数据清洗过程的元数据模型,利用XML树相似性判定算法,提出了一种 智能清洗XML数据的新方法,通过相应规则库的预定义完成XML数据 的清洗;另外为了解决XML数据清洗检测繁锁及灵活性差的问题,提出 了通过合理组合XML键、融入粒子群算法、结合隐马尔可夫模型信息抽 取策略构建XML数据清洗优化算法;为了提高XML数据查询的智能性与 有效性,通过采用启发式方法,结合XML半结构化的特点,将粒子算法 与蚁群算法融入到海量XML数据概率查询上,并进行相应改进,实现了 数据查询范围的并行处理能力与收敛效率的提高。 3.XML数据智能挖掘策略 互联网上已聚集了海量的XML数据,为了有效地对XML数据进行挖 掘,本文从以下几个方面进行研究: (1)为了提高海量XML文档集的聚类质量,分别以粒子群算法与矩阵 迭代自组织算法为基础,提出了基于粒子群的XML白适应混沌聚类算法 和基于向量空间模型的矩阵迭代白组织XML辅助聚类算法; (2)为了提高海量XML文档集的并行处理能力,根据混沌原理,融入 蚁群聚类算法,通过定义相应混沌适应度函数衡量蚂蚁与其邻域的相似程 度,提出了一种基于混沌原理与蚁群聚类模型的XML分片算法; (3)针对XML数据的流动性和无限性等特点及质量检测存在的不足, 提出构建XML键的矢量矩阵作为窗口,利用矢量积小波变换多级分解与 重构,再结合最小二乘支持向量机构建双滑动窗口进行XML数据自适应 监测算法,满足对XML数据进行网络传递的质量管理要求。 4.XML智能重构策略 为了更好地优化XML的语义规范,解决随着用户需求的变化以及时 间的推移、XML数据结构也会发生变化这一问题,对XML重构进行了探 测性研究。在XML文档片段重构的基础上,利用XML语义约束关系及 XML路径层次性,再结合向量机原理与频繁模式的特点,提出了XML频 的质量。 关键词:XML键,蚁群算法,粒子群算法,向量矩阵,投影频繁模式树, 重构 ABSTRACT Withthe ofmassiveXMLdataandits has emergence standardoftheinformationanddata beenthe expressionexchange important ontheInternet.So fortheXML

文档评论(0)

bb213 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档