- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
摘要
随着海量XML数据的涌现与传递,XML已成为互联网上信息表示和
数据交换的一个重要标准,继而产生了对XML数据管理的需求,如何有
效地表示、查询与挖掘这些XML数据已经成为当前XML数据管理领域
遇到的一个重要挑战。
针对目前XML数据管理研究现状中存在的问题与不足,本文研究了
XML数据模型、群体智能、模式识别、神经网络、数据挖掘与智能计算
清洗、查询、数据挖掘等新的智能管理方法,同时探讨了XML重构的有
效途径等问题。
本文围绕XML数据的查询与数据挖掘等智能管理问题展开研究,研
究内容和取得的成果主要体现在以下四方面:
1.XML数据管理框架一XPDM的建立
现有的XML数据模型存在着四个问题影响了XML数据的有效管理,
即:(1)数据的异构:给多数据源集成带来许多困难,影响了信息查询的有
效性;(2)数据的非一致性:由于数据约束的不完整性,常导致数据前后不
一致,影响数据查询的准确性;(3)多数据源之间数据依赖关系的不确定性:
影响数据之间的归并与查询;(4)语义标准的规范:由于XML正处于发展
之中,许多规范还不完善,往往导致了查询语句的繁琐与混乱。
针对以上问题,本文提出了一种以XML键构建的向量空间模型为基
础、利用概率理论进行操作的海量XML数据管理框架一xPDM。该框架
1.0和XPath2.0数据模型XDM进行语义规范新扩充及
通过对XQuery
XML数据矢量转换,较好地解决了以上四个问题。
2.数据智能清洗与查询策略
为了解决XML文档中的“脏数据”问题,通过引入XML键组合及
XML向量模型,利用贝叶斯学习方法与马尔可夫链概率转移策略建立XML
数据清洗过程的元数据模型,利用XML树相似性判定算法,提出了一种
智能清洗XML数据的新方法,通过相应规则库的预定义完成XML数据
的清洗;另外为了解决XML数据清洗检测繁锁及灵活性差的问题,提出
了通过合理组合XML键、融入粒子群算法、结合隐马尔可夫模型信息抽
取策略构建XML数据清洗优化算法;为了提高XML数据查询的智能性与
有效性,通过采用启发式方法,结合XML半结构化的特点,将粒子算法
与蚁群算法融入到海量XML数据概率查询上,并进行相应改进,实现了
数据查询范围的并行处理能力与收敛效率的提高。
3.XML数据智能挖掘策略
互联网上已聚集了海量的XML数据,为了有效地对XML数据进行挖
掘,本文从以下几个方面进行研究:
(1)为了提高海量XML文档集的聚类质量,分别以粒子群算法与矩阵
迭代自组织算法为基础,提出了基于粒子群的XML白适应混沌聚类算法
和基于向量空间模型的矩阵迭代白组织XML辅助聚类算法;
(2)为了提高海量XML文档集的并行处理能力,根据混沌原理,融入
蚁群聚类算法,通过定义相应混沌适应度函数衡量蚂蚁与其邻域的相似程
度,提出了一种基于混沌原理与蚁群聚类模型的XML分片算法;
(3)针对XML数据的流动性和无限性等特点及质量检测存在的不足,
提出构建XML键的矢量矩阵作为窗口,利用矢量积小波变换多级分解与
重构,再结合最小二乘支持向量机构建双滑动窗口进行XML数据自适应
监测算法,满足对XML数据进行网络传递的质量管理要求。
4.XML智能重构策略
为了更好地优化XML的语义规范,解决随着用户需求的变化以及时
间的推移、XML数据结构也会发生变化这一问题,对XML重构进行了探
测性研究。在XML文档片段重构的基础上,利用XML语义约束关系及
XML路径层次性,再结合向量机原理与频繁模式的特点,提出了XML频
的质量。
关键词:XML键,蚁群算法,粒子群算法,向量矩阵,投影频繁模式树,
重构
ABSTRACT
Withthe ofmassiveXMLdataandits has
emergence
standardoftheinformationanddata
beenthe expressionexchange
important
ontheInternet.So fortheXML
文档评论(0)