- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种自适应的XML 数据流质量预测策略1
1 1 2
刘波 ,杨路明 ,邓云龙
1 中南大学信息学院,湖南长沙(410083 )
2 中南大学湘雅附三医院,湖南长沙(410013 )
E-mail :ltbo99@,l-tb@163.com
摘 要:由于XML 文档资源在Web 上不断增长及数据交换的多样性,如何对XML 数据流
进行质量检测及重构是保证XML 有效性的关键。针对当前XML 数据流质量检测存在的不
足,提出构建XML 键的矢量矩阵作为窗口,利用矢量积小波变换多级分解与重构XML 数
据流,再结合最小二乘支持向量机对XML 数据流质量进行预测的一种方法(简称XAFS ),
满足XML 数据流质量重构时实时检测的要求,保证XML 数据的约束性、一致性与完整性;
为了更好的适应网络负载,采取加权与自适应窗口调整等调度策略充分保证XML 数据流的
质量检测。对比其它相应算法,一系列仿真实验表明所提出算法具有较高的精度与实用性,
是XML 数据流挖掘的一种有效方法。
关键词:XML 键;XML 数据流;预测;矢量积小波变换;最小二乘支持向量机
中图分类号:TP311.13 文献识别码:A
0. 引言
随着 Web 技术及其应用的快速发展,XML 数据流及其相关技术己经成为当前数据处理
领域的研究热点之一,XML 数据流具有半结构特征,是连续的、输入速率随时间变化的、
有序的序列,这些有别于传统数据流的管理。
目前数据流研究领域中有关预测的理论和方法主要有相似性检测、神经网络模式匹配、
异常或模式差异、传感器数据挖掘等,如文献[1]针对传感器的识别原理提出一种利用
LS-SVM模型进行传感器动态系统辨识的方法;文献[2]探讨利用相空间重构技术与LS-SVM
模型进行非线性系统建模的方法;文献[3]基于XML路径相似性检测提出XML聚类的算法;
文献[4]针对XML数据流与其模式XAT 的匹配处理过程,从代数学的角度提出自动检测异常
的方法,并实现查询重写的功能;文献[5]提出基于相空间重构技术的局域法多步预报模型;
当前比较通用和完善的XML数据流系统XTREAM[6]是一个基于XML 的解析引擎,将XML信
息从Web站点中抽取并保存,具有较好查询扩展性。
这些方案较好地解决了 XML 数据流操作存在的问题,也存在不足,首先对 XML 数据
流主要采用 XML 路径相似性分析,针对 XML 数据流,这种操作算法所需时间与空间代价
昂贵,不适合数据流实时性的要求;其次大部分现有的算法都只能在给定长度的窗口上进行
数据流的检测,用户往往不知道最合适的检测窗口的大小,需要同时检测大量不同长度的窗
口,这样的策略将浪费大量的存储空间及计算的开销,在数据流较大时,不可避免地导致性
能的下降,不适合在线自适应资源管理和最优决策的需要;第三,同时从XML 流中多次提
取路径,存在检测难、分解不准确的问题,阻碍了 XML 数据流质量的进一步提升[7,8] ;与之
相比,最小二乘支持向量机[9]结构简单,推广能力强,对于解决非线性以及高维模式识别问
题表现出了很大的优越性。
因此利用XML 键的提取构建 XML 键向量矩阵作为双滑动窗口,通过矢量积小波转换[10]
对 XML 数据流进行划分,提出利用 LS-SVM 对 XML 进行质量预测的方法,同时分析 XML
1本课题得到湖南信息职业学院科技创新项目(编号 108652006011 名称:基于 XML 数据库压缩算法与概
率查询分析及实现)和国家自然科学基金重点项目(编号名称: 生物信息学中的相关组合理论和
算法研究)的资助。
-1-
数据流序列,通过对 XML 键的不同组合及加权、自适应等操作优化质量预测,其策略主要包
括如下 5 个主要阶段: 1)构建 XML 键向量矩阵作为检测窗口
您可能关注的文档
最近下载
- 仓储管理系统的设计与实现.docx VIP
- 机械装备制造技术课件.pptx
- 25年秋新版外研社七年级上册英语同步上课课件Unit 3--Reading for writing 读写课.pptx VIP
- 分子进化与系统发育分析课件.ppt VIP
- 2025湖北武汉东湖新技术开发区公开招聘81名社区干事招聘笔试备考试题及答案解析.docx VIP
- 黄亮与李燕的创业故事(PDF文本).pdf VIP
- Yamaha 雅马哈 音乐制作合成器 MOTIF XF 用户手册.pdf
- 2025广西公需科目考试答案(3套,涵盖95_试题)一区两地一园一通道建设;人工智能时代的机遇与挑战.pdf VIP
- 金管局考试题目及答案.doc VIP
- 《ICU血糖管理》课件.ppt VIP
文档评论(0)