- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
______________________________________________________________________________________
基于索引的XML 数据流的变化检测1
Index-Based Change Detection for XML Data Streams
李智 唐常杰 栾江 汪锐 贾晓兵
(四川大学计算机学院成都610064 )
Abstract The current known XML change detection algorithms need tree-parse process in advance, which is not
suitable for stream data. In this paper, we study a kind of XML data stream, and introduce stream expression for
XML tree model. We propose two kinds of XML stream index, SSI and GSSI(k), and propose and implement a novel
change detection algorithm for XML data streams (SDiff). SDiff is capable of processing a large scale of XML
stream data, and has linear time and space complexity.
Key words XML stream, Stream index, Change detection
1. 引言 是对流数据的索引,其自身也能够以数据流的
可扩展标识语言XML 已经成为互联网上信息 方式处理,从而大幅度地减少了对内存空间的
表示和信息交换的新标准。越来越多的数据使用 使用;
XML 进行描述,以适应信息处理的需要。在许多 在流索引的基础上,设计和实现了一种新颖的
应用中,我们不仅对当前的数据感兴趣,同时还需 XML 数据流的变化检测算法 SDiff ,并通过
要了解数据的变化情况。这就是对XML 数据的变 XPath 表示数据的变化情况。SDiff 通过对索引
化检测。 的比较,最大程度地减少不必要的XML 解析
目前已知的XML 变化检测算法,如 X-Diff, 量,从而有效提高XML 流的检测效率;
XyDiff 等,都是基于对XML 树的“最小修改代价” 我们对 SDiff 进行了初步的比较试验。试验表
的搜索。即,先将新旧XML 文档解析为树形结构 明,相对于目前已知的XML 文档变化检测算
Tnew,Told ,再通过对结点或子树的插入(Insert ),删 法(如X-Diff ),SDiff 具有线性的时间和空间
除(Delete )和更新(Update)操作,实现从 Told 到 复杂度,更适合于结构固定的 XML 流数据的
Tnew 的转化,并以取得最小代价的转化方案作为最 变化检测。
终的变化检测结果。然而,我们在应用中发现这样
的事实:大量的XML 文档仅仅是作为数据的载体, 2. 相关工作
他们具有相对固定的静态结构和良好的颗粒度。 XML 是树形结构的文本文档,因此可以利用
XML 文档的变化仅仅局限于其承载的数据的变
您可能关注的文档
- 基于GPS轨迹矢量路网地图自动生成方法.pdf
- 基于Hoek_Brown准则开挖扰动引起围岩变形特性的研究.pdf
- 基于HyperWorks车身地板有限元分析.doc
- 基于INTERNET网上支付交易模型及流程(v1.2-100114).pdf
- 基于LabView上下位机串口通 讯系统设计.doc
- 基于MSC.marc滑轮单元有限元分析.docx
- 基于PC模拟驾驶视景仿真技术的研究.pdf
- 基于Petri网车站股道分配方案瓶颈识别.pdf
- 基于PXA255PDA交通管理系统在Linux环境下实现.doc
- 基于RFID传感器网络.doc
- “正德厚生,臻于至善”:中国移动企业文化建设的探索与实践.docx
- 纳米复合介质受潮后的耐电性能蜕变与吸潮机制探秘.docx
- 一种基于Sorting机制的偶图模型检测工具的设计与实现.docx
- 华南理工大学数字图书馆信息资源建设项目管理的深度剖析与策略优化.docx
- 平台艺术:开启艺术大众化新时代.docx
- 百合抗病基因类似物克隆及杂种胚培珠离体培养技术的协同创新研究.docx
- 詹姆斯·菲什金协商民主理论探析.docx
- 经济法视域下政府诚信的多维审视与建设路径.docx
- 血管内热交换下不同低温治疗对犬重型颅脑外伤脑保护作用的比较研究.docx
- 白藜芦醇抗急性痛风性关节炎:疗效剖析与机制探寻.docx
原创力文档


文档评论(0)