- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种关于XPATH视图维护的优化方法.pdf
第 39卷第4期 郑 州 大学 学 报(理 学版) V01.39 No.4
2007年12月 J.of Zhengzhou Univ.(Nat.Sci.Ed.) Dec.2007
一 种关于XPATH视图维护的优化方法
张永军, 徐 红
(山东商业职业技术学院计算机科学与技术系 济南250103)
摘要:Sawires等人给出的视图维护方法能在少量辅助空间的情况下增量地维护视图,但是在较多约束的视图定义
下,由于该方法在约束检测方面没有被优化,所以影响了视图维护效率.提出了Sawires视图维护方法的一种优化
方法,并通过试验验证了该方法能够有效地提高视图的维护效率.
关键词:XPATH视图;过滤概率;约束统计日志;测试代价
中图分类号:TP 302.7 文章编号:1671—6841(2007)04—0141—05
0 引言
将Web数据抽取并包装成XML文档的格式能够为查询分析或数据挖掘提供通用、格式良好的基本数
据.因此,如何提高对XMI 数据的查询分析效率成为一个研究的热点.针对结构灵活的半结构化数据,建立
基于路径的物化视图 能够极大限度地利用视图的内容来响应用户的查询,从而提高了查询分析效率.目
前,大量的研究工作是围绕如何维护半结构化数据物化视图进行的_2 ].基于信息集成的数据源以低耦合的
形式居多,所以在松散耦合系统的模式下,文档多以树模型来表示.针对较复杂的路径表达式,文献[6-8]给
出了一般的解决方法,但没有对增量视图维护策略进行优化.本文给出了Sawires视图维护方法的一种优化
方法并通过试验验证了该优化方法的有效性.
1 使用XQUERY语言的特定查询和物化视图
对于某个拍卖网站的数据,使用xQUERY语言查询分析如下:
Q ul{
for S X in doc(”auction.xml”)/site/pe0p1e/pers0n[address/c0untry一”United States”]
[emailaddress][count(watches/watch)4][profile[age30 and age50]/@income50 ooo]
returnphone{Sx/name}{Sx/phone}/phone
)/u1
V:/site/people/person[address/country]Eemailaddress][count(watch)2]
[profile[age20 and age60]/@income10 ooo]
对于该查询分析Q,将满足特定条件的人作为拍卖通知的主要对象是查询分析应该考虑的问题.如果对
该查询建立满足在节点person处谓词测试的物化视图V能够有效地提高分析效率,那么对于该视图要在
person节点处进行谓词测试的过程要分解成多个谓词测试来完成.在不知道测试结果真假时,往往将所有
约束分支的谓词检测都进行测试或按任意固定顺序检测,从而浪费了大量的时间进行约束检查,而且在视图
维护过程中对基本数据的查询是最耗时的.通过最近的两次查询日志来估计将来可能的更新会发生在数据
库的哪些区域,由此来按照某种顺序做约束测试可以提高视图维护效率.
收稿日期:2007~06—14
作者简介:张永军(1977--),男,讲师,硕士,主要从事数据库优化研究;通讯作者:徐红(1966一),女,副教授,硕士,主要从事分布式计算
研究.
142 郑 州大 学 学报 (理 学版 ) 第39卷
2 相关定义
定义l(XPATH视图) 将XPATH视图定义为基于XPATH查询的结果集,即一系列树的集合 一
{T ,T。,…,T }.此外,定义def(V)为视图定义的表达式.
例如,定义视图def(、厂 一DB/A[count(/B)≥1]//M,在该定义下的视图V 为{M (w。),M (w ,W。),
M3(W )}.
定义2(约束统计日志) 对数据库依据视图定义,按某一时间间隔进行数据分布和相关约束查询时间
耗费的统计,并将这些统计信息写入日志关系,这些日志记录为
文档评论(0)