- 0
- 0
- 约16.03万字
- 约 174页
- 2019-01-27 发布于上海
- 举报
xml数据管理关键技术的分析管理科学与工程专业论文
摘要随着XML(eXtended
摘要
随着XML(eXtended Markup Language,扩展标记语言)技术的b速发展, 越来越多的数掘使用XML进行表示,XML已经逐渐成为Web上数据表示和 交换的标准。XML数据足一种特殊的半结构化数据,且其查询也不同r传统 关系数据库的SQL语句,这为XML数据管理带来新的研究问题。
本文以XML数据管理技术为研究对象,研究XML数据管理中的关键技 术,存XML数据的数据模型、XML数据的查询语高、XML数据的存储结 构、XML数据查询处理及优化技术方面取得了一系列研究成果。
在XML数掘的数掘模型方面,提出了一种基丁映射的XML数据库的数 据模型。该模型能够充分表达XML数据库的复杂数据结构和语义,并支持 以路杼表达式为核心的查询代数操作。优丁其他数据模型,该模型给出了 XML数据模型的精确定义,同时定义了模式维护和数据维护操作。
在XML数掘的查询语言方面,提出了一种XML数据库的查询语言 x.SQL。X.SQL具有类似丁SQL(Structure Query Language,结构化查询语言) 语言的Select—From.Path.Where结构,使用方便,具有路径表达式查询能力
和同时从多个数据源选取数据的能力,支持数据更新操作和查询结果的语义 描述。
在XML数据存储结构方面,设计并实现了基J二模式划分的ASRX存储 结构、以及适应丁Twig Join方法的ERCX存储结构。理论分析和实验结果 表明,这些存储结构能够有效地支持并种XML数据维护操作。
在XML数据的查相处理及优化方面,提出了三种XML数据查询处理方 法:基1‘ASRX存储结构的路径表达式查询处理方法、基丁过滤的XML数 据奋相处理赞法和基r ERCX存储结构的查询处理算法。(1).基丁ASRX存 储结}{f=『的奁淘处理方法利用自动机匹配求解查询计划,并根据数掘的划分信 息扫描少量的数掘块,从而降低了算法的I/0代价。本文将异步迭代查询处 理技术应用r基r ASRX的查询处理,在查询计划的执行过程中不同层次的
结点以流水线疗式运行,并行完成奄询的处理,提高了查询处理的效率。(2). 本文还提出J7=二种基丁过滤的奄询处理方法BFX—Filter、CX—Filter和 SX。Filter。这三种基7i过滤的算法可以大大降低元素扫描数目,使得参加查 向处理的元素结点数日大大降低。但由r采用了适合顺序扫描的索引结构, 使得这一种方法运行时间丌销比较大。为此,我们研究了基r ERCX存储结
构的查询处理方法。(3).利用结点的ERC编码,数据在存储时被进行划分。
构的查询处理方法。(3).利用结点的ERC编码,数据在存储时被进行划分。 查询处理时,只扫描对查询处理结果可能有贡献的结点。实验结果表明,基 1-ERCX存储结构的HTwigJoin查询处理算法无论在扫描的结点数目、磁盘 I/O数月还是运行时间上都优y-目前的其它XML查询处理方法。本文还给出
HTwigJoin算:法的优化策略:基丁ERC编码的查询最小化方法。理论分析表 明,该方法可以有效提高HTwigJoin算法的效率。
基r以上研究的结果,我们实现了一个XML数据库原型系统,用丁验
证所提出的理论和方法的正确性,同时为进一步深入研究打下一个基础。该 系统已经用丁分布式信息集成与共享系统。
关键词XML;数据模型;查询语言;存储结构;查询处理
AbstractWith
Abstract
With the increasingly development of XML,more data is represented by the format of XML,which has been a de如CtO standard for Web data representation and exchange.XML data is a kind of special semistructured data.Furthermore, the query for XML data is greatly different from the SQL.The management for XML data becomes a rising field in data management community.
This thesis aims to study the key techniques in XML data management,and achieves a series of results in XML data managment,which includes data model, query language,storag
您可能关注的文档
- 睾丸组织高表达蛋白trim69在精子发生中的功能研究生物化学与分子生物学专业论文.docx
- 产权属性政治关联与文化企业并购绩效会计学专业论文.docx
- 电动汽车大规模随机接入智能电网的负载均衡研究计算机软件与理论专业论文.docx
- 分级式冲击磨的研究与应用机械制造及其自动化专业论文.docx
- 超高像素全景环带成像研究光通信技术专业论文.docx
- 创业板上市公司ipo盈余管理分析会计学专业论文.docx
- 电信计费中数据收集系统的设计与实现软件工程专业论文.docx
- 北京市中小学体育名师标准及特征研究体育人文社会学专业论文.docx
- 二氧化碳催化加氢直接合成二甲醚的研究工业催化专业论文.docx
- 多功能p100蛋白对细胞周期的调控机制研究基础医学;免疫学专业论文.docx
最近下载
- (二模)苏北七市2025届高三第二次调研测试化学试卷(含标准答案).pdf
- 家校协同育人实施方案.docx
- 《数学(拓展模块一)上下册》中职数学课程全套教学课件.pptx
- 桥梁、涵洞施工方案.docx VIP
- 2026年春教科版(新教材)小学科学三年级下册(全册)教学设计(附教材目录P131).pdf
- 2025年供应链管理知识考试试题及答案解析 .docx VIP
- 5G通信基站安装协议.docx
- 煤矿井下供电的三大保护细则.docx VIP
- Unit 1 - Unit 4 课文原文及中文翻译 2025-2026学年译林版英语八年级下册.docx VIP
- 法理学(中国人民大学) 超星尔雅学习通章节测试答案.docx VIP
原创力文档

文档评论(0)