XML文档数据挖掘频繁子树编码优化查询.docVIP

下载本文档

0
0
约2.07千字
约 3页
2017-08-15 发布于重庆
举报
版权申诉

XML文档数据挖掘频繁子树编码优化查询.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

XML文档数据挖掘频繁子树编码优化查询.doc

XML文档论文：频繁子树优化查询策略【中文摘要】现阶段,数据挖掘不论是在理论上还是在应用上都得到快速的发展。所谓数据挖掘,简而言之,就是从海量的数据中发现先前未知的、有用的信息。数据挖掘的重要性主要体现在计算机网络、Web挖掘、生物信息学、多关系数据挖掘、XML文档挖掘等方面的大量应用上近几年,随着数据挖掘的发展,频繁子树的挖掘已经成为一个新的研究领域,在许多方面得到很好的实际应用,频繁模式挖掘是数据挖掘中一个很重要的课题。如何快速找到频繁结构,查询访问更新频繁结构信息,并对该结构进行必要的更新操作是迫在眉睫的时代要求。在Dietz编码(属于区域编码)的基础之上,本文提出一种新的编码方案——PLDC编码(Parent Level Dietz Coding)。利用PLDC对XML文档树中节点进行编码,给定任何一个节点,在XML文档树中都可以找到从根节点到该节点的唯一的一条完整路径。该编码适用于给文档树建立索引,并继续运用到将XML文档转换为关系数据表之后的索引。另外将XML文档转换成关系数据表形式,用编码建立索引表,给出任何一个节点,在索引表中都能找到该节点的所有出现,并根据该节点的编码获得节点信息,不需要从根节点开始查找。此外针对XML文档... 【英文摘要】Today is the information age, it is closely linked with people’s basic needs of real life that all aspects of a wide range of information. With the rapid progress of the social and technology, all kinds of data and information which grows as the explosive mode come into people’s learning, production and living. As well as the data storage and management is facing a severe test. Fortunately, XML with the characteristics of semi-structured data is produced. How to effectively management XML data in the databa... 【关键词】XML文档数据挖掘频繁子树编码优化查询【英文关键词】XML Document Data Mining Frequent Subtree Encoding Optimization Query 【索购全文】联系Q1：138113721 Q2：139938848 【目录】频繁子树优化查询策略提要 4-5 摘要 5-7 Abstract 7-8 第1章绪论 11-16 1.1 引言 11 1.2 研究背景及选题意义 11-12 1.3 国内外研究现状 12-13 1.4 论文的主要工作及文章安排 13-15 1.5 本章小结 15-16 第2章 XML的相关技术 16-26 2.1 引言 16 2.2 认识XML 16-21 2.2.1 一个XML例子 16-19 2.2.2 XML的特征 19-21 2.3 XML的相关技术 21-25 2.3.1 XML文档结构标准 22-24 2.3.2 XML文档解析标准 24-25 2.4 本章小结 25-26 第3章频繁子树与编码知识介绍 26-35 3.1 引言 26 3.2 基本概念 26-30 3.2.1 图的基本概念 26 3.2.2 树的基本概念 26-28 3.2.3 子树的基本概念 28-30 3.3 编码 30-34 3.3.1 区域编码 31-32 3.3.2 前缀编码 32-33 3.3.3 k分树编码 33-34 3.4 本章小结 34-35 第4章频繁子树的查询与转化 35-50 4.1 引言 35 4.2 算法思路 35-46 4.2.1 DOM解析XML文档 36-37 4.2.2 对DOM树中节点编码 37-41 4.2.3 查找频繁子树 41-43 4.2.4 匹配频繁子树并存储 43-45 4.2.5 对关系数据表的查询 45-46 4.3 实验结果分析 46-47 4.3.1 时间复杂度分析 46 4.3.2 空间复杂度分析 46-47 4.4 性能分析 47-49 4.4.1 实验环境 47 4.4.2 实验分析 47-49 4.5 本章小结 49-50 第5章结论与展望 50-52 参考文献 52-55 作者简介及在学期间所取得的科研成果 55-5