基于XML的WEB挖掘系统的应用研究-计算机技术专业论文.docxVIP

下载本文档

3
0
约3.71万字
约 42页
2019-02-15 发布于上海
举报
版权申诉

基于XML的WEB挖掘系统的应用研究-计算机技术专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

西安建筑科技大学硕士学位论文西安建筑科技大学硕士学位论文西安建筑科技大学硕士学位论文西安建筑科技大学硕士学位论文 PAGE PAGE 2 PAGE PAGE 5 Webtz据作为数据挖掘的一个新主题，是一个新兴的研究领域。 Web挖掘可以简单地定义为:针对包括 Web页面内容、页面之间的结构、用户访问信息、电子商务信息等在内的各种 Web数据，应用数据挖掘方法来帮助人们从 WWW中提取知识，为访问者、站点经营者以及基于因特网的商务活动提供决策支持。 Web挖掘是}个正在兴起的研究用户 Web浏览行为的技术和工具。理解访问者的浏览兴趣是提高 Web 服务质量和改善站点结构设计的重要环节。通过分析和探究用户访问情况中的规律，可以识别潜在用户，增强对最终用户的因特阿信息服务的质量和交互，井改进 Web 服务器系统的性能和结构。 Web挖掘根据站点挖掘目标不同可以分为 Web内容挖掘 (WebContent Mining)、 Web访问挖掘 (WebUsage Mining) 和Web结构挖掘 (WebStructure Mining) 三种主要类型。根据挖掘对象的不同 Web数据挖掘分为内容挖掘，结构挖据和访问信息挖掘三大类，而目前国内外基于 Web日志的用户访问模式挖掘又可以分为三类: 1. 分析站点性能，主要从统计学角度对频繁模式等进行发据，很多商用工具及有些免费工具属于此类: 2.理解用户意图，路径游历模式(p a由traversal pattem)发现算法等就是此类代表; 3. 改进站点设计，通过频繁路径、用户聚类，重构站点之间连接关系，适应用户访问习惯，提供个性化信息服务。 Web内容挖掘的研究大体以Web文本内容挖掘为主。Web内容挖掘一般从资源查找和数据库两个不同的方面进行研究。从资源查找的方面来看， Web内容挖掘的任务是从用户的角度出发，怎样提高信息质量和帮助用户过滤信息e 主要是对非结构化文档和半结构化文挡的挖掘。非结构化文挡主要指Web上的自由文本，如小说、新闻等。 Web上的半结构化文档挖踞指在加入了 HTML、超链接等附加结构的信息上进行挖掘，其应用包括超链接文本的分类、聚类、发现文档之间的关系、提出半结构化文档中的模式和规则等。 1.3 论文的主要内容本论文针对基于 XML的Web数据挖掘的Web 日志系统进行了深入细致的研究，通过对用户访问信息进行有效的数据挖掘，可以得到有关用户访问行为的知识，这些知识可以发现电子商务中用户的访问模式，在电子商务中针对用户实现个性化推荐。本论文在研究基于 XML的Web挖掘技术的同时，基于 XML的Web挖掘系统将Web挖掘技术应用于实践。本论文的主要工作表现在以下几个方面: 1.分析了目前数据挖掘的现状和发展趋势，对数据挖掘技术进行了介绍。 2. 分析了XML的特点和机制。 3. 详细叙述了基于 XML 的数据挖掘技术与理论 4. 深入的研究了基于削 L的Web挖掘系统的设计思想并将其应用于实践。本人在读研期间参与了多项与网络管理及数据挖掘相关的项目设计等工作。通过实践经验的总结以及理论知识的积累，对于数据挖掘的与 Weli挖掘的知识有了一定的认识与理解。在本论文中，本人的主要工作如下:针对基于 XML的Web数据挖掘的Web 日志系统进行了深入细致的研究，并参了基于XML的Web挖掘系统的部分设计与实施工作。 1.4 论文组织结构首先介绍了数据挖掘方面的相关知识，然后介绍了WEB挖掘技术的相关理论与 XML的一些特点及应用，再分析了对 XML数据的一些处理方法，分析了基于 XML 数据挖掘的方法。最后重点介绍了 WES数据挖掘的设计和整个系统实现，优化和测试。第1章介绍了Web数据挖掘的研究背景和意义，指出了国内外的研究现状和发展趋势，同时简要介绍了Web的一些知识以及本人在课题中所做的一些工作井且概述了本文的主要工作和章节的安排。第2章主要介绍基于泊位的 WEB挖掘技术的理论及 WEB挖掘的主要技术与方法。第3章主要介绍XML的相关知识， XML数据的特点与应用己及对 XML数据的一些处理方法。第4章基于XML的Web挖掘技术应用于工程实践，详细介绍了基于 XML挖掘技 WEB挖掘系统的设计与实现过程第5章对文章作了总结，并对将来的工作做了展望。第2章 WEB挖掘技术理论 2.1 数据挖掘概述数据挖据IIJ(Data Mining)是一类深层改的数据分析方法，是从大量的、不完全的、有噪声的。模糊的、随机的数据中提取隐含在其中的、人