网站大量收购独家精品文档,联系QQ:2885784924

《Web事务聚类分析的研究与实现》-毕业论文.doc

《Web事务聚类分析的研究与实现》-毕业论文.doc

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE 9 w w MACROBUTTON MTEditEquationSection2 SEQ MTEqn \r \h \* MERGEFORMAT SEQ MTSec \r 1 \h \* MERGEFORMAT SEQ MTChap \r 3 \h \* MERGEFORMAT 学号: Web事务聚类分析的研究与实现 Research and Implementation of Web Transactions Clustering Analysis 系 别: 啊啊啊啊 专 业: 啊啊啊啊啊啊 班 级: 啊啊啊啊 学生姓名: 啊啊啊啊 指导教师: 啊啊啊啊 (职称) 日 期: 年 月 日 w 摘要 本文系统、完整地论述了Web事务聚类分析的两个阶段,即数据预处理和聚类分析阶段。其中数据预处理阶段又包括日志解析、数据清洗、用户识别和事务识别四个过程;同时,论文在此阶段引入了“概念URL”,以获得容易理解的聚类结果。在聚类分析阶段,本文结合蚁群优化的原理,建立了人工蚂蚁模型,并基于该模型实现了蚁群聚类分析算法。另外,本文还在聚类分析过程中使用了K均值算法,并比较了蚁群算法和K均值算法在Web事务聚类分析上的优劣。采用北京电子科技学院Web服务器()日志作为数据集的试验表明,本文的技术和方法能够获得质量良好的聚类结果。 【关键词】Web事务 聚类分析 概念URL K均值 蚁群算法 Abstract This paper discusses the two phases, which are data preprocessing and clustering analysis, in Web transactions clustering analysis in a systematic and complete view. The data preprocessing phase also contains the procedures of log file interpretation, data washing, user identification and transaction identification; at the same time, in order to gain an easily interpreted result, the paper introduces the “Concept URL” in this phase. In clustering phase, a model of artificial ant is set up. Based on this model, the paper implements an ant-colony clustering algorithm. What’s more, k-means algorithm is also implemented in clustering analysis phase, the result is compared with that of ant colony algorithm. Experiment results are presented on web logs of to illustrate the techniques and methods. The quality of results is good. 【Keywords】Web Transaction; Clustering Analysis; Concept URL; k-means; Ant Colony Algorithm 目录 TOC \o 1-2 \h \z \u HYPERLINK \l _Toc199735741 1 绪论 PAGEREF _Toc199735741 \h 4 HYPERLINK \l _Toc199735742 1.1 问题的提出 PAGEREF _Toc199735742 \h 4 HYPERLINK \l _Toc199735743 1.2 数据挖掘 PAGEREF _Toc199735743 \h 4 HYPERLINK \l _Toc199735744 1.3 聚类分析 PAGEREF _Toc199735744 \h 6 HYPERLINK \l _Toc199735745 1.4 Web挖掘和Web事务聚类分析 PAGEREF _Toc199735745 \

您可能关注的文档

文档评论(0)

咪蒙 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档