- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
学号:
Web事务聚类分析的研究与实现
Research and Implementation of Web Transactions Clustering Analysis
系 别: 啊啊啊啊
专 业: 啊啊啊啊啊啊
班 级: 啊啊啊啊
学生姓名: 啊啊啊啊
指导教师: 啊啊啊啊 (职称)
日 期: 年 月 日
摘要
本文系统、完整地论述了Web事务聚类分析的两个阶段,即数据预处理和聚类分析阶段。其中数据预处理阶段又包括日志解析、数据清洗、用户识别和事务识别四个过程;同时,论文在此阶段引入了“概念URL”,以获得容易理解的聚类结果。在聚类分析阶段,本文结合蚁群优化的原理,建立了人工蚂蚁模型,并基于该模型实现了蚁群聚类分析算法。另外,本文还在聚类分析过程中使用了K均值算法,并比较了蚁群算法和K均值算法在Web事务聚类分析上的优劣。采用北京电子科技学院Web服务器()日志作为数据集的试验表明,本文的技术和方法能够获得质量良好的聚类结果。
【关键词】Web事务 聚类分析 概念URL K均值 蚁群算法
Abstract
This paper discusses the two phases, which are data preprocessing and clustering analysis, in Web transactions clustering analysis in a systematic and complete view. The data preprocessing phase also contains the procedures of log file interpretation, data washing, user identification and transaction identification; at the same time, in order to gain an easily interpreted result, the paper introduces the “Concept URL” in this phase. In clustering phase, a model of artificial ant is set up. Based on this model, the paper implements an ant-colony clustering algorithm. What’s more, k-means algorithm is also implemented in clustering analysis phase, the result is compared with that of ant colony algorithm. Experiment results are presented on web logs of to illustrate the techniques and methods. The quality of results is good.
【Keywords】目录
1 绪论 4
1.1 问题的提出 4
1.2 数据挖掘 4
1.3 聚类分析 6
1.4 Web挖掘和Web事务聚类分析 6
2 Web事务聚类分析系统的总体设计 8
2.1 开发目标 8
2.2 挖掘数据源 8
2.3 工作流程 8
2.4 系统架构与开发技术 9
3 数据预处理 11
3.1 日志解析 11
3.2 数据清洗 12
3.3 用户识别 13
3.4 会话/事务识别 错误!未定义书签。
3.5 概念URL 错误!未定义书签。
4 基于K均值算法的Web事务聚类分析 15
4.1 K均值算法 15
4.2 事务间的距离 15
4.3 K均值算法的实现 错误!未定义书签。
5 基于蚁群算法的Web事务聚类分析 17
5.1 蚁群算法 17
5.2 事务间的相似度 18
5.3 人工蚂蚁建模 错误!未定义书签。
5.4 基于人工蚂蚁模型的聚类分析算法 19
6 试验与分析 22
6.1 基于蚁群算法的聚类分析结果 22
6.2 基于K均值算法的聚类分析结果 24
6.3 试验结果小结 29
7 总结与展望 30
7.1 论文总结 30
7.2 下一步的研究工作 31
8 致谢 32
9 参考文献 33
附录 Web事务聚类分析系统用户界面 35
1 绪论
1.1 问题的提出
随着信息技术的发展,人类社会的工作和生活中都充满了大量的
文档评论(0)