- 1、本文档共43页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE 9
w
w
MACROBUTTON MTEditEquationSection2 SEQ MTEqn \r \h \* MERGEFORMAT SEQ MTSec \r 1 \h \* MERGEFORMAT SEQ MTChap \r 3 \h \* MERGEFORMAT 学号:
Web事务聚类分析的研究与实现
Research and Implementation of Web Transactions Clustering Analysis
系 别: 啊啊啊啊
专 业: 啊啊啊啊啊啊
班 级: 啊啊啊啊
学生姓名: 啊啊啊啊
指导教师: 啊啊啊啊 (职称)
日 期: 年 月 日
w
摘要
本文系统、完整地论述了Web事务聚类分析的两个阶段,即数据预处理和聚类分析阶段。其中数据预处理阶段又包括日志解析、数据清洗、用户识别和事务识别四个过程;同时,论文在此阶段引入了“概念URL”,以获得容易理解的聚类结果。在聚类分析阶段,本文结合蚁群优化的原理,建立了人工蚂蚁模型,并基于该模型实现了蚁群聚类分析算法。另外,本文还在聚类分析过程中使用了K均值算法,并比较了蚁群算法和K均值算法在Web事务聚类分析上的优劣。采用北京电子科技学院Web服务器()日志作为数据集的试验表明,本文的技术和方法能够获得质量良好的聚类结果。
【关键词】Web事务 聚类分析 概念URL K均值 蚁群算法
Abstract
This paper discusses the two phases, which are data preprocessing and clustering analysis, in Web transactions clustering analysis in a systematic and complete view. The data preprocessing phase also contains the procedures of log file interpretation, data washing, user identification and transaction identification; at the same time, in order to gain an easily interpreted result, the paper introduces the “Concept URL” in this phase. In clustering phase, a model of artificial ant is set up. Based on this model, the paper implements an ant-colony clustering algorithm. What’s more, k-means algorithm is also implemented in clustering analysis phase, the result is compared with that of ant colony algorithm. Experiment results are presented on web logs of to illustrate the techniques and methods. The quality of results is good.
【Keywords】Web Transaction; Clustering Analysis; Concept URL; k-means; Ant Colony Algorithm
目录
TOC \o 1-2 \h \z \u HYPERLINK \l _Toc199735741 1 绪论 PAGEREF _Toc199735741 \h 4
HYPERLINK \l _Toc199735742 1.1 问题的提出 PAGEREF _Toc199735742 \h 4
HYPERLINK \l _Toc199735743 1.2 数据挖掘 PAGEREF _Toc199735743 \h 4
HYPERLINK \l _Toc199735744 1.3 聚类分析 PAGEREF _Toc199735744 \h 6
HYPERLINK \l _Toc199735745 1.4 Web挖掘和Web事务聚类分析 PAGEREF _Toc199735745 \
您可能关注的文档
- 《SMC的发展现状及成型工艺》》-毕业论文.doc
- 《SMS复合非织造材料纵横向机械性能差异的因素的研究分析》》-毕业论文.doc
- 《SMT技术的发展趋势》》-毕业论文.doc
- 《SMT技术的发展趋势》-毕业论文.doc
- 《SL1126发动机机盖的工艺工装设计》》-毕业论文.doc
- 《SMT检测与质量管理》-毕业论文.doc
- 《SMT生产线的运行与维护》》-毕业论文.doc
- 《SMT生产工艺流程》》-毕业论文.doc
- 《SNMP_XML转换网关的设计与实现》》-毕业论文.doc
- 《Snort研究与应用》》-毕业论文.doc
- 2025年度扬州市专业技术人员公需考试 -党的二十届三中全会精神解读考试.doc
- 2025至2031年中国中号品味导弹口杯行业投资前景及策略咨询研究报告.docx
- [保山]云南保山隆阳区消防救援局乡镇政府专职消防员招聘92人笔试历年参考题库附带答案详解.docx
- [中央]2024年国家药品监督管理局特殊药品检查中心招聘笔试历年参考题库附带答案详解.docx
- 2024浙江绍兴市上虞区交通集团有限公司公开招聘合同制职工10人笔试参考题库附带答案详解 .docx
- 2025年中国数字图像系统市场调查研究报告.docx
- [临沂]山东临沂郯城县消防救援大队政府专职消防队员招聘40人笔试历年参考题库附带答案详解.docx
- 2025至2030年中国舰船通讯用特种不间断电源数据监测研究报告.docx
- 2025至2030年中国轴承车工圈内外套数据监测研究报告.docx
- [临沧]云南临沧市镇康县司法局招聘司法协理员笔试历年参考题库附带答案详解.docx
文档评论(0)