- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE 9
MACROBUTTON MTEditEquationSection2 SEQ MTEqn \r \h \* MERGEFORMAT SEQ MTSec \r 1 \h \* MERGEFORMAT SEQ MTChap \r 3 \h \* MERGEFORMAT
Web事务聚类分析的研究与实现
Research and Implementation of Web
摘要
本文系统、完整地论述了Web事务聚类分析的两个阶段,即数据预处理和聚类分析阶段。其中数据预处理阶段又包括日志解析、数据清洗、用户识别和事务识别四个过程;同时,论文在此阶段引入了“概念URL”,以获得容易理解的聚类结果。在聚类分析阶段,本文结合蚁群优化的原理,建立了人工蚂蚁模型,并基于该模型实现了蚁群聚类分析算法。另外,本文还在聚类分析过程中使用了K均值算法,并比较了蚁群算法和K均值算法在Web事务聚类分析上的优劣。采用北京电子科技学院Web服务器()日志作为数据集的试验表明,本文的技术和方法能够获得质量良好的聚类结果。
【关键词】Web事务 聚类分析 概念URL K均值 蚁群算法
Abstract
This paper discusses the two phases, which are data preprocessing and clustering analysis, in Web transactions clustering analysis in a systematic and complete view. The data preprocessing phase also contains the procedures of log file interpretation, data washing, user identification and transaction identification; at the same time, in order to gain an easily interpreted result, the paper introduces the “Concept URL” in this phase. In clustering phase, a model of artificial ant is set up. Based on this model, the paper implements an ant-colony clustering algorithm. What’s more, k-means algorithm is also implemented in clustering analysis phase, the result is compared with that of ant colony algorithm. Experiment results are presented on web logs of to illustrate the techniques and methods. The quality of results is good.
【Keywords】Web Transaction; Clustering Analysis; Concept URL; k-means; Ant Colony Algorithm
目录
TOC \o 1-2 \h \z \u HYPERLINK \l _Toc199735741 1 绪论 PAGEREF _Toc199735741 \h 4
HYPERLINK \l _Toc199735742 1.1 问题的提出 PAGEREF _Toc199735742 \h 4
HYPERLINK \l _Toc199735743 1.2 数据挖掘 PAGEREF _Toc199735743 \h 4
HYPERLINK \l _Toc199735744 1.3 聚类分析 PAGEREF _Toc199735744 \h 6
HYPERLINK \l _Toc199735745 1.4 Web挖掘和Web事务聚类分析 PAGEREF _Toc199735745 \h 6
HYPERLINK \l _Toc199735746 2 Web事务聚类分析系统的总体设计 PAGEREF _Toc199735746 \h 8
HYPERLINK \l _Toc199735747 2.1 开发目标 PAGEREF _Toc199735747 \h 8
HYPERLINK \l _Toc199735748 2.2 挖掘数据源 PAGEREF _Toc199735748 \h 8
HYPER
您可能关注的文档
- 基于PLC的轮胎内硫化机的电控系统设计自考毕业设计论文.doc
- 怎样提高学生的听力能力How to improve the students listening ability.doc
- 查尔斯狄更斯作品中的批判现实主义的研究A Study of Critical Realism in Charles Dickens´s Novels.doc
- 某某轻钢龙骨加工项目可行性研究报告.docx
- B2C电子商务赢利模式分析及对比研究课件.ppt
- “基于单片机综合火灾报警器”生产工艺实习报告毕业设计.doc
- Linux系统下3DES加密算法实现的毕业论文.doc
- “双考”考务管理系统设计论文.doc
- 2-取代咪唑-4,5-二羧酸及其钴配合物的合成与晶体结构.doc
- 10kV馈电线路微机保护系统毕业设计.doc
最近下载
- 自行车里程速度计设计论文(本科)毕业设计论文.doc VIP
- GBT3049—2006工业用化工产品铁含量测定的通用方法1,10—菲啰啉分光光度法.pdf
- 新版《建筑设计防火规范》(GB50016-2014年)规范编制组宣讲课件.ppt VIP
- 2024年洛阳文化旅游职业学院单招职业技能测试题库及答案(全优).docx VIP
- 环保管家服务方案.docx VIP
- 2024年洛阳文化旅游职业学院单招职业技能测试题库及答案(必刷).docx VIP
- 大数据平台数据治理规划方案.docx
- 山东文旅云智能科技有限公司笔试考啥.pdf
- 航空移动卫星通信(AMSS).ppt
- 17J008 挡土墙(重力式、衡重式、悬臂.docx VIP
文档评论(0)