- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
C基于数据挖掘的web日志分析研究
Author: 青州seo
Author: 寿光seo
基于数据挖掘的web日志分析研究
摘 要
随着互联网的迅速普及和广泛应用,Web上产生的信息也随之飞速增长,WWW网无论是在访问量、规模上还是在网站设计的复杂度上都以惊人的速度增长着。为了更好地设计Web服务器,一个更好的方式就是分析原来的网站是如何被利用的。日志数据的分析可以通过统计数据的形式,像统计经常被访问的页面集、统计经常需要分析的重要的表格数据、通过网站分析找出一般的访问路径模式等。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,从而解决上面所提出的问题。
本文对Web日志挖掘的概念、内容、关键技术和目前的国内外的现状进行了研究,并且在这基础上设计并实现了Web日志挖掘工具。该挖掘工具采用C语言编写并严格按照日志挖掘的基本步骤设计,它分为四个模块:源数据输入模块、数据预处理模块、模型建立模块和结果显示模块。该挖掘工具在设计过程中采用了快速的数据预处理算法,从而提高预处理阶段的处理速度;能够建立多种模型,如关联、聚类,并且可根据用户的选择来实现相应的模型建立;结果显示阶段采用易懂的图表形式显示,提高了结果的可读性。 。
最后运用所设计的挖掘工具针对某商业网站的访问日志进行了挖掘,并对显示的结果做了详细的分析和研究。在对结果分析的基础上,找出用户访问规律,从而为改善网站结构和内容以及实现网站的智能化提供了决策支持。
关键词:Web日志挖掘,关联规则,聚类分析,web日志挖掘工具设计,结果分析
目 录
TOC \o 1-3 \h \z \u
HYPERLINK \l _Toc199762694 第1章 绪论 PAGEREF _Toc199762694 \h 1
HYPERLINK \l _Toc199762695 1.1 本课题研究背景及意义 PAGEREF _Toc199762695 \h 1
HYPERLINK \l _Toc199762696 1.2 本课题研究动态 PAGEREF _Toc199762696 \h 2
HYPERLINK \l _Toc199762697 1.3 论文的组织 PAGEREF _Toc199762697 \h 2
HYPERLINK \l _Toc199762698 第2章 数据挖掘概述 PAGEREF _Toc199762698 \h 4
HYPERLINK \l _Toc199762699 2.1 数据挖掘与web数据挖掘 PAGEREF _Toc199762699 \h 4
HYPERLINK \l _Toc199762700 2.1.1 数据挖掘 PAGEREF _Toc199762700 \h 4
HYPERLINK \l _Toc199762701 2.1.2 数据挖掘系统分类 PAGEREF _Toc199762701 \h 5
HYPERLINK \l _Toc199762702 2.1.3 web挖掘 PAGEREF _Toc199762702 \h 5
HYPERLINK \l _Toc199762703 2.1.4 web挖掘分类 PAGEREF _Toc199762703 \h 6
HYPERLINK \l _Toc199762704 2.2 web日志挖掘简介 PAGEREF _Toc199762704 \h 7
HYPERLINK \l _Toc199762705 2.2.1 web日志挖掘的提出 PAGEREF _Toc199762705 \h 7
HYPERLINK \l _Toc199762706 2.2.2 web日志挖掘的应用 PAGEREF _Toc199762706 \h 7
HYPERLINK \l _Toc199762707 2.2.3 web 日志挖掘流程 PAGEREF _Toc199762707 \h 8
HYPERLINK \l _Toc199762708 2.3 web日志挖掘存在的问题及所要解决的问题 PAGEREF _Toc199762708 \h 9
HYPERLINK \l _Toc199762709 2.4 本章小结 PAGEREF _Toc199762709 \h 9
HYPERLINK \l _Toc199762710 第3章 web日志挖掘系统的预处理技术 PAGEREF _Toc199762710 \h 10
HYPERLINK \l _Toc1997
文档评论(0)