Web日志数据分析系统研究.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web日志数据分析系统研究   1日志数据分析模型的设计思想本论文设计平台通过对日志文件分析,统计出哪个页面最受欢迎,访问者来自哪里,访问时段分布情况等。   分析结果生成代码,最终通过浏览器以页面的形式将各种报表呈现在用户面前。   其中要用到目前比较常用的技术,由于要将海量的日志数据存入,所以还要用到-这个功能强大的数据库。   11系统的体系结构日志数据分析系统的主要用户是一般企业网站或个人网站管理员,目前常见的网络开发模式共有3种体系结构两层体系结构;三层体系结构;三层体系结构。   综合考虑本系统的用户群特点及这三种体系结构特点,最终采用的体系结构是目前国际上流行的即三层网络结构模型。   这种体系结构简单实用,客户端只要采用标准浏览器与网络进行连接就可以了。   12系统功能模块设计系统功能模块是系统与用户交互的接口,本系统包括数据预处理模块、基本分析模块、智能分析模块和可视化模块,系统功能模块数据预处理模块该模块主要功能是首先去掉原先存放在关系数据库中的部分没有用的原始日志,然后设置日志文件格式、采样方法,依据包含替换规则对数据进行净化,再将该数据导入源数据库,形成页面映射表信息,最后形成用户表。   基本分析模块该模块主要是对网站的访问情况进行以下6方面的统计汇总,即时段分析模块、地域分析模块、来源统计模块、客户端分析模块、受访页分析模块、搜索引擎模块。   智能分析模块该模块主要功能是利用关联规则对站点的页面之间的链接关系和站点结构进行分析,构建一个新的站点拓扑结构,寻有关联的客户群体,开展有针对性和个性化的电子商务活动。   2日志数据分析系统功能的实现21数据收集由于本系统是对日志的分析,所以数据收集部分的工作实际上就是对日志的收集工作,所以最重要得一点是网站的管理者允许对其日志文件进行研究,在同意对日志文件保密的前提下,笔者从电脑商网中国商务门户获取了一段时间的网站日志文件以此作为分析对象。   22数据预处理数据的预处理过程是将日志整理成适合数据挖掘的数据模型。   整个挖掘预处理过程分为数据净化、用户识别、会话识别、路径补充、事务识别5个步骤。   23智能分析模块实现我们利用了算法的思想,但同时对算法进行了改造,采用了改进的算法进行频繁路径挖掘。   改进是受到算法的启发,但它适合频繁路径的挖掘。   24基本分析模块实现基本分析可以分为两个方面,一是网站整体的访问统计,另一方面是具体网页的访问分析。   整体分析可以统计用户数、点击数,分析客户端信息等等;对具体网页可以统计其访问量,以分析其受欢迎程度,也可表示其重要程度。   这些工作的数据来源是预处理中数据清理阶段产生的源数据库和整个预处理阶段后产生的用户事务数据库,实现方法也比较简单,一般都是简单的统计分析处理。   基本分析模块由时段分析模块、地域分析模块、来源统计模块、客户端分析模块、受访页分析模块、搜索引擎分析模块6个模块组成。   本文以时段分析模块为例进行阐述。   根据日志中的日期域、时间域以及所花时间域-可以统计出每天哪个时段的访问人数和具体逗留时间,每个小时访问量的变化,通过一天中每小时的访问数可以得出站点哪个时间段的访问人数最多是访问高峰期,进而分析出访问人群的职业和上网习惯等相关信息。   日志数据分析是信息处理的一个重要应用,目前我们只是实现了一些简单的功能,还可以对日志的分析处理上进行某些更详细的深入分析,譬如可以根据访问者的登录时间、访问页面、停留时间等信息进行统计分析,然后制定个性化的电子商务营销策略,帮助电子商务网站在最短的时间内抓住最有效的客户。   还可根据以往时间段的访问人数统计,对网站未来几天或者某个时间段的访问流量进行预测。   作者吴敏纲黄杰恒郑义平单位景德镇陶瓷学院信息工程学院景德镇市第六人民医院景德镇市国税局直属分局 本word为可编辑版本,以下内容若不需要请删除后使用,谢谢您的理解   篇一:重症肺炎的诊断标准及治疗   重症 肺 炎   【概述】肺炎是严重危害人类健康的一种疾病,占感染性疾病中死亡率之首,在人类总死亡率中排第5~6位。重症肺炎除具有肺炎常见呼吸系统症状外, 尚有呼吸衰竭和其他系统明显受累的表现, 既可发生于社区获得性肺炎(community -acquired pneumonia, CAP),亦可发生于医院获得性肺炎(hospital acquired pneumonia, HAP)。在HAP中以重症监护病房(intensive care unit ,ICU)内获得的肺炎、呼吸机相关肺炎(ventilator associated pneumonia ,VAP)和健康护理( 医疗) 相关性肺炎(health care–ass

文档评论(0)

tangtianxu1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档