基于网络日志挖掘技术数据信息分析的研究.pdfVIP

基于网络日志挖掘技术数据信息分析的研究.pdf

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于网络日志挖掘技术数据信息分析的研究.pdf

科技与创新 lScienceandTechnologyInnovation 2015年 第 6期 文章编号:2095—6835(2015)06—0068—02 基于网络 日志挖掘技术数据信息分析的研究 付 生 (中国海洋大学,山东 青岛 266100;潍坊科技学院,山东 潍坊 262700) 摘 要:对网络 日志挖掘技术数据信息分析的研究,是动态交互网络使用数据挖掘的一种技术实现。通过挖掘动态交互 网络 日志.可以查找用户访问动态交互网络的浏览方式和习惯性行为,并依据数据挖掘分析和研究动态交互网络 日志记 录中的规律 ,判断数据价值链与组织结构的适应性问题,从而提高信息查找的快速指向性和信息检索的高效性,并利用 统计和关联的分析找 出特定用户与特定地域、特定时间、特定页面等要素之 间的内在联系。 关键词:日志挖掘;数据分析 ;信息检索;网络 日志 中图分类号:TP3l1.13 文献标识码:A DOI:10.15913~.cnki.kjyex.2015.06.068 1 日志数据挖掘 数据页面的引导表现出了便捷和快速的特点;④利用 日志挖掘 动态交互网络获取信息的过程存在站点访问的跳跃性和无 技术查询用户有价值信息,依据数据价值判断、推算出潜在的 序性,数据信息指向是呈布朗运动分布的。超文本链接的跳转 数据连接和页面访问指向。 过程具有一定的普遍性,并且还有数据存量大、数据更替快等 3.2 系统架构 大数据 4V特点。挖掘规律即是动态交互网络用户访问信息发 该系统主要由4个功能模块组成,即客户端访问模块、数 现的重要研究内容。动态交互网络日志挖掘是对大量用户行为 据访问模块、价值识别模块和个性化服务模块。 和数据价值有效性的判断,该判断是经过数据的预处理、数据 3.2.1 客户端访 问模块 模式识别和模式分析 3个过程实现的。 客户端访问模块主要用于处理客户端的基本信息并识别用 2 动态交互网络 日志挖掘的过程 户,其工作内容包括客户端的登录服务、识别用户名和密码。其 对于动态交互网络 日志挖掘,首先要研究和分析网络 日志 中,登录服务主要是完成用户信鼠的修改和存储。同时,用户的 记录信息存在的变化和特点,进而实现数据的预处理过程。另 不可修改信息也会被存储和识别,比如MAC、IP浏览器版本号等。 外,要识别用户信息,提高对用户价值信息的服务质量,改进 3.2.2 数据访 问模块 动态交互网络服务系统的数据信息判断和组织结构。 客户端被访问时会在服务器端和客户端产生El志信息,而 2.1 数据预处理 日志信息是数据预处理和模式识别的基础。访问日志模块主要 在动态交互网络 日志文件记录中,存储的是用户访问站点 用于处理用户行为记录的各项信息,访问信息具有大量、多样 信息的原始记录,而原始记录的数据具有多样性和大量性,所 和快捷的特点。日志信息包括访问某一页面的次数、访问页面 以,直接从数据中挖掘其有效价值存在不确定性和一定的困难。 的多个URL地址信息、用户行为信息的判断和大量数据保存方 在借助一定的算法和工具分析数据时,必须要对数据进行预处 面的管理配置等。利用数据访问模块 ,可以识别和分析数据, 理。预处理过程是指对数据质量、数据的多样性和量级进行处 完成预处理工作。 理,这会直接影响数据挖掘的结果,还会影响数据价值存在的 3.2.3 价值识别模块 判断。对于数据访问量小、数据多样性单一的网络 日志信息, 网站的构成具备多网页站点间多联系、交互的特点,而网 数据处理的准确性具有非常重要的意义。日志预处理主要是通 站数据具有多样性和快捷性。网站要想显示用户兴趣和行为, 过数据净化、

文档评论(0)

月光般思恋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档